Speechmaticsは言語を転写するためにAIを使い、そしてそれはグーグルを破っている

$config[ads_kvadrat] not found
Anonim

スピーチマティックスはグーグルに続いています。英国の新興企業は先月、自動言語学者を締めくくりました。これは、数日で音声テキスト変換のためのあらゆる言語を学ぶことができる強力な人工知能です。チームは、世界の約7,000の言語すべてにテクノロジを有効にして、人生を変える可能性を考えています。

言語学ツールを立ち上げて以来、SpeechmaticsはOmniglotの開発に取り組んできました。先週、同社は大きな節目を迎えた。正式にGoogleに勝ったのは、合計72のユニークな言語である。

システムは、機械学習を使用して音声データとそれに対応するトランスクリプトを照合します。次に、他の言語の言語パターンを使用してプロセスをできるだけ簡単にし、音声と文法構造の類似点を特定して新しい言語に適用します。このプロセスは非常に効果的です。たとえば、Speechmaticsのヒンディー語での作業は、わずか2週間で80%の精度に達しました。最終製品がグーグルの努力に対してテストされたとき、それは23パーセント少ない間違いをしました。

逆 詳細については、SpeechmaticsのCEOであるBenedikt vonThüngen氏に話を聞いた。

どのようにしてチームは最初にプロジェクトに取り組み始めましたか?

私たちは自分たちへの挑戦としてOmniglotプロジェクトを始めました - 6週間でどれだけ多くの言語を構築することができるかを見るためです。私たちは、各言語を個別に構築するという伝統的なアプローチは、急速に規模を拡大しようとするときにはもはや実行可能ではないことに気づいた。そのことを念頭に置いて、言語とは何か、それがどのように構造化されているのか、そして異なる言語間にはどのような類似点があるのか​​を再考しなければなりませんでした。これらの共通点を使用してパターンを識別し、これまで以上に高速に言語を構築するためのAI搭載フレームワークであるAutomatic Linguist(AL)を支援する方法を見つけました。 !

これはGoogleの取り組みとどう違うのですか。

言語構築への私たちのアプローチは、Googleと私たちを区別する主な側面の1つです。我々は彼らが彼らの言語を個別に(あるいは我々が「ブルートフォース」と呼ぶものによって)構築すると仮定しているが、我々はA.Iの力を使っている。言語構築プロセスを合理化しスピードアップする。さらに、Googleのような他のサービスは固有の言語ではなく方言の構築に重点を置いていますが、私たちの努力はこれまで大手テクノロジー企業では不十分だった分野を含む世界中の固有の言語に集中してきたことを誇りに思います。

これに対する実際のアプリケーションは何ですか?

私たちは今、私たちのサービスをこれまで以上に広範囲に広げ、全員に自動音声認識(ASR)をもたらすための技術と知識を持っています。これは、リテラシー率が低い国では特に重要です。そこでは、以前は利用できなかった音声合成技術を使用してコミュニケーションをとることができるため、人々に大きな違いをもたらすことができます。 ASR技術がアクセシビリティの問題を解決するのに役立つ他の現実的なケース - 世界中の聴覚障害者は、電話と同じくらい簡単なデバイスを使用して、周囲の人々と対話することができます。

これは英語のような十分にカバーされた言語の正確さを改善しますか?

より多くの言語を開発し続けるにつれて、私たちのA.Iはフレームワークは、言語の特徴やパターンを識別することにますます熟達するようになるでしょう。私たちは、英語を含む私たちの現在の言語基盤を完成し続けるためにこの知識を使います。

これにより、Google Pixel Budsのリアルタイム翻訳ツールのようなものが改善されるでしょうか。

Omniglotのようなプロジェクトが今後のリアルタイム翻訳ツールの改善に役立つことは間違いありません。言語の範囲と正確さを拡大するためにより多くのリソースが投資されるにつれて、翻訳サービス分野では継続的な改善が見られるでしょう。

これはどんな言語でも、クリンゴン語のように構築された言語でも動作しますか?

conlangをまだ構築しようとしていませんが、それらが機能しない理由はわかりません。これらの言語はまだ人間によって話されているので、日常の言語(音素数など)と同様の構造上の規則と制約にも従っています。これはALにビルドのための十分なデータを与えるでしょう。

あなたはプロジェクトをオープンソース化していますか?

いいえ、その予定はありません。

ライセンスはどのように機能しますか?

Omniglotプロジェクトで提供されている言語は無料で、商用目的には使用できません。そのため、当面の間、それらに付随するライセンスはありません。

ここからの次のステップは?

プロジェクトオムニスロットは私たちにとってほんの始まりです。私たちは最終的には世界のあらゆる言語を構築したいと思っているので、私たちはその目標に向かって懸命に努力しています!

$config[ads_kvadrat] not found