Dame la cosita aaaa
マイクロソフトは、人間よりも正確な音声認識ソフトウェアを開発した世界初の企業となりました。月曜日に発表された論文「会話型スピーチ認識における人間の平等の達成」において、ソフトウェアは人間の努力よりも半分以下少ない誤りを含むトランスクリプトを作り出した。それはどれほど良い人々がスピーチを理解しているかを考えると信じられない。突破口は新しいA.I.への扉を開きますこれまで以上に正確なアシスタント。
このような短期間でテクノロジがどれほど進歩したかは印象的です。コンピュータの音声認識が絶望的に離れているように見える奇妙なニッチだったのは、昔のことです。 2006年のWindows Vistaの音声認識ソフトウェアのデモをご覧ください。
チームは、音声転写の信頼性を測定するために業界全体で使用されている、米国標準技術局(NIST)2000のテストを使用しました。会話が2人の参加者の間で電話を介して順番に行われ、その後、結果のスクリプトが比較され、辞書のスペルと比較されます。
2人の見知らぬ人がはじめて話す配電盤部分では、ヒューマンエラー率は約5.9%ですが、お互いに知っている2人の人が話すコールホーム部では、エラー率は約11.3%です。 Microsoftのソフトウェアは、約0.4%低いエラー率を記録した。
飛躍的な進歩は没入型A.Iの新しい形をもたらすのを助けるでしょう。8月に、学生Joshua Browderは彼のDoNotPayチャットボットからラップを外しました。そして、それはホームレスの人々が無料の法的助言を得るのを助けることができます。認識の進歩と組み合わせることで、人々が自分のコンピュータと定期的に会話をすることで、仮想アシスタントに住宅の手伝いを依頼する未来を想像するのは簡単です。
この段階では、研究者たちはどのようにしてA.I.を使った音声認識がよりスマートな反応をもたらすのかを検討しています。センセイ、怒りを検知するA. Siriの後ろの研究室から、ユーザーが怒っているのか混乱しているのかを検出するために高度な認識機能を使い、状況に合わせて答えを変えている。エラーを起こしやすい音声認識の障壁を取り除くことで、仮想的な支援のためのエキサイティングな新しい機会が生まれます。