Siriに尋ねる:Appleがどのようにして教えるのかA.I.お気に入りのレストランの名前

$config[ads_kvadrat] not found

株式会社博展 - 東芝実績動画

株式会社博展 - 東芝実績動画
Anonim

現在ユーザーとSiriの間に存在する言語と商取引の両方に対する障壁を修正しようとしているAppleは、A.Iを持っている。実際に地元企業の名前を認識します。その計画は?特定の地域のレストラン、ブティック、金物店を理解できるように、システムにユーザーの位置情報に関する知識を提供します。

Appleはこの技術を「地理位置情報ベースの言語モデル」、または略してGeo-LMと呼んでいます。そして、同社のMachine Learning Journalの木曜日のブログ記事で、Siriの音声認識チームは、商標で返答する代わりに、これを使ってあなたの地元のピザのジョイントに関する情報をシームレスに表示すると説明しました。 」

Siriは、音声モデルと言語モデルの2つのユニットで構成されている自動音声認識(ASR)システムです。前者は誰かが話すときに作られた言葉と音を捉えますが、前者は話されている言語に特定の一連の単語がどれだけありそうかを決定します。本質的には、Siriはせいぜいあなたが何を求めているのか理解するために教育を受けた推測をしています。

Appleは2つの興味深い欠点を見つけた。 1つは、ビジネスで使用される特定の単語や名前が標準のダイアログで使用されていないため、システムのトレーニングデータに表示されることがほとんどなく、ユーザーがそれらの単語や名前をどのように発音するかわかりません。

この問題を解決するために、Geo-LMはブログが「エンティティ名」と呼んでいるものにSiriがアクセスできるようにします。こうすることで、音声アシスタントはレストランについて話しているときを予測できます。同じような名前を共有しましょう。

Appleは、米国人口の80%をカバーする169の地域からの米国国勢調査局のデータを使用して、そのGeo-LMをまとめました。彼らはまた、それらの分野に含まれていないすべての地域のためのグローバルGeo-LMを構築しました。そのため、ユーザーがSiriに、国勢調査データでカバーされていない地元の食料品店を探すように依頼した場合は、代わりにグローバルGeo-LMを使用します。

これはSiriのいくつかのギャップを埋めるかもしれないが、Appleは現在、現実的な人間の声で電話をかけることができる次世代の音声アシスタント、DuplexをトレーニングしているGoogleのようなものに遅れを取っている。ただし、Googleはさまざまなアクセント、方言、および言語を理解するためのGoogleアシスタントの能力の向上にも取り組んでいることに注意することが重要です。

ブログの投稿には、このアップデートがいつ公開されるかは明記されていませんでした。ただし、誤って友人のDinoに電話してもらうことなく、SiriにDeninoのPizzaから注文するように依頼できます。

$config[ads_kvadrat] not found