自然言語理解はA.Iの未来音声認識

$config[ads_kvadrat] not found

?? Subway Surfers - Official Launch Trailer

?? Subway Surfers - Official Launch Trailer
Anonim

AmazonのAlexaとSiriが一貫して雑用を増やす(そしてますます生意気になる)能力が出現したことで、多くの人が疑問に思っています。

このレースにはいくつかの企業が首を重ねています。 Facebookが買収したWit.aiという会社がある - あなたはデモで遊べる。 (このコマンドを試してみてください:「私は猫を見たいです。」)AppleにはそのHomeKitがあり、それとともに、Appleが最善を尽くすものをやっている - お尻を蹴る。 Amazonはまた、Alexaを搭載したEchoとEcho Dotを販売しています。

自然言語理解の道を争っている会社の1つがMindMeldです。 MindMeldは、自社の製品、サービス、またはデバイスにインテリジェントな音声インターフェイスを追加しようとしている他の企業に、その自然言語理解機能を提供します。サンフランシスコを拠点とする会社は、パートナーが自分のデバイスに独自の、きめ細かいパーソナルアシスタントを使用できるように、インフラストラクチャとカスタマイズのオプションを提供しています。 MindMeldは最近Spotifyとのこのようなパートナーシップを発表しましたが、自動車会社、防衛機関、Eコマース会社などとも協力しています。 (そして当然、そのようなパートナーシップの多くの詳細を共有することはできません。)

逆 音声認識分野の現状についてMindMeldのSam Vasisht氏に話を聞いたが、彼は企業としての「音声認識」が「日常的な話題」になっていることをすぐに指摘した。音声認識はほぼ全盛期を迎えました。50年にわたる開発の末、AIは音声を効果的に認識できるようになりました。これらのシステムは、仕事において人間よりもほぼ優れており、まもなく単なる人間を凌ぐでしょう。

予測可能な次のステップは、子供の発達によく似ていますが、これらのシステムに次のことを教えることです。 わかる 彼らが今認識できる言語。 「この人間は言葉を話しています。これらの言葉は、「私はこの人間が言っていることを理解しています。手伝ってもらいましょう。」

そして、そのさらなるステップと開発は、 意味 :人間の心が言語情報を処理する方法を模倣する。この方程式には2つの部分があります。最初の意図は次のとおりです。この文章を話すことに対する人間の目標や欲求は何ですか。話し言葉から意図を抽出することができるコンピュータは、人間が影響を与えたいと思うことを「理解する」ことができます。 バツ またはと対話する よ 。このプロセスと絡み合っているのが方程式の2番目の部分です。エンティティ。 A.I.対処しようとしているエンティティ、人間の意図の対象を決定する方法を知っている必要があります。

そうするために、MindMeldは哲学者を採用していません(私が推測していたように、または望んでいたように)。それは自然言語の専門家を採用していますが、A.Iの大部分を占めています。 「学習」プロセス自体は比較的手間がかかります。あなたがコーヒーの注文を理解するようにシステムを教えているなら、あなたは人々がおそらくコーヒーを注文するかもしれないすべての異なる方法をシステムに示す必要があります。

"私はモカが欲しいのですが。"

"私はジョーを1杯もらえますか?"

"私のためだけの大規模なコーヒー。"

自然言語の専門家 - 言語学者 - がそこにやってくるのです。しかし、それでもデータはクラウドソーシングできるので、それはもはや必要ありません。これらのツールを使用すると、何千人もの人々に同じ質問をして回答をまとめることができます。それからあなたはそれらの返事をA.I.に送り込むだけです。 ほら :A.問い合わせの可能性の広い範囲に反応することができます。 「何千ものクエリから、私たちは今では基本的に他の何十億ものクエリがどのように生成されるかを機械で学ぶことができます」とVasishtは言います。

逆 A.Iのインサイダーであることが長いVasishtに尋ねた。自然言語理解の分野、私たちを推測する。

MindMeldは拡張対話に参加できますか?例えば、私がフォローアップの質問をするならば、A.I。理解して反応し続ける?

はい。それはデザインの一部です。誰かが不完全な質問をした場合 - たとえば、私がコーヒーを注文していて、私が欲しいコーヒーのサイズを指定していない場合、それは戻ってきて、次のように言います。欲しいです?"

チューリングテストで何か進歩があると思いますか?

私たちはそれにかなり近づいていると思います。つまり、IBM Watsonはそうしました。 危険! それは本当に良い例だと思います。私たちはその時点にいます。それはとても近づいています。今のところ、音声認識の点では、私たちは機械が人間と同じぐらい優れているところにいるのと同じように、私たちは - 確かに次の3 - 5年後に - これらの会話型音声の大部分が来るところに来ると思いますシステムは人間と同じくらい良いと考えられるでしょう。

MindMeldはどのようなホームオートメーションのことをしていますか?

私達は私達の技術をあらゆる種類の製品、あらゆる種類のサービス、あらゆる種類のデータドメインに適用することができます。ホームオートメーションもそのひとつです。家の中では、照明制御、サーモスタット、セキュリティシステム、オーディオシステム、ビデオシステム、これらすべてのものがあります。適切なインターフェースがあれば、どのシステムでも制御できます。

あなたはあなた自身の家の中でMindMeldにつなげることができることを何を望みますか?

Spotifyに話しかけて「Rolling Stonesプレイリストをプレイしてください」や「クラシック音楽を今晩プレイしてください」と言っているような、より高度なユースケースは…素晴らしいと思います。

あなたがあなたの声でコントロールしたいと思っていること、もっと予想外のもの、またはすぐに使えるものがありますか。

私があなたに説明したことは私が差し迫っていると思うことです。言い換えれば、これらはすぐに起こるでしょう。すぐには起こらないのは、電子レンジ、コーヒーメーカー、冷蔵庫などだと思います。こういった種類の電気器具を管理することで、基本的に次のように言うことができます。 「コーヒーメーカーの電源を入れて」準備していない場合は、戻ってきて「すみませんが、コーヒーメーカーの準備はできていません」と言うはずです。それが聖杯になるでしょう。基本的にすべての機器があなたに話しかけることができ、それができることとできないことをあなたに言うことができます。しかし、まだそこにはありません。

業界を抑制していると思いますか?

これらは現在、非常に低コストの機器です。つまり、これらはあなたがほとんど何も買えない電化製品です。 10年前、彼らはもっと多くの費用がかかりました。したがって、新機能を組み込むことは、これらのデバイスのコストを増大させるものです。結局のところ、現在の価値命題は非常に強いものです。これらの製造業者のほとんどは、非常に低コストでない限り、新機能を追加する傾向はありません。

それがその一側面だと思います。もう1つの側面は、これらの機器を接続することです。したがって、これらのデバイスを接続するには、単なる音声の使用例以上のものが必要です。それらが実行可能になる前にその接続に乗る必要があるより多くの機能があるはずです。

後者の能力に取り組んでいる会社を知っていますか?

多くの半導体会社が非常に低コストのマイクロホンアレイを開発しています。あなたが基本的に埋め込むことができる種類のもの - 非常に低コストで、ほとんどすべてのデバイスまたはアプリケーションに - それは音声入力があることを可能にするでしょう。そして、あなたはこれらの機器の隣に立っている必要はありません - あなたは10フィート先から話をすることができます。その能力を築く - それが出発点だと思います。そして、人々がマイクをデバイスに装着し始めることを可能にし、それからもう一つの高度な機能が続くだろうと私は思う。しかし、現時点では、この種のスマートコーヒーメーカー、スマート電子レンジ、または洗濯機を製造している会社はわかりません。

私たちが完全にスマートな家、完全にスマートなアパートを持っているときのためのあなたの最も良い見積もりは何ですか?

今日、私たちは実際には、人々が自動化を望んでいる、自動化が可能な、すべての重要なサブシステムを持っています。これには、ライト、サーモスタット、セキュリティシステム、ガレージドア、フロントドアロックなどがあります。これらすべてができます。問題は本当に値段の周りです。これらはまだ、それが主に初期の採用者であり、彼らにとって本当にひどいニーズを持っている人々であるところの価格水準にあります。しかし、これらのものの価格は劇的に、非常に早く下がります。私たちは、これらのサブシステムを今後数年以内にマスマーケットに投入するでしょう。

私が話した他のこと - 非常に低コストの電化製品を自動化すること - 私はそれらがおそらく早いうちに5 - 7年の期間内にあると思う。それらが現実になる前に、10年ほど経ったように。しかし、私が前に言ったように、それらは一緒になるために他の多くのことを必要とするものです。そして、それらのさまざまな成分がより早く噛み合うと、より早く起こる可能性があります。

2050年、ニューヨークやサンフランシスコのアパートはどのように見えると思いますか。

2050年!ワオ。私たちは完全にそこにいると思います。私たちがサイエンスフィクション映画で見るようなもの - あなたが家の中のすべてのシステムとほとんど話すことができて、そして声ですべてを制御することができる - 私はそれらの種類の能力が広がると思う。確かにニューヨークやサンフランシスコのような都市では。

$config[ads_kvadrat] not found