深みのある「強化学習」は、これまで以上に新しいスキルをロボットに教えることです

$config[ads_kvadrat] not found

いろはすをãã˜ã‚Šã¾ãã‚‹ã¨è¶…強力な銃になる

いろはすをãã˜ã‚Šã¾ãã‚‹ã¨è¶…強力な銃になる
Anonim

ロボットは、スピードアップした仮想世界でタスクを完成させる方法を学び、そうでなければ数ヶ月かかるかもしれない数時間のうちにスキルを伸ばします。シミュレートされたディープ強化学習(またはディープRL)は、通常A.I.に対して55日かかるスキルを意味します。現実の世界で学ぶためには、超高速教室で一日しかかかりません。

Google DeepMindのリサーチサイエンティスト、Raia Hadsellは木曜日、ロンドンで開催されたRe-Work Deep Learning Summitで、「ロボット工学の分野でできることに本当に革命を起こす可能性がある」と述べた。 "私たちは人間レベルのスキルを学ぶことができます。"

ロボットの要点は確かにプログラマーが自分たちに何かをするように教えることができるので、直感に反するかもしれませんね。しかし、現実の世界で動作する機械を設計するときには、ロボットは、なじみのない状況でタスクを実行する方法を理解するために大量のデータを必要とします。 A.I.このデータを使用して、以前に発生したすべてのインスタンスに基づいてスキルを「習得」できます。

深層強化学習では、人間が学ぶ方法と同じようにそのデータを収集します。ロボットは、ボールを捕まえるなどのタスクを繰り返し実行し、そのデータを記録して新しい状況でボールを捕らえる方法を示します。 2013年にDeepMindがAtariのゲームをマスターする方法をロボットに教えるために使用したとき、画面の前に座って最終目標を設定するだけで、科学界はそれを気に入っていました。

問題は、これは永遠にかかることです。ロボットにボールを繰り返し投げかける必要があります。アタリの場合は、ロボットを寝室にしばらく置いておきます。 MuJoCoシミュレーションをプログレッシブニューラルネットワークと組み合わせて実行すると、トレーナーはロボットを模倣するプログラムを実行し、学習した行動をロボットに転送し、仮想の動きを現実の世界にマッピングすることができます。

「これらのシミュレータは一日中、一晩中実行できます」とHadsell氏は言います。

結果は彼ら自身のために話す。キャッチすることで卒業証書を得たこのロボットは、まるで本物のボールであるかのように仮想ボールを追うことができます。

$config[ads_kvadrat] not found