NvidiaからこのAIニューラルネットワークは写実的な偽の画像を作成します

$config[ads_kvadrat] not found

もしも...

もしも...
Anonim

一見すると、上の写真は普通の通りの普通の写真のように見えます。ダッシュカムから、あるいはそのような平凡なシーンの写真を撮るのに十分なほど馬鹿げた誰かから撮られたものです。

しかし、もう少し詳しく見てください。交通信号がわずかに歪んでいるのか、車の中にはぼやけて見えるのかに注目してください。ここに何か問題があります。これは写真ではありません。それは完全にA.I.によって作成された画像です。

ハイテク企業Nvidiaとカリフォルニア大学バークレー校のコンピュータ科学者は、arXivのプレプリントで入手可能な研究論文を執筆し、現実的なストリートイメージと人物像を生成するためのニューラルネットワークの入手方法を詳しく説明しました。彼らはさらにあなたが余分な葉を追加することによってさえ天気を変えることによってあなたが望む写真を微調整することを可能にするユーザーインターフェースを含んだ。

Nvidiaの上級科学者であるMing​​-Yu Liuは、次のように述べています。 逆 メールで。 「ただし、仮想世界の構築には今日のテクノロジを使用すると費用がかかります。なぜなら、アーティストは自分が構築している世界のテクスチャと照明を明示的にモデル化してシミュレーションする必要があるからです。画像から画像への変換では、実世界をサンプリングして仮想世界を作成することができます。」

ニューラルネットワークは、情報を取り込み、それを適用し、その結果から学習することによって、人間の脳のように機能するようにモデル化されたコンピュータです。この研究では、2014年にIan Goodfellowによって導入された特別な種類のニューラルネットを使用しました。これは一般的にジェネレータと弁別器の2つのネットワークからなる生成型敵対的ネットワーク(GAN)です。

発電機は写真を与えられ、それが与えられたものと同様の合成画像を作り出し始めます。それはそれからそれが与えられたイメージと弁別器への偽物の混合を示しています。そして、その仕事はそれらを区別することです。このプロセスが進行するにつれて、ジェネレータは元の画像を模倣するのがより良くなり、弁別器は偽造物を区別するのがより良くなる。結果は、かなり説得力のある、そして全く偽の写真です。

この研究は、ジェネレーターネットワークとディスクリミネーターネットワークをいくつかのサブネットワークに分割し、より高解像度の画像を出力できるようにすることで、従来のGANモデルに基づいています。ニューラルネットワークはまた、セマンティックマップ、または写真がどのように見えるかについての青写真を取り入れて、自律的にテクスチャを埋めることができます。ストリートビューで木の代わりに建物を追加したり、ポートレートで目を広くしたりしたい場合、ユーザーは青写真に入って物事を変更することさえできます。

この論文はこの結果をこの方法を用いて行った同様の実験と比較している。最も注目すべきものはpix2pixである。 NvidiaとUC Berkeleyの調査では、読みやすいナンバープレートのように小さくて正確な細部の画像を生成することができ、pix2pixは水彩画のように見える画像を出力します。

このツールを使用して、数枚の珍しい写真を使って無料のredditカルマを獲得することはできますが、著者はこのアプローチを利用して単純な青写真でリアルなグラフィックを生成することに大きな可能性を見出します。

何百時間もの骨の折れる労力が、Googleマップ、映画、ビデオゲームで使用するための仮想世界の生成に費やされています。 Liu氏は、このモデルはほとんどの設計を簡単に実行してから詳細を調整する方法として役立つ可能性があると述べています。

「明示的にモデリングして世界をレンダリングするのではなく、画像から画像への変換を使用して、テクスチャや照明を含まない世界の単純なモデルと写実的な出力との間で変換して暗黙的に世界を構築できます。 。この機能により、仮想世界を構築することがはるかに安価になるはずです」と彼は言います。 逆.

この研究の次のステップでは、チームはビデオからビデオへの翻訳を探求したいと考えています。これはニューラルネットを使ってリアルなビデオを作成するものです。 Luiが言う目標は、この分野の研究者に挑戦しています。

これで、偽の画像を簡単に作成できることがわかりました。 Googleの画像に表示されるものすべてを信頼しないでください。

$config[ads_kvadrat] not found