マルチアームバンディットがオンラインで見る広告とストーリーをどのように決定するか

$config[ads_kvadrat] not found

ACQUAのじかん12月19日予告ムービー

ACQUAのじかん12月19日予告ムービー
Anonim

あなたがギャンブラーで、いくつかのスロットマシンの前に立っていると想像してください。あなたの目標はあなたの賞金を最大化することですが、あなたは実際に各マシンによって提供される潜在的な報酬について何も知りません。あなたは、しかし、あなたはあなたが引くレバーとあなたがそうする頻度はあなたのギャンブル暴動の結果に影響を与えることを理解しています。

このシナリオは、ラスベガスやアトランティックシティを訪れる人々が毎日直面している状況で、「マルチアームバンディット」と呼ばれる古典的な論理パズルです。スロットマシンは「ワンアーム」と呼ばれます。なぜなら彼らは1つのレバーを持ち、人々のお金を奪うからである。マルチアームバンディットの状況に対処するための正しい方法は1つもありません - 最も近い候補はGittinsインデックスです - あなたがオンラインに行くとき毎日登録せずに見るこれらの問題に取り組むための戦略的アプローチがあります。 GoogleやWebサイトでのコンテンツの表示方法を管理する多くのアルゴリズムは、MAB戦略に基づいて構築されています。ほとんどすべての場合の目標は、学習と結果を結びつけ、両方の可能性を最大化することです。

マルチアームバンディットアプローチはによって使用されます ワシントンポスト どの写真や見出しがクリックされる可能性が最も高いかを判断し、ワイヤレスネットワークを使用して、最適な省エネルートのうちどれが最適かを判断します。これらの企業や他の多くの企業にとって、MBAアプローチから生まれたアルゴリズムは非常に重要です。これらの企業は基本的に、いつどの広告をオンラインで表示するかを決定するからです。

人々を見せるためにどの広告を表示するかを決定することは、オンラインのものをクリックすることをまわりで走っている非常に多くの片腕強盗があるので、挑戦的な問題です。広告用のMABアルゴリズムは通常、有限期間にわたって適用される急速に変化する「致命的なマルチアームバンディット問題」を使用します。交通データは、ますます効果的な方法論を開発するために使用されています。

MABを正確な目的に結び付けることは困難です。式のバリエーションを数多く作成することが可能だからです。たとえば、K武装した盗賊は、期待される最高の報酬を得るために競争する「武器」を持っています。盗賊の状況依存化も同じですが、「ユーザーに以前に収集されたデータ」と「専門家の助言」を使用します。また、Web対応の「ILOVETOCONBANDITS」は事前に指定されたラウンドのスケジュールでのみ機能します。対照的に、古典的なMABアプローチは可能な副次的情報を持たず、結果は選択された行動の可能性にのみ依存します。

MABの最も有用なアプリケーションはこれまでのところインターネットに関連しているように思われますが、研究者はそれらを「実生活」(別名ミートスペース)シナリオに適用する方法を見つけることに向けて取り組んでいます。 2015年の論文で、ブリティッシュコロンビア大学の研究者らはMABの医療試験への適用を検討しています。ここでMABが可能であると判明した場合の目標は、MABアルゴリズムが特定の薬の効果を測定できることです。明らかな問題は、これをコンピュータで変調したものを作成できなければ、この方法では時間がかかりすぎるということです。 MABデザインを臨床試験に含めることはできません。

そのアイデアは素晴らしいですが、現時点では実現不可能です。将来がやってくるまでは、ポップアップ広告をクリックしてやろうとしているときには、マルチアームの盗賊が現れるのが大好きです。

$config[ads_kvadrat] not found