Googleのチェス実験でAIのパフォーマンスを向上させる方法がわかりました。

1 min read

彼のグループは学ぶことにした。 彼らは、さまざまな状況で独立して訓練する複数のAIシステムを含む新しい、さまざまなバージョンのAlphaZeroを構築しました。 システム全体を管理するアルゴリズムは、一種の仮想仲介機として機能する、とZahavyは言いました。 つまり、移動時にどのエージェントが成功する可能性が最も高いかを識別するように設計されたアルゴリズムです。 彼と彼の同僚はまた、「多様性ボーナス」をコーディングしました。 これは、システムがさまざまな選択肢から戦略を引き出すたびにシステムに対する報酬です。

チェスの彫刻

新しいシステムが独自のゲームを実行するように設定されたとき、チームは多くの多様性を観察しました。 様々なAIプレーヤーは、新しく効果的なオープニング、キャスリングの時期や場所などの特定の戦略について、斬新で健全な決定を試しました。 ほとんどの試合でオリジナルのAlphaZeroに勝ちました。 チームはまた、さまざまなバージョンがオリジナルよりも2倍のチャレンジパズルを解くことができ、ペンローズパズル全体のカタログの半分以上を解くことができることを発見しました。

「アイデアは、どのプレイヤーも勝つことができる1つのソリューションまたは単一のポリシーを見つけるのではなく、ここで [it uses] 創造的な多様性のアイデアです。」とCullyは言いました。

Zahavyはより多くのさまざまなゲームにアクセスできるため、多角化されたAlphaZeroは困難な状況が発生したときにより多くのオプションを持つことができると述べました。 「あなたが見るゲームの種類を制御できれば、基本的にそれがどのように一般化されるかも制御できます」と彼は言いました。 これらの奇妙な暗黙の補償(および関連する行動)は、さまざまな行動の強みになる可能性があります。 その後、システムは、異なるアプローチを評価し、価値を付与し、いつ最も成功したかを確認する方法を学ぶことができます。 「私たちは、このエージェントグループが実際にこれらの立場に合意できることを発見しました。」

そして決定的にその意味はチェスを超えて拡張されます。

実生活の創造性

Cullyは、さまざまなアプローチが強化学習ベースのAIシステムだけでなく、すべてのAIシステムにも役立つと述べています。 彼は長い間多様性を使って物理システムを訓練してきました。 6脚のロボット 意図的に「怪我」をする前に、さまざまな種類の動きを探索することができ、以前に開発した技術のいくつかを使用して動き続けることができました。 「私たちは、これまでに見つけたすべての以前のソリューションとは異なるソリューションを見つけようとしました。」 近年、研究者と協力して多様性を活かし、有望な新薬候補を特定し、効果的な株式取引戦略を策定しています。

Cullyは、「すべてのソリューションが、次のソリューションとは非常に異なる潜在的に数千の異なるソリューションの大規模なコレクションを作成することを目的としています」と述べました。 したがって、さまざまなチェスプレーヤーが方法を学んだように、あらゆる種類の問題に対してシステム全体が可能な最良のソリューションを選択できます。 彼はZahavyのAIシステムが「さまざまな戦略を探すことが固定観念から外れ、解決策を見つけるのにどのように役立つか」を明確に示していると述べた。

Zahavyは、AIシステムが創造的に考えるには、研究者がより多くの選択肢を検討する必要があると疑います。 この仮説は、人間と機械の間の興味深い関連性を示唆しています。 たぶん、知能は計算能力の問題だけです。 AIシステムの場合、創造性は十分に大きいオプションのビュッフェで考慮し、選択する能力に帰結することができます。 システムがさまざまな最適な戦略を選択することで報酬を得ることで、これらの創造的な問題解決能力は強化され強化されます。 最終的に理論的には、人間が創造的であると認識するあらゆる種類のトラブルシューティング戦略を模倣することができます。 創造性は計算上の問題になります。

Liemhetcharatは、様々なAIシステムが機械学習の広範な一般化問題を完全に解決することはできないと指摘した。 しかし、それは正しい方向に進むステップです。 「欠点の1つを軽減しています」と彼女は言いました。

より実質的にZahavyの結果は、協力がどのように人間の困難な仕事のより良い成果をもたらすことができるかを示す最近の努力と共感しています。 ビルボード100リストに掲載されたヒット曲のほとんどは、個人ではなく作曲家チームが作曲したものです。 そしてまだ改善の余地があります。 さまざまなアプローチは一般的なシステムよりはるかに多くの可能性を考慮する必要があるため、現在の計算コストがかかります。 Zahavyはまた、さまざまなAlphaZeroが可能性の全スペクトルを捉えるとは確信していません。

「私はまだ [think] 他の解決策を見つける余地がある」と話した。 「世界のすべてのデータを考えると、どれが存在するのかわかりません。 [only] すべての質問に対する答えは一つです。」


オリジナルストーリー の許可を得て再印刷されました。 カンタマガジン編集上独立した出版物 シモンズ財団 数学、物理科学、生命科学の分野における研究の発展と動向を扱いながら、科学に対する大衆の理解を高めることを使命としています。

Nakama Shizuka

"フリーランスの学生。微妙に魅力的な料理の達人。トータルベーコンの先駆者。旅行の第一人者。自慢のオーガナイザー。"

You May Also Like

More From Author

+ There are no comments

Add yours