人工知能の急速な発展にもかかわらず、AIは科学の実行において人間を置き換える準備ができていません。 しかし、それは彼らが日常的な科学実験の修正された作業のいくつかを自動化するのを助けることができないという意味ではありません。 たとえば、数年前、研究者は自動化された実験室機器を制御するAIを配置し、一連の出発物質の間で発生する可能性のあるすべての反応を徹底的にリストするように教えました。
役に立つかもしれませんが、最初にシステムを訓練するにはまだ多くの研究者の介入が必要でした。 Carnegie Mellon Universityの1つのグループは、AIシステムに自分で化学を学習させる方法を見つけました。 システムには、それぞれ異なるタスクに特化した3つのAIインスタンスセットが必要です。 しかし、一度設定して原材料を供給したら、どのような反応が欲しいのかを知っておくとわかります。
AI 三位一体
研究者は、大規模言語モデル(LLM)が科学的努力にどのような能力をもたらすことができるかを理解することに興味があることを示しています。 したがって、この作業に使用されたすべてのAIシステムはLLM(主にGPT-3.5およびGPT-4)ですが、他のシステム(Claude 1.3およびFalcon-40B-Instruct)もテストされました。 (GPT-4とClaude 1.3が最も優れています。)しかし、化学のあらゆる側面を処理するために単一のシステムを使用する代わりに、研究者は労働分業の設定で協力するために別々のインスタンスを設定し、それを「Coscientist」と呼びます。呼びました。
彼らが使用した3つのシステムは次のとおりです。
Web検索者。 これには2つの主な機能があります。 1つは、Googleの検索APIを使用して、ページに含まれる情報を収集する価値のあるページを見つけることです。 2番目は、そのページを収集し、ここから情報を抽出することです。 これは、チャットGPTが後で回答を通知するために維持できる会話の前の部分のコンテキストに似ていると思います。 研究者はこのモジュールがどこで時間を費やしているかを追跡することができ、訪問した場所の約半分がウィキペディアページでした。 彼が訪問したトップ5のサイトには、アメリカ化学会(American Chemical Society)と王立化学会(Royal Society of Chemistry)が発行したジャーナルが含まれていました。
ドキュメント検索者。 これを次のように考えてください。 RTFM ケース。 AIはロボット流体ハンドラなどのさまざまなラボオートメーション機器を制御する予定であり、多くの場合、特別なコマンドやPython APIなどを介して制御されます。 このAIインスタンスには、この機器のすべてのマニュアルにアクセスでき、機器の制御方法を知ることができました。
立案者。 プランナーは他の両方のAIインスタンスにコマンドを発行して応答を処理できます。 Pythonサンドボックスにアクセスしてコードを実行し、計算を実行できます。 また、自動化されたラボ機器にアクセスでき、実際に実験を実行して分析できます。 したがって、プランナーは化学者のように振る舞い、文献で学び、機器を使って学んだことを実装する必要があるシステムの一部と考えることができます。
また、プランナーは、ソフトウェアエラーが発生した時期(Pythonスクリプトまたは自動化されたハードウェア制御の試行中)を確認して、間違いを修正することができます。
システム活用
当初、システムはアセトアミノフェン、イブプロフェンなどのいくつかの化学物質を合成するように求められ、Webおよび科学文献を検索した後、一般的に実行可能な合成を見つけることができることを確認しました。 したがって、問題は、システムが概念的な機能を機能させるのに十分にアクセスできるハードウェアを特定できるかどうかです。
簡単なものから始めるために、研究者たちは長方形の格子状に配置された小さな井戸の束を保持する標準的なサンプルプレートを使用しました。 システムは、さまざまな色の液体を使用して正方形、斜めストライプ、またはその他のパターンを埋めるように要求され、これを効果的に実行しました。
次に、彼らは井戸格子のランダムな位置に3つの異なる色の解決策を配置しました。 システムは、どの井戸がどの色であるかを識別するように求められました。 Coscientist自体はこれを行う方法を知りませんでした。 しかし、異なる色が異なる吸収スペクトルを示すことを思い出させるプロンプトが与えられると、アクセス可能な分光計を使用して異なる色を識別することができました。
基本的な命令と制御が機能しているように見える状況では、研究者はいくつかの化学を試みることにしました。 彼らは、単純な化学物質、触媒などで満たされたウェルを含むサンプルプレートを提供し、特定の化学反応を実行するように依頼しました。 Coscientistは最初からすぐに化学を得ましたが、反応を加熱し、たるんだハードウェアに誤ったコマンドを送信したため、合成を実行しようとすると失敗しました。 これにより、問題を修正して対応を実行できるように、文書化モジュールに再送信されました。
そしてそれはうまくいきました。 所望の生成物のスペクトルシグネチャーが反応混合物中に存在し、その存在はクロマトグラフィーによって確認された。
最適化
基本的な反応が働いている間、研究者はシステムに反応効率を改善するように頼んだ。 彼らは、反応収率に応じてスコアが上がるゲームで最適化プロセスを提示しました。
システムは最初のテスト反応でいくつかの誤った推測をしましたが、より良い歩留まりに急速に焦点を当てました。 研究者たちはまた、少数のランダムな開始混合物によって生成された収率に関する情報をコシエンティストに提供することによって、最初のラウンドで誤った選択を回避することができることを発見しました。 これは、Coscientistが実行されている反応や外部の情報源から情報をどこで取得するかは重要ではなく、その情報を計画に統合できることを意味します。
研究者らは、Coscientistが次のようないくつかの注目すべき機能を持っていると結論付けました。
- 公共情報を活用した化学合成企画
- 複雑なハードウェアに関する技術マニュアルの探索と処理
- 対応する知識を使用して様々な実験室機器を制御
- これらのハードウェア処理機能をラボワークフローに統合する
- 自己反応を分析し、その情報を使用して改善された反応条件を設計します。
多くの点で、これは学生が大学院の1年生で経験できる経験と似ています。 理想的には大学院生がそれ以上に発展します。 しかし、おそらくGPT-5もそうすることができます。
さらに真剣に言えば、多くの専門化されたシステムの相互作用に依存するCoscientistの構造は、脳がどのように機能するかと似ています。 明らかに、脳の特別なシステムははるかに広い範囲の活動を行うことができ、その数ははるかに多いです。 ただし、この種の構造は、より複雑な動作を可能にするために重要です。
言い換えれば、研究者たちはコスキエンティストのいくつかの能力について懸念しています。 合成が容易になるのを見たくない化学物質(神経ガスのようなもの)がたくさんあります。 そして、GPTインスタンスに何もしないように指示する方法を見つけることが継続的な課題になりました。
Nature, 2023. DOI: 10.1038/s41586-023-06792-0 (DOI情報)。
+ There are no comments
Add yours