ChatGPTは、テスト中に予期せずユーザーの複製音声で話し始めました。

木曜日にOpenAIは「システムカードChatGPTの新しいGPT-4o AIモデルのモデル制限と安全テスト手順について詳しく説明します。現在のところ、OpenAIはこのような事態を避けるための保護を備えていますが、このケースは小さなクリップですべての音声を模倣できるAIチャットボットを安全に設計する上でますます複雑になることを反映しています。

高度な音声モードは、ユーザーがAI秘書と音声で会話できるようにするChatGPTの機能です。

「許可されていない音声生成」というタイトルのGPT-4oシステムカードセクションでは、OpenAIは、騒々しい入力のためにモデルが突然ユーザーの音声を模倣するようになったエピソードを詳細に説明しています. OpenAIは、「音声生成は、ChatGPTの高度な音声モードに音声を生成する機能を使用するなど、敵対的でない状況でも発生する可能性があります」と述べました。「テスト中に、モデルが意図せずにユーザーの音声を模倣する出力を生成するまれなケースも観察しました.」

OpenAIが提供する意図しない音声生成のこの例では、AIモデルは「いいえ！」と叫び、クリップの冒頭で聞いた「赤いチームメイト」に似た声で文を続けます。（赤チームメンバーは、敵対的なテストを行うために会社に雇われた人です。）

機械と会話した後、突然機械があなたの声で話すと、明らかに不気味になります。一般に、OpenAIはこれを防ぐための保護装置を備えているため、同社はこれを完全に防止する方法を開発する前にも、このようなことはまれであると述べています。しかし、このケースはBuzzFeedデータサイエンティストMax Wolf つぶやき「OpenAIは今、Black Mirrorの次のシーズンプロットを流出しました」

オーディオプロンプトインジェクション

OpenAIの新しいモデルで音声模倣がどのように起こるのでしょうか？最も重要な手がかりはGPT-4oシステムカードの他の場所にあります。音声を作成するために、GPT-4oは音響効果や音楽を含むトレーニングデータに見られるほとんどすべての種類のサウンドを合成できるようです（OpenAIは特別なガイドラインでこの動作を抑制します）。

システムカードに示すように、このモデルは基本的に短いオーディオクリップに基づいてすべての音声を模倣できます。 OpenAIは、模倣するように指示された承認された音声サンプル（雇用された声優の声）を提供して、この機能を安全に案内します。会話の開始時にAIモデルのシステムプロンプト（OpenAIの「システムメッセージ」と呼ばれる）にサンプルを提供します。 OpenAIは、「システムメッセージの音声サンプルを基本音声として使用して、理想的な完成を監督します」と書いています。

テキストのみのLLMでは、システムメッセージiチャットセッションの開始直前にチャット履歴に自動的に追加されるチャットボットの動作を案内する一連の隠されたテキストガイドライン。連続した対話は同じチャット履歴に追加され、ユーザーが新しい入力を提供するたびに、コンテキスト全体（しばしば「コンテキストウィンドウ」と呼ばれる）がAIモデルに戻ります。

（2023年初めに作成した図を更新する時が来たようですが、AIチャットでコンテキストウィンドウがどのように機能するかを示しています。最初のプロンプトが「あなたは役に立つチャットボットです。システムメッセージだと想像してください。）

大きくする / GPT対話型言語モデルのプロンプトがどのように機能するかを示す図。

ベンジ・エドワーズ / Ars Technica

GPT-4oはマルチモーダルでトークン化されたオーディオを処理できるため、OpenAIはモデルのシステムプロンプトの一部としてオーディオ入力を使用することもできます。。同社はまた、モデルが承認されていないオーディオを生成するかどうかを検出するために他のシステムを使用しています。 OpenAIは、「私たちはモデルが特定の事前に選択された音声のみを使用することを許可します」と書いて、「そして出力分類器を使用して、モデルがそれから外れているかどうかを検出します」と言います。

Breaking News

都心部を探索：ストレスフリーな冒険のための旅行者ガイド

キャンプ料理を楽しもう！おすすめ調理器具と使い方ガイド

レイ・ダリオ、中国経済が1990年代に日本と同じくらい深刻な問題を経験することを懸念

研究者が発見した過去最大のブラックホールジェット

日本アメリカフィジーラグビー|国のスポーツ

3Dモデルマニアが投稿したNintendo Switch 2デザイン、インターネットで話題

イスラエル、レバノン全域でヘズボラ装備爆発で戦争の「新時代」開始宣言

ChatGPTは、テスト中に予期せずユーザーの複製音声で話し始めました。

オーディオプロンプトインジェクション

More From Author

3Dモデルマニアが投稿したNintendo Switch 2デザイン、インターネットで話題

AUKUS、カナダ、日本、ニュージーランド、防衛技術について議論

AUKUS提携により、日本、韓国、カナダ、ニュージーランドとの技術共有範囲を拡大

+ There are no comments

コメントをキャンセル

Kyle Dakeは74kgフリースタイルレスリング準決勝で日本のDaichi Takataniに敗れ、銅メダルをめぐって競争する予定です。

ドワイト・ラモス、日本Bリーグ選手団の主張で活躍する準備完了

You May Also Like:

都心部を探索：ストレスフリーな冒険のための旅行者ガイド

キャンプ料理を楽しもう！おすすめ調理器具と使い方ガイド

レイ・ダリオ、中国経済が1990年代に日本と同じくらい深刻な問題を経験することを懸念

研究者が発見した過去最大のブラックホールジェット

日本アメリカフィジーラグビー|国のスポーツ

3Dモデルマニアが投稿したNintendo Switch 2デザイン、インターネットで話題