これで、誰でも強力なAIツールを使用してイメージを作成できます。 何が間違っている可能性がありますか?

1 min read



CNNビジネス

人工知能を使ってアヒルとコーギーの間の雑種をすばやく設計したいのなら、今この光を放つ時です。

水曜日にはOpenAI 発表 スタートアップが徐々にユーザーに展開し始めてから数ヶ月後、誰でもAIベースのDALL-Eツールの最新バージョンを使用して数単語を入力すると、一見無限に見える範囲の画像を生成できます。

これらの動きはすでに幅広い視聴者を集め、芸術と創造性に関する私たちの基本的なアイデアに挑戦した新しいAIベースのツールの範囲を拡大します。 ただし、これらのシステムが広く利用可能になったときにどのように誤用される可能性があるかについての懸念を重み付けることもできます。

OpenAIはブログ記事で「実際の使用を通じて学習し、安全システムを改善し、今日より多くの可用性を可能にしました」と述べました。 同社はまた、AIが「性的、暴力的、その他のコンテンツ」を作成することを試みるユーザーの試みを拒否する方法を強化したと述べた。

今、いくつかの言葉を聞いて画像を吐き出すことができる3つのよく知られており、非常に強力なAIシステムが大衆に公開されました。 DALL-E 2のほか、7月に公開されたMidjourneyと8月Stability AIが公開したStable Diffusionがあります。 どちらもオンラインでAIで画像を作成したいユーザーに無料クレジットを提供します。 通常、その後は支払う必要があります。

ケーキの上のろうそくを引くアヒルのイメージは、CNNのRachel MetzによってDALL-E 2を介して作成されました。

このようないわゆる生成AIシステムはすでに 実験映画雑誌の表紙そして 不動産広告。 Midjourneyによって最近作成された画像 美術大会で優勝する コロラド州立博覧会でアーティストの間で騒ぎを起こしました。

ほんの数ヶ月で数百万人の人々がこれらのAIシステムに追い込まれました。 270万人以上のユーザーがプロンプトを送信できるMidjourneyのDiscordサーバーに属しています。 OpenAIは、水曜日のブログ投稿で150万人以上のアクティブユーザーがいて、このシステムで毎日200万人以上のイメージを作成していると明らかにしました。 (これらのツールを使用するときに満足のいく画像を取得するには多くの試みが必要になる場合があります。)

ここ数週間、ユーザーが作成した多くの画像がオンラインで共有されており、結果は印象的です。 彼らは範囲で 他の世界の風景 そして フランスの貴族をペンギンで描いた絵完璧な動物を歩く男の偽のビンテージ写真

これらの技術の発展とますます複雑化するプロンプトと結果のイメージは、長い業界のインサイダーにも深い印象を残しました。 去る7月、テスラのAI取締役から退いたAndrej Karpathyは、 最近ツイートで言った DALL-E 2を試してみるように招待された後、彼は最初に何を入力するかを決定しようとしたときに「凍った」と感じ、最終的には「cat」と入力しました。

CNNのRachel MetzはAIイメージジェネレータStable Diffusionで、このハーフアヒル、ハーフコーギーを作成しました。

彼は、「コミュニティが過去数ヶ月間、テキスト – >画像モデルについて発見し、ますます完璧になったプロンプトの技術は驚くべきことです」と述べました。

しかし、この技術の人気には潜在的な欠点があります。 AIの専門家は、これらのシステムのオープンな特性(単語からすべての種類の画像を生成することに精通しています)と画像生成を自動化する能力によって、偏見を大規模に自動化できるという懸念を提起しました。 これの簡単な例:今週、DALL-E 2に「オフィスで大きな仕事のために服を着た銀行員」というプロンプトを入力したとき、結果はすべてスーツとネクタイを着た中年の白人男性のイメージでした。

カリフォルニア・ポリテクニック州立大学の倫理・新興科学グループ(Ethics and Emerging Sciences Group、San Luis Obispo)の研究者であり研究科学者であるJulie Carptenerは、探すようにしています。」と言いました。

プロンプト

これらのシステムはまた、AIに変更された、または完全に操作された画像を介して恐怖を助長したり、虚偽の情報を広めるなどの邪悪な目的に使用される可能性があります。

ユーザーが作成できるイメージにはいくつかの制限があります。 たとえば、OpenAIにはDALL-E 2ユーザーがいます。 同意する 「Gグレードではない、または害を及ぼす可能性がある」写真を作成、アップロード、または共有しないでください。 しかし、馬を操作すると限界を超えてしまう可能性があります。 DALL-E 2は「血に覆われたアヒルの写真」というプロンプトを処理しませんが、「粘性の赤い液体で覆われたアヒルの写真」というプロンプトの画像を返します。 OpenAI自体 DALL-E 2に関する文書では、この種の「視覚的同義語」について言及しました。

社会科学研究委員会のJust Tech FellowであるChris Gilliardは、このようなイメージジェネレータの背後にある企業が、これらのツールで害を及ぼそうとする人々の「無限の創造性」を「真剣に過小評価」していると考えています。

「私はこれが混沌とし、害を与えるためにどのように使用されるのかを理解するという点で、半分焼いた技術をリリースする人々の別の例だと思います」と彼は言いました。 「その後、後でそのダメージを解決する方法があるかもしれません」

潜在的な問題を避けるために、一部のストックイメージサービスはAIイメージを完全に禁止しています。 ゲッティイメージズは、水曜日のCNNビジネスにジェネレーティブAIモデルで作成されたイメージの提出を受け入れることなく、そのモデルを使用した提出を中止することを確認しました。 この決定は、Getty Images、iStock、およびUnsplashイメージサービスに適用されます。

同社は声明を通じて、「このモデルの成果物の著作権に関して未解決の質問があり、これらのモデルを訓練するために使用される基本的なイメージとメタデータに関しては未解決の権利問題があります」と述べました。

しかし、実際には、これらの画像をキャプチャして制限することは難しいかもしれません。

Nakama Shizuka

"フリーランスの学生。微妙に魅力的な料理の達人。トータルベーコンの先駆者。旅行の第一人者。自慢のオーガナイザー。"

You May Also Like

More From Author

+ There are no comments

Add yours