iPad AI教師のデモは、学生に驚くべき新世界を提示します

1 min read

まだしていない場合 見た 昨日のOpenAIイベントがあるので、ぜひ参加してみてください。 ヘッドラインニュースは、最新のGPT-4oモデルがテキスト、オーディオ、ビデオのすべての組み合わせとシームレスに動作することでした。

これには、他のアプリで撮影している画面をGPT-4oアプリに「表示」する機能が含まれます。 これは、会社がかなりクレイジーなiPad AI教師のデモを通して紹介した機能です。

GPT-4o

OpenAIは「o」が「omni」を意味すると言いました。

GPT-4o(「オムニ」を意味する「o」)は、はるかに自然な人間とコンピュータの相互作用に向けた一歩です。 テキスト、オーディオ、画像のすべての組み合わせを入力として受け入れ、テキスト、オーディオ、画像出力の組み合わせを生成します。

232ミリ秒以内にオーディオ入力に応答でき、平均320ミリ秒かかります。 これは会話の人間の応答時間(新しいウィンドウで開きます)に似ています。 […] GPT-4oは、特に従来モデルに比べて視覚的・聴覚的理解度が優れています。

これの声の側面でさえ大きな問題です。 以前は、ChatGPTは音声入力を許可していましたが、作業する前にそれをテキストに変換しました。 対照的に、GPT-4oは実際に音声を理解しているので、変換ステップを完全にスキップします。

昨日述べたように、無料ユーザーは、以前に有料加入者に限定されていた多くの機能も提供します。

AI iPadチューターデモ

OpenAIがデモンストレーションした機能の1つは、iPad画面(分割画面モード)で実行されている作業を見ることができるGPT-4oの機能でした。

この例は、数学の問題がある学生を教えるAIを示​​しています。 最初はGPT-4oが問題を理解し、すぐに解決したいと聞きました。 しかし、新しいモデルが中断される可能性があり、その場合は学生が自分で解決するのを手伝ってもらうよう依頼しました。

ここで見ることができるもう1つの機能は、モデルが音声で感情を検出し、感情自体を表現することもできると主張することです。 私の好みによると、デモ版ではこれがやや誇張され、ここに反映されています。 AIはおそらく少し傲慢な方でしょう。 しかし、それはすべて調整可能です。

実際、世界中のすべての学生は、この種の能力を持つ個人の教師を持つことができます。

Appleはこのうちどれくらいの部分を統合する予定ですか?

私たちは、AIがiOS 18の主な焦点であり、AppleデバイスにOpenAI機能を提供するための契約を締結していることを知っています。 当時はChatGPTのためのものとして説明されていましたが、今では実際の取引がGPT-4oへのアクセスである可能性が非常に高いです。

しかし、私たちは、Appleが独自のチップを実行する独自のデータセンターを介して独自のAIモデルを開発してきたことも知っています。 たとえば、Apple は次のような作業を行ってきました。 所有する Siriがアプリの画面を理解できるようにする方法です。

だから私たちは会社がデバイスにどのGPT-4o機能を提供するのか正確にはわかりませんが、この機能はAppleと完全に同等であると考えるべきです。 これは人々に力を与えるために技術を使用することです。

ビデオ: オープンAIBenjamin Mayoがこのレポートに貢献しました。

FTC: 私達は収入を作成する自動アフィリエイトリンクを使用します。 もっと。

READ  Apple PayはすぐにBARTとMuniで動作します - TechCrunch
Nakama Shizuka

"フリーランスの学生。微妙に魅力的な料理の達人。トータルベーコンの先駆者。旅行の第一人者。自慢のオーガナイザー。"

You May Also Like

More From Author

+ There are no comments

Add yours