昨年この頃、ソーシャルメディアはMyHeritageのバイラル「Deep Nostalgia」技術で熱くなった。 この技術のAIウィザードは、私たちの古い家族の写真に衝撃的な事実感を吹き込みました。 もちろん、あなたがそれを恐れている場合は、リリースされたばかりの新機能が表示されるのを待ちます。 ライブストーリー。
今回は、オンライン系譜会社の技術が親戚の古い写真に基づいて小さな10-20クリップを作成することではありません。 代わりに、LiveStoryは、リップシンクオーディオと古い写真のスライドショーで完成した祖先の人生全体の物語を、より長いアニメーションビデオとして作成します。
以前と同様に、親戚の顔写真をアニメーション化するAIベースの「再演」技術を使用して動作します。 ただし、今回はMyHeritage家系図から自動的に作成したり、ユーザーが手動で入力したオーディオも取得できます。 これにより、テキスト音声変換(TTS)技術がストーリーを鮮やかに伝え、オーディオが親戚のアニメストーリーの頭と同期します。
どのように動作しますか?
昨年の「Deep Nostalgia」テクノロジと同様に、LiveStoryのアニメーションは、多くの「ドライバビデオ」セットを使用して作成されます。 サービスのアルゴリズムがアップロードした写真を分析すると、その注目すべき特徴や顔の「ランドマーク」がドライバービデオにマッピングされ、動きの印象を作ります。 アルゴリズムは欠けている詳細も埋めます。 合成音声ジェネレータは、その人のプロフィールに関する情報に基づいてナレーションを生成したり、最初から独自のテキストを生成したりすることもできます。 独自のオーディオ録音をアップロードすることもできます。
テクノロジーを作成しライセンスを提供するイスラエルの会社であるMyHeritageとD-IDは、最終結果を完全にカスタマイズすることができ、家族やソーシャルメディアに送信する前に物語、写真、音声を変更する機能を提供すると言います。 LiveStoryは、さまざまな男性と女性の音声オプションと組み合わせて、31の言語、数十の方言、数百の音声ペルソナをサポートしているようです。
そのすべてにもかかわらず、この技術が少し不気味で、私たちを不愉快な谷でより大きな旅行に連れて行くことは間違いありません。 場合によっては、オーディオを追加するには時間がかかりすぎる可能性があり、MyHeritageは技術を乱用しないようにいくつかの免責事項を追加する必要がありました。 LiveStoryは「死者、一般に自分の祖先の写真にのみ使用するようになっている」とし、「生きている人の写真に許可なく使用してはならない」と明示されています。
それにもかかわらず、ソーシャルメディアの多くは、昨年の「Deep Nostalgia」の技術が、実際の生活で一度も見たことのない関係を事実上「会う」慰めになったり、心温まる方法であることを知りました。 この機能と同様に、LiveStoryは現在デスクトップ、モバイルWeb(両方 マイヘリテージサイト)とMyHeritageモバイルアプリから。 無料で複数のLiveStoriesを作成できますが、その後は購読料を支払う必要があります(年間$ 119 / £ 89)。
分析:不愉快な谷へのより大胆なステップ
昨年の「Deep Nostalgia」のように、私たちはMyHeritageの新しい「LiveStory」機能について少し引き裂かれました。 この技術が魅力的であることには疑いがなく、写真、家系図、一部のテキストで自動的に90秒のビデオ転記を生成できるという事実が印象的でありながらもひどいです。
しかし、私たちは技術の以前のバイラル成功(1億のアニメーションで帰結)のかなりの部分が微妙さに起因したことを感じることはできません。 「Deep Nostalgia」が生み出す生き生きとした顔は、時々頭を点滅させたり傾いたりしたが、それがすべてだった。 この拘束は技術の限界を覆いながら幻想を作るのに役立った。
オーディオを追加することは論理的なステップであり、私たちはこれが否定できないクリープ要素から喪失を得ることができない人々にとって人気のあるツールであることを証明することに疑問はありません。 しかし、私たちが今まで見た例では、イントネーションは時々ロボットであり、声が元の人からサンプリングされていないという事実のために少し人為的すぎます。
今は、LiveStoryが博物館や教育にもっと適していると感じています。 歴史的人物(個人関係より)に命を吹き込む機能が、訪問者と子供たちに歴史をより魅力的にする有用な方法であることを証明することができます。
もちろん、誤用の可能性もありますが、D-ID(技術メーカー)は、このようなことが発生しないようにガードレールを作成しました。 すべてのユーザーは、LiveStoryを作成する前に生きている人には使用しないという約束を含む条件に同意する必要があります。 侮辱的、名誉毀損、偽情報の有無を確認するためのテキスト調停アルゴリズムも搭載されていますが、後者の確認方法は不明です。
いつ 昨年の独占インタビューでD-IDと話しました。我々は、AI技術が邪悪な方法で使用されないことを約束に感銘を受けましたが、インターネットで見るほとんどの視覚メディアが「5〜10年以内に合成」になるという予測に少し当惑しました。 LiveStoryは、「Deep Nostalgia」が昨年の口コミに乗ったほど大きな人気を集めなかった場合、明らかに別のステップです。
+ There are no comments
Add yours