技術

アクセントを変えるアプリを作っています。

彼らにとっては意味がありませんでした。 彼は英語とスペイン語に堪能で、とてもフレンドリーで、システムエンジニアリングの専門家でした。 彼はなぜコールセンターの仕事に耐えられなかったのですか?

彼のイントネーションは、多くの顧客が彼を理解しにくくしたと彼は言った。 何人かの人々は彼の言い訳のために侮辱を与えました。

3人の学生は、問題が友人の経験よりもはるかに大きいことに気づきました。 だから彼らはそれを解決するためにスタートアップを設立しました。

今、彼らのSanasはリアルタイムで人々のイントネーションを変えることによって誤ったコミュニケーションを取り除くことを目指している人工知能ベースのソフトウェアをテストしています。 たとえば、フィリピンのコールセンターのスタッフは、マイクに向かって普通に話すことができ、最終的にはカンザスでもう一方の顧客に聞こえるかもしれません。

コールセンターはスタートアップの創設者が話す始まりに過ぎません。 同社のウェブサイトは「Speech, Reimagined」という計画を宣伝しています。

結局、彼らは開発中のアプリです さまざまな産業や個人が使用します。 医師は患者をよりよく理解するか、孫が祖父母をよりよく理解するのを助けることができると言います。

最高経営責任者(CEO)のマキシム・セレブリアコフ氏は、「私たちはサナスにとって非常に寂しいビジョンを持っています。

そしてSerebryakovと彼の共同創設者にとって、このプロジェクトは個人的なものです。

人々の「声はアクセントほど聞こえない」

Sanasを設立した3人はスタンフォード大学で出会いましたが、もともとは他の国から来ました。 現在CEOであるSerebryakovはロシア出身です。 現在、最高財務責任者であるAndrésPérezSoderiはベネズエラ出身です。 現在、最高技術責任者であるShawn Zhangは中国出身です。

彼らはもはやスタンフォードの学生ではありません。 SerebryakovとPérezは卒業しました。 ZhangはSanasに命を吹き込むことに集中するために自退しました。

彼らは昨年会社を設立し、「私たちのグローバル使命を強調し、人々をより近づけるために」さまざまな言語で簡単に発音できる名前を付けたとPérezは言います。

長年にわたり、3人ともアクセントが邪魔になる方法を経験したと言います。

「私たちは皆、国際的な背景から来ました。私たちは、あなたが言う方法のために人々があなたをどのように異なって扱うのかを直接見ました」とSerebryakovは言います。 「時には胸が痛い」

Zhangは、20年以上前に中国からアメリカに渡ってきた母親が恥ずかしく、一緒に食料品の買い物に行くときに計算員と話すように言います。

「それが私がMaxとAndrésと一緒にこの会社を設立した理由の1つです。彼らの声がイントネーションほどよく聞こえないと思う人を助けるよう努めています」と彼は言います。

Serebryakovは、両親がアメリカを訪れたときにホテルでどのように扱われるか、つまり人々が自分のイントネーションを聞くときに推測する方法を見たと言います。

「彼らはもう少し大きく言います。彼らは行動を変えます」と彼は言います。

Pérezは、イギリスの学校に通ってからアメリカに到着したとき、最初はアメリカのイントネーションを理解するのが難しいと言いました。

そして、彼の父親が彼の家族がクリスマスに彼に与えたAmazon Alexaを使用しようとしたときに何が起こっているのかを始めないでください。

Pérezは、「Alexaが家の中のランダムな場所に火をつけてピンク色にするとき、Alexaが父親のイントネーションをまったく理解していないことをすぐに見つけました」と言います。

コールセンターが技術をテストしています。

英語はt彼は世界で最も広く使われている言語。 約15億人の人々がこの言語を使用し、ほとんどはネイティブスピーカーではありません。 アメリカで数百万人の人々が英語を第二外国語として使用しています。

これにより、ユーザーが英語の発音を練習するのに役立つアプリ市場が成長しています。 しかし、SanasはAIを使用して異なるアプローチを取っています。

前提:言葉を異なって発音する方法を学ぶのではなく、スキルがあなたのためにそうすることができます。 もはやコストがかかり、時間がかかるアクセント低減トレーニングは必要ありません。 そして理解はほぼ即座になります。

Serebryakovは、人々のイントネーションとアイデンティティが密接につながることができることを知っており、会社がイントネーションを消去しようとしないこと、またはある方法が他の方法よりも優れていることを示唆していると強調しています。

「私たちは人々がポジションを維持するために言う方法を変える必要はありません。アイデンティティとイントネーションは非常に重要です。 「あなたは誰かが誰かを満足させるためにイントネーションを変えることを決して望んでいません.」

現在、Sanasのアルゴリズムは英語をアメリカ、オーストラリア、イギリス、フィリピン、インド、スペインのアクセントに変換することができ、チームはさらに追加する予定です。 彼らはプロの俳優のオーディオ録音や他のデータでニューラルネットワークを訓練することによってシステムに新しいアクセントを追加することができます。 このプロセスには数週間かかります。

SanasチームはCNNのために2つのデモンストレーションをしました。 一つは、インドのアクセントを持つ男が一連の文学的文章を読む音を聞きます。 その後、同じフレーズがアメリカのイントネーションに変換されます。

別の例では、「氏名と注文番号を教えてください。すぐに修正を開始できます。」

アメリカのイントネーションの結果は、SiriやAlexaのような仮想秘書の声のようにやや人工的で不適切に聞こえますが、Pérezはチームがスキルの向上に取り組んでいると言います。

「イントネーションは変わりますが、イントネーションは維持されます」と彼は言います。 「私たちは、結果をできるだけ自然で感動的でエキサイティングにする方法を研究し続けています。」

この手法を使用したコールセンターの最初のフィードバックは肯定的だったとPérezは言います。 彼らのベンチャーについての噂が広がるにつれて、ウェブサイトにコメントが提出されました。

スタートアップの創設者が未来を見る方法

これにより、Sanasは従業員を増やすことができました。 カリフォルニア州パロアルトに本社を置く同社の従業員の多くは多国籍の背景から来ました。 そしてそれは偶然ではないとSerebryakovは言います。

「私たちが作っていることは、私たちが雇った人々を含む、あまりにも多くの人々の共感を得ました。

会社が成長している間、Sanasがアプリストアに表示されるか、近くの携帯電話に表示されるまでにはまだ時間がかかることがあります。

チームは現在、大規模なコールセンターのアウトソーシング会社と協力しており、個々のユーザーにとってより遅いロールアウトを選択することで、技術を向上させ、セキュリティを確保できると述べています。

この画面キャプチャは、ユーザーがSanasデスクトップアプリで見るものを示しています。

しかし、結局のところ、彼らはSanasを必要とする誰もが他の分野でも使用できることを願っています。

Pérezは、人々が医師とのコミュニケーションに重要な役割を果たしていると考えています。

「時間の喪失や誤ったメッセージによって誤解によって失われるすべての瞬間は、潜在的に非常に、非常に影響力があります」と彼は言います。 「翻訳で損失がないことを確認したい」

彼はいつか人々が言語を学び、映画のダビングを改善し、家庭のスマートスピーカーと車の声秘書が他のイントネーションを理解するのを助けることができると言います。

そして英語だけでなく、Sanasチームはアルゴリズムに他の言語を追加したいと考えています。

3人の共同創設者はまだ細部に取り組んでいます。 しかし、この技術がどのようにして将来より良いコミュニケーションを生み出すことができるのかは理解しやすいものの1つです。

READ  ベストバイフラッシュセール、プライムデーと競争:4K TV、サウンドバーおよびその他の土曜日特価

Nakama Shizuka

"フリーランスの学生。微妙に魅力的な料理の達人。トータルベーコンの先駆者。旅行の第一人者。自慢のオーガナイザー。"

Related Articles

コメントを残す

メールアドレスが公開されることはありません。 * が付いている欄は必須項目です

Back to top button
Close
Close