Stability AI、日本語StableLM Alpha公開:日本語モデルの飛躍

1 min read

Stable Diffusionの先駆的な生成AI会社であるStability AIは、日本の生成AI環境を改善するための重要な進展で、日本StableLM Alphaとして知られる最初の日本語言語モデル(LM)を発売しました。 この記念碑的な発売は、同社が自社のLMが日本語ユーザーを対象とする最も上手な公開モデルであると主張して注目を集めました。 この主張は、他の4つの日本LMの包括的なベンチマーク評価で証明されています。

70億パラメータの印象的なアーキテクチャを誇るこの新しく導入された日本のStableLM Alphaは、技術発展に対するStability AIの約束を証します。 このモデルは、さまざまな言語操作のための多目的高性能ツールです。 さまざまなカテゴリーで同時代の製品を抜いて業界のリーダーとして位置づけました。

日本のStableLM Base Alpha 7Bの商用バージョンは、広く知られているApache License 2.0に従ってリリースされる予定です。 この特別なモデルは、オンラインリポジトリから慎重にインポートされた日本語と英語のテキストの7,500億トークンを含む膨大なデータセットの広範なトレーニングを通じて慎重に構築されています。

この成果の基礎も共同努力のおかげです。 Stability AIは、EleutherAI Polyglotプロジェクトの日本チームの専門知識を活用して、Stability AIの日本コミュニティによって作成されたデータセットを完成しました。 Stability AI の開発プロセスの基礎となる EleutherAI の GPT-NeoX ソフトウェアの拡張バージョンを使用すると、この共同作業がさらに促進されます。

並行イノベーションである日本のStableLM Instruct Alpha 7Bは、もう一つの素晴らしいマイルストーンを作りました。 このモデルは主に研究目的で設計されており、研究アプリケーション専用です。 複数のパブリックデータセットを活用したSupervised Fine-tuning(SFT)と呼ばれる体系的なアプローチにより、ユーザーガイドラインに準拠したユニークな機能を紹介します。

これらのモデルは、EleutherAIの言語モデル評価装置を用いた厳格な評価によって検証された。 このモデルは、文の分類、文のペアの分類、質問の回答、文の要約など、さまざまな分野で調査され、54.71%の驚くべき平均スコアでした。 Stability AIは、この性能指標が日本のStableLM Instruct Alpha 7Bを同時代の製品よりも確実に先行させ、その技量と優越性を強調すると主張しています。

興味深いことに、Stability AIの日本LMリリースは、SoftBankの最近の発表に関連して、時期的に別の興味を引き起こします。 先週、SoftBankは日本市場向けに設計された自社開発LLM(Large Language Models)領域へのベンチャーを公開しました。 同社の約束は、今年後半にデビューするジェネレーティブAIコンピューティングプラットフォームに約200億円(1億4000万ドル以上)の相当な金額を割り当てることによってさらに強調される。

風景が広がり続けて、どのような日本語モデルがダイナミックで進化するジェネレーティブAI分野で究極的に優位を占めるかを確認するのは待つゲームになります。


確認 プロジェクト この研究のすべてのクレジットは、このプロジェクトの研究者に渡されます。 また、参加することを忘れないでください。 28k+ ML SubReddit 40k+ Facebook コミュニティ、 ディスコードチャンネル そして 電子メールニュースレター最新のAI研究ニュース、素晴らしいAIプロジェクトなどを共有します。


NiharikaはMarktechpostの技術コンサルティングインターンです。 彼女は学部3年目で、現在KharagpurにあるIndian Institute of Technology(IIT)でB.Techを勉強しています。 彼女は機械学習、データサイエンス、AIに大きな関心を持ち、これらの分野の最新開発に熱心な読者を持つ非常に情熱的な個人です。


Nakama Shizuka

"フリーランスの学生。微妙に魅力的な料理の達人。トータルベーコンの先駆者。旅行の第一人者。自慢のオーガナイザー。"

You May Also Like

More From Author

+ There are no comments

Add yours