フランスのAI研究所Kyutaiは、初の全ての人が利用可能な音声対応AI「Moshi」を発表しました。
8人のチームが6ヶ月で開発したこのAIは、発表会で参加者と対話するデモが行われました。
Kyutaiのウェブサイトでオンラインテストが可能です。Moshiは自然で表現豊かな対話を実現し、コーチやコンパニオンとしての利用が可能です。
また、Moshiはローカルにインストール可能で、安全にオフラインで動作するとのこと。
Kyutaiとは?
Kyutaiは、AIのオープンリサーチを目的とした非営利研究所であり、2023年11月に設立されました。主要な科学者で構成されたチームが新しい汎用モデルの研究を行っています。
開発されたモデルやソフトウェアは自由に共有され、AI研究や音声ベースの製品開発に役立てられます。
Moshiとはなにか?
Moshiは、文字だけでなく音声でも自然でリアルなコミュニケーションができる革新的なAIです。
軽量設計のため、インターネット接続なしでもスマホやパソコンで手軽に動作するのがポイントです。
注目すべき点は、ソースコードと学習済みモデルが公開されていることで、音声AI分野では画期的なオープンさを実現しています。
これにより、開発者は自分のニーズに合わせてカスタマイズしたり、音声機能を持つ製品開発に活用したりすることが可能です。
さらに、Moshiは感情豊かな話し方や複数の声色に対応した高性能な音声合成機能を搭載しており、ユーザーとの対話をより豊かにします。
Moshiをつかってみた
Moshiは、このリンク(https://us.moshi.chat/)から、メールアドレスを入れることで試すことができます。
早速やってみました。
残念ながら日本語は苦手らしく、聞き取ってもらえませんでした。
また、音声としてはかなりはっきり聞こえますが、会話の能力はまだ低いのかなというイメージでした。
ただ、Kyutaiによると、Moshiの知識と事実の正確さは意図的に制限されているとのことです。ですので、今後は正確になっていくのではないでしょうか?