rinna株式会社、新たな日本語音声認識モデル「Nue ASR」を公開 | romptn Magazine

rinna株式会社、新たな日本語音声認識モデル「Nue ASR」を公開

AIニュース

rinna株式会社が、大規模言語モデルGPTを活用した日本語音声認識モデル「Nue ASR」を開発し、公開しました。

このAIニュースのポイント

  1. 「Nue ASR」は、音声基盤モデルHuBERTとテキスト基盤モデルGPTを組み合わせて開発されました。
  2. このモデルは、約19,000時間の日本語音声コーパスを用いて学習し、高い認識率を達成しています。
  3. Nue ASRは、リアルタイム音声認識においても高速かつ正確な認識能力を持つことが特徴です。

今回開発された「Nue ASR」は、AI音声認識技術の分野で新たな進展を示すものです。事前学習済みの基盤モデルを活用することで、学習コストを軽減しつつ高精度な音声認識を実現しています。

このモデルは、日本語処理に特化しており、GPTの構造を活用しています。DeepSpeedという高速推論手法を導入することで、認識速度を大幅に向上させており、実用的な音声認識サービスの提供に一歩近づいています。また、CSJ Eval1テストセットにおけるファインチューニングを通じて、文字誤り率を大幅に改善しました。

rinna株式会社は、今後もAI技術の社会実装を目指して、音声対話に関する研究・開発を進めていく方針です。同社のAI技術は、人間とAIの共創世界を目指すビジョンに基づき、さまざまな分野での活用が期待されています。

出典: PRTimes