フランス発の革新、コーディング向け生成AIモデル登場
米Microsoftの支援を受けるフランスのAI企業Mistral AIは、2024年5月29日に同社初のコーディング向け生成AIモデル「Codestral」を発表しました。
今回は、こちらのニュースについて解説していきます。
コーディング生成AI「Codestral」の概要と特徴
Codestralは、コード生成タスクに特化して設計された生成AIモデルです。このモデルの重みはオープンウェイトとして公開されており、HuggingFaceからダウンロード可能で、MistralのAPIプラットフォームを通じて利用できます。
Codestralは、Python、Java、C、C++、JavaScript、Bashを含む80以上のプログラミング言語のデータセットでトレーニングされています。
また、SwiftやFortranにおいても優れた性能を発揮することが確認されています。
高性能を誇るLLM(大規模言語モデル)を持つ
この生成AIモデルは、3万2000トークンのコンテキストウィンドウを持つ220億パラメータのモデルで、コード生成の長期評価であるRepoBenchにおいて優れた性能を示しています。
競合する米MetaのCode Llama(4000/700億)や中国DeepSeekのDeepSeek Coder(1万6000/330億)と比較しても、Codestralは一歩抜きんでた性能を誇ります。
「Codestral」のライセンスと利用制限について
Codestralはオープンウェイトとして公開されていますが、Mistral AI Non-Production Licenseのもとでリリースされており、研究やテストの目的での利用に限られます。
そのため、商用利用は許可されていません。
Mistral AIの「Codestral」は、その性能と多言語対応により、開発者にとって強力なツールとなるでしょう。今後の技術的進展に期待が寄せられます!