米カリフォルニア大学バークレー校の研究室が運営する「LMSYS Org」(The Large Model Systems Organization:大規模モデルシステム機関)では言語モデルをまとめて公開しているWebサービス「Chatbot Arena」あります。
その中に、「gpt2-chatbot」というモデルが突如現れ、4月29日深夜(日本時間、以下同様)から話題になり始めています。
気になる最新AIの詳細について以下で解説します。
今回のニュースのポイント
米OpenAIが提供する生成AI「ChatGPT」は、高性能な大規模言語モデル(LLM)「GPT-4」のリリース以来、次世代モデルについて沈黙を守っていました。
しかし、LLMを比較できるWebサービス「Chatbot Arena」に、「gpt2-chatbot」という謎の高性能LLMが突如現れたことで、OpenAIの次の一手に注目が集まっています。
GPT-4のパラメータは1兆7600億ですが、今回の「 GPT-2 chatbot」のパラメータは100兆個になるようです。
実際にgpt2-chatbotを利用したユーザーからは、GPT-4やAnthropicのClaude3 Opusに匹敵する、あるいは勝るとも劣らないパフォーマンスを示しているという感想が寄せられています。
このモデルの詳細や正式提供予定は現時点では不明ですが、OpenAIのサム・アルトマンCEOがX(旧Twitter)で「gpt2にはすごく思い入れがある」と投稿し、さらに投稿内容の「gpt-2」を「gpt2」に修正していることから、OpenAIがgpt2-chatbotに関連している可能性が高いと考えられます。
OpenAIは関与しているの?
OpenAIがgpt2-chatbotを公開した意図については様々な憶測が飛び交っています。
一つの可能性は、次世代モデルの性能を実際のユーザーの反応を通じて評価し、改善点を探ることです。
また、競合他社に対して優位性をアピールする狙いもあるかもしれません。
さらに、OpenAIが新たなビジネスモデルを模索している可能性も考えられます。例えば、gpt2-chatbotを利用したサービスを提供することで、新たな収益源を確保しようとしている可能性もあります。
専門家の意見は?
一部の専門家は、「gpt2」がGPT-2ではなく、GPT(Generative Pretrained Transformer)自体の次世代アーキテクチャを指していると推測しています。
これが事実であれば、OpenAIがGPTの基本アーキテクチャを大幅に改良し、パフォーマンスを大きく向上させた可能性があります。
また、gpt2-chatbotがGPT-4とGPT-3.5の中間的なスペックを持っていると考えられることから、GPT-4とGPT-3.5の間を埋める新たなモデルが登場する可能性もあります。