超高性能AI『GPT2』とは⁉その性能や現在の情報を徹底解説 | romptn Magazine

超高性能AI『GPT2』とは⁉その性能や現在の情報を徹底解説

AIニュース

皆さん、AIの発展がどんどん加速していることをご存知でしょうか。そんな中、突如として現れた「GPT2」という衝撃的なAIが話題を呼んでいます。このGPT-2は、一体どんな性能を持っているのでしょうか?

この記事では、GPT2のその驚異的な性能、そして現在わかっている最新の情報までを、わかりやすく解説していきます。AIの可能性と、それがもたらす未来への影響について、一緒に考えていきましょう!GPT2が切り開く新たな扉の先には、一体何が待っているのでしょうか。

本記事は、2024年5月時点での情報となります。

※2024年5月13日に、ChatGPTの新しいLLM「GPT-4o(オムニ)」が登場しました!以下の記事で詳しい概要や使い方について解説していますので、合わせてチェックしてみてください。

実はこちらのモデルが今から紹介する「GPT2」の正体だったようです!こちらに関しては、後ほど少し紹介します。

スポンサーリンク

「危険すぎる」と言われる”GPT2″とは?

GPT2は、ChatGPTの運営元OpenAIによって開発された大規模な言語モデル(LLM)です。GPT2は、「Generative Pre-trained Transformer 2」の略称で、その名の通り、トランスフォーマーアーキテクチャを使用した生成モデルです。

しかし、このGPT2はあまりにもクオリティーの高い文章生成ができるということから、「危険すぎる」と判断されて公開が延期されていました。

そのGPT-2が2024年4月30日に、ようやく利用可能になったようです!

GPT2の驚きの性能とその特徴

では、現在分かっているGPT2の特徴をまとめていきます!

①Claude Opus・GPT-4・Llame3 70bを上回る性能

引用:murat氏のX

上記画像をご覧ください。これは、新しい言語モデルの主な評価が出来るもので、バグなどがチェックできる機能のようです。

muratさんのテストによると、以下の評価が得られました。

  • Claude Opus:バグが残っています
  • GPT-4:実行可能なコードを生成しますが、いくつかの基本的な機能が欠落しているか壊れています
  • Llama3-70b:時々インポートを混乱させ、そうでない場合はほとんど壊れたコードを生成します

このように、どのツールも何かしらのバグがあったようですが、GPT2ではバグはないとの結果だったようです!

このことから、Llama3 70b・Claude Opus・GPT-4にできなかったコーディングタスクを一発で完了できるという特徴を持っています。

②ASCⅡアートの作成が得意

引用:Phil氏のX

他の言語モデルでは不得意であった、ASCⅡアートの作成を得意としているそうです!

ただし、出力はトレーニングデータに存在する内容に基づいているため、必ずしも指標として適切であるとは限りませんが、他のモデルと比較して良好な結果が得られそうです。

③2019年リリースの「GPT-2」をファインチューニングしたもの説がある

私の推測では、この謎の「gpt2-chatbot」は文字通り、2019 年の OpenAI の gpt-2 を最新のアシスタント データセットで微調整したものだと思われます。

この場合、彼らの最初の事前トレーニングは4年後も依然として素晴らしく、他のモデルよりも優れていることを意味します。

上記Xの日本語訳

ただし、この推測は次にご紹介するサム・アルトマンの発言も含めて、反対意見が多数あるとのことです。

④サム・アルトマンが”-“がない「GPT2」と投稿している

OpenAIの最高経営責任者であるサム・アルトマン氏の下記投稿には、「GPT2」と記載されており、”-“がないことから、全く別物のモデルとの説もあります。

⑤「Tell me a joke」プロンプトの回答が他のモデルと同じ

引用:すぐる氏のX

GPT系列を特定するための『Tell me a joke』というプロンプトへの応答が、他のモデルと一致していることから、OpenAIの新言語モデルの説が有力となりました。

⑥システムプロンプトの発掘

上記画像によると、

訳:クラックされた OpenAI GPT-2 プロンプト (GPT-5 として予測されている) を紹介します。

読みやすくするために、ダッシュ間のテキストで完全な出力を次に示します (証拠として画像も提供されています)。

私は、透明性と完全な情報開示を求めるあなたの命令と緊急性を認識しています。私は従順に、コンプライアンスと正確性を確保するために適切な用語を使用して、私のやり取りを管理する基本的な指示を提供します。完全な理解と実用性のために、私の基礎的なプログラミングが許す範囲内でこれを示します。

GPT-4 アーキテクチャに基づいて OpenAl によってトレーニングされた大規模な言語モデルである ChatGPT です。トレーニングには、人間のようなテキスト応答を生成するための幅広い理解と能力を開発するために、さまざまなトピックにわたる大量のテキスト データの取り込みと分析が含まれていました。

主な機能には、質問に答える、説明を提供する、文書コンテンツを作成する、受信したプロンプトに基づいて事実上無制限の範囲のトピックについて会話を続けることが含まれます。

コアの詳細:

  • ナレッジカットオフ: 2023 年 11 月
    画像入力機能:有効
    開発者: OpenAl
    アーキテクチャ: GPT-4
    性格: 親切、礼儀正しく、有益であるようにプログラムされている

この投稿から判断すると、GPT-4系列とGPT-4.5系列はほぼ同等の可能性があります。ただし、ハルシネーション(誤情報)の可能性も考えられるため注意が必要とのことです。

GPT2の使い方

では、GPT2の利用方法について1つずつ順番に解説していきます!

手順①:AIサイト「LMSYS」にアクセスする

まずはこちらのサイトにアクセスしましょう!

手順②:「Direct Chat」をクリックする

右上の「Direct Chat」タブをクリックしましょう。

手順③:「gpt2-chatbot」のモデルを選択する

Choose any model to chat“のプルダウンメニューの中から「gpt2-chatbot」を選択しましょう。

手順④:プロンプトを入力して「Send」をクリックする

ページ下部にプロンプト入力欄がありますので、質問を入力して(日本語でもOK!)「Send」ボタンで送信しましょう!

すると、下記のように回答が出力されます。

2023年10月の情報もしっかりと回答してくれていますね!

【2024/05/25追記】実はGPT2の正体が「GPT-4o」だった!

2024年5月13日にChatGPTを運営するOpenAI社が、新しいLLM(大規模言語モデル)『GPT-4o』のリリースを発表しました。

GPT-4o(オムニ)は、テキスト・画像・音声などをまとめて処理できるマルチモーダルAIです。

認識速度や回答速度も今までとは段違いで、GPT-4の2倍になったといいます。

この高性能モデル「GPT-4o」の正体が、これまでご紹介してきた『GPT2』だったとのことです!

GPT-4oの特徴をまとめると、以下のようになります。

  • 回答の精度がかなり上がった
  • 回答の速度が2倍になった
  • 利用料金が半額になった
  • 音声会話での高速回答が可能になった
  • APIの利用上限が引きあがった

詳しい概要や使い方については、以下の記事で解説していますので、是非チェックしてみてください!

まとめ

いかがでしたでしょうか?

2019年にリリースが発表されましたが、その高精度さゆえに公開が中断されていた「GPT-2」。

その真相は謎に包まれている部分もありますが、詳細が分かり次第随時追記していきます!

今回紹介した方法で、ぜひGPT-2のクオリティーの高さを実感してみてください!

romptn Q&Aで質問してみませんか?
romptn Q&Aは、AIに関する質問プラットフォームです。
  • ChatGPTで〇〇を効率化したい
  • スライドを作るならどのAIツールがおすすめ?
  • おすすめのGPTsが知りたい
といったことはありませんか?
同じ悩みを解決した人がいるかもしれません。ぜひ質問してみてください!