OpenAI最新LLM『GPT-4o』とは?使い方から特徴まで徹底解説! | romptn Magazine

OpenAI最新LLM『GPT-4o』とは?使い方から特徴まで徹底解説!

AIニュース

ChatGPTを運営するOpenAI社が、新しいLLM(大規模言語モデル)『GPT-4o』のリリースを発表しました。

本記事では、GPT-4oの概要や特徴から使い方・活用方法などを網羅的に解説していきます。

これからのAI業界に、GPT-4oがどんな革新をもたらしていくのでしょうか?一緒に見ていきましょう!

スポンサーリンク

【2024年5月13日】OpenAIがChatGPTのアップデートを発表!

今回の発表で重要なポイントは、以下の3つです。

  • 新しい大規模言語モデル(LLM)『GPT-4o』の発表
  • デスクトップアプリの公開(macOSのみ)
  • GPTs/GPT Store/GPT-4などの無料開放

①新しい大規模言語モデル(LLM)『GPT-4o』の発表

すでにChatGPT上で利用可能で、感情の理解や表現ができるようになりました。

非公開となっていた「GPT2」と呼ばれるモデルの正体が『GPT-4o』だったとのことです。その賢さは、どのモデルよりも圧倒的です。

さらに、OCRという画像読み取り機能について日本語にも対応ができるようになりました。

※ChatGPTのOCR機能については、以下の記事で解説しています。

②デスクトップアプリの公開(macOSのみ)

引用:OpenAI

「Option+スペース」ボタンのショートカットキーで簡単にChatGPTを立ち上げることができるようになります。

Windows用のデスクトップアプリは、2024年後半にリリース予定とのことです。

③GPTs/GPT Store/GPT-4などの無料開放

今まで有料プランでしか利用できなかった機能が、ほぼ無料プランで利用可能になりました!

分かりやすいように表にまとめましたので、以下を参考にしてください。

機能無料プランChatGPT Plusプラン
GPT-4の学習内容
Webブラウジング機能
データ分析・チャート作成
写真の解析(OCRなど)
ファイルのアップロード
GPT Store
GPTsの作成×
メモリ機能
メッセージの上限
(超過した場合は、GPT-3.5へ)

(無料の5倍の上限)
画像生成×
音声会話×

ここまで豊富な機能を利用できるとは驚きです。

GPTsを作成したい方や画像を生成したい方、たくさん質問したい方は課金することをおすすめします!

以上が、OpenAIの発表のまとめになります。

『GPT-4o』とは?

GPT-4o(オムニ)は、テキスト・画像・音声などをまとめて処理できるマルチモーダルAIです。

認識速度や回答速度も今までとは段違いで、GPT-4の2倍になったといいます。

価格の方は、「ここまで高機能だと高いのでは⁉」と思う方も多いかもしれませんが、なんと今までの半額(1,500円)程度で利用できるようになります!

オムニ(omni)とは、「全て」という意味があるそうで、テキスト・音声・画像を網羅的に学習しているということを含めてオムニと呼んでいます。

『GPT-4o』の主な特徴

先ほど説明したGPT-4oの特徴をまとめると、以下のようになります。

  • 回答の精度がかなり上がった
  • 回答の速度が2倍になった
  • 利用料金が半額になった
  • 音声会話での高速回答が可能になった
  • APIの利用上限が引きあがった

①回答の精度がかなり上がった

OpenAIが公開した、Text Evaluation(テキストの評価)を見てみましょう。

ほぼすべての項目において、1番上の成績を出しています。

②回答の速度が2倍になった

下記Xの動画を見てください。とんでもない速さで回答が返ってきています!

なんとGPT-4 Turboより3倍以上の結果が出ているそうです。

③利用料金が半額になった

APIの使用料を比較してみると、従来より半額の料金で利用できるようになっています。

GPT-4 TurboGPT-4o
入力10ドル(約1,556円)/100万トークン5ドル(約778円)/100万トークン
出力30ドル(約4,669円)/100万トークン15ドル(約2,334円)/100万トークン

④音声会話での高速回答が可能になった

上記動画にて音声会話を実践していますので、ぜひ見てみてください。

人間と話しているようにChatGPTと音声で会話ができるようになったのですね…。今後音声での呼びかけでChatGPTが起動する…なんてこともあり得そうです。

⑤APIの利用上限が引きあがった

APIの利用上限が、GPT-4 Turboに比べてGPT-4o5倍高くなったそうです。こちらの上限は、今後順次解放されていくとのことです。

『GPT-4o』の使い方

GPT-4oは、ウェブサイト・スマホアプリ・APIを利用することができます。

GPT-4oの基本的な使い方

ChatGPTを開き、モデルから「GPT-4o」を選ぶことで利用できます!

APIを利用する方法

では、GPT-4oのAPIを利用する方法をご紹介します。

①以下のコマンドで「OpenAI SDK for Python」をインストールします。

pip install --upgrade openai --quiet

OpenAIクライアントを設定し、テストリクエストを送信する

APIキーを取得していない方は、以下の手順で取得してください。

  1. プロジェクトを新規作成する
  2. プロジェクト内でAPIキーを作成する
  3. 作成したAPIキーを環境変数として、全部のプロジェクトに反映する

設定が出来ましたら、初めのリクエストでモデルにテキスト入力を送信しましょう。

以下のコマンドで実行できます。(参考記事)

質問内容を好きなものに変えて入力しましょう。

from openai import OpenAI 
import os

# APIキーとモデル名を設定
MODEL="gpt-4o"
client = OpenAI(api_key=os.environ.get("OPENAI_API_KEY", "<環境変数として設定されていない場合のAPIキー>"))

completion = client.chat.completions.create(
  model=MODEL,
  messages=[
    {"role": "system", "content": "何をさせるかを入力"}, # システムメッセージ
    {"role": "user", "content": "質問を入力"}  # ユーザーメッセージ
  ]
)

print("アシスタント: " + completion.choices[0].message.content)

こちらの方法で試してみてください!

※ChatGPTのAPIについては、以下の記事でくわしく解説しています。

『GPT-4o』の活用例

SNSでは、早速GPT-4oの活用方法がたくさん考案されています。どのような活用例があるのかいくつかご紹介していきます!

活用例①:東京大学の数学問題を一発で解く

一回で解けるだけでもすごいですが、プロンプトなしでも正解とはGPT-4oのヤバさが伺えますね。

活用例②:プレゼンテーション

下記Xの動画のように、プレゼンテーションも自動で行ってくれるようです。

活用例③:レシートの仕分け

写真から領収書を細かく仕訳けてくれます。解説もしてくれるみたいです!

活用例④:AI Tuberのレスポンスを速める

AIが即時に判断して喋っているようには到底思えない速度です…。本当に人間がしゃべっているみたいです。

活用例⑤:イラストのUIをコードにする

GPT-4oの画像認識能力の高さはすごいですね…!

活用例⑥:脳データを解析する

GPT-4oは、科学や医学にも大いに貢献することが期待されています。

活用例⑦:AIアプリ生成ツール『Dify』でGPT-4oを利用する

以下のポストで、使い方を解説してくださっています!

※『Dify』の概要や基本的な使い方については、以下の記事で解説しています。

活用例⑧:AIカオスマップの文字起こし

OCRの性能も高いため、複雑なカオスマップも正確に認識してくれるようです!

カオスマップとは、各企業の特徴や関係性などを表した業界地図のことを言います。

活用例⑨:漫画を読解する

台詞数が少ない漫画でも、しっかりと人物の特徴をつかめていますね。

活用例⑩:AI開発ツール『Create.xyz』でGPT-4oを利用する

流行りのスイカゲームを作成できるみたいです!

※『Create.xyz』の概要や使い方については、以下の記事で解説しています。

活用例⑪:ゲームのシミュレーション

他にも、人生ゲームなどもできるみたいです。

活用例⑫:漫画のポイント解説

自分の視点だけでなく、新しく魅力を発見できるようになりますね。

活用例⑬:書籍の書き起こし

レイアウトを加味してくれるので、まとめる際にも便利ですね。

活用例⑭:架空RPGをプレイする

簡単にゲームマスターを任せることが可能になりました。

活用例⑮:カロリーを推測する

ダイエットや健康管理にも使えて便利ですね!

活用例⑯:画像から3Dプリントのデータを作成する

他のAIツールより飛びぬけて生成が上手いそうです。

みなさんいろいろな活用例を考案していて素晴らしいですね。

GPT-4oのヤバさ・凄さ・賢さがこの活用例からも伝わったのではないでしょうか?特にマルチモーダル機能が今までよりさらに強化されたイメージがありますね。

他にも活用例がありましたら随時追加していきます!

まとめ

いかがでしたでしょうか?

OpenAI最新LLM『GPT-4o』について解説してきました。

今回のポイントをまとめると、以下のようになります。

  • OpenAIがChatGPTのアップデートを発表!
    • ①新しい大規模言語モデル(LLM)『GPT-4o』の発表
    • ②デスクトップアプリの公開(macOSのみ)
    • ③GPTs/GPT Store/GPT-4などの無料開放
  • 『GPT-4o』の主な特徴
    • ①回答の精度がかなり上がった
    • ②回答の速度が2倍になった
    • ③利用料金が半額になった
    • ④音声会話での高速回答が可能になった
    • ⑤APIの利用上限が引きあがった

今後新たな動きがあれば、随時追記していきます!

romptn Q&Aで質問してみませんか?
romptn Q&Aは、AIに関する質問プラットフォームです。
  • ChatGPTで〇〇を効率化したい
  • スライドを作るならどのAIツールがおすすめ?
  • おすすめのGPTsが知りたい
といったことはありませんか?
同じ悩みを解決した人がいるかもしれません。ぜひ質問してみてください!