【博士課程超え】Grok4が登場!料金や機能、Heavyとの比較を徹底解説

AIニュース

2025年7月10日、イーロン・マスク氏率いるxAIが新たなフラッグシップAIモデル「Grok 4」と「Grok 4 Heavy」をリリースしました。

Grok4は、マスク氏によると、博士課程レベルの知能を全分野で備え、AIの新時代を切り開く存在になるとこのことです。

本記事では、xAI Grok4のリリース背景から機能の詳細、Grok4 Heavyとの違い、そして気になる料金プランまでを徹底解説。

実際に使用してみた感想や使い方まで掲載するので、ぜひ参考にしてみてください。

監修者プロフィール
森下浩志
日本最大級のAI情報プラットフォーム「romptn ai」編集長。著書に「0からはじめるStable Diffusion」「0からはじめるStable Diffusion モデル・拡張機能集編」など、AmazonベストセラーのAI関連書籍を多数執筆。AIにおける情報の非対称性を解消するための社内研修や出張講義も行う。

romptn aiが提携する「SHIFT AI」では、AIの勉強法に不安を感じている方に向けて無料オンラインセミナーを開催しています。

AIを使った副業の始め方や、収入を得るまでのロードマップについて解説しているほか、受講者の方には、ここでしか手に入らないおすすめのプロンプト集などの特典もプレゼント中です。

AIについて効率的に学ぶ方法や、業務での活用に関心がある方は、ぜひご参加ください。

\累計受講者10万人突破/

Grok4とは?

300$のプランに加入すると「SuperGrok」のように表示される

Grok4は、xAIが開発した第4世代の大規模言語モデルです。2025年7月9日の現地時間に正式リリースされ、同日夜にはイーロン・マスク自身がXのライブストリーミングで詳細を発表しました。このモデルは、自然言語処理、数学的推論、科学的分析において「比類のないパフォーマンス」を提供することを目標として設計されています。

最も注目すべき特徴は、マスク氏が「学術的な質問に関して、Grok4はあらゆる分野でPhDレベルを上回る性能を発揮する」と断言している点です。これは単なる誇張ではなく、実際のベンチマークテストでその実力が証明されています。

o3やGeminiと比較しても勝っているよう。

上記は、xAIが提示した「Humanity’s Last Exam」(通称:HLE)というスコアでの指標です。HLEは、AI研究者が「人類最後の試験」と呼ぶ極めて困難なベンチマークテストです。

このテストは、数学、人文学、自然科学など幅広い分野から数千の問題を集めたもので、人間の専門家でも正答率が低い高難度の問題で構成されています。

イーロン・マスクによると、普通の人のスコアは5%くらいだそう。

そもそもGeminiやChatGPTのo3ががかなり優秀ということもわかりますが、Grok4、Grok4 Heavyはかなり圧倒的です。

要は、博士課程の学生よりも大幅に優秀になってしまったということですね。

Grok 4 Heavyとは?

Grok4とGrok4 Heavyは、同じ基盤技術を共有しながらも、処理能力と利用方法において大きな違いがあります。Grok4が標準的な高性能AIモデルとして位置づけられるのに対し、Grok4 Heavyは「マルチエージェント版」として、より複雑で高度な問題解決に特化した上位モデルです。

この違いは、単純な性能向上ではなく、問題解決のアプローチそのものが異なることを意味します。Grok4が単一のAIエージェントとして動作するのに対し、Grok4 Heavyは複数のAIエージェントが協調して作業する「集合知」のシステムとして設計されています。

項目Grok4Grok4 Heavy
処理方式単一エージェントマルチエージェント
計算資源標準大幅増強
応答時間高速やや時間要
精度高精度超高精度

マスク氏によると、マルチエージェントとは「複数のエージェントが同時に問題に取り組み、最後に『勉強グループ』のように結果を比較して最適な答えを見つける」と説明しています。

イメージは、人間の専門家チームが協力して問題を解決するプロセスをAIで再現している感じです。複雑な科学的問題に対して、数学専門のエージェント、物理学専門のエージェント、統計学専門のエージェントがそれぞれ異なる角度から分析を行い、最終的にそれらの結果を統合して最適解を導き出します。

この方式により、単一のAIでは見落としがちな視点や、専門分野間の知識の隙間を埋めることができまるそう。また、各エージェントが独立して推論を行うため、一つのエージェントが誤った方向に進んでも、他のエージェントがそれを補正する自己修正機能も備えています。

ちょっと難しいですがあまりにも賢いことはわかったかと思います。

Grok4の料金は?無料で使えるか

Grok4は、残念ながら無料で使うことはできません。

Xのサブスクリプションに加入しているか、Grokに課金する必要があります。

プラットフォームプラン名月額年額特徴・注意点
grok.com SuperGrok $30(約4,800円)$300128Kトークンコンテキスト、マルチモーダルサポート。
grok.com SuperGrok Heavy$300(約48,000円)$3,000Grok 4 Heavy への早期アクセスと今後の機能。高度な使用向け。
X.comPremium+$40(約6,400円)$395Grok 4 へのアクセスと高い使用制限。X プラットフォーム経由。

SuperGrok Heavyプランについては、なんと50,000円近くになっており、かなり高額です。

結局、Grok4は何がすごくなった?

続いては、Grokの何がすごいのかを見ていきましょう。

①博士課程を超えるレベルの学術的知識と推論能力

あらゆる指標で最上位を獲得。

先程も少し解説しましたが、Grok4の最も革新的な特徴は、あらゆる学術分野においてPhDレベル(博士課程レベル)の専門知識を有する点です。従来のAIモデルが特定の分野で優秀な性能を示す一方で分野を跨いだ総合的な知識では限界があったのに対し、Grok4は文系・理系を問わず幅広い専門領域で高度な理解と分析を提供します。

具体的には、数学や物理学といった理系分野では複雑な証明や計算を正確に実行し、人文学や社会科学では多角的な視点から深い洞察を提供できるそう。

例えば、経済学の理論を生物学の進化論と組み合わせて社会現象を分析したり、哲学的概念を数学的モデルで表現したりといった高度な知的作業が可能です。

マスク氏によると、「時には常識に欠ける場合もあるが、新しい技術の発明や新しい物理学の発見も時間の問題だ」と述べています。

②高度な画像解析とマルチモーダル対応

Grok4は、テキスト処理だけでなく、画像解析においても卓越した性能を発揮します。単純な画像認識を超えて、画像に含まれる複雑な情報を文脈的に理解し、詳細な分析や説明を提供する能力を持っています。

例えば、科学的な図表やグラフを解析して数値データを抽出し、その意味を解釈することができます。また、芸術作品を分析して技法や歴史的背景を説明したり、医療画像から異常を検出して専門的な見解を提供したりすることも可能です。

さらに、2025年9月にはマルチモーダルエージェント機能が追加予定で、テキスト、画像、音声、動画を統合した包括的な情報処理が可能になるそうです。

③リアルタイムデータアクセスと最新情報の活用

イーロン・マスクのポスト

Grok4の大きな競争優位性の一つは、Xプラットフォームとの深い統合によるリアルタイム情報アクセス能力です。従来のAIモデルが訓練データの時点で知識が固定されるのに対し、Grok4は常に最新の情報にアクセスし、現在進行中の出来事や最新のトレンドについても正確な情報を提供できます。

この機能により、ニュース分析、市場動向の予測、リアルタイムでの事実確認などが可能になります。例えば、株式市場の急激な変動について質問された場合、Grok4は最新の市場データと関連ニュースを即座に分析し、その背景や影響を詳しく説明できます。

マスク氏はX上で、「私の経験では、インターネットや書籍のどこにも答えが見つからないような、現実世界の難しいエンジニアリングの問題を AI が解決できたのは、Grok 4 が初めてです。」と話しています。

③音声対話機能と自然な会話体験

Grok4は、高度な音声認識と音声合成機能を搭載しており、自然な音声での対話が可能です。単純な音声コマンドの認識を超えて、複雑な質問や議論にも音声で対応し、人間らしい自然な会話体験を提供します。

音声機能の特徴は、多様な声質とトーンに対応している点です。ユーザーの好みや用途に応じて、フォーマルなビジネストーンからカジュアルな日常会話まで、適切な話し方を選択できます。また、感情的なニュアンスも理解し、ユーザーの気分や状況に応じて適切な反応を示すことができます。

声も5つから選ぶことができ、会話の速度も2倍以上早くなっています。(画像参照)

④コーディングと技術的問題解決

Grok4は、プログラミングと技術的問題解決において特に優秀な性能を発揮します。2025年8月~9月にリリース予定の「Grok 4 Code」では、さらに特化した機能が提供される予定ですが、現在のGrok4でも高度なコーディング支援が可能です。

公式発表によると、なんとプロンプト一つで以下のようなゲームを作ることができるらしいです。

xAIの公式より

Grokを実際に使ってみてわかったすごい点

ここまで公式発表の凄さを見てきましたが、実際どうなのでしょうか?

実際に最上位プラン(SuperGrok Heavy)に加入して試してみたので、その感想と一緒にお伝えします。

マルチエージェント機能が使用できる

こちらはGrok4 Heavyだけになりますが、マルチエージェント機能が使用できるので、一つのチャットで同時に複数作業を行ってもらうことができます。具体例を見てみましょう。

Grok4 Heavyがマルチエージェントで実行している様子

こんな形です。ただ、作業はそれなりに時間がかかるため、マルチエージェントだから使いやすいみたいなことは一般のユーザーからするとないかもしれません。

複雑なコーディングを実装できるそう

もちろんコーディング能力も一級品でした。

このような群衆を動かすアニメーションを作ることもできます。

会話力はめちゃくちゃ高い

Grokは会話力がかなり高いです。現状スマホアプリ版でしか使えないため、画面録画と音声がうまく入らなかったのですが、会話はかなり流暢にできました。

Grokとの会話のスクショ

【結論】Grok4は現状課金しなくても良さそう

色々使ってみましたが、Grok4は非エンジニアの方などはあまり使わなくていいように感じました。

理由はいくつかあります。

Grok4のデメリット①:安全性の考慮が少ない

実は、これは良い点でも悪い点でもあるのですが、Grokはかなり安全性の基準が低いです。

以下は、Claudeとの会話のスクリーンショットですが、ChatGPTやGemini、Claudeは安全性・倫理にかなり力を入れているため、差別的・暴力的な内容は出力をしないようになっています。

その点、GrokはXの投稿から学習しているためか、思想に若干偏りが見られることがあります。

Grok4のデメリット②:デザイン力が低い

他のAIと比較して、デザインセンスが悪い気はしました。ゲームを作らせてみたのを比較してみましょう。

どのAIにも以下の同じプロンプトを入れていて、全て最新のモデルを使用しています。

ブラウザで遊べる面白いゲームを作ってみて。

Grok4の場合

Grokが作ったゲーム

ヘビがブロックを食べて大きくなるというシンプルなゲームを作ってくれました。

ChatGPT o3の場合

ChatGPTが作ったゲーム

上から降ってくる障害物に当たらないように避けるというゲームです。正直簡単すぎました。

Claude Opus4の場合

Claudeの作ったゲーム

Claudeはかなりカラフルなデザインですね。ただ、ゲームの難易度はかなり簡単でした。

Gemini 2.5Proの場合

Geminiの作ったゲーム

正直、ゲームに関してはGeminiの圧勝ですね。デザインもゲーム性も全て一番良かったです。

Grok4のデメリット③:日本語読み取り精度が低い

実際試してみましたが、確かにミスが多いように感じました。

Gro4kのデメリット④:基本的にはGeminiやChatGPTで良さそう

最後については、ここまでのまとめになるかもしれないですが、わざわざGrokを使う場面が少ないように感じました。

Grokは優秀かもしれないですが、欠点も多いです。そのため、ChatGPTやGeminiからGrokに乗り換える必要はまったくないと思います。

ただ一点、規制のゆるさについては強みになるかもしれません。ChatGPTやGeminiは、かなり倫理観が強いです。そのため、本当は問題のないことでも禁止されることがあります。そのような場合はGrokを使うといいかもしれません。

Grokの今後

xAIの展望

xAIによると、上記のようなスパンで開発が進められていくとのことです。

今後、マルチエージェントモデルやコーディングモデル、動画生成モデルが出るのが楽しみですね。

まとめ

ここまでGrok4について見てきましたがいかがだったでしょうか?

今後もromptn aiでは、Grokを始めとするAIの最新情報を発信していきますので、ぜひご覧ください。

romptn aiが提携する「SHIFT AI」では、AIの勉強法に不安を感じている方に向けて無料オンラインセミナーを開催しています。

AIを使った副業の始め方や、収入を得るまでのロードマップについて解説しているほか、受講者の方には、ここでしか手に入らないおすすめのプロンプト集などの特典もプレゼント中です。

AIについて効率的に学ぶ方法や、業務での活用に関心がある方は、ぜひご参加ください。

\累計受講者10万人突破/