Grok Imagineの3モードを徹底比較!同じプロンプトで何が変わるかを実例で解説

Grok

Grok Imagineで動画を作ろうとすると、まずNormal / Fun / Customという3つのモード切替に出会います。どれを選ぶかで出力の方向性が変わるので、最初の数本でつまずきやすいポイントです。

本記事では、同じプロンプトを3モードに投げる比較と、SNSループ・商品プレゼン・演出強めリール・ミーム的バズの4つの用途別おすすめを、早見表 + 比較表 + マトリクスで提示します。読み終わるころには『自分の用途ならまずどのモードを試すか』が手元に残るはずです。

内容をまとめると…

  • Normalは万能、Funは派手寄り、Customは作風寄り、というモード設計の差

  • 同じプロンプトでも3モードで出力の方向性とプロンプト解釈の癖が違う

  • SNSループならFun、商品プレゼンならNormal、演出強めリールならCustomが第一候補

  • 迷ったらまずNormalで1本投げて、結果を見てFunかCustomに切替

  • Spicyは健全用途では触らず、必要なときは姉妹メディア側に住み替え

きれいな画像を作れるようになっただけで、収益化できずに止まってませんか?

romptn ai では、実際に画像生成AIで稼いでいるプロを講師に招いた完全無料のAIクリエイターセミナーを開催しています。

2時間のオンラインセミナーで、実際に稼いでいる人が使う最新画像生成AIツールや上級者にステップアップするための必須スキルなどの知識面はもちろんのこと、ゼロから収益化を実現するための具体的なロードマップ体験談ベースで詳しく学ぶことができます。

また、豪華な無料参加特典も用意していますので、ぜひご興味を持った方はお気軽に下記のボタンから詳細をチェックしてみてください!

\ 現役の画像生成AIのプロから学べる! /

無料セミナーの詳細をみる
監修者_SD以外
監修者プロフィール
森下浩志
日本最大級のAI情報プラットフォーム「romptn ai」編集長。著書に「0からはじめるStable Diffusion」「0からはじめるStable Diffusion モデル・拡張機能集編」など、AmazonベストセラーのAI関連書籍を多数執筆。AIにおける情報の非対称性を解消するための社内研修や出張講義も行う。

3モードの違いを30秒でつかむ早見表

まずはこの先で深掘りする3モードを、1行サマリーで全体像から押さえます。

Grok Imagineで動画を作るときに最初に出会うのが、Normal / Fun / Customという3つのモード切替です。それぞれは「出力の方向性」と「指定できる細かさ」の組み合わせで役割が分かれており、用途に応じて選ぶことで失敗回数を減らせます。

モード一行サマリー向いている使い方
Normal標準的でクセが少ない万能モード。プロンプトをそのまま素直に解釈する何から試すか迷ったとき、安定した動画が欲しいとき
Fun遊び寄りに振った演出強めのモード。色や動きを少し誇張するSNS用ループ、ミーム的に楽しい動画を作りたいとき
Customスタイルや要素を細かく指定できるカスタマイズ寄りのモード自分の作風に寄せたい、商品紹介など世界観を統一したいとき

なお、健全用途で使う3モードに加え、UI上にはアダルト寄りの Spicy モードも並んで見えます。これは romptn では取り上げず、後ほど『Spicyモードについて』の章でその扱い方だけ触れます。

ここから先は、この3モードの違いを「比較する3つの軸」「同じプロンプトを投げたときの差」「ユースケース別のおすすめ」の順に分解していきます。

Grok Imagineのモードを比較する3つの軸

ここでは、この後の比較がどんな基準で行われているのか、判定の軸そのものを先にそろえます。

「3モードを比較しました」と言われても、何を見比べているのかが共有できていないと、結果の表を読んでも自分の用途に当てはまりません。本記事では次の3つの軸で違いを見ていきます。

  • 出力の方向性 — 出てくる動画が「素直な再現」寄りか、「演出を盛ったアレンジ」寄りか
  • プロンプト解釈の癖 — 同じ言葉でも、各モードがそれをどれくらい忠実に受け取るか、どこを補完しようとするか
  • 推奨ユースケース — どの用途(SNSループ・商品紹介・演出強めリール・ミーム的バズ)で結果が活きやすいか

この3軸を最初に決めておくと、「Normalは素直だけど物足りない」「Funは派手だけど商品には合わない」といった印象を、感覚論ではなくモードの設計差として説明できます。

次の章では実際に同じプロンプトを3モードに投げ、この軸でどんな違いが出たかを並べていきます。

同じプロンプトで3モードを比較した結果

ここからが本記事の中核です。先ほどの3軸で各モードを横並びにし、同じプロンプトを投げたときの実際の差を見ていきます。

Grok Imagineは2025年7月28日にリリースされた、テキストプロンプトから約6秒間の動画クリップを生成するツールです。UI上には複数のモードが並んでおり、本記事では健全用途で使う Normal / Fun / Custom の3モードを比較対象にします(残るSpicyモードは成人向け扱いで、後ほど別章で取り上げます)。

比較は次の3本のプロンプトで行います。それぞれの結果は次章以降で1本ずつ深掘りしますが、まず全体像だけ整理しておきます。

  • ①静的シーン — 人物ポートレートのように動きが小さい題材。素直な再現力の差を見るのに向きます
  • ②動きの強いシーン — 商品紹介のような回転やズームを含む題材。モーション解釈の癖が出やすいです
  • ③抽象演出 — 色や光、雰囲気重視の題材。演出寄りの出力で差が分かりやすいです

この3本を Normal / Fun / Custom にそれぞれ同じ条件で投げ、(a) 出力の方向性、(b) プロンプト解釈の癖、(c) 再生成のしやすさ、の観点で並べます。本章では先に比較の枠組みだけを示し、具体的なセル(計9パターンの実出力)は次の3章で順番に見ていく構成です。

プロンプト \\ モードNormalFunCustom
①静的シーン(人物ポートレート)後述(sec-04)後述(sec-04)後述(sec-04)
②動きの強いシーン(商品回転)後述(sec-05)後述(sec-05)後述(sec-05)
③抽象演出(雰囲気リール)後述(sec-06)後述(sec-06)後述(sec-06)

検証は本記事公開時点(2026年5月)のGrok Imagineで行う前提です。UI表記やモード名は画面上の英語表記をそのまま採用しており、xAIのアップデートで日本語ラベルに変わった場合は表記揺れが起きうる点だけ先に断っておきます。

※本章および次の3章で示す比較セル(計9パターン)の実機キャプチャは、編集者が実機検証のうえ後日差し込みます。本記事は枠組みと判定軸を先に固定しておき、各セルの差分コメントは編集側の実出力に合わせて確定する方針です。

それでは次章から、3本のプロンプトを順番に見ていきましょう。

①静的シーン:人物ポートレート

1本目は動きが小さい静的シーンで、人物ポートレート系のプロンプトを各モードに投げます。動きが少ない題材なので、素直な再現力の差がもっとも比較しやすい入口です。

検証プロンプトは次の文面を使う想定です(編集者の実機検証時にそのまま使えるよう、本記事にも明示しておきます)。

A young Japanese woman in her late 20s, standing in soft natural window light, looking calmly toward the camera, shoulders-up portrait, gentle smile, minimalist beige interior background.

このプロンプトを Normal / Fun / Custom にそれぞれ同じ条件で投げ、出力の方向性を比べる前提です。各モードに期待する大枠は次のように整理できます。

  • Normal — クセが少ない万能モード。指示文にある要素(光・表情・背景)を素直に再現する方向の出力になりやすい想定
  • Fun — 遊び寄りに振った演出強めのモード。同じ指示でも色味や雰囲気を少し誇張する方向の出力になりやすい想定
  • Custom — スタイルや要素を細かく指定できるカスタマイズ寄りのモード。Normal の素直さを残しつつ、追加指定(カメラワーク・色温度など)で世界観を寄せられる想定

判定軸は本記事冒頭で定義した3つ(出力の方向性 / プロンプト解釈の癖 / 推奨ユースケース)です。静的シーンでは特に、(b) プロンプト解釈の癖が読み取りやすく、Normal が指示通り出すのに対して Fun がどこを盛るか、Custom がどこまで寄せられるかの差が見えやすいはずです。

※本章の3モードぶんの実機キャプチャ(同一プロンプトでの出力静止画 or 短尺クリップ)は、編集者が実機検証のうえ後日差し込みます。差分の所感(どのモードがどう寄ったか)もキャプチャ確定後に確定します。

②動きの強いシーン:商品紹介の回転

2本目は動きの強いシーンとして、商品紹介系リールでよく使う 被写体の回転 + 軽いズームイン を含むプロンプトを各モードに投げます。Grok Imagineで生成できるクリップは6秒前後と短いため、動きの方向性が一発で見えるかが鍵になります。

検証プロンプトは次の文面を使う想定です。

A sleek matte-black wireless earbud case slowly rotating on a clean white pedestal, soft studio lighting from upper left, smooth dolly-zoom in over 6 seconds, product reveal style.

動きが入る題材は、(b) プロンプト解釈の癖の差がはっきり出やすい領域です。各モードに期待する大枠は次のとおりです。

  • Normal — 回転とズームを指示通りに素直に解釈する方向。商品の見せ方として落ち着いた仕上がりになりやすい想定
  • Fun — モーションを少し誇張する方向。回転スピードや光の動きを盛って、SNS映えする派手なリールに寄りやすい想定
  • Custom — 回転速度・カメラ距離・光の方向などを細かく指示して、ブランドの世界観に寄せた仕上がりを狙える想定

商品紹介の用途では、Normal が安定の第一候補Fun が掴み重視のSNSリール候補Custom がブランドカラーに合わせ込みたいときの候補、という3者の住み分けになりやすい構造です。実際の優劣は出力傾向に依存するため、編集側の実機キャプチャを確定してから断定します。

※本章の3モードぶんの実機キャプチャ(同一プロンプトでの出力動画の代表フレーム or 短尺クリップ)は、編集者が実機検証のうえ後日差し込みます。モーション解釈の癖の差分コメントもキャプチャ確定後に確定します。

③抽象演出:雰囲気重視のリール

3本目は被写体ではなく 色・光・空気感 を軸にした抽象演出系のプロンプトを各モードに投げます。SNSリールやミーム的に拡散させる短尺動画で使われるパターンで、ここがいちばんモードごとの演出の差が出やすい領域です。

検証プロンプトは次の文面を使う想定です。

Hazy dreamlike loop of warm orange and pink sunset light leaking through wind-blown curtains, slow camera drift, lo-fi aesthetic, subtle film grain, no human subject.

抽象演出は具体物が無いぶん、(a) 出力の方向性の差がそのまま結果に出ます。各モードに期待する大枠は次のとおりです。

  • Normal — 指示文に書かれた色と光をそのまま再現する方向。落ち着いたムードビデオに寄りやすい想定
  • Fun — 色を盛り、動きを派手にしてアレンジを足す方向。SNS で目を引くバズりやすい仕上がりになりやすい想定
  • Custom — 色温度・グレイン・カメラドリフト速度などを細かく指定して、特定の作風(例: 90s 映画調、Lo-Fi MV調)に寄せ込める想定

抽象演出は どれが正解とも言いにくい領域 なので、本章はモードごとに想定される傾向と『刺さる用途』をセットで読者に渡すのが本来の役割です。SNSリール本数を稼ぎたい運用なら Fun、ブランドの世界観を統一したい運用なら Custom、無難に安定させたいなら Normal、という整理を出力傾向の確認後に確定します。

※本章の3モードぶんの実機キャプチャ(同一プロンプトでの出力動画の代表フレーム or 短尺ループ)は、編集者が実機検証のうえ後日差し込みます。演出寄り出力の差分コメントもキャプチャ確定後に確定します。

ユースケース別のおすすめモード

ここまでの比較を、いま手元にある用途に翻訳します。比較表は読んでも『で、自分はどれ?』が残るので、よくある4つの用途で先に答えを出しておきます。

結論からまとめると、次のマトリクスがそのまま判断材料になります。

用途第一候補補欠選ぶ理由
SNS用ループ動画(リール / TikTok / ショート)FunNormal派手で目を引く演出に振りやすく、6秒で掴みを作りやすい
商品紹介(EC / ブランド)NormalCustom指示通り素直に出るので商品の見え方を崩しにくい。世界観を寄せたい時は Custom
演出強めリール(ムード重視 / Lo-Fi 系)CustomFun色温度や動きを細かく指定して作風に寄せ込みやすい
ミーム的バズ用(笑い / 一発ネタ)FunNormal誇張寄りの出力がミームと相性が良い。安定が欲しければ Normal

このマトリクスは『迷ったらこれを最初に試す』のショートカットです。最初の1〜2回はおすすめ通りに投げて、出力の癖を体で掴んでから、必要に応じて別モードに切り替えるのが効率的です。

なお、4つの用途のうちどれにも Normal が補欠以上で残るのがポイントです。Normal は『万能の基準値』として機能する ので、Fun / Custom で迷ったらまず Normal で1本作り、その結果を比較対象にすると判断が早くなります。

モード切替後の再生成手順とクレジット感覚

気に入ったモードが見つかったら、あとは同じプロンプトをそのモードで投げ直すだけです。実務手順はシンプルなので、流れだけ整理しておきます。

  1. プロンプト入力欄の上(または横)にあるモード切替バーから、使いたいモードを選び直す
  2. プロンプト本文はそのまま、必要なら細かい言い回しだけ調整して送信する
  3. 出力された動画(6秒前後の短尺クリップ)を確認し、満足できなければ同じ手順で再生成する

モードを切り替えても、過去に生成した動画は履歴側に残るので消えません。比較しながら気軽に切り替えできる のがGrok Imagineの良さで、最初の数本は『どのモードが自分の用途に合うか』の探索だと割り切るのがおすすめです。

気になるのが 動画生成1本あたりの感覚的なコスト ですが、本記事では深掘りしません。プランごとの上限本数やクレジット周りは更新が入りやすい領域なので、最新情報は別記事にまとめています。料金体系の最新情報は別記事を参照してください。

細かいクレジット消費の刻みを気にするより、最初の数本は 『失敗してもいいから3モード全部投げる』 のが結果的に近道です。比較してこそ向き不向きが見えるので、まずは手を動かす導線を最優先にしましょう。

Spicyモードについて:本記事では扱わない理由

Grok ImagineのUIにはNormal / Fun / Customに加えて Spicy モードが並んで見えますが、本記事ではこのモードの使い方は扱いません。Spicyは成人向け(NSFW)寄りの出力に振ったモードで、本記事が想定する『SNSループや商品紹介など健全用途で動画を作りたい読者』とは目的が違うためです。

健全用途の比較が目的であれば、Normal / Fun / Customの3モードだけ覚えておけば困りません。UI上でSpicyが視界に入っても、用途が違うものとして触らずに進めるのがおすすめです。

Spicyモードの仕様や使い方そのものを知りたい場合は、姉妹メディアであるmania ai側の解説記事に住み分けています。Grokの成人向け機能を扱う記事はそちらにまとまっているので、必要な読者はそちらを参照してください。

Grok Imagineのモード選びでよくある質問

Q
Grok Imagineのモードは画面上で日本語表記ですか?
A

現状はNormal / Fun / Custom / Spicyという英語表記のまま並んでいます。xAIのアップデートで日本語ラベルに変わる可能性はありますが、本記事では画面上の英語表記をそのまま採用しているため、UIで見える表記と本記事の名前が一致するはずです。日本語ラベルに切り替わった場合は、対応する英語名で読み替えてください。

Q
モードを変えると同じプロンプトでも結果が変わりますか?
A

はい、変わります。これがそもそも本記事でモードを比較した理由でもあります。Normalは指示通りに素直に出す方向、Funは色や動きを少し誇張する方向、Customは細かい指定を効かせやすい方向と、設計が違うので、同じプロンプト文でも仕上がりの方向性が変わります。

Q
CustomモードはNormalと比べてどんな指定が増えますか?
A

Customは『スタイルや要素を細かく寄せる』ことを目的にしたモードで、カメラ距離・色温度・グレイン・参考スタイルなどの追加指定を効かせやすい設計です。Normalがプロンプト文を素直に解釈するのに対して、Customは追加指定によって作風や世界観を寄せ込めると考えてください。

Q
途中でモードを切り替えると過去の動画は消えますか?
A

消えません。モード切替はあくまで『次に生成する動画にどのモードを使うか』の選択で、過去に生成した動画は履歴側に残ります。気軽に切り替えながら比較できるので、最初の数本は3モード全部試して感触を掴むのがおすすめです。

Q
Spicyモードを誤って選んでしまったらどうすればいいですか?
A

出力前であれば、モード切替バーからNormal / Fun / Customのいずれかに戻すだけで通常の生成に戻れます。すでに生成してしまった場合は、その動画を削除して、改めて使いたいモードで生成し直してください。Spicyモードの詳細を知りたい場合は、本記事で扱わず姉妹メディア側に住み分けています(前章のリンク参照)。

迷ったらNormal、用途で割り切るならFunとCustom

本記事のまとめです。Grok Imagineの3モードは、それぞれ役割がはっきり違います。

  • Normal — 万能の基準値。迷ったら最初に試す
  • Fun — SNSループやミーム系で『派手に振りたい』時の第一候補
  • Custom — ブランドカラーや作風を寄せ込みたい商品紹介・ムードリール向け

4つの用途(SNSループ / 商品紹介 / 演出強めリール / ミーム的バズ)に対して、補欠まで含めるとどの用途にも Normal が残るのが特徴です。最初の1本はまず Normal で出して、結果を見てから Fun か Custom に切り替える のがいちばん効率的な使い方になります。

3モード全部を1回ずつ試すコストは6秒動画3本ぶんなので、検討段階で迷う時間より、まず投げて比較する方が結論が早く出ます。Grok Imagineは『気軽に切り替えながら比較できる』のが利点なので、本記事のマトリクスを片手に、まずは1本目を投げてみてください。

次の一手としては、プロンプトの書き方そのものをもう一段詰めるとモードの差を引き出しやすくなります。プロンプト設計や料金プランの最新情報は別記事にまとめているので、合わせて読むと深掘りできます。

実際に稼いでいる人の画像生成AIのスキルと収益化方法を知っていますか?

romptn ai が開催する完全無料のAIクリエイターセミナーでは、現場で活躍するプロから下記のような内容を学べます。

  • ゼロから画像生成AIで収益化を達成するための具体的なロードマップ
  • 実績のある講師が実践する初心者を脱出するための必須スキルと最新ツール
  • Nano Banana や Grokなどスマホからでもできる本格的な画像生成AI活用方法
  • 広告画像や映像など実際の制作過程をイメージするための講師によるライブデモ

2時間のオンラインセミナーで、ただ画像生成AIや動画生成AIの上級スキルや最新ツールを知るだけでなく、実際に収益化を達成する一歩を踏み出すための必須知識を学ぶことができます。

沖
講師 沖@画像生成
画像生成クリエイター Xフォロワー 5.5万人 romptn ai 監修者
  • 大手企業6社と契約実績(TOYOTA, mercari, 伊藤園 等)
  • AI映画制作3本、WORLD AI FILM FESTIVAL 2026 in KYOTO にて2冠達成
  • Best AI Anime 受賞
  • Japan Best AI Film(グランプリ)受賞(応募431作品中)
  • 経歴:元WEBデザイナー・マーケター → 2023年に生成AIと出会い転身 → プロのAIクリエイターへ
受付中 完全無料 先着限定 オンライン

本物のプロとハンズオン形式で学ぶ2026年版画像生成AI最前線セミナー

セミナー内容詳細をみる 今すぐ予約する方もこちら
Grok
romptn Magazine
画像生成AIのプロから無料で学べる! クリエイターセミナーの詳細をみる