Z-Image を使おうとして、Z-Image-Turbo・Z-Image(通称 Base)・Z-Image-Edit と名前が並び、「結局どれを落とせばいいの?」と手が止まっていませんか。実はこの3つは、目的がはっきり分かれています。この記事では、Turbo・Base・Edit それぞれの役割を整理し、速度・品質・編集というあなたの目的から逆引きで1つに選べるように、比較表と選び方までまとめて解説します。読み終えるころには、自信を持って最初の1本を選べるはずです。
内容をまとめると…
Turbo・Base・Edit は「速度」「品質と学習の土台」「指示編集」で役割が分かれる
推奨ステップ数・CFG・想定VRAM・公開状況は比較表で一目で把握できる
目的から逆引きすれば、迷わず1つのチェックポイントに選べる
入手は HuggingFace と ComfyUI、Edit の現況はコレクションで確認できる
きれいな画像を作れるようになっただけで、収益化できずに止まってませんか?
romptn ai では、実際に画像生成AIで稼いでいるプロを講師に招いた完全無料のAIクリエイターセミナーを開催しています。
2時間のオンラインセミナーで、実際に稼いでいる人が使う最新画像生成AIツールや上級者にステップアップするための必須スキルなどの知識面はもちろんのこと、ゼロから収益化を実現するための具体的なロードマップを体験談ベースで詳しく学ぶことができます。
また、豪華な無料参加特典も用意していますので、ぜひご興味を持った方はお気軽に下記のボタンから詳細をチェックしてみてください!
\ 現役の画像生成AIのプロから学べる! /
無料セミナーの詳細をみるZ-Imageとは?モデルが複数ある理由
Z-Image(ゼットイメージ)は、Alibaba の Tongyi Lab が公開している画像生成モデルです。約60億パラメータの単一ストリーム型 DiT(Scalable Single-Stream DiT)というアーキテクチャを採用し、英語と日本語を含む文字をきれいに描けるバイリンガル文字描画と、写実的な表現に強みがあります。ライセンスは商用利用もしやすい Apache-2.0 です。
戸惑いやすいのは、Z-Image が「1つのモデル」ではなく、目的の違う複数のチェックポイントに分かれている点です。HuggingFace や ComfyUI では Z-Image-Turbo・Z-Image(通称 Base)・Z-Image-Edit といった名前が並び、どれを選べばよいか迷いがちです。
この分かれ方はシンプルで、「速さ」のTurbo・「品質と学習の土台」のBase・「指示で編集」のEdit という役割分担になっています。次章から、それぞれの中身と選び方を順に整理していきます。
3つのバリアントの役割

Z-Image のチェックポイントは、ざっくり3つの役割で覚えると混乱しません。
- Turbo:生成を高速化した蒸留版。少ない計算で素早く1枚を出したいとき向け。
- Base(foundation):速度より品質と汎用性を優先した非蒸留版。追加学習(LoRA など)の土台にも使われます。
- Edit:文章の指示で既存画像を編集する派生版。
つまり「まず試す・量産する」なら Turbo、「画質を詰める・自分用に育てる」なら Base、「すでにある画像を直す」なら Edit、という住み分けです。
なお、現時点で実際にダウンロードして使えるのは Turbo と Base が中心で、Edit は順次公開が進んでいる段階です。次の3つの小見出しで、各チェックポイントをもう少し具体的に見ていきます。
① Turbo:速度重視の蒸留版
Turbo は、生成を高速化するために「蒸留」という手法でチューニングされたチェックポイントです。通常のモデルより大幅に少ないステップ数で1枚を生成でき、ガイダンス(CFG)もオフ前提で動くため、待ち時間が短いのが最大の魅力です。
ハイエンド GPU ではほぼ待たされずに生成でき、必要なメモリも抑えめなので、コンシューマ向けの 16GB クラス GPU でも動かしやすいのが実用上のポイントです。推奨ステップ数や必要メモリの目安は、このあとの一覧で具体的に確認できます。
その代わり、蒸留版は画づくりの「伸びしろ」をやや絞っているため、最高画質や細かな作り込み、追加学習の土台にはあまり向きません。まず Z-Image を触ってみたい人や、枚数を多く出したい人の最初の1本として最適です。迷ったらここから始めるのがおすすめです。
② Base:品質と学習の非蒸留版
Base は、蒸留していない「素」のチェックポイントです。HuggingFace 上の正式なリポジトリ名は単に Z-Image ですが、ComfyUI やコミュニティでは Turbo と区別するため通称「Base」と呼ばれています。
性格は Turbo と正反対です。生成に踏むステップ数は多く時間もかかりますが、その分だけ描き込みの密度や表現の幅が広がり、ネガティブプロンプトの指定もよく効きます。さらに非蒸留ゆえに追加学習(LoRA やファインチューニング)の土台に向くため、自分用のスタイルやモデルを育てたい人に適しています。
なお公式には、生成と編集の両方を想定したさらに素に近い系統として「Omni-Base」も予告されています。少しややこしいですが、本記事でいう Base は「いま使える非蒸留の foundation(=Z-Image)」を指すと考えてください。
③ Edit:指示で編集する派生版
Edit は、自然な文章の指示で既存の画像を編集する image-to-image 系の派生チェックポイントです。「背景を夜にして」「この服を赤に」といった言葉ベースの指定で、狙った部分を書き換えられることを目指したモデルです。
ただし注意したいのは提供状況です。Edit は公式に予告されているものの、本記事の執筆時点では一般公開が順次進んでいる段階で、Turbo や Base のようにすぐ落として使えるとは限りません。最新の公開状況は HuggingFace の Z-Image コレクションで確認するのが確実です。
いますぐ画像編集をしたい場合は、Edit の公開を待つ間、Base や Turbo を使った通常の image-to-image や、他の編集対応モデルで代用するのが現実的です。Edit が正式に揃えば、Z-Image 単体で生成から編集まで完結しやすくなります。
スペック比較表で違いを把握
3つの違いは、表で並べると一目で掴めます。迷ったときは、まずこの表を基準にしてください(数値は目安で、設定や提供状況によって変わります)。
| 項目 | Turbo | Base(foundation) | Edit |
|---|---|---|---|
| 位置づけ | 高速な蒸留版 | 非蒸留の土台 | 指示で編集する派生 |
| 蒸留 | あり | なし | なし(編集特化) |
| 推奨ステップ | 約8ステップと少なめ | 30〜50ステップと多め | 多め(編集向け) |
| ガイダンス(CFG) | オフ前提(0) | 3〜5程度 | あり |
| 速度感 | 非常に速い | ゆっくり | 編集処理ベース |
| 想定VRAM | 16GBクラスでも動かしやすい | 余裕があるほど安心 | 同程度の想定 |
| 向く用途 | 量産・お試し | 高画質・追加学習 | 既存画像の編集 |
| 公開状況 | 公開済み | 公開済み | 順次公開中 |
表のとおり、速さの Turbo・品質と学習の Base・編集の Edit という軸で性格がはっきり分かれます。次は、この違いを「自分の目的」から逆引きして選ぶ方法を見ていきます。
目的別:どのモデルを選ぶか
どれを選ぶか迷ったら、「何をしたいか」から逆引きするのが早道です。次の基準で1つに絞れます。
- とにかく速く・手軽に・少ないVRAMで出したい → Turbo。最初の1本として最適で、枚数を多く試す用途にも向きます。
- 画質を最大限に詰めたい/自分用に LoRA などで育てたい → Base。時間はかかりますが、描き込みと学習の土台としての強さが効きます。
- すでにある画像を、言葉の指示で編集したい → Edit。ただし公開状況を確認し、未提供なら Base/Turbo の image-to-image で代用します。
実務では「普段は Turbo で素早く当たりを作り、ここぞの仕上げや学習用途だけ Base を使う」という二刀流が扱いやすい組み合わせです。まず Turbo を入れて感触を掴み、必要になったら Base を足す、という順番で十分です。
入手・導入方法とEditの現況

入手先は大きく2つです。1つは HuggingFace の Tongyi-MAI のページで、Turbo と Base(Z-Image)のチェックポイントが配布されています。シリーズ全体の公開状況は「Z-Image」コレクションのページを見ると、どれが公開済みでどれが予定かを一覧で確認できます。
もう1つは ComfyUI です。Z-Image は ComfyUI 側が公開と同時に公式ワークフローを用意しており、ノードを組まなくてもテンプレートから動かし始められます。ローカルで画像生成を回している人は、こちらが導入しやすいでしょう。
Edit の現況については、上記の HuggingFace コレクションが一次情報になります。「使えるようになったか」を知りたいときは、まずそこをチェックするのが確実です。導入で迷ったら、まず Turbo をダウンロードして ComfyUI のテンプレートで1枚出してみるのが、最短の入口になります。
よくある質問
- QZ-Image-Edit は今すぐ使えますか?どこで公開状況を確認できますか?
- A
執筆時点では順次公開が進んでいる段階で、Turbo や Base のように必ずしもすぐ落として使えるとは限りません。最新の提供状況は、HuggingFace の Tongyi-MAI「Z-Image」コレクションのページを見るのが確実です。編集をすぐ行いたい場合は、公開を待つ間 Base や Turbo の image-to-image で代用できます。
- Qとりあえず Turbo だけ入れておけば十分ですか?
- A
多くの人はまず Turbo で十分です。少ないステップで速く生成でき、必要メモリも抑えめなので、お試しや量産に向きます。一方で、画質を最大限に詰めたい、あるいは LoRA などで自分用に学習させたい場合は、非蒸留の Base が必要になります。普段は Turbo、ここぞの場面だけ Base、という使い分けがおすすめです。
- Q通称 Base(foundation)と公式の Omni-Base は何が違うのですか?
- A
本記事の Base は、いま使える非蒸留の foundation チェックポイント(HuggingFace 上の名称は
Z-Image)を指します。Omni-Base は、生成と編集の両方を想定したさらに素に近い系統として公式が予告しているもので、別物です。まずは「Base=非蒸留の土台」と覚えておけば、実用上は混乱しません。
- Q自分の GPU(VRAM)でも Turbo / Base は動きますか?
- A
Turbo はメモリ消費が比較的軽く、16GB クラスのコンシューマ GPU でも動かしやすい設計です。Base はステップ数が多く処理も重いため、VRAM に余裕があるほど安心して回せます。具体的な必要量は環境や設定で変わるため、まずは Turbo で試し、足りなければ設定を軽くする、という進め方が無難です。
まとめ
Z-Image は1つのモデルではなく、目的別のチェックポイント群です。迷ったら、次の3点だけ押さえれば選べます。
- Turbo:速くて手軽な蒸留版。まず試す・量産するならこれ。
- Base(foundation):非蒸留で高画質、LoRA などの学習の土台。仕上げや育成向け。
- Edit:言葉の指示で画像を編集する派生版。公開状況を確認して使う。
基本は「普段は Turbo、画質と学習は Base、編集は Edit(現状は順次公開中)」という住み分けです。ステップ数や CFG、必要 VRAM の目安は前半の一覧で確認できるので、設定に迷ったらそこへ戻れば大丈夫です。まずは Turbo を1本入れて、ComfyUI のテンプレートで生成を試すところから始めてみてください。
実際に稼いでいる人の画像生成AIのスキルと収益化方法を知っていますか?
romptn ai が開催する完全無料のAIクリエイターセミナーでは、現場で活躍するプロから下記のような内容を学べます。
- ゼロから画像生成AIで収益化を達成するための具体的なロードマップ
- 実績のある講師が実践する初心者を脱出するための必須スキルと最新ツール
- Nano Banana や Grokなどスマホからでもできる本格的な画像生成AI活用方法
- 広告画像や映像など実際の制作過程をイメージするための講師によるライブデモ
2時間のオンラインセミナーで、ただ画像生成AIや動画生成AIの上級スキルや最新ツールを知るだけでなく、実際に収益化を達成する一歩を踏み出すための必須知識を学ぶことができます。
- 大手企業6社と契約実績(TOYOTA, mercari, 伊藤園 等)
- AI映画制作3本、WORLD AI FILM FESTIVAL 2026 in KYOTO にて2冠達成
- Best AI Anime 受賞
- Japan Best AI Film(グランプリ)受賞(応募431作品中)
- 経歴:元WEBデザイナー・マーケター → 2023年に生成AIと出会い転身 → プロのAIクリエイターへ

