Z-Imageを動かすには結局どれくらいのVRAMが必要ですか？

情報源によって数字が割れますが、目安としては推奨16GB、量子化版を使えば6〜8GBクラスでも動作すると幅で捉えておくと安全です。割れる理由は、公式の配布情報がフル精度を前提に16GBを推奨する一方、実測ベースの比較では8GB前後から動くと整理されているためです。どちらが正しいというより、量子化を使うかどうかで前提が変わります。自分のGPUで足りるか判断したいときは、前半の比較表でSDXL・SD3.5の必要VRAMと並べて確認してください。

今まで使っていたSDXL用のLoRAはZ-Imageでそのまま使えますか？

そのままは使えません。Z-ImageはSDXLとモデルの土台(アーキテクチャ)が異なるため、SDXL向けに作られたLoRAをそのまま読み込むことはできません。ただし、これは「資産を失う」というより作り直しのコストの問題です。Z-Image用のControlNetは公式のControlNet Union(Canny・Depth・Lineartなどに対応)が用意されており、Z-Image用のLoRAを自分で学習する手段も出てきています。ワークフローの主要な部品は、そのまま移植はできなくても再構築できる範囲が広がりつつある、と捉えておくとよいでしょう。

Z-Imageではネガティブプロンプトが効かないというのは本当ですか？

おおむね本当です。Z-Image(Turbo)は少ないステップで一気に描き切るために高速化のチューニングが施されており、その仕組み上、ネガティブプロンプトが事実上ほとんど効きません。そのため、SDXLのように「描きたくないものをネガティブ側に列挙する」運用は前提が変わります。避けたい要素を打ち消すのではなく、描きたいものを肯定文(ポジティブプロンプト)で具体的に書き込むことで仕上がりをコントロールするのがコツです。

Z-Imageは商用利用しても大丈夫ですか？

執筆時点では、Z-Image(Turbo)はApache-2.0ライセンスで公開されており、商用利用が認められています。ライセンスは更新されることがあるため、実際に業務で使う前には配布元のモデルカードに記載された利用条件を一度確認しておくと安心です。生成物の扱いや表記義務など、細かい条件はライセンス本文が最終的な根拠になります。

アニメ・イラストを描くならZ-ImageとSDXLのどちらが向いていますか？

アニメ・イラスト中心なら、執筆時点ではSDXLのほうが向いています。SDXLにはPonyやIllustriousといったアニメ・イラストに特化した派生モデルとLoRAの蓄積があり、この領域ではまだ厚みがあります。一方でZ-Imageは写実的な人物表現に強く、リアル系の用途で速度を活かしたいときに向きます。作風で向き不向きがはっきり分かれるため、両方を用途で使い分けるのも現実的な選択です。SDXL側のモデル選びを深掘りしたいときは、関連する解説ガイドも参考になります。

Z-ImageとSDXL・SD3.5を比較！乗り換え・併用・据え置きの判断軸

Z-Imageの話題でまず流れてくるのは、わずかなステップで一気に描き切れるという速さの評判です。けれどSDXLやSD3.5を使い込んできたあなたが本当に知りたいのは、たぶん「速いかどうか」ではないはずです。

気がかりなのは、これまで集めて育てたLoRA資産や、組み上げてきたControlNet中心のワークフローを手放してまで移る価値があるのか、という一点でしょう。一方的な乗り換え推奨は、その不安には答えてくれません。

この記事では、速さの数字に飛びつく前に、あなたの作風と手元のGPUを起点にして判断できるよう、乗り換え・併用・据え置きの3つの軸で整理します。読み終えるころには、自分がどの選択に近いかと、その次にやることがはっきり見えているはずです。

内容をまとめると…

Z-ImageとSDXL・SD3.5の差は性能の優劣ではなく、作風と手元のGPUのどちらに合うか
本当の論点は速さより、積み上げたLoRA資産とControlNetワークフローを手放す価値があるか
失うのはファイルそのものではなく作り直す手間で、公式ControlNet Unionや自作LoRA学習で再構築できる
写実+速度ならZ-Image、アニメ・イラストや重いLoRA運用ならSDXL据え置きが合理的
全面乗り換えか今のままの二択ではなく、用途で振り分ける併用が現実解になりやすい

プロンプト・導入・制作フローをまとめて学びたい方向けに、AI制作に役立つ無料資料を用意しています。

画像生成だけでなく、AIに作業を任せるためのエージェント活用資料もあわせて受け取れます。

クリエイター向け資料を受け取る

本当の悩みは「速いか」ではない
Z-ImageとSDXL・SD3.5を一覧比較
Z-Imageの特徴と使い勝手の違い
乗り換えで本当に失う資産はどれか
写実とアニメで評価が分かれる理由
用途別の判断軸
Z-Image乗り換えのよくある質問
まとめ

本当の悩みは「速いか」ではない

Z-Image の話題でまず目に入るのは、ステップ数が少なく一気に生成できるという速さの評判です。でも SDXL や SD3.5 を使い込んできたあなたが本当に気にしているのは、たぶんそこではありません。

気がかりなのは、今まで集めて育てた LoRA や、組み上げてきた ControlNet 中心のワークフローです。これを手放してまで新しいモデルに移る価値があるのか、という一点に尽きるはずです。

ここで効いてくるのがサンクコスト、つまり「これまで注いだ手間や時間がもったいない」という感覚です。これがあるから、速いと聞いても素直に乗り換えに踏み切れません。

そして多くの人が「全部乗り換える」か「今のまま」かの二択で考えがちですが、実際には用途で使い分ける併用という現実解があります。

そこでこの記事では、一方的に乗り換えをすすめるのではなく、あなたの作風と手元の GPU で判断できるように、乗り換え・併用・据え置きという3つの軸で整理していきます。

Z-ImageとSDXL・SD3.5を一覧比較

乗り換えを判断するうえで、まず3つのモデルが何でどれだけ違うのかを同じものさしで並べておきます。

速度・必要VRAM・写実性・既存資産の成熟度・ライセンスを横に並べると、次のようになります。

観点	Z-Image-Turbo	SDXL	SD3.5
パラメータ数	約6B(S3-DiT)	約3.5B	Medium 約2.5B / Large 約8B
速度・ステップ数	約8ステップ・3〜5秒	約20〜30ステップ・15〜30秒	約20〜30ステップ
必要VRAM	推奨16GB(量子化で6〜8GBでも動作)	8GB以上(最適化で4GB)	Medium 8GB以上 / Large 12GB以上
写実性の傾向	写実的な人物に強い	写実から汎用まで幅広い	文字描画が改善
失う資産(LoRA・ControlNet)	新興だが急成長中。公式ControlNet Unionあり	LoRA・ControlNetのエコシステムが最大(Pony・Illustrious等)	コミュニティLoRAはまだ薄い
ライセンス	Apache-2.0(商用可)	モデル提供元の規約に準拠	モデル提供元の規約に準拠

必要VRAMは情報源によって割れます。公式の配布情報では推奨16GBとされる一方、実測ベースの比較では8GB以上から動くと整理されており、これは量子化版を使うかどうかで前提が変わるためです。執筆時点では、フル精度なら16GB前後、量子化すれば6〜8GBクラスでも動く、と幅で捉えておくと安全です。

もうひとつ押さえたいのが、速度の速さと資産の蓄積はトレードオフだという点です。Z-Imageは少ないステップで一気に描き切る代わりに周辺資産がまだ育ち途中で、SDXLはその逆になります。

Z-Imageの特徴と使い勝手の違い

速さや必要スペックは前の章で並べたので、ここでは数字に出にくい「使ったときの感触」の違いを押さえます。

まず安心材料から。Z-Image-TurboはApache-2.0ライセンスで公開されており、商用利用が明確に許されています。仕事の制作物に使えるかを気にしている人にとっては、判断のハードルがひとつ下がるポイントです。

ライセンスの考え方はモデルごとに異なります。SDXLやSD3.5はそれぞれ提供元の規約に従う形なので、商用範囲を確かめてから使う一手間が要ります。Z-Imageはその点がシンプルです。

使い勝手で一番戸惑いやすいのが、ネガティブプロンプトが事実上効かないことです。Z-Image-Turboは少ない手数で速く描くためにCFGという仕組みを蒸留して組み込んでおり、その副作用として「これは出さないで」という指定がほぼ無視されます。

SDXLやSD3.5では、避けたい要素をネガティブ側に書いて仕上がりを整えるのが定番でした。Z-Imageではこのやり方が通じません。

そのため、出したいものを肯定文のプロンプト側で具体的に言い切る書き方へ切り替える必要があります。今までのプロンプト資産がそのままでは活きにくい、という前提で向き合うのが無難です。

つまりZ-Imageは、商用利用のしやすさという安心感と引き換えに、プロンプトの組み立て方そのものを少し作り直す手間がかかるモデルだと捉えておくとよいでしょう。

乗り換えで本当に失う資産はどれか

ここでは「乗り換えで何を失うのか」を冷静に切り分けます。

失う資産は、永久に消えるものと、作り直せばまた使えるものに分かれます。多くは後者で、つまり再構築のコスト問題です。

まず誤解しやすいのが既存のSDXL用LoRAです。Z-ImageはSDXLと土台のアーキテクチャが異なるため、手元のSDXL用LoRAをそのまま読み込んで使うことはできません。

ただし、これは「二度と作れない」という話ではありません。執筆時点では、家庭用の控えめなVRAMでもZ-Image向けのLoRAを学習できる手順が公開され始めています。

ControlNet中心のワークフローについても、Z-Image向けの公式ControlNet UnionがCanny・Depth・Lineartに対応する形で提供されています。線画やポーズを起点にした制御は引き継げます。

資産ごとに整理すると、扱いは次のようになります。

資産	Z-Imageでの扱い
SDXL用LoRA	そのままは動かない。Z-Image向けに学習し直す
ControlNet(Canny/Depth/Lineart)	公式Unionで引き継げる
プロンプトの書き方	ネガティブ運用は変わるが資産そのものは流用可

つまり、失うのは「ファイルそのもの」ではなく「作り直す手間」です。手間をかける価値があるかは、後ほどの『用途別の判断軸』の章で用途ごとに見ていきます。

写実とアニメで評価が分かれる理由

ここまでの比較を踏まえると、Z-ImageとSDXLのどちらが優れているかは、あなたが何を作るかでほぼ決まります。一方が全面的に強いわけではなく、作風によって向き不向きがはっきり分かれるからです。

Z-Imageは、実在しそうな人物や風景といった写実的な表現に重心を置いてチューンされたモデルです。執筆時点では、このリアル路線では先ほどの比較表で触れた速度の手軽さも相まって扱いやすい選択肢になります。

一方で、アニメやイラストのような二次元の作風になると、評価は逆転します。ここはSDXLが長く積み上げてきた領域で、PonyやIllustriousといったイラスト特化の追加学習モデルが豊富に揃っているためです。

こうした作風特化の蓄積は一朝一夕には生まれません。Z-Imageには、執筆時点でこのイラスト系の追加学習に並ぶ等価物がまだ用意されていません。

つまり優劣ではなく、写実はZ-Imageの土俵、二次元はSDXLの土俵という住み分けです。自分の作風がどちら寄りかを基準に選べば、判断は迷いにくくなります。

用途別の判断軸

ここまでZ-ImageとSDXL・SD3.5を比べてきました。ここからは「あなたはどうすべきか」に絞り込みます。選択肢は全面乗り換えか今のまま据え置きかの二択ではなく、乗り換え・併用・据え置きの3つです。

見落とされがちなのが真ん中の「併用」です。写実は速さの出る新しいモデル、アニメ・イラスト系の用途や使い慣れたワークフローは従来のままと、用途で分ける使い方ができます。全部を入れ替えなくても、効くところだけ取り込めます。

どれが正解かを決めるのは、あなたの用途(どんな作風を作るか)と、手元のGPU(使えるVRAM)の2つです。この2つが、3つの分岐のどこに当てはまるかをほぼ決めます。

この後、乗り換えが向く人・併用が向く人・据え置きが向く人の3つのタイプに分けて、それぞれどんな人が当てはまるかを見ていきます。自分がどこに近いかを当てはめながら読んでみてください。

①乗り換えが向く人

写実寄りの人物や風景を、とにかく速く・たくさん作りたい人です。少ないステップで一気に生成できるZ-Imageは、何度も作り直して当たりを探す制作ほど待ち時間の差が積み上がり、1枚あたりの速さがそのまま回転数に直結します。

描いた線にリアルタイムで絵が追従するcanvas型の制作や、案を量産して当たりを選ぶ使い方では、この速さが体験そのものを変えます。実際にSDXLからZ-Imageへ移したクリエイターも、リアルタイム制作での待ち時間の短さを乗り換え理由に挙げています。

手元のGPUが控えめでも、量子化版を使えば乗り換えを試せます。速さがそのまま制作量や手数の多さに効くワークフローで、写実中心の絵を作る人ほど、Z-Imageへの乗り換えは有力な選択肢になります。

②併用が向く人

写実系の作品も作りつつ、アニメ・イラスト系の作風や使い慣れた制作フローも手放したくない人には、全面乗り換えではなく両方を併用する形が一番現実的です。

理由はシンプルで、Z-Image と SDXL は得意分野がずれているからです。写実的な人物や速さを求める作業は Z-Image に任せ、Pony・Illustrious 系の蓄積が効くアニメ・イラスト系の制作は SDXL のまま残せば、それぞれの強い面だけを使えます。

併用が向くのは、たとえば次のような人です。

写実系の制作で生成の速さを取り込みたいが、アニメ・イラスト系の作風も続けたい
既存の制作フローや過去の作品資産を当面は崩したくない
どちらか一方に絞る確信がまだ持てない

併用の利点は、移行を一気に進めなくて済むことです。まず写実系の一部だけを新しいモデルに置き換え、手応えを見ながら範囲を広げられます。

この段階的なやり方なら、積み上げてきた資産を失うリスクを抑えたまま、速度面のメリットだけを先に取り込めます。迷っている人ほど、いきなりの全面移行より併用から始めるのが無難な選択です。

③据え置きが向く人

次のような読者は、無理に乗り換えず今のSDXL環境を続けるのが現実的な選択です。

アニメ・イラスト領域の作風が中心の人
多数のLoRAを組み合わせて使い込んでいる人
ControlNetをいくつも併用してワークフローを組んでいる人

この領域で蓄積されてきたLoRAやControlNet周りの環境は、執筆時点では新モデル側より厚みがあり、絵柄の作り込みでは依然として一歩先にあります。

すでに手になじんだ資産で狙いどおりの結果が出ているなら、当面は据え置きが合理的です。新モデルが同じ作風で同等の作り込みを再現できるようになってから動いても遅くありません。

SDXL側の資産選びをさらに深めたい場合は、後ほど案内する関連ガイドも合わせて参考にしてください。

Z-Image乗り換えのよくある質問

Q Z-Imageを動かすには結局どれくらいのVRAMが必要ですか？: A
情報源によって数字が割れますが、目安としては推奨16GB、量子化版を使えば6〜8GBクラスでも動作すると幅で捉えておくと安全です。
割れる理由は、公式の配布情報がフル精度を前提に16GBを推奨する一方、実測ベースの比較では8GB前後から動くと整理されているためです。どちらが正しいというより、量子化を使うかどうかで前提が変わります。
自分のGPUで足りるか判断したいときは、前半の比較表でSDXL・SD3.5の必要VRAMと並べて確認してください。

Q 今まで使っていたSDXL用のLoRAはZ-Imageでそのまま使えますか？: A
そのままは使えません。Z-ImageはSDXLとモデルの土台(アーキテクチャ)が異なるため、SDXL向けに作られたLoRAをそのまま読み込むことはできません。
ただし、これは「資産を失う」というより作り直しのコストの問題です。Z-Image用のControlNetは公式のControlNet Union(Canny・Depth・Lineartなどに対応)が用意されており、Z-Image用のLoRAを自分で学習する手段も出てきています。
ワークフローの主要な部品は、そのまま移植はできなくても再構築できる範囲が広がりつつある、と捉えておくとよいでしょう。

Q Z-Imageではネガティブプロンプトが効かないというのは本当ですか？: A
おおむね本当です。Z-Image(Turbo)は少ないステップで一気に描き切るために高速化のチューニングが施されており、その仕組み上、ネガティブプロンプトが事実上ほとんど効きません。
そのため、SDXLのように「描きたくないものをネガティブ側に列挙する」運用は前提が変わります。
避けたい要素を打ち消すのではなく、描きたいものを肯定文(ポジティブプロンプト)で具体的に書き込むことで仕上がりをコントロールするのがコツです。

Q Z-Imageは商用利用しても大丈夫ですか？: A
執筆時点では、Z-Image(Turbo)はApache-2.0ライセンスで公開されており、商用利用が認められています。
ライセンスは更新されることがあるため、実際に業務で使う前には配布元のモデルカードに記載された利用条件を一度確認しておくと安心です。
生成物の扱いや表記義務など、細かい条件はライセンス本文が最終的な根拠になります。

Q アニメ・イラストを描くならZ-ImageとSDXLのどちらが向いていますか？: A
アニメ・イラスト中心なら、執筆時点ではSDXLのほうが向いています。SDXLにはPonyやIllustriousといったアニメ・イラストに特化した派生モデルとLoRAの蓄積があり、この領域ではまだ厚みがあります。
一方でZ-Imageは写実的な人物表現に強く、リアル系の用途で速度を活かしたいときに向きます。
作風で向き不向きがはっきり分かれるため、両方を用途で使い分けるのも現実的な選択です。SDXL側のモデル選びを深掘りしたいときは、関連する解説ガイドも参考になります。