FLUX.2のマルチリファレンスは何枚まで使えますか？

執筆時点の公式情報では、FLUX.2 max / pro / flex はAPIで最大8枚、Playgroundで最大10枚が目安です。FLUX.2 kleinは最大4枚、FLUX.2 devは最大6枚推奨と案内されています。ただし、出力サイズや合計画素数の条件で変わるため、使うモデルの最新ドキュメントを確認してください。

商品写真の背景だけを変えることはできますか？

できます。ただし、商品画像を主役の参照として指定し、背景画像は背景や光だけの参照だと明記することが大切です。ロゴ、ラベル、形、素材など、変えたくない要素はプロンプトで具体的に残す指示を入れてください。

同じキャラクターを毎回完全に固定できますか？

完全固定を保証するものではありません。顔立ち、髪型、衣装、雰囲気をそろえる助けにはなりますが、角度や表情、細部は揺れます。長期的に同じキャラを使う場合は、マルチリファレンスで方向性を試したうえでLoRAも検討するとよいです。

ComfyUIでも同じように使えますか？

ComfyUIでもFLUX.2系のワークフローは広がっていますが、公式APIやPlaygroundとは操作方法も制限も異なります。初心者はまず公式環境で挙動を確認し、必要になってからローカル環境へ移すほうが失敗原因を切り分けやすいです。

FLUX.2のマルチリファレンスとは？商品写真・キャラ固定の使い方を解説

FLUX.2のマルチリファレンスは、複数の画像を入れるだけで商品やキャラが自動で固定される魔法の機能ではありません。うまく使う鍵は、参照画像ごとに「残すもの」と「変えるもの」を分けて指示することです。

この考え方を押さえると、商品写真の背景替え、ブランドトーンの統一、同じキャラクターの別シーン展開がかなり扱いやすくなります。一方で、参照画像数や解像度、APIとPlaygroundの違いを知らないまま始めると、思ったより早くつまずきます。

この記事では、FLUX.2のマルチリファレンスの基本、商品写真・キャラ固定での使い方、使える枚数の目安、失敗した時の直し方までを初心者向けにまとめます。読み終えるころには、まず何枚の画像で、どんな指示から試せばよいか判断できるはずです。

内容をまとめると…

複数参照は画像ごとの役割指定が品質の分岐点
商品写真は商品本体と背景・光・作風を分けるほど安定
APIは最大8枚、Playgroundは最大10枚が目安
キャラ固定は一貫性の補助であり完全保証ではない
長期運用の同一キャラにはLoRAも選択肢

プロンプト・導入・制作フローをまとめて学びたい方向けに、AI制作に役立つ無料資料を用意しています。

画像生成だけでなく、AIに作業を任せるためのエージェント活用資料もあわせて受け取れます。

クリエイター向け資料を受け取る

まず使い方の全体像
商品写真で使うコツ
キャラ固定でできること
使える枚数と制限
うまくいかない時の直し方
よくある質問
まとめ

まず使い方の全体像

ここでは、FLUX.2のマルチリファレンスを実際に使う前の全体像を固めます。

マルチリファレンスは、複数の参照画像を渡して「この商品は残す」「この背景の雰囲気を使う」「この人物の特徴を保つ」のように生成を誘導する使い方です。単に画像を多く入れる機能ではなく、画像ごとの役割を分ける機能と考えると失敗しにくくなります。

最初は、参照画像を用意する、役割を決める、プロンプトで指定する、結果を見て直す、という4段階で進めるのが扱いやすいです。商品写真でもキャラ固定でも、この順番はほぼ同じです。

① 参照画像を用意する

参照画像は「入れられるだけ入れる」より、目的から逆算して選びます。固定したいものが商品なら商品単体、キャラなら顔や服装がわかる画像、雰囲気を借りたいなら背景やライティングが伝わる画像を用意します。

最初のテストでは2〜3枚に絞ると扱いやすくなります。主役画像が1枚、変えたい要素の参考が1〜2枚あるだけでも、結果の原因を追いやすくなります。

暗すぎる画像、ロゴが小さい画像、複数の商品や人物が混ざった画像は、AIがどこを参照すべきか迷いやすいです。できるだけ主役がはっきり見える画像から始めてください。

② 画像の役割を決める

参照画像を選んだら、それぞれに役割を付けます。ここを曖昧にすると、商品を固定したいのに背景まで引っ張られたり、作風だけ借りたいのに人物の顔まで混ざったりします。

たとえば、次のように分けます。

画像	役割	残したいもの	変えてよいもの
画像1	商品参照	形、色、ロゴ	背景、影
画像2	背景参照	場所の雰囲気	商品の形
画像3	作風参照	光、質感、色調	被写体そのもの

この整理を先にしておくと、プロンプトも短く正確になります。

③ プロンプトで指定する

プロンプトでは、画像の役割、残したい特徴、変えたい要素を分けて書きます。日本語でも考え方は同じですが、英語のほうがモデルに伝わりやすい場面もあります。

商品写真なら、次のような形です。

Use image 1 as the product reference. Keep the bottle shape, label design, logo, and material. Use image 2 only as the background and lighting reference. Create a clean e-commerce product photo on a bright kitchen counter. Do not change the product design.

大事なのは「何を残すか」だけでなく「何を参照しないか」も書くことです。特にロゴ、顔、服、商品の形は崩れると気づきやすいので、明示しておく価値があります。

④ 結果を見て直す

1回で狙い通りに出すより、結果を見て原因を切り分けるほうが早いです。商品が崩れたなら商品参照を強くし、背景が弱いなら背景参照をより明確な画像に変えます。

修正時は、同時に多くの条件を変えないでください。参照画像を1枚減らす、役割文を1文足す、出力サイズを下げる、のように一つずつ変えると、何が効いたか判断できます。

マルチリファレンスは「正解画像をそのままコピーする」機能ではありません。近づけたい要素を選び、不要な混ざり方を減らす機能として使うと安定します。

商品写真で使うコツ

ここからは、ECの商品写真や広告素材で使う場合に絞って見ていきます。

商品写真で一番大事なのは、商品本体の情報を守ることです。形、色、ロゴ、パッケージ、素材感が変わると、きれいな画像でも実物と違う素材になってしまいます。

FLUX.2のマルチリファレンスは、商品を保ったまま背景や見せ方を変える用途と相性があります。たとえば、同じボトルを白背景、キッチン、ギフト向けの雰囲気に出し分ける、といった使い方です。

ただし、ブランドロゴや文字は崩れやすい要素です。納品前提の素材では、生成後に必ず原本と見比べて確認してください。

① 商品を固定する

商品を固定したい場合は、商品単体の参照画像を主役にします。背景や作風の画像よりも先に、商品そのものがはっきり写った画像を入れてください。

プロンプトでは、残す要素を具体的に書きます。「same product」だけでは弱いので、ボトル形状、ラベル、ロゴ位置、素材、色のように、変わると困る点を列挙します。

一方で、背景や影は変えてよいと明記します。商品を残す指示と背景を変える指示を分けることで、モデルが守るべき優先順位を理解しやすくなります。

② 背景と光を変える

背景や光を変えるときは、背景参照を「場所や雰囲気の参考」として扱います。商品参照と背景参照を同じ重さで混ぜると、背景の物体が商品側に入り込むことがあります。

たとえば、商品は白いボトル、背景は朝のキッチン、光は自然光というように分けます。プロンプトでは「use image 2 only for background and lighting」と書くと、背景の役割が伝わりやすくなります。

EC用なら、背景を盛りすぎないことも大切です。商品が主役に見える明るさ、余白、影の自然さを優先すると、広告っぽさと実用性のバランスが取りやすくなります。

③ 作風だけを借りる

作風参照は、色調、質感、光の当たり方、構図の雰囲気だけを借りたいときに使います。商品写真では便利ですが、参照画像の被写体まで混ざると失敗になります。

そのため、作風画像には「style only」「do not copy objects from this image」のような役割を持たせます。商品を固定する画像と、作風を借りる画像を同じ説明に混ぜないことがポイントです。

ブランド素材を作る場合は、毎回同じ作風参照を使うとトーンが揃いやすくなります。ただし、ロゴや商品名の正確さは別途確認が必要です。

キャラ固定でできること

次に、キャラクターや人物を一定の見た目で出したい場合の考え方です。

FLUX.2のマルチリファレンスは、顔立ち、髪型、服装、体型、画風などをそろえる助けになります。BFL公式のユースケースでも、同じキャラクターの一貫性を保ちながらシーンを変える使い方が示されています。

プロンプトでは、商品写真と同じく「残す要素」と「変える要素」を分けて書きます。たとえば次のような形です。

Use image 1 as the character reference. Keep the same face, hairstyle, and outfit. Use image 2 only as the scene reference for a cafe interior. Change the pose and camera angle. Do not copy any people or text from image 2.

顔・髪・服のように崩れると気づきやすい要素を残す指定にまとめ、ポーズや背景だけ変えると、同じキャラの別シーンを作りやすくなります。

ただし、完全に同じ人物を毎回保証する機能ではありません。角度、表情、年齢感、服の細部は揺れます。参照画像が少なすぎると特徴が弱くなり、多すぎると特徴が混ざることもあります。

SNS投稿やラフ案の量産には向いていますが、長期連載の主人公や広告の公式キャラのように厳密な統一が必要なら、後ほどのLoRAも検討してください。

使える枚数と制限

ここでは、マルチリファレンスで誤解しやすい枚数とサイズの制限を整理します。

BFL公式ドキュメントでは、FLUX.2のモデルごとに参照画像数の目安が分かれています。特にAPIとPlaygroundで上限が違う点に注意してください。

経路・モデル	参照画像数の目安	注意点
FLUX.2 max / pro / flex API	最大8枚	出力サイズや合計画素数の影響を受ける
FLUX.2 max / pro / flex Playground	最大10枚	まず試す用途に向く
FLUX.2 klein	最大4枚	軽めに試したい用途向け
FLUX.2 dev	最大6枚推奨	ローカルや周辺ツール側の対応差に注意

仕様は更新される可能性があります。実制作では、使うモデル名と実行経路を先に決めてから参照画像を準備するのが安全です。

① APIとPlayground

APIは、サービスや自動化に組み込みたい人向けです。参照画像をパラメータとして渡せるため、同じ商品画像を使って大量のバリエーションを作るような運用に向いています。

Playgroundは、まず見た目を試したい人向けです。操作が視覚的で、複数画像を入れながら結果を確認しやすいので、初心者はここから始めると判断しやすくなります。

どちらが優れているというより、目的が違います。検証はPlayground、量産や社内ツール化はAPI、という分け方が実務ではわかりやすいです。

② 解像度と画像サイズ

参照画像の枚数だけでなく、画像サイズも結果に影響します。大きすぎる画像を何枚も入れると、アップロードや生成で失敗したり、使える参照枚数が減ったりします。

BFLのマルチリファレンスガイドでは、FLUX.2 proのAPIについて入力画像と出力画像の合計画素数の制限が案内されています。高解像度で出したいほど、同時に使える参照画像は減ると考えてください。

最初は、参照画像を必要な範囲で切り抜き、主役が見えるサイズに整えるのが実用的です。不要な余白や背景まで大きく入れると、参照の焦点がぼやけます。

③ ComfyUIとの違い

ComfyUIは、ローカル環境でワークフローを組みたい人向けの選択肢です。ノードで細かく制御できる一方、モデル、VRAM、依存関係、ワークフロー更新の理解が必要になります。

初心者が「FLUX.2のマルチリファレンスで何ができるか」を知りたい段階なら、まずはPlaygroundや公式APIで挙動を確認するほうが早いです。うまくいく条件がわかってからComfyUIへ移すと、原因不明の失敗を減らせます。

NVIDIAもFLUX.2のComfyUI利用に触れていますが、ローカル実行は環境差が出やすい分野です。記事やワークフローを参考にするときは、公開日と対応モデルを必ず確認してください。

うまくいかない時の直し方

ここからは、生成結果が思った通りにならない時の直し方です。

失敗の多くは、モデル性能だけでなく「参照画像が多すぎる」「役割が曖昧」「残す要素と変える要素が混ざっている」ことで起きます。まずはプロンプトを長くする前に、参照画像と役割分担を見直してください。

確認する順番はシンプルです。

主役の参照画像だけで生成して、固定したい要素が残るか見る
背景や作風の参照を1枚ずつ足す
崩れたタイミングで、その画像の役割文を直す
それでも崩れる場合は参照画像を減らす

この順番なら、どの条件が悪さをしているか追いやすくなります。

① 参照画像を減らす

結果が崩れると、つい参照画像を増やしたくなります。しかし、複数の画像が同じ役割を持つと、モデルはどの特徴を優先すべきか迷います。

まずは主役画像1枚で生成し、商品やキャラの核が残るか確認します。その後、背景、作風、ポーズのように役割が違う画像だけを1枚ずつ足してください。

似たような画像を何枚も入れるより、役割の違う少数の画像を使うほうが安定しやすいです。特にロゴや顔が崩れる場合は、主役以外の参照を一度外すと原因を切り分けられます。

② 役割指定を直す

役割指定は、「画像1を参考にする」だけでは足りません。何を残すのか、何を変えてよいのか、何を真似しないのかを分けて書きます。

たとえば、商品写真なら次のように直します。

残す: 商品の形、色、ロゴ、ラベル
変える: 背景、影、配置、小物
真似しない: 背景画像に写った別の商品や人物

キャラ固定でも同じです。顔立ち、髪型、衣装を残し、ポーズや背景だけ変えると書くと、不要な混ざり方を減らせます。

③ LoRAも検討する

マルチリファレンスは、画像を用意してすぐ試せるのが強みです。一方で、毎回同じキャラを長期的に出し続ける用途では、参照画像だけだと細部の揺れが残ります。

同じ人物、同じ衣装、同じ画風を何十枚も作るなら、LoRAのようにキャラや作風を学習させる方法も候補になります。準備は重くなりますが、継続運用では一貫性を作りやすくなります。

まずはマルチリファレンスで方向性を試し、固定したいキャラが固まった段階でLoRAを検討する流れが現実的です。

よくある質問

Q FLUX.2のマルチリファレンスは何枚まで使えますか？: A
執筆時点の公式情報では、FLUX.2 max / pro / flex はAPIで最大8枚、Playgroundで最大10枚が目安です。FLUX.2 kleinは最大4枚、FLUX.2 devは最大6枚推奨と案内されています。ただし、出力サイズや合計画素数の条件で変わるため、使うモデルの最新ドキュメントを確認してください。