画像生成AI『FLUX(フラックス)』とは?使い方・プロンプトのコツを解説! | romptn Magazine

画像生成AI『FLUX(フラックス)』とは?使い方・プロンプトのコツを解説!

AIツール

画像生成AI技術の急速な進化により、ビジネスや創造的な分野に革命が起きています。その最前線に立つのが、Stable Diffusion開発チームが立ち上げたBlack Forest Labsによる最新モデル「FLUX.1(フラックス)」です。Midjourneyを超える画質と精度で注目を集め、商用利用も可能なFLUX.1は、ビジネスにおけるAI活用の新たな世界を切り開いています。

本記事では、このFLUX.1の基本情報から実践的な使い方まで、FLUX.1の可能性を徹底解説します。AI時代における業務効率化の鍵を握るFLUX.1の魅力に、ぜひ触れてみてください。

スポンサーリンク

Fluxとは?

FLUX.1は、画像生成AI技術の最前線を行くモデルです。Stable Diffusionの開発チームが立ち上げたBlack Forest Labs(BFL)によって2024年8月に公開された本モデルは、その圧倒的な性能で業界に衝撃を与えています。

FLUX.1の主な特徴は、以下の通りです。

  • 卓越した画質とリアリズム:人物の表情や手の細部、複雑な構造物まで破綻なく描写
  • 高いプロンプト忠実度:ユーザーの指示を正確に反映した画像生成
  • 文字表示の正確性:広告やデザイン分野で重宝される機能
  • オープンソース:開発者によるカスタマイズや改良が可能

FLUX.1は、Midjourneyを超える性能を持つとされ、Artificial Analysis Text to Image Model Leaderboardで1位を獲得しました。この成果は、FLUX.1が画像生成AI市場に新たな基準をもたらしたことを示しています。

FLUX.1モデルの種類

FLUX.1は、用途に応じて3つのバリエーションが提供されています。

ユーザーは自身のニーズに合わせて最適なモデルを選択できます。

FLUX.1のオープンソース性は、AI技術の発展と透明性確保に大きく貢献しています。開発者や企業は、FLUX.1をベースに独自のアプリケーションやカスタマイズされたモデルを開発することができ、これにより画像生成AI技術の更なる進化が期待されています。

FLUX.1は、その高い性能と柔軟性により、デザイン、マーケティング、エンターテインメントなど幅広い分野での活用が可能です。特に、商用利用可能なモデルがリリースされていることから、ビジネスにおけるAI活用の新たな可能性を開いています。

今後、FLUX.1がクリエイティブ産業やビジネス分野にどのような革新をもたらすのか、その動向に注目が集まっています。

Black Forest Labsについて

Black Forest Labs は、画像生成AI技術の最前線を走る新興企業です。この会社の設立背景と特徴は以下の通りです。

  • Stable Diffusion開発者が設立
  • 3100万ドル(約45億円)の資金調達に成功
  • FLUX.1など最新AI画像生成モデルを開発
  • オープンソースと商用モデルの両立を目指す
  • AI画像生成技術の更なる進化と普及を牽引

Black Forest Labsの設立は、AI画像生成技術の世界に新たな風を吹き込んでいます。Stable Diffusionの成功を基盤としつつ、さらに進化した技術と新しいビジネスモデルを提案することで、クリエイティブ産業やテクノロジー分野に大きなインパクトを与えることが期待されています!

FLUX.1の使い方

では、早速画像生成のやり方をご説明していきます!

FLUX.1は、以下の4つの方法で利用することができます。

  • fal.ai
  • Replicate
  • Hugging Face
  • ローカル

それぞれ使い方を解説していきます!

fal.aiでの利用方法

まずは、こちらの公式サイトにアクセスしましょう。

続いて「Continue with GitHub」をクリックして、GitHubのアカウントを連携しましょう。

「Create an account」を押して新規登録を行いましょう。

次に「Authorize fal-ai」をクリックすると、連携完了です!

アカウント登録時には、1ドル分のクレジットが貰えます。

まずは、fat.aiの公式サイトにログインして「Model Gallery」を開きましょう。

ここでは、画像生成で使用するモデルを選択します。

FLUX.1で利用できるのは、先ほどご紹介した

  • FLUX.1 [pro]
  • FLUX.1 [dev]
  • FLUX.1 [schnell]

こちらの3種類です。

使用したいモデルを選んだら、クリックしましょう!

※今回は、1番高品質の「FLUX.1 [pro]」を使ってみます。

モデルが選択できたら、続いて「プロンプトを入力」します。

今回は、以下のプロンプトで生成します。

Extreme close-up of a single tiger eye, direct frontal view. Detailed iris and pupil. Sharp focus on eye texture and color. Natural lighting to capture authentic eye shine and depth. The word "FLUX" is painted over it in big, white brush strokes with visible texture.

訳:単一のタイガーアイを正面から見た極端なクローズアップ。詳細な虹彩と瞳孔。目の質感と色にシャープに焦点を当てます。自然光で本物の目の輝きと奥行きを捉えます。 「FLUX」という言葉が、目に見えるテクスチャーを備えた大きな白いブラシストロークでその上に描かれています。

プロンプトが入力出来たら、その下の詳細設定を行います。

「More」をクリックするとプルダウンメニューが開くので、以下の表を参考に設定してください!

設定意味
Image Size生成する画像のサイズ・縦横比(アスペクト比)を設定できます。
Num Inference Steps画像生成の処理ステップ数を設定できます。
デフォルト値は「28」で、数が多いほどクオリティが高い画像生成できます。(ただし生成に時間がかかる)
Seedそれぞれの画像に振り分けられる値。同じSeed値を使うと同じ画像が生成されます。
Guidance scale (CFG)モデルがプロンプトにどの程度従うかを表す数値で、デフォルトは「3.5」です。
Sync Modeオンオフで切り替える、画像生成が終わるまで待つかどうかの設定です。CDN不要で直接画像を得られます。(ただし生成に時間がかかる)
Num Images生成する画像の枚数を設定できます。(2024/08/24時点では1枚のみ)
Safety Tolerance生成する画像の倫理的チェックを設定できます。1から上がるにつれて緩くなります。デフォルトは「2」です。

設定が完了しましたら、「Run」ボタンを押して画像を生成します。

すると、生成された画像が右側に表示されます。

画像を共有したい場合は「Share」を、画像を保存したい場合は「Download」をクリックしましょう。

Replicateでの利用方法

まずは、Replicateの公式サイトにアクセスし、右上の「Sign in」をクリックします。

続いて「Sign in with GitHub」をクリックします。

お持ちのGitHubアカウントでサインインします。

質問が出てくるので、答えるか「スキップ」します。

以上で完了です!

ReplicateのこちらのページからFLUX.1を利用することができます!

使いたいモデルを選択します。

プロンプトやアスペクト比、ステップ数などを設定して、画像を生成します!

ReplicateでFLUX.1を使う場合は、APIの利用料金がかかりますのでご注意ください!

Hugging Faceでの利用方法

まずは、Hugging Faceのこちらのページにアクセスしましょう。ログイン不要なので、操作はとても簡単です!

プロンプトを入力して「Run」を押すだけで画像を生成できます。

すると、下記のように生成された画像が表示されます。

下部には、「Advanced Settings」という設定項目がありますので、下記画像を参考に適宜設定しましょう。

ローカル環境(ComfyUI)での利用方法

まず、ローカル環境で利用する場合にはパソコンが高性能であることが必須です。スペックとしては、VRAM24GB以上のGPUがあるものが良いでしょう。

そんなハイスペックなパソコン持っていないよ…!という方は「ComfyUI」を使って利用するのがオススメです。

まずはComfyUIを開いたら、こちらのページにある画像をドラッグアンドドロップしましょう。

  • 1枚目:Flux Dev(fp16)
  • 2枚目:Flux Flux Schnell(fp16)
  • 3枚目:Flux Dev(fp8、モデルサイズ小←スペック低い方向け)
  • 4枚目:Flux Schnell(fp8)

そうすると、ワークフローが表示されます。

続いては、必要なモデルをダウンロードします。

下記モデルをダウンロードし、それぞれComfyUIのディレクトリに配置していきます。

ダウンロードしたモデルは、以下の位置に配置しましょう。(FLUX.1 Dev(fp16)の場合)

最後に、プロンプトを入力して生成します。

以上が、FLUX.1の使い方になります!筆者が使ってみた感想としては、fal.aiでの利用が1番簡単でした!

FLUX.1はX(旧Twitter)でも利用可能

FLUX.1の画像生成は、X(旧Twitter)の有料サブスクリプションサービスの一環として提供されています。

  • Xでの利用方法
利用条件・X「プレミアム」または「プレミアムプラス」プランの加入者が対象
・XのAIチャットボット「Grok」を通じて FLUX.1 の画像生成機能にアクセス可能
機能の特徴・Xプラットフォーム内で直接高品質な画像を生成
・テキストプロンプトを使用して、カスタマイズされた画像を作成
・ソーシャルメディアでの視覚的コンテンツ制作を効率化
展開状況・段階的なロールアウトを採用
・全ての有料ユーザーに即時に提供されるわけではない
・順次、対象ユーザーに機能が解放される予定
利用のメリットコンテンツ制作の効率化:投稿に合わせたオリジナル画像を素早く生成
クリエイティビティの向上:テキストだけでなく、視覚的な表現の幅が広がる
エンゲージメントの増加:独自の生成画像によって、フォロワーの関心を引く可能性が向上
注意点・機能の可用性は、ユーザーのアカウント設定や地域によって異なる場合がある
生成された画像の著作権や利用規約については、X及びFLUX.1の公式ガイドラインを確認することが重要

Xプレミアムまたはプレミアムプラスのユーザーは、この新機能を自身のアカウントで利用可能かどうかを確認することをおすすめします。FLUX.1の高度な画像生成能力とXのグローバルリーチを組み合わせることで、ソーシャルメディア上での新たな表現方法が開かれることが期待されます。

Stable Diffusionとの比較

大人気画像生成AI「Stable Diffusion」を普段から使っている筆者として、FLUXと比較して感じたことを纏めてみました!

  • Stable DiffusionとFLUXの違いで大きいのは、テキストを生成できるか否か
  • 画像の品質自体はさほど変わりはない(ただし、利用するモデルによる)
  • どちらもオープンソースなので、自分が使いやすい利用方法を見つければ簡単に画像が生成できる

Stable Diffusionでは、画像の中にテキストを生成するのは至難の業ですが、FLUXではテキストをきれいに生成できるのが強いと感じました。

FLUXで生成した画像

Stable DiffusionとFLUXで、同じプロンプトで生成結果を比較してみましょう。

今回使用したのは、下記のプロンプトです。

best quality ,masterpiece, 1 girl, ponytail, uppper body, view straight on, smile, standing, school uniform, class room
Stable Diffusion(モデル:AnyLoRA – Checkpoint)
FLUX.1 pro

どちらもきれいな画像が出来ていますが、鮮明さや質感の良さ、影の入り方などはFLUXが一歩優れているような気がします。

※Stable Diffusionの使い方については、以下の記事で解説しています。

FLUX.1のプロンプト入力のコツ

FLUX.1で理想の画像を生成するには、適切なプロンプト(指示文)の入力が鍵となります。以下に、効果的なプロンプト作成のコツをまとめました。

コツ①:詳細かつ具体的な描写を心がける

画像の細部まで制御するには、具体的な描写が重要です。

  • 構図、色彩、雰囲気、光の当たり方などを細かく指定します。
  • 画像のスタイル(写実的、油絵風、アニメ調など)も明記すると効果的です。

コツ②:英語でプロンプトを入力する

FLUX.1を含む多くの画像生成AIは、英語での学習データが豊富なため、英語のプロンプトがより正確に解釈されます。

英語が不得意な場合は、Google翻訳やChatGPTなどの翻訳ツールを活用しましょう。

コツ③:プロンプトの構造化

効果的なプロンプトは、以下の要素を含むと良いでしょう。

a) 主題:描きたいメインの対象や場面

b) 背景:設定や周囲の環境

c) スタイル:画像の全体的な雰囲気や表現方法

d) 技術的詳細:構図、照明、フォーカスなど

コツ④:AI助手を活用したプロンプト生成

ChatGPTやGeminiなどの文章生成AIを使って、より洗練されたプロンプトを作成できます。

AIに以下のように指示します。

以下の画像生成AIプロンプトをより具体的で詳細なものに改善してください:[あなたのアイデア]
ChatGPTでのプロンプト生成例

AIが生成したプロンプトを確認し、必要に応じて調整します。

コツ④:ネガティブプロンプトの活用

生成したくない要素を指定することで、より精度の高い画像生成が可能になります。

例:「no text, no watermarks, no distorted features

これらのコツを活用することで、FLUX.1の性能を最大限に引き出し、あなたのビジョンにより近い画像を生成することができるでしょう。プロンプト作成は一種の技術であり、練習を重ねることで上達します。様々なプロンプトを試し、結果を分析することで、あなただけの効果的なプロンプト技術を磨いていけるはずです。

FLUX.1の料金プラン

FLUX.1は、ユーザーのニーズに合わせて3つの異なるモデルを提供しています。各モデルの特徴と料金は、使用目的や予算に応じて選択できるよう設計されています。

FLUX.1 ProFLUX.1 DevFLUX.1 Schnell
品質最高品質の画像生成高品質の画像生成高速処理
商用利用商用利用可能条件付きで商用利用可能商用利用可能
料金1メガピクセルあたり0.05ドル1メガピクセルあたり0.025ドル1メガピクセルあたり0.003ドル
おすすめ広告やマーケティングなどのプロフェッショナルな用途に最適研究開発や個人利用向けコスト効率を重視するプロジェクトに最適

注意点

  • FLUX.1 Devの商用利用には制限があります。モデル自体の商用利用や、生成画像を競合AIの訓練に使用することは禁止されています。
  • 料金や利用条件は変更される可能性があるため、最新情報は公式サイトで確認することをおすすめします。

プラットフォームによる料金の違い

  • fal.ai:上記の料金表に基づいた従量制
  • flux1ai.com:月額制のサブスクリプションプラン(例:STARTER 500枚/月 9.9ドル、PREMIUM 1,000枚/月 12.9ドル、PRO 5,000枚/月 29.9ドル)

選択のポイント

  1. 画質重視:FLUX.1 Pro
  2. コスト効率重視:FLUX.1 Schnell
  3. 研究開発用:FLUX.1 Dev

初めて利用する場合は、fal.aiでGitHubアカウントを使って登録すると、1ドル分の無料クレジットが付与されるので、試用に適しています。

ユーザーは自身のプロジェクトの規模、目的、予算に応じて最適なプランを選択し、FLUX.1の高度な画像生成能力を活用することができます。商用利用の際は、特に利用規約を注意深く確認し、ライセンス条件を遵守することが重要です。

APIの利用料金について

FLUX.1のAPIを利用する際の料金体系は、モデルによって異なり、ユーザーのニーズに応じて選択できるようになっています。以下に、各モデルの料金をまとめました。

  • FLUX.1 pro:0.055ドル(約8円)
  • FLUX.1 dev:0.030ドル(約4円)
  • FLUX.1 schnell:0.003ドル(約0.4円)

API使用に関して、Fal.aiは無料利用枠が多いため、初心者におすすめのプラットフォームです。そして、商用利用の場合、FLUX.1 Proの使用が推奨されています!

FLUX.1 devとschellは、ローカルの場合無料で利用できます。

FLUX.1の商用利用について

FLUX.1は、その革新的な画像生成能力で注目を集めていますが、商用利用に関しては慎重な対応が必要です。各モデルによって利用条件が異なるため、ユーザーは自身のニーズに合わせて適切なモデルを選択する必要があります。

各モデルの商用利用の可否は、以下の通りです。

  • FLUX.1 Pro:可能(広告やマーケティングなど、幅広いビジネス用途におすすめ)
  • FLUX.1 Dev:不可能(研究や個人的な実験、非営利プロジェクトに限定して使用可能)
  • FLUX.1 Schnell:可能(非商用および非生産目的での自由な利用が可能)

商用利用が不可能なFLUX.1 Devについては、以下のように公式発表されています。

Black Forest Labs, Inc. (“we” or “our” or “Company”) is pleased to make available the weights, parameters and inference code for the FLUX.1 [dev] Model (as defined below) freely available for your non-commercial and non-production use as set forth in this FLUX.1 [dev] Non-Commercial License (“License”).

訳:Black Forest Labs, Inc. (「当社」または「弊社」または「会社」) は、FLUX.1 [dev] モデル (以下に定義) の重み、パラメーター、および推論コードを、お客様以外のユーザーが自由に利用できることを嬉しく思います。 – この FLUX.1 [dev] 非商用ライセンス (「ライセンス」) に規定されている商用および非実稼働使用。

引用:FLUX.1 [dev] Non-Commercial License

FLUX.1を商用利用する際は、

  • 利用するモデルのライセンス条件を必ず確認する。特にFLUX.1 Devの非商用ライセンスには注意が必要
  • Flux AIの利用規約を十分に理解し、遵守する。生成された画像の著作権や使用範囲についても確認が必要
  • 商用プロジェクトではFLUX.1 ProまたはSchnellを選択。研究や個人利用の場合は、FLUX.1 Devの使用が適切

これらの点に注意を払うことで、安全かつ効果的に画像生成AIの能力を活用することができます。また、ライセンス条件や利用規約は変更される可能性があるため、定期的な確認をおすすめします。大規模な商用利用を計画している場合は、法的アドバイスを受けることも検討すべきでしょう。

まとめ

いかがでしたでしょうか?

画像生成AI『FLUX.1(フラックス)』の使い方について詳しく解説してきました。

今回のポイントは、以下の通りです。

  • FLUX.1は、Stable Diffusionの開発チームが立ち上げたBlack Forest Labs(BFL)によって2024年8月に公開されたモデル
  • FLUX.1の主な特徴
    • リアリティーの高さ
    • プロンプトに忠実
    • テキスト生成に対応
    • オープンソース
  • FLUX.1モデルの種類
    • FLUX.1 pro:高性能モデル
    • FLUX.1 dev:中性能モデル
    • FLUX.1 schnell:低性能モデル
  • FLUX.1にはさまざまな利用方法があるが、fal.aiが1番簡単かつ分かりやすく使える
  • FLUX.1はX(旧Twitter)でも利用可能
  • FLUX.1の商用利用について
    • FLUX.1 Pro:可能(広告やマーケティングなど、幅広いビジネス用途におすすめ)
    • FLUX.1 Dev:不可能(研究や個人的な実験、非営利プロジェクトに限定して使用可能)
    • FLUX.1 Schnell:可能(非商用および非生産目的での自由な利用が可能)

FLUXは、現段階ではかなり高い位置にいる画像生成AIだと言われています。

fal.aiでは簡単に無料で画像を生成することが出来るので、ぜひ1度試してみてください!

romptn Q&Aで質問してみませんか?
romptn Q&Aは、AIに関する質問プラットフォームです。
  • ChatGPTで〇〇を効率化したい
  • スライドを作るならどのAIツールがおすすめ?
  • おすすめのGPTsが知りたい
といったことはありませんか?
同じ悩みを解決した人がいるかもしれません。ぜひ質問してみてください!