【SDXL】おすすめの画像サイズ(解像度)とは?最適な画質の設定方法を解説! | romptn Magazine

【SDXL】おすすめの画像サイズ(解像度)とは?最適な画質の設定方法を解説!

Stable Diffusion

!Stable Diffusion XL(SDXL)を使って高品質な画像を生成したいけど、「画像サイズってどう設定すればいいの?」「最適な解像度がわからない」と悩んでいませんか?

SDXLは従来のStable Diffusionと比べて基本解像度が1024×1024と大きくなり、パラメーター数も2倍以上になりました。しかし、この解像度設定を間違えると画像が崩れたり、生成に時間がかかったりと様々な問題が発生します。

この記事では、SDXLで美しい画像を生成するための推奨サイズ設定から、アスペクト比の調整方法、高解像度化のコツまで、実践的な知識を徹底解説します。

今回の記事で分かること
  • SDXLの推奨サイズ一覧(サイズチートシート)
  • SDXLでの画像サイズ設定方法
  • 高解像度化するコツ
  • 解像度設定を効率化する拡張機能
  • よくある解像度トラブルとその対処法

※Stable Diffusionの使い方については、下記記事で解説しています。

スポンサーリンク

SDXLの解像度とは?従来版との違い

SDXLと従来のStable Diffusionモデルとの最大の違いは、基本的な解像度です。Stable Diffusion 1.5までは512×512ピクセルが基本となっていましたが、SDXLでは1024×1024ピクセルが基本解像度となっています。

これは単に数字が大きくなっただけではなく、モデル自体がこのサイズで学習されているため、生成の品質に直結する重要な違いなのです。

従来版SD1.5との主な違い
  • 基本解像度: SD1.5は512×512、SDXLは1024×1024
  • パラメーター数: SDXLは従来の2倍以上
  • 画像処理: BaseモデルとRefinerモデルの2段階処理が導入
  • 表現力: コントラストや影などが改善され、より鮮やかで正確な描写が可能
  • プロンプト効率: 「masterpiece」などの修飾語がなくても高品質な生成が可能

SDXLの解像度設定は、生成される画像の品質を大きく左右します。基本解像度より小さいサイズ(例:512×512)で生成すると、画像が崩れたり品質が低下したりする可能性が高くなります。

Stable Diffusionの画像生成を最速で学びたいあなたへ!
  • Stable Diffusionの基礎を2時間でマスター!
  • 高スペックPCがない方向けに徹底解説。
  • ControlNetなど、必須級の拡張機能も網羅。
  • 今話題のSDXL、AI動画生成も。
  • 特典として、大人気「おすすめ拡張機能・モデル解説」「プロンプト大全」つき!
\このボタン限定!70%オフキャンペーン実施中!/
70%オフキャンペーン実施中!/

SDXLの推奨サイズ一覧(サイズチートシート)

SDXLでは、基本解像度である1024×1024を基準に、総ピクセル数がおよそ1,048,576(1024×1024)に近い様々なアスペクト比の解像度が推奨されています。

以下が、SDXLで高精度に生成するための推奨サイズ一覧です。

正方形(1:1)

  • 1024×1024

横長画像

  • 1152×896(およそ4:3)
  • 1216×832(およそ3:2)
  • 1344×768(およそ16:9)
  • 1536×640(12:5)
  • 1568×672(21:9)
  • 1728×576(3:1)

縦長画像

  • 896×1152(およそ3:4)
  • 832×1216(およそ2:3)
  • 768×1344(およそ9:16)
  • 640×1536(5:12)
  • 576×1728(1:3)
  • 512×2048(1:4)

これらの解像度を使うことで、SDXLの性能を最大限に引き出せます。特に、どの組み合わせも掛け算するとおよそ104万ピクセル(1024×1024)になるんです。これがSDXLの学習時に使用された画像サイズであるため、最適な生成結果が期待できます。

画像生成時は、使いたいアスペクト比に最も近い推奨サイズを選ぶことをお勧めします。

SDXL解像度は低すぎても高すぎても問題が生じることがありますので、基本的にはこの推奨サイズ内で調整するのがベストです。

プロンプトジェネレーターで画像生成プロンプトの参考に!
  • Stable Diffusionのプロンプトの見本が知りたい
  • 画像生成が思ったようにできない
  • 色々なプロンプトを探したい
など、画像生成AIのプロンプトに関する疑問が解決するかもしれません。

アスペクト比ごとの特徴とおすすめ用途

画像のアスペクト比(縦横比)は、生成される画像の見え方に大きな影響を与えます。SDXLでは、用途に応じて適切なアスペクト比を選ぶことが重要です。

主なアスペクト比とその特徴を、表にまとめたので参考にしてください。

アスペクト比特徴おすすめの用途
1:1 (正方形)バランスの取れた構図・SNS投稿(Instagram)
・アイコン
4:3やや横長、クラシックな印象・印刷物
・プレゼンテーション
3:2一般的な写真の比率・写真風の画像
・壁紙
16:9ワイドスクリーン・動画サムネイル
・プレゼン資料
3:4/2:3超ワイド・映画風の画像
・パノラマ風景
21:9やや縦長・スマホ壁紙
・縦長コンテンツ
9:16スマホ画面比率・スマホ用コンテンツ
・Stories(Instagram)

アスペクト比を調整する際は、SDXLの推奨サイズに近い値を選ぶようにしましょう。例えば16:9の画像を作りたい場合、1344×768が最適な選択となります。

アスペクト比を適切に設定することで、視覚的なバランスが保たれ、より魅力的な画像を生成できます。特に、ブランディング素材やSNS投稿など、用途に合わせたアスペクト比選びが重要です。

SDXLでの画像サイズ設定方法

SDXLのWeb UIでは、画像サイズを調整するための直感的なインターフェースが用意されています。基本的な操作方法を見ていきましょう。

Stable Diffusion Web UIでの設定方法

①Stable Diffusion WebUIを起動する

②「txt2img」タブの、「Width」と「Height」の設定値を調整する

  • スライダーを使う方法
  • 数値を直接入力する方法

推奨されるSDXL画像サイズは前述のチートシートを参考にしてください。

画像のサイズ設定のコツ

画像サイズを設定する際は、以下の3つのポイントを意識すると良いでしょう。

  • バランスを考える: 総ピクセル数が約100万(1024×1024)になるようにする
  • 用途に合わせる: SNS投稿なら正方形(1:1)や横長(4:3)、スマホ壁紙なら縦長(9:16)など
  • 生成時間を考慮: サイズが大きいほど生成時間が長くなるため、必要に応じて調整

SDXL最適サイズで生成すれば、従来のようにわざわざ「masterpiece(傑作)」などの修飾語を使わなくても、高品質な画像が生成できるようになりました。短いプロンプトでも効果的に作品が作れるのは、SDXLの大きな利点です。

高解像度化できる「Hires.fix」の活用法

SDXLの基本解像度(1024×1024)より大きいサイズの画像が必要な場合は、高解像度化できる機能を活用しましょう。

中でも「Hires.fix」は、Stable Diffusion Web UIに標準搭載されている高解像度化機能です。

Hires.fixとは?

Hires.fixは、画像をアップスケールしながらノイズや歪みなどを除去してクリアで鮮明な画像が生成できます。

ただ、パラメーターの設定を誤るとデザインが大きく変わったり、生成時間が遅いという問題が起きるので注意してください。

具体的に通常生成した画像と、「Hires.fix」で高解像度にアップスケールしたものとを見比べてみましょう。

引きではわかりづらいので、目元をアップにしてみます。

書き込み量が増えていますね。

このように Hires.fix を使うと、高解像度の画像を生成することができます。

Hires.fixの設定方法

Stable Diffusionのバージョン(V1.6)の方は触るだけで有効化されます。

Stable Diffusion V1.6

それ以前のバージョンをお使いの方はHires. fixにチェックを入れて有効化しましょう。

Stable Diffusion V1.5以前

次に各パラメーターを設定していきます。そこまで難しいのはありません。

  • Upscaler – 低解像度の元画像を拡大する際に用いるアルゴリズムの種類を指定します。10種類以上ありますが、それぞれ特徴や出力結果が異なります。
  • Hires steps – 高解像度化する際のステップ数。ステップ数が多いほど緻密になりますが、時間もかかります。0にするとSampling stepsの値と同じになります。Sampling methodをDDIMにしてSampling stepを下げて生成している場合(高速化のため)やSampling stepを上げて生成している場合は適切な範囲(10〜20)で設定しましょう。
  • Denoising strength – txt2imgで生成した画像をどの程度変化させるかの割合です。0ではアップスケール自体ができませんし、大きくすると元の画像からの変化も大きくなります。
  • Upscale by – アップスケールの倍率です。あまりに大きすぎるとメモリ不足でエラーが出る場合があります。

おすすめのアップスケーラー

複数のアップスケーラーがあり、画像の種類によって選ぶと良いものが異なります。

  • R-ESRGAN 4x+ Anime6B: アニメ調の画像に最適
  • 4x-Ultrasharp: 実写系でシャープな仕上がりを求める場合
  • 4x-NMKD-Superscale: 自然でナチュラルな仕上がり
  • 4x-SwinIR-M_Pretrain: マイルドな印象の仕上がり

Hires.fixは高解像度化に非常に有効ですが、大きなVRAMを消費します。12GB以上のVRAMを搭載したGPUがあると快適に使えます

解像度設定を効率化する拡張機能「Aspect Ratio selector」

SDXLの最適なサイズを手軽に設定するための拡張機能もいくつか開発されています。中でも「Aspect Ratio selector」は大変便利です。

インストールは、下記方法をご覧ください。

  1. Stable Diffusion WebUIを開き、「Extensions」タブを選択
  2. 「Install from URL」をクリック
  3. http://github.com/AlexanderLemke/sd-webui-ar」を入力
  4. 「Install」をクリックし、インストール完了後WebUIをリロード

この拡張機能を使えば、ワンクリックでアスペクト比を変更できます。あらかじめ設定された比率から選ぶだけで、SDXLに最適化された画像サイズに自動調整されます。

固定サイズボタンを使用すれば、特定のサイズに即座に画像を変更できます。例えば、1024×1024や1344×768といった一般的なサイズをワンクリックで選択できるため、時間を大幅に節約できます。

【FAQ】解像度・サイズについてよくあるエラーとその対処法

SDXLを使用する際によくある解像度に関する質問と対処法をFAQ形式でまとめました!

Q
SDXLで生成した画像の顔や手足が崩れてしまうのはなぜですか?
A

画像の崩れは主に推奨サイズから外れていることが原因です。SDXLは1024×1024の基本解像度で学習されているため、総ピクセル数が約100万ピクセル(1024×1024)になるよう設定しましょう。

特に短辺が1024ピクセルを超えると急に崩れることが多いので注意してください。推奨サイズ(例:1344×768、896×1152など)を使用するのが最も安全です。

Q
画像生成が極端に遅いのですが、解像度と関係していますか?
A

はい、関係しています。大きな解像度を指定するほど生成時間は長くなります

処理速度を上げるなら以下を試してみてください。

  • サンプリング法を「Euler A」や「DPM++ 2M Karras」に変更する
  • サンプリング回数は25〜30程度に設定する(SDXLではそれ以上増やしても効果は薄い)
  • プロンプト関連度は5〜7程度に設定する
  • 解像度を推奨サイズ内に収める
Q
2K以上の高解像度画像を作りたいのですが、どうすれば良いですか?
A

SDXLで大きなサイズの画像を直接生成するのではなく、次の2段階アプローチがおすすめです。

  1. まず推奨サイズ(例:1024×1024)で画像を生成する
  2. Hires.fixを使って高解像度化する
    • Upscalerは用途に合わせて選択(アニメ向けなら「R-ESRGAN 4x+ Anime6B」など)
    • Upscale by(倍率)を1.5〜2.0に設定
    • Denoising strengthは0.2〜0.5程度に設定

この方法なら画像の構図を崩さずに高解像度化できます。

Q
VRAMエラーが出て画像が生成できません。解像度と関係ありますか?
A

はい、大きな解像度はより多くのVRAMを必要とします。SDXLは基本的に、少なくとも8GB以上のVRAMを推奨しています。

VRAMが少ない場合は、以下を試してみてください。

  • より小さな推奨解像度を選ぶ(例:1024×1024より768×1344など)
  • バッチサイズを1に設定する
  • xformersなどのメモリ最適化機能を有効にする
  • Hires.fixを使用せず、通常の解像度で生成する
Q
生成した画像のファイルサイズが大きすぎます。どうすれば小さくできますか?
A

画像のファイルサイズを小さくするには、以下を試してみてください。

  • 画像形式をPNGからJPEGに変更する(Web UIの設定から変更可能)
  • 必要以上に高い解像度を避ける
  • Web用に最適化ツールを使用する(TinyPNGなど)
Q
特定のアスペクト比(縦横比)で生成したいのですが、推奨解像度がわかりません
A

SDXLの推奨解像度は総ピクセル数が約100万になることが重要です。

希望するアスペクト比の近似値を計算するには、以下を試してみてください。

  1. 希望するアスペクト比(例:16:9)を決める
  2. 総ピクセル数が約100万になるよう計算する (例:16:9なら1344×768=1,032,192ピクセルで近似値)
  3. チートシートから最も近い推奨解像度を選ぶ

主な比率の推奨解像度は本文の「SDXLの推奨サイズ一覧」を参照してください。

Q
SDXL LoRAを使用する際、画像サイズに注意することはありますか?
A

はい、SDXL LoRAも基本的にSDXLと同じ解像度で学習されています。SDXL LoRAを使用する際も推奨解像度(総ピクセル数約100万)を守ることで、LoRAの効果を最大限に引き出せます。

特にキャラクターの顔や特徴が崩れる場合は、まず解像度設定を見直してみましょう。

Q
縦長画像(例:スマホ壁紙)を生成すると特に崩れやすいです。対策はありますか?
A

縦長画像は特に崩れやすい傾向があります。以下の対策を試してみてください。

  • 短辺(横幅)が512ピクセル以上あることを確認する
  • 極端な縦横比は避け、推奨サイズ(例:768×1344や832×1216)を使用する
  • 必要に応じてプロンプトに「full body」「zoom out」などを追加し、構図を調整する
  • 極端に縦長にしたい場合は、まずやや縦長で生成した後、Hires.fixで縦方向に拡大する

まとめ

いかがでしたでしょうか?

SDXLで高品質な画像を生成するための画像サイズ設定について、基本解像度から推奨サイズ、アスペクト比の選び方、高解像度化の方法まで詳しく解説しました。

この記事で紹介したことをまとめると次のようになります。

  • SDXLの基本解像度は1024×1024で、総ピクセル数約100万を目安にサイズ設定する
  • 用途に合わせた最適なアスペクト比を選び、推奨サイズ一覧から適切な解像度を使用する
  • 大きなサイズが必要な場合は、まず推奨サイズで生成してからHires.fixで高解像度化する
  • 解像度設定を効率化するには、Aspect Ratio selectorなどの拡張機能を活用する
  • 画像が崩れる場合は、推奨サイズに戻すことが最も効果的な対処法

SDXLの性能を最大限に引き出すための画像サイズ設定に悩んでいた方や、より高品質な画像を生成したいという方に、かなり助けになる情報だったのではないでしょうか?

ぜひ、今回紹介した推奨サイズやコツを活用して、SDXLで思い通りの画像を生成してみてください!