全身を入れた瞬間、顔は豆粒みたいに潰れ、脚や頭は画面の外に切れ、ポーズは棒人間に近づいていく。ADetailerやHires.fixを試しても結局救えない、という中途半端な敗北感を抱えていないでしょうか?
全身崩れはひとつのプロンプトミスではなく、構図・解像度・ピクセル数の制約が同時に効いている状態で、1パスで全部を救うのは原理的に厳しい領域です。だからこそ、症状を「顔潰れ」「脚切れ」「棒人間化・関節破綻」に分け、全身を生成してから顔だけ別パスで直す2-passワークフローを軸に処方を当てるのが、現役のデファクトになっています!
この記事は、お使いのモデルがSDXL/Pony/Illustrious系かSD1.5系かで前提が変わる解像度処方も含めて、症状から該当章へ直接降りて手を動かせるよう設計しました。読み終えるころには、次に触るべき設定が手元で1つに決まっているはずです!
内容をまとめると…
全身崩れは構図・解像度・ピクセル数の同時制約で、1パスでは原理的に直らない
症状は顔潰れ・脚切れ・棒人間化の3系統に分岐し、対処はそれぞれ別物
現役のdefactoは全身→顔別パスの2-passワークフロー(ADetailer + Hires.fix)
起点解像度はSDXL系で832×1216、SD1.5系で512×768の縦長アスペクト
プロンプトで救えないポーズ破綻はControlNet OpenPoseが境界線
きれいな画像を作れるようになっただけで、収益化できずに止まってませんか?
romptn ai では、実際に画像生成AIで稼いでいるプロを講師に招いた完全無料のAIクリエイターセミナーを開催しています。
2時間のオンラインセミナーで、実際に稼いでいる人が使う最新画像生成AIツールや上級者にステップアップするための必須スキルなどの知識面はもちろんのこと、ゼロから収益化を実現するための具体的なロードマップを体験談ベースで詳しく学ぶことができます。
また、豪華な無料参加特典も用意していますので、ぜひご興味を持った方はお気軽に下記のボタンから詳細をチェックしてみてください!
\ 現役の画像生成AIのプロから学べる! /
無料セミナーの詳細をみる※Stable Diffision全体のエラーについては、下記記事でも詳しく解説しています!
全身を生成すると崩れる、その正体とは?
まずここで扱うのは、「Stable Diffusionで全身を出した瞬間に絵が崩れる」という、最初の一手で詰まる典型的な手詰まりです。

全身を入れた途端、顔は豆粒みたいに潰れ、脚や頭は画面の外に切れ、ポーズは棒人間に近づいていく。プロンプトを足しても消しても直らず、ADetailerやHires.fixを入れても結局救えない、という中途半端な敗北感を抱えていないでしょうか?
崩れる正体は、ひとつのプロンプト設定ミスではありません。全身ショットでは構図・解像度・ピクセル数の制約が同時に効くため、1パスで顔も体も整えるのは原理的に厳しいのが実態です…!
この記事では、症状(顔潰れ・脚切れ・棒人間化・関節破綻)ごとに何が起きているかを切り分け、現役の処方として定着した「全身を生成→顔だけ別パスで直す」2-passのワークフローを軸に、対処を一本の流れに整理していきます。
お使いのモデルがSDXL系かSD1.5系かで処方は変わるため、解像度の前提もあわせて確認できる構成にしました。読み終えるころには、次に何を触ればいいかが手元で決まっているはずです!
症状から該当章への分岐地図
ここからは、いま手元で起きている崩れがどのタイプかを先に決め、対応する章に直接降りられるよう、症状を4つに整理します。
自分の生成された画像に当てはまる症状から、該当の章に飛んでください!
- 顔が豆粒みたいに潰れる、目鼻が崩れる → 「顔が豆粒に潰れる症状の処方」の章
- 脚や頭が画面の外に切れる、構図が窮屈 → 「脚や頭が切れる症状の処方」の章
- ポーズが棒人間化する、腕や脚の生え方がおかしい → 「棒人間化や関節破綻の処方」の章
- 関節がねじれる、指や手首が破綻する → 同じく「棒人間化や関節破綻の処方」の章
複数の症状が同時に出ている場合は、まず「顔潰れ」と「脚切れ」のような構図側から先に手を入れると、ポーズや関節の崩れも一緒に軽くなることが多いです。
先に原因の見立てを整えたい方は、次の章から順に読み進めると分岐の理由まで掴めます!
顔や体の崩れの根本原因を3つに切り分ける
ここからは、表面の症状の奥で何が起きているかを3つの層に分けて見立てます。原因が分かれば、後段の処方箋のどれを引くべきかが決まります。
全身が崩れる原因は、ほぼ次の3つに整理できます。
- 構図起因:アスペクト比が横長すぎる、解像度が小さい。顔や手に割り当たるピクセル数が足りず、ディテールが描き切れない
- ポーズ起因:モデルが全身ポーズの知識を十分に持っていない。プロンプトで指定しても関節や手足の生え方が破綻する
- ディテール起因:構図もポーズも合っているのに、顔や指など細部だけが解像不足で潰れる、全身ショット固有の層
一方、ポーズ起因はプロンプトだけでは限界があり、後ほどの「棒人間化や関節破綻の処方」や「ControlNetをどこまで使うか」で扱う領域に踏み込む判断になります!
2-passワークフローというデファクト
ここからは本記事を貫く軸となる2-passワークフローを最初に置きます。先に作戦を固めておくと、以降の処方が「どこに効くのか」を迷わず読めます!

2-passとは、全身を一度生成したあと、顔や手など細部だけを別パスで描き直すやり方です。ADetailerやFaceDetailerが顔の領域を自動で検出し、そこだけを高解像でinpaint(部分再生成)してくれます。これが現在の現役のdefactoとして広く使われています。
2-passに切り替えると、全身の構図はそのまま保ちつつ、顔だけ高解像で描き直せるため、「全身も顔も成立する絵」が現実的に出せるようになります。
ADetailerはt2iの後段に組み込み、生成と同時に顔を直すパスを自動で挟む使い方が標準です。手動のinpaintより速く、Hires.fixとの併用もできます!
まず自分のモデル系統を見分ける
いまお使いのモデルがSD1.5系かSDXL/Pony/Illustrious系かを、ここで先に確定させましょう。曖昧なまま設定値を真似ても、解像度処方が全部ズレるためです。
見分けの目印は次のとおりです。
- ファイル名や配布ページに「SDXL」「Pony」「Illustrious」「XL」がある → SDXL系
- ファイル名に「SD1.5」「v1-5」、または2023年前後のアニメ系checkpoint(AnythingやMeina系など) → SD1.5系
- 専用VAEに「sdxl_vae.safetensors」が指定されている → SDXL系
- checkpointサイズが約6GB以上 → SDXL系(SD1.5系は概ね2〜4GB)
ここを先に決めるのは、nativeな学習解像度が両者で違うためです。SDXL系は1024ベース学習で、512×512で出すと顔から崩壊します。SD1.5系は逆に512ベースで、いきなり1024を要求すると別の破綻が起きます。
系統が決まったら、次の章で解像度とアスペクト比を当てましょう!
モデル系統別の解像度とアスペクト比
系統が決まったら、ここからは推奨解像度とアスペクト比を当てていきます。全身を入れるなら、横長より縦長アスペクトの方が顔と脚の両方を救いやすいのが共通原則です!
以下では、現在の主流であるSDXL/Pony/Illustrious系と、まだ使われているSD1.5系の2系統に分けて、それぞれの推奨解像度を整理します。お使いの系統に対応する側だけ読めば十分です。
SDXL / Pony / Illustriousの場合
SDXL/Pony/Illustrious系はnative解像度1024ベースで学習されています。全身を入れる場合は、正方形ではなく832×1216(2:3)などの縦長アスペクトを起点にするのが定石です。
代表的な縦長解像度の置き方は次のとおりです。
- 832×1216(2:3):全身を入れつつ、顔と脚の両方を比較的救いやすい標準値
- 768×1344(4:7前後):立ち絵で頭から足先まで余裕を持って収めたいとき
- 1024×1024(1:1):上半身〜膝上ショット向き。全身フレームには窮屈
Hires.fixを併用する場合は、初期解像度を上の縦長で出し、倍率は1.5倍前後から試すと顔の輪郭が崩れにくくなります。2倍以上は破綻リスクが上がるため、必要ならADetailerの2-pass側で稼ぐ判断にします。
横長(例:1216×832)は風景寄りで、人物の全身ショットには向きません!
SD1.5系を使う場合
SD1.5系はnative解像度512ベースで学習されています。全身ショットの起点は512×768(2:3)前後の縦長アスペクトに置き、Hires.fix前提で組むのが基本になります!
代表的な縦長解像度の置き方は次のとおりです。
- 512×768(2:3):全身用の標準値。ここからHires.fixで拡大する
- 512×896〜960:頭から足先まで余裕を持って入れたいとき
- 768×768(1:1):上半身向き。全身フレームには窮屈
Hires.fixは倍率1.5〜2倍を起点に、Upscalerに「R-ESRGAN 4x+ Anime6B」(アニメ系)や「4x-UltraSharp」(実写系)を当てると顔の崩れが軽くなります。Denoising strengthは0.3〜0.5の範囲で振ると、構図を維持しつつディテールが乗ります!
顔が豆粒に潰れる症状の対処法
ここから症状別の処方に入ります。最初は「顔だけが豆粒みたいに潰れ、目鼻が描き切れない」症状です。

何が起きているかは単純で、全身ショットでは顔の領域が画面全体の数%しか占めず、そこに割り当たるピクセル数だけでは目や鼻のディテールを描く余地がない状態になっています。プロンプトで「detailed face」を足してもピクセルが足りないので情報量は増えません。
解決策は2-passを軸に組みます。
- 主軸:ADetailerを有効化(face_yolov8n.ptなどの顔検出モデルを選び、Denoising strengthは0.3〜0.4)。生成と同時に顔だけ高解像でinpaintされる
- 補助:Hires.fix併用。SDXL系なら1.5倍、SD1.5系なら2倍前後で拡大
- mask paddingは32→64に上げると、輪郭の継ぎ目が目立ちにくくなる
- 顔用のプロンプトをADetailer側に分離して書くと、全身プロンプトと衝突せず顔表現を効かせやすい
それでも直らない場合は、後ほどの「2-passを入れても直らない時の見直し点」に進んでください!
脚や頭が切れる症状の対処法
次は「脚や頭が画面の外に切れる、人物が窮屈で収まらない」症状の解決策です。
何が起きているかは構図の問題で、横長アスペクトや正方形では人物の縦方向が画面に収まりきらないためです。「full body」と書いても画角が縦に足りなければ脚先は必ず切れます…!
処方は最小手数の順に次のとおりです。
- アスペクト比を縦長に切り替える:SDXL系なら832×1216、SD1.5系なら512×768を起点にする
- フレーミング語を明示する:full body、cowboy shot(腰上から膝上)、upper bodyをプロンプトに足し構図を指定する
- 余白語を添える:standing in empty room、wide shot、from distanceで人物の余白を確保する
- それでも切れる場合はControlNet OpenPoseで骨格を固定する(後ほどの「ControlNetをどこまで使うか」で扱います)
「縦長に変えるのは面倒」と感じる方も、最初の1つだけで症状の多くは軽くなります。上から1つずつ試す順で十分です!
棒人間化や関節破綻の処方
次は「ポーズが棒人間化する、関節がねじれる、指や手首が破綻する」症状の対処法です。
何が起きているかは、モデルがそのポーズを十分に学習していないか、訓練データから外れたポーズ(複雑な座り姿勢、武器を持つ姿勢など)を要求しているケースです。語彙を増やしてもモデルが知らないポーズは安定しません。
処方は段階的に重くします!
- プロンプトを整える:standing、sittingなど基本姿勢に寄せる、bad anatomy / extra limbs / missing fingersをネガティブプロンプトに入れる
- ポーズLoRAを試す:該当姿勢のLoRAを軽め(weight 0.4〜0.6)で当てる
- ControlNet OpenPoseを入れる:ここで救えないなら骨格を固定するしかなく、詳しくは次の章で扱います
- 手や指の破綻は2-pass側の責務で、手用のADetailerモデル(hand_yolov8n.pt)併用で軽くなります
複雑なポーズほどプロンプトでは粘れません。ControlNet導入の境界線がここに来ます!
ControlNetはどこまで使えば良い?
ここではControlNetを「どこまで使えばよいか」だけに絞り、preprocessorの詳細は深追いしません。読者のみなさんの負荷を抑えつつ、最低限の判断軸を渡します!

ControlNetは、参照画像から骨格や深度を抽出し、生成側に強制条件として渡す仕組みです。プロンプトだけでは制御しきれないポーズや構図を、画像側から固定できます。
全身崩れに対しては次の3つだけ押さえれば判断がつきます!
- OpenPose:棒人間状の骨格を参照画像から取り、ポーズだけを固定する。棒人間化や関節破綻に最初に当てる基本
- dw_openpose_full:OpenPoseの改良版で、手や顔まで拾う。手の生え方まで縛りたいとき
- Depth:奥行きを使い、構図全体(人物の大きさやカメラ距離)を固定する。フレーミングが揺れるとき
2-passを入れても直らない時の見直し点
ここは「ADetailerもFaceDetailerもHires.fixも入れたのに直らない」読者のみなさん向けの見直し点です。上から順に試せば、どこかで止まる構成にしてあります!
- mask paddingを32→64→96に上げる:顔の輪郭に継ぎ目が出るときの基本。paddingが狭いと境界に違和感が残る
- Denoising strengthを0.3〜0.4に下げる:denoiseが0.6以上だと顔が別人化する。低めから振り直す
- プロンプトの競合を疑う:全身プロンプトとADetailerプロンプトに矛盾(別人物の特徴語など)がないか確認する
- モデル相性を疑う:face_yolov8nが効かないリアル系は、face_yolov8m_seg.ptなどに差し替える
- seedを固定する:同じseedで設定だけ振ると、どの変更が効いたか切り分けやすい
- Hires.fixとADetailerの順序:Hires.fix→ADetailerが標準。逆順だと2-passの効果が薄れる
まとめ
全身崩れは、ひとつの原因ではなく症状別の処方を順に当てる作業です。本記事の要点を圧縮しておきます!
- 自分の崩れが顔潰れ・脚切れ・棒人間化のどれかを最初に決め、該当の章に降りる
- 全身は1パスで救わず、全身→顔だけ別パスの2-passワークフローを軸にする
- SDXL系は832×1216、SD1.5系は512×768など、モデル系統に合った縦長解像度を起点にする
- 顔はADetailer(denoise 0.3〜0.4、padding 64)、ポーズはControlNet OpenPose、と症状に応じて道具を切り替える
次の一手は、お使いの環境を開いてアスペクト比を縦長に直し、ADetailerを有効化するところからです。今ある絵をそのまま再生成すれば、顔と構図が同時に救われる感触が掴めます。
症状がさらに絞れたら、顔単体・手指単体の関連記事に降りて細かい設定値を取りに行ってください!
実際に稼いでいる人の画像生成AIのスキルと収益化方法を知っていますか?
romptn ai が開催する完全無料のAIクリエイターセミナーでは、現場で活躍するプロから下記のような内容を学べます。
- ゼロから画像生成AIで収益化を達成するための具体的なロードマップ
- 実績のある講師が実践する初心者を脱出するための必須スキルと最新ツール
- Nano Banana や Grokなどスマホからでもできる本格的な画像生成AI活用方法
- 広告画像や映像など実際の制作過程をイメージするための講師によるライブデモ
2時間のオンラインセミナーで、ただ画像生成AIや動画生成AIの上級スキルや最新ツールを知るだけでなく、実際に収益化を達成する一歩を踏み出すための必須知識を学ぶことができます。
- 大手企業6社と契約実績(TOYOTA, mercari, 伊藤園 等)
- AI映画制作3本、WORLD AI FILM FESTIVAL 2026 in KYOTO にて2冠達成
- Best AI Anime 受賞
- Japan Best AI Film(グランプリ)受賞(応募431作品中)
- 経歴:元WEBデザイナー・マーケター → 2023年に生成AIと出会い転身 → プロのAIクリエイターへ




