Stable DiffusionのPony系モデルは、表現力豊かなポーズや表情を再現でき、特に手の描写が崩れにくいという大きな特徴を持っています。
元々は「My Little Pony」のようなポニーアニメのスタイルに基づいて開発されましたが、現在では人型のAIイラスト生成にも広く使われていますね。
この記事では、Pony系モデルの基本設定から、プロンプトの書き方(順番・ネガティブプロンプトなど)、活用方法まで詳しく解説します!
- Pony系モデルの基本設定
- Pony系モデルを使う際のプロンプトの基本!
- 人気のPony系モデル
- Pony系モデルで高速生成する方法
※Stable Diffusionの使い方については、下記記事で詳しく解説しています。
Pony系モデルの基本設定


Pony系モデルを使用する前に、適切な設定が必要です。これらの設定は画像生成の品質に大きく影響します。
- Clip Skip: 2(画像生成AIによっては「-2」と表記)
- ステップ数: 25
- サンプラー: Euler a(Euler ancestral)
- 画像サイズ: 1024×1024px
ClipSkipを2に設定しないと、生成画像の品質が著しく低下するため、必ず確認しましょう。また、画像サイズは1024pxがベースとなり、SD1.5のように小さいサイズで出力すると品質が落ちる傾向があります。
※Stable Diffusionの設定項目については、下記記事で詳しく解説しています。
また、Pony系モデルはSDXL用のVAEを使用する必要があります。SD1.5系列のVAEとは互換性がないため、SDXL用のVAEを利用しないと色合いがおかしくなることがあります。
※VAEについては、下記記事で詳しく解説しています。
Pony系モデルを使う際のプロンプトの基本!
Pony系モデルには独自のプロンプト記述方法があり、これを理解することで生成結果が大きく変わります。


Pony系モデルのプロンプトは以下の順番で記述するのが一般的です。
- 品質のプロンプト(スコアタグ)
- 画風のプロンプト(ソースタグ)
- コンテンツ制限に関するプロンプト(NSFW)
- キャラクターや動作の説明に関するプロンプト
- 補足のプロンプト
多くのユーザーが「score_9, score_8_up, score_7_up, source_anime, masterpiece, best quality」のような品質タグの組み合わせから始めています。
品質のプロンプト(スコアタグ)の使い方に
スコアタグとは画像の品質を指定するプロンプトで、数字が大きいほど品質が高くなります。
- score_9: 最高品質(90%以上)
- score_8_up: 80%以上の品質
- score_7_up: 70%以上の品質
- score_6_up: 60%以上の品質
- score_5_up: 50%以上の品質
- score_4_up: 40%以上の品質
高品質な画像を生成するには、「score_9, score_8_up, score_7_up」を使用するのが一般的です。公式では「hdやmasterpiece」などの品質タグは不要とされていますが、実際には多くのユーザーが併用しています。
※Stable Diffusionで使える品質に関するプロンプトについては、下記記事で詳しく解説しています。
画風のプロンプト(ソースタグ)の使い方
ソースタグは生成する画像のスタイルを指定するためのタグです。
- source_anime: 日本のアニメ風の絵柄
- source_pony: ポニー(マイリトルポニー)風の絵柄
- source_furry: けもの系(獣人)の絵柄
- source_cartoon: 欧米のカートゥーン風の絵柄
使いたいスタイルのソースタグをプロンプトに入れ、使わないスタイルはネガティブプロンプトに入れるのが効果的です。例えば、アニメ調の画像を生成したい場合、「source_anime」をプロンプトに、その他のソースタグをネガティブプロンプトに入れます。
※Stable Diffusionで使える画風指定に関するプロンプトについては、下記記事で詳しく解説しています。
Pony系モデルの特殊なプロンプトの書き方
Pony系モデルではプロンプト記述に特徴があります。
- スペースの代わりに「_」(アンダーバー)を使うとプロンプトの効きが良くなる場合がある
- 例:「red hair」→「red_hair」
- 例:「sitting on bench」→「sitting_on_bench」
- プロンプトを強調するには通常通り「(close up:1.2)」のように記述しますが、強調しすぎると全体的に画質が落ちる傾向があるため注意が必要
コンテンツ制限に関するプロンプトとNSFWについて
Pony系モデルには、コンテンツの制限レベルを指定するレーティングタグがあります。
- rating_safe: エロ要素なし(安全なコンテンツ)
- rating_questionable: 軽度のエロ要素あり
- rating_explicit: 露骨なエロ要素あり(NSFW)
使用するレーティングタグによって生成される画像の内容が変わります。なお、「rating_explicit」を使用しても、未成年キャラクターを含む露骨なコンテンツはフィルタリングされているとされています。
エロ要素を避けたい場合は、明示的に「rating_safe」をプロンプトに入れておくと安心です。
※Stable DiffusionのNSFW対応については、下記記事で詳しく解説しています。
Pony系モデルに効果的なネガティブプロンプト
公式では「ネガティブプロンプトが必要ない」と説明されていますが、実際には多くのユーザーがネガティブプロンプトを活用しています。
特に使われる一般的なネガティブプロンプトの例
score_6, score_5, score_4, (worst quality:1.6), (low quality:1.4), (normal quality:1.4), ((illustration:1.3)), 3d, ((paintings:1.3)), ((sketches:1.3)), 不要なソースタグ(例:source_furry, source_pony, source_cartoon)
また、手や指の崩れを防ぐためのネガティブプロンプトもよく使われます。
low-res, bad anatomy, bad hands, text, error, missing fingers, extra digit, fewer digits, cropped, worst quality, low quality, normal quality, jpeg artifacts, signature, watermark, username, blurry
※Stable Diffusionの効果的なネガティブプロンプトについては、下記記事で詳しく解説しています。
Pony系モデルの特殊なカテゴリータグ
Pony系モデルには様々な特殊なカテゴリータグがあり、より細かく画像を制御できます。
服装タグ | costume_formal: フォーマルな服装 costume_casual: カジュアルな服装 | costume_formal![]() |
体型タグ | body_slim: スリムな体型 physical_short: 低身長 | body_slim![]() |
髪型・髪色タグ | hair_braid: 三つ編み hair_color_black: 黒髪 | hair_braid![]() |
表情・目の色タグ | mouth_smile: 笑顔 eye_color_brown: 茶色の目 | mouth_smile![]() |
感情タグ | emotion_joy: 喜びの感情 | emotion_joy![]() |
ポーズタグ | hand_sign_peace: ピースサイン action_running: 走るポーズ action_walking: 歩くポーズ | hand_sign_peace![]() |
背景タグ | environment_seaside: 海辺の背景 | environment_seaside![]() |
これらのタグを組み合わせることで、ControlNetなどの拡張機能を使わなくても意図した画像を生成しやすくなります。
Pony系モデルのリアル系とアニメ系の調整方法
リアル系の画像を生成したい場合と、アニメ系の画像を生成したい場合でプロンプトを変えると効果的です。
①リアル系向けプロンプト例
score_9, score_8_up, score_7_up, 32k, masterpiece, best quality, ultra HD quality details, RAW photo, smooth face, beautiful face, delicate and smooth skin

②アニメ系向けプロンプト例
score_9, score_8_up, score_7_up, source_anime, masterpiece, best quality, anime style, vibrant colors, (big eyes:1.2)

リアル系モデルでは「realistic」をプロンプトに入れると同じ顔が生成されやすい傾向があるため、モデルによって微調整が必要です。
- Stable Diffusionのプロンプトの見本が知りたい
- 画像生成が思ったようにできない
- 色々なプロンプトを探したい

人気のPony系モデルを紹介!
Pony系モデルには様々な派生モデルがあり、それぞれ特徴が異なります。それぞれCivitaiのリンクを貼っていますので、ぜひお気に入りのモデルを見つけてみてください。
①リアル系モデル
- CyberRealistic Pony:プロンプトの忠実な再現など、ユーザビリティの向上にも重点を置いているモデル
- pinkiepiePonyMix: リアルな質感とディテールが優れたモデル
- BDPonyReal: 写真のような質感の表現に強いモデル
- aoiRealisticPony: リアルな肌の質感表現に優れたモデル
- waiREALCN: アジア人の顔立ちに特化したリアル系モデル
- realPony_realAnimeNo04: セミリアルな表現ができるモデル
- anirealPony: アニメとリアルの中間的な表現が可能なモデル
- hponyrealism25D: 2.5次元的なリアリズムを表現できるモデル
- waiSemireal: セミリアル表現に特化したモデル
- chacolsemirealponymix: チョコレートのような温かみのあるトーンが特徴のセミリアルモデル
- RunBullXL Pony: 実写に特化したモデル
- SwamPonyXL: アジア系の顔に強いリアルモデル
- ebara pony: 高品質な写実的表現が可能なモデル
- soraAni25DSDXLPony: 2.5次元的なリアル表現ができるモデル
①アニメ系モデル
- Prefect Pony:アニメやキャラクター性の高い画像を生成できるモデル
- Pony Diffusion:複数のキャラクターの配置や構図の破綻が少ないモデル
- hanamomopony: ぷにっとしたロリ系のアニメ表現が得意なモデル
- AutismMix: 手足の表現が安定したアニメモデル
- Pony Diffusion For Anime: アニメ特化型のオリジナル派生モデル
- PonyCartoonMix: カートゥーン風のデフォルメが得意なモデル
- Epona Mix: 日本の文化に近い絵柄を出せるモデル
- AnimePonyMix: アニメキャラクターの表情表現に強いモデル
- kawaiPonyXL: かわいらしいキャラクター表現に特化したモデル
- PonyAnimeStyle: 日本のアニメスタイルに特化したモデル
- VividPonyAnime: 鮮やかな色彩表現が特徴のアニメモデル
- AnimeFantasyPony: ファンタジー系アニメの表現に特化したモデル
- StylizedAnimePony: スタイライズされたアニメ表現が得意なモデル
これらのモデルはそれぞれ特徴が異なるため、生成したい画像のスタイルや表現方法に合わせて選ぶと良いでしょう。
また、モデルによって最適なプロンプト設定が異なる場合があるので、各モデルの公式ページやサンプル画像を参考にすることをおすすめします。

※下記記事では、Pony系モデルの使い方について紹介していますので合わせて参考にしてください。
Pony系モデルで高速生成する方法
Pony系モデルは高品質ですが、生成に時間がかかる場合があります。
以下の方法で高速化できますので、ぜひ試してみてください。
- SDXL Lightning/LCM LoRA: 生成時間を短縮できますが、画質が若干低下する可能性あり
- Hyper-SD LoRA: CFGとSampling Stepsを大幅に減らすことができ、低スペック環境でも高速化可能
※LoRAの使い方については、下記記事で詳しく解説しています。
【FAQ】Pony系モデルに関するよくある質問
- QPony系モデルで生成した画像の色合いがおかしいのですが、なぜですか?
- A
これはVAE(Variational Autoencoder)の設定が原因である可能性が高いです。Pony系モデルはSDXL用のVAEを使用する必要があります。SD1.5系列のVAEとは互換性がないため、SDXL用のVAEに変更してみてください。WebUIの設定画面からVAEの変更が可能です。
- Q生成された画像にノイズが多く含まれています。どうすれば改善できますか?
- A
いくつかの原因と解決法があります。
- WebUIの設定の問題:Emphasis Modeを「No norm」に設定してみてください
- プロンプトの順番:プロンプトの順番を変えることでノイズが軽減する場合があります
- Prevent Artifact拡張機能:この拡張機能を導入すると、ノイズ対策ができます
- サンプラーの変更:DPM++からEuler Aに変更すると改善する場合があります
- QPony系モデルでLoRAが効きません。どうすればいいですか?
- A
Pony系モデルは他のモデル(SD1.5など)で学習したLoRAとの互換性が低い傾向があります。
以下の対処法を試してみてください。
- Pony用に特化したLoRAを使用する
- 強調値を上げる(例:(LoRA名:1.5)など)
- スコアタグの後にLoRAを指定する順番を試してみる
これらでも効かない場合は、残念ながら基本的には使えないと考えた方が良いケースもあります。
- Q手や指がうまく生成されません。Pony系モデルは手に強いはずでは?
- A
Pony系モデルは一般的に手の描写が安定していますが、以下のことを試してみてください。
- ネガティブプロンプトに「bad hands, missing fingers, extra digit, fewer digits」を追加する
- ポジティブプロンプトに「detailed hands」などを追加する
- AutismMixなど手の描写に特に強いPony派生モデルを試す
- 特定の手のポーズを指定する(例:hand_sign_peaceなど)のタグを使う
- Q画像生成に時間がかかりすぎます。高速化する方法はありますか?
- A
Pony系モデルの高速化には以下の方法があります。
- SDXL LightningやLCM LoRAを導入する(ただし画質が若干低下する可能性あり)
- Hyper-SD LoRAを使用してCFGとSampling Stepsを減らす
- サンプラーをDPM++ 2M SDE TurboやEuler A Turboに変更する
- ステップ数を減らす(品質とのバランスを考慮)
- 小さいサイズで生成してからアップスケールする(ただし品質に影響する場合あり)
- QClipSkip設定を変えても画質が悪いままです。
- A
ClipSkipは必ず2(または一部のUIでは-2)に設定してください。
それでも改善しない場合は、以下を試してみてください。
- モデルが正しくロードされているか確認
- スコアタグ(score_9, score_8_up, score_7_up)が正しく入力されているか確認
- VAEの設定を見直す
- WebUIを再起動してみる
- Q特定のソースタグを使っても望んだスタイルになりません。
- A
以下を試してみてください。
- 不要なソースタグをネガティブプロンプトに入れる(例:source_animeを使いたい場合、source_pony, source_furry, source_cartoonをネガティブに)
- ソースタグの後に具体的なスタイル指定を追加(例:source_anime, anime style, vibrant colors)
- 別のPony派生モデルを試す(モデルによって得意なスタイルが異なる)
- プロンプトにアンダーバーを使う(例:anime_style)
まとめ
いかがでしたでしょうか?Ponyモデルのプロンプトの書き方を詳しく解説してきました!
Pony系モデルを最大限に活用するための重要ポイントをまとめました。
- 基本設定: クリップスキップ2、Euler a、25ステップ、1024px解像度、SDXL用VAEの使用が必須
- プロンプト順序: スコアタグ(score_9, score_8_up, score_7_up)→品質タグ→ソースタグ→レーティングタグ→内容の指定
- 書き方のコツ: スペースの代わりにアンダーバー(_)を使うとプロンプトの効きが良くなる場合あり
- ソースタグ: source_anime(アニメ)、source_pony(ポニー)、source_furry(ケモノ)、source_cartoon(カートゥーン)から目的に合わせて選択
- 特殊タグ: 服装、体型、髪型、表情、動作など様々な特殊タグが利用可能
Pony系モデルの特徴を理解し、適切なプロンプトを使うことで、手の描写に強く、表現力豊かな高品質な画像生成が可能になります。モデルによって得意なスタイルが異なるため、目的に応じて適切なPony系派生モデルを選ぶことも重要です!
- Stable Diffusionのプロンプトの見本が知りたい
- 画像生成が思ったようにできない
- 色々なプロンプトを探したい
