Stable Diffusionでは、一度に2人・複数人が表示された画像を生成することができます。
しかし、単純に画像を生成しようとするだけでは、顔が崩れるなどのトラブルが発生しやすく、うまくいかないことも多いです。
そのため、呪文(プロンプト)に工夫を加えることや、拡張機能を使用することが求められます。
この記事では、
- 「Stable Diffusionを使って一度に2人・複数人が表示された画像を生成したい!」
- 「Stable Diffusionで一度に2人・複数人を生成するために必要な工夫が知りたい!」
- 「Stable Diffusionで2人・複数人を生成する際に使う拡張機能の使い方を知りたい!」
そんな方向けにStable Diffusionで2人・複数人の画像を生成する方法について解説していきます。
また、2人・複数人の画像を生成する際に役立つ呪文(プロンプト)やネガティブプロンプトについても合わせて紹介していきます。
ぜひ最後までご覧ください!
2人・複数人を生成できる拡張機能①:『Latent Couple』
Stable Diffusionで「2人・複数人を一度に生成するた」めには、拡張機能の使用が不可欠となります。
複数人の画像を生成するために使う拡張機能は2種類あり、それぞれインストールをして導入する作業が必要です。
また、この2種類の拡張機能は使用方法もそれぞれで異なるものとなっています。
そこで、以下では、複数人の画像を生成するために必要な拡張機能のインストール方法から、導入方法、使用方法まで、実際に画像をお見せしながら解説していきます。
『Latent Couple』の導入方法
Stable Diffusionで2人・複数人が表示された画像を生成するために使う拡張機能には、まず、『Latent Couple』というものがあります。
『Latent Couple』とは、生成する1枚の画像を複数に区分し、それぞれに異なる呪文(プロンプト)を適用することができる拡張機能です。
そのため、『Latent Couple』を使用することで、生成したい2人・複数人の人物それぞれに対して呪文(プロンプト)を指定することができるようになり、複数人の画像を綺麗に生成することができます。
『Latent Couple』のインストール方法は下記の通りです。
- Stable Diffusionを起動し、『Extensions』というタブをクリックする
- 『Extensions』タブの中にある『Available』というタブをクリックする
- 『Available』タブを開くと、『Load from』というボタンがあるので、そこをクリックする
- 『Search』という欄に『Latent Couple』と入力する
- 『Search』欄の下に、いくつか検索結果が表示される
検索結果の中から『Latent Couple manipulations』を探し、『Install』をクリック
する
上記の手順を踏んでインストールが完了したら、Stable Diffusionを再起動することで『Latent Couple』を使うことができるようになります。
『Latent Couple』のパラメータ設定について
『Latent Couple』を使用するには、まず、『txt2img』というタブの中にある『Latent Couple』という欄の◀️をクリックしてください。
そうすることで、いくつかの設定可能なパラメーターを見ることができるようになります。
以下では、それぞれのパラメーターについて解説していきます。
パラメーターの設定画面は、『Latent Couple』を開き、『Rectangular』をクリックすることで見ることが可能になります。
●『Divisions』
『Divisions』とは、画像を分割する際の行の数と列の数を指定するためのパラメーターです。
”行数:列数”となっています。
デフォルトでは、「1:1,1:2,1:2」と表示されています。
最も左側の「1:1」は背景の比率を表しており、行数と列数が同じ値であるため、背景は分割されず全画面になることを表しています。
真ん中と右側の「1:2」は行数が1、列数が2となっているため、画面を縦半分に分割するということを表しています。
また、真ん中の「1:2 」は左右の一方の側を、右の「1:2」は左右のもう一方の側を表しています。
●『Positions』
『Positions』とは、分割した画像の配置を指定するためのパラメーターです。
『Divisions』で指定した背景とその他の部分の配置を決めることができます。
縦の配置:横の配置となっており、デフォルトでは、「0:0,0:0,0:1」と表示されています。
1番左側の「0:0」は背景の配置を表しています。
『Divisions』で指定した「1:1」に対しての配置なので、縦の座標0、横の座標も0という状態は、全画面に配置されていることを表しています。
真ん中の「0:0」は『Divisions』で分割した「1:2」のうちの一方に対する配置で、左側の配置を表しています。
右側の「0:1」は『Divisions』で分割した「1:2」のうちのもう一方に対する配置を示しており、左右のうちの右側を表しています。
●『Weights』
『Weights』とは、配置の重度を表しています。
「,」区切りで入れる『Weights』の数は、『Divisions』と『Positions』で指定した数と一致している必要があります。
デフォルトでは、「0:1,0:8,0:8」となっています。
つまり、背景に適用される呪文(プロンプト)の強度は低い状態であるということです。
●『end at this step』
『end at this step』とは、『Latent Couple』がどこまで作用するのかを指定することができるパラメーターです。
『Latent Couple』が存在する『txt2img』と同じタブに存在している『Sampling steps』の数値と一致させることで終始『Latent Couple』を作用させることができます。
以上が、「Latent Couple」を使用する際に設定できるパラメーターになります。
『Latent Couple』の使い方
それでは、ここからは、実際に『Latent Couple』を使って2人の人物を一つの画像に生成してみます。
『Latent Couple』を使って複数人の画像を生成するための手順は以下の通りです。
『Enabled』をクリックする
- 『Divisions』で背景とその他の部分の分け方を指定する
- 『Positions』で『Divisions』で分割した部分のそれぞれの配置を指定する
- 『Weights』で呪文(プロンプト)の適用される強度を指定する
- 『end at this steps』の数値を指定する
- 全体への呪文(プロンプト)と分割した部分それぞれへの呪文(プロンプト)を入力する
- 画像を生成する
今回は2人の人物を生成するので、分け方・配置・呪文(プロンプト)の適用される強度についてはデフォルトの状態から特に変更を加える必要がありません。
そのため、『Divisions』・『Positions』・『Weights』の数値は変えないでおきます。
また、『end at this steps』についてもデフォルトのままで大丈夫です。
パラメーターを上記のように設定できたら、次は呪文(プロンプト)を入力していきます。
呪文(プロンプト)を入力する際は、1点注意することがあります。
ネガティブプロンプトについては、上記のような設定をする必要はありません。
今回は下記の呪文(プロンプト)を入力しました。
呪文(プロンプト)
masterpiece, high quality, 4K, 2women, 20 years old, book store
AND
masterpiece, high quality, 4K, 2women, 20 years old, sweatshirt, pink hair
AND
masterpiece, high quality, 4K, 2women, 20 years old, T-shirt, long hair, black hair
ネガティブプロンプト
Easy negative, bad body, long neck, bad hands, bad eyes
呪文(プロンプト)の背景、左の人物、右の人物の全てにおいて、「masterpiece, high quality, 4K, 2women, 20 years old」は共通して入力しております。
そして、生成した画像がこちらです。
このように、『Latent Couple』を使うことで2人・複数人の画像を生成することが可能になります。
2人・複数人を生成できる拡張機能②:『Multi Diffusion』
また、『Latent Couple』の他に、『Multi Diffusion』という拡張機能を用いる方法でも複数人の画像を生成することができます、
『Multi Diffusion』とは画像のサイズを変更して、2人・複数人が表示された画像を生成することができる拡張機能です。
また、画像の特定の部分に人物を配置して、髪型や服装といったそれぞれの人物像を指定しながら複数人の画像を生成することも可能です。
『Multi Diffusion』の導入方法
『Multi Diffusion』のインストール方法は、下記のとおりです。
- Stable Diffusionを起動し、『Extensions』というタブをクリックする
- 『Extensions』タブの中にある『Install from URL』というタブをクリックする
- 『https://github.com/pkuliyi2015/multidiffusion-upscaler-for-automatic1111』を入力する
- URLの入力が完了したら『Install』をクリックする
インストール完了後、Stable Diffusionを再起動し、『txt2img』タブに『Tiled Diffusion』と『Tiled VAE』が表示されていれば、『Multi Diffusion』を使うことが可能です。
『Multi Diffusion』の使い方・パラメータ設定について
『Multi Diffusion』を使って複数人の画像を生成する方法は下記の2つです。
- 『Tiled Diffusion』と『Tiled VAE』の設定を行って画像生成する方法
- 『Region Prompt Control』を使う方法
『Tiled Diffusion』と『Tiled VAE』を使って複数人生成する方法
『Tiled Diffusion』と『Tiled VAE』の設定を行って画像生成する方法では、『Tiled Diffusion』と『Tiled VAE』を開き、いくつかパラメーターなどの設定を行う必要があります。
具体的な手順は下記のとおりです。
- 『Tiled Diffusion』の欄にある◀️をクリックする
- 『Enable Tiled Diffusion』をクリックする
- 『Overwrite image size』をクリックする
- 『Image width』で画像の幅を設定する
- 『Image height』で画像の高さを設定する
- 『Tiled VAE』の欄にある◀️をクリックする
- 『Enable Tiled VAE』をクリックする
- 呪文(プロンプト)を入力する
- 画像を生成する
今回は、『Image width』(幅)を『1024』、『Image height』(高さ)を『512』に設定したいと思います。
また、今回用いる呪文(プロンプト)は下記です。
呪文(プロンプト)
masterpiece, best quality, clothes store, 3women, 20 years old, beautiful eyes, cute face
ネガティブプロンプト
Easy negative, flat color, nsfw, bad body, poorly eyes, long neck, bad hands
そして、生成した画像がこちらです。
『Region Prompt Control』を使って複数人生成する方法
また、『Multi Diffusion』では、『Region Prompt Control』を使う方法でも複数人の画像を生成することが可能です。
『Region Prompt Control』とは、画面を分割することによって、生成する人物を描き分けることができる機能です。
具体的な使用手順は下記です。
- 『Tiled Diffusion』内にある『Region Prompt Control』欄の◀️をクリック
- 『Enable Control』をクリックする
- 『Draw full canvas background』をクリックする
- 『Create txt2img canvas』をクリックする
- 『Region 1』〜『Region 8』の中から設定したい個数分パラメーターを設定する
各『Region』に呪文(プロンプト)を入力する
- 画像を生成する
各『Region』において設定する必要があるパラメーターは以下の4つです。
- 『Enable Region』
- 『Type』
- 『xとy』
- 『wとh』
それぞれについて解説していきます。
●『Enable Region』
クリックすることで『Region』の使用が可能になります。
●『Type』
前景(Foreground)か背景(Background)か選ぶことができます。
●『xとy』
指定した領域の配置を決めることができます。
●『wとh』
指定した領域の幅と高さを決めることができます。
さてそれでは、『Region Prompt Control』を使って2人が表示された画像を生成していきたいと思います。
それぞれのパラメーターと呪文(プロンプト)は以下のように設定しました。
①背景
『Region 1』
『Type』:『Background』
『xとy』:どちらも『0』
『wとh』:どちらも『1』
『Region 1』の呪文(プロンプト)↓
masterpiece, best quality, beach
②左の人物
『Region 2』
『Type』:『Foreground』
『xとy』:『x』が『0』、『y』が『0.1』
『wとh』:『w』が『0.5』、『h』が『0.8』
『Region 2』の呪文(プロンプト)↓
masterpiece, best quality, 1woman, full body, blue hair, beautiful eyes
③右の人物
『Region 3』
『Type』:『Foreground』
『xとy』:『x』が『0.5』、『y』が『0.1』
『wとh』:『w』が『0.5』、『h』が『0.8』
『Region 3』の呪文(プロンプト)
masterpiece, best quality, 1woman, full body, red hair, beautiful eyes
また、ネガティブプロンプトについては、各『Region』共通で下記のものを設定しました。
ネガティブプロンプト
grayscale, nsfw, bad hands, bad body, long neck
そして生成した画像がこちらです。
このように、『Multi Diffusion』を用いる方法でも、複数人の画像を生成することができます。
- Stable Diffusionのプロンプトの見本が知りたい
- 画像生成が思ったようにできない
- 色々なプロンプトを探したい
Stable Diffusionで複数人を生成する際におすすめの呪文(プロンプト)
最後に、2人・複数人の画像を生成する際に役立つ呪文(プロンプト)を紹介します。
複数人の画像を生成する際には、『数字+名詞の複数形』と名詞を複数形にしたり、『group of 名詞』でグループを指定したりするのがおすすめです。
また、『family 〜ing』や『名詞 and 名詞』のかたちを用いることも複数人の画像を生成する際に役立つことが多いです。
呪文(プロンプト)の具体例は下記です。
呪文(プロンプト) | 意味 |
---|---|
2boys | 2人の男の子 |
2girls | 2人の女の子 |
2men | 2人の男性 |
2boy | 2人の男の子 |
2women | 2人の女性 |
group of students | 生徒のグループ |
group of office workers/office workers /group of business people | 会社員のグループ |
group of fighters/group of soldiers | 戦闘員(兵士)のグループ |
group of friends/classmates /group of students /group of colleagues | 友だちのグループ、クラスメイト |
group of dancers | ダンサーグループ |
group of tourists | 旅行者のグループ |
group of chefs | 料理人のグループ |
group of doctors | 医者のグループ |
group of actors | 俳優のグループ |
group of senior citizens /group of retirees /group of elderly friends | 老人のグループ |
group of grandparents | 祖父母のグループ |
group of swimmers | 水泳選手のグループ |
team of athletes | アスリートチーム |
band members | バンドのメンバー |
family talking in the park | 公園で話している家族 |
family having lunch | 昼食をとっている家族 |
family working in the shop | お店で働いている家族 |
family running in the field | 野原を走る家族 |
family portrait | 家族写真 |
teacher and student | 先生と生徒 |
mother and child | 母と子ども、母子 |
father and child | 父と子ども、父子 |
boy and girl | 男の子と女の子、男女 |
parent and child | 親と子ども、親子 |
Husband and Wife | 夫妻 |
couple | カップル、恋人 |
siblings | 兄弟、姉妹 |
wedding party | 結婚パーティー |
choir | 合唱団 |
●生成画像例
mother and child cooking together
parents and children playing a board game,
brother and sister eating ice cream
family portrait
couple
Husband and Wife
group of soldiers
group of senior citizens
family having a picnic
young people having fun at a night pool
Stable Diffusionで複数人を生成する際におすすめのネガティブプロンプト
Stable Diffusionで複数人の画像を生成する際は、ネガティブプロンプトも重要なものとなっています。
適切なネガティブプロンプトを入力することで、人物の表情や体の構図の崩れを防ぐことができるためです。
おすすめのネガティブプロンプトの具体例は下記です。
ネガティブプロンプト | 意味 |
---|---|
low quality | 低クオリティ |
worst quality | 最低のクオリティ |
bad body | 崩れた体 |
bad hands | 崩れた手 |
bad proportions | 全体の構図が悪い |
bad anatomy | 崩れた人体構造 |
poorly eyes | 崩れた目 |
long neck | 過剰に長い首 |
ugly | 醜い状態 |
missing fingers | 指の欠落 |
extra digits | 余分な指 |
※『ネガティブプロンプト』についてさらに詳しく知りたい方は以下の記事を参考にしてください。
※また、他にもさまざまなジャンルの呪文(プロンプト)をまとめたものもありますので、今回ご紹介した呪文(プロンプト)と合わせて参考にしていただければ幸いです。
まとめ
いかがでしたでしょうか?
今回の記事では、Stable Diffusionで2人・複数人の画像を生成する方法やおすすめの呪文(プロンプト)について解説してきました。
要点をまとめると、以下のようになります。
- 複数人の画像を生成する方法は、『Latent Couple』を使う方法と『Multi Diffusion』を使う方法の2つがある
- 『Latent Couple』は生成する1枚の画像を分割し、それぞれに異なる呪文(プロンプト)を適用することができる拡張機能
- 『Multi Diffusion』は画像のサイズを変更して複数人の画像を生成したり、画像を区分して人物を描き分けることで、複数人の画像を生成したりできる拡張機能
- 『Latent Couple』も『Multi Diffusion』もインストールやパラメーターの設定が必要
- 複数人の画像を生成するには、『数字+名詞の複数形』や、『group of 名詞』、『family 〜ing』や『名詞 and 名詞』といった呪文(プロンプト)の活用がおすすめ
- 適切なネガティブプロンプトを入力しないと画像が崩れる
今回ご紹介したように、2人・複数人の画像を生成するにはいくつかの方法があるので、ぜひ自分に合った方法を探してみてください!
- Stable Diffusionのプロンプトの見本が知りたい
- 画像生成が思ったようにできない
- 色々なプロンプトを探したい