「Stable Diffusionの呪文(プロンプト)って何?」、「Stable Diffusionを導入したけど、どうやって画像生成したらいいかわからない」、「呪文(プロンプト)を上手く使いこなせない」
このような悩みや疑問をお持ちではないでしょうか。Stable Diffusionは、呪文(プロンプト)と呼ばれるテキストの指示を入力して画像を生成します。呪文(プロンプト)で背景や絵柄を指定すれば、好みの画像を効率的に出力できます。
しかし、呪文(プロンプト)にはいくつかのコツがあります。理解していないと、イメージに近い画像を生成するのは困難です。
そこで本記事では、
- 呪文(プロンプト)とは?
- Stable Diffusionの呪文(プロンプト)で重要な要素
- 呪文(プロンプト)を入力する際のテクニック
などについて解説していきます。
この記事を読めば呪文(プロンプト)の活用方法が理解でき、イメージ通りの画像を効率よく作成できるようになります。呪文(プロンプト)に関連した記事もいくつか紹介していますので、ぜひ参考にしてください。
呪文(プロンプト)とは?
Stable Diffusionにおける呪文(プロンプト)は、生成する画像の内容を指示するために入力するテキストのことです。あくまで呪文(プロンプト)の指定はおおまかなので細かい指定はできません。
- 指定しやすい:人数、髪型、髪色、体型、服装、背景
- 指定しにくい:目線の向き、指の向き、腰の角度、背景の小物
人物の属性(髪型や目の形)や動作(食事や運動)は呪文(プロンプト)で指定し、詳細な構図やポーズはimg2imgやControlNetで指定するのが基本です。
また、モデルやLoRaによっては、推奨される呪文(プロンプト)の単語や入力の仕方があります。あらかじめ、使用するモデルやLoraのディスクリプションを確認するようにしましょう。
※『img2img』の使い方、『ControlNet』の使い方を知りたい方は、以下の記事を参考にしてください。
呪文(プロンプト)の構文
呪文(プロンプト)は単語を並べて書いていくことが基本で、動詞や形容詞などを含めることもあります。それぞれの単語は英語で入力し「, 」(カンマと半角スペース)で連結していきます。
単語に誤字がある場合などは、赤線の波線アンダーバーが表示されるので注意しましょう。
呪文(プロンプト)の例
実際に、「リアルな美女の全身画像」というイメージを例に、呪文(プロンプト)を書いてみます。
Prompt;masterpiece, 1girl, beautiful, full shot
すると以下のような画像が生成されました。
“全身”を表す”full shot”以外の呪文(プロンプト)はすべて反映されていますね。
全身画像や立ち絵にしたい場合は、画像のサイズを縦長に変更したり、”full shot”の呪文(プロンプト)を強調(後半の章で説明します)してみると良いかもしれません。
- Stable Diffusionのプロンプトの見本が知りたい
- 画像生成が思ったようにできない
- 色々なプロンプトを探したい
呪文(プロンプト)で重要な要素
呪文(プロンプト)を入力する際の重要な要素として、以下の7つが挙げられます。
1.品質
2.コアプロンプト
3.追加の要素
4.背景・風景
5.画像のスタイル
6.構図・アングル
7.照明・エフェクト・フィルター
これらを意識して入力すれば、自分の思う画像を生成しやすくなるはずです。それでは、1つずつ解説していきます。
呪文(プロンプト)で重要な要素①:品質
呪文(プロンプト)で重要な要素の1つ目は、品質です。具体的には以下の単語などを使用し、高画質の画像を生成することが可能です。画像のクオリティに影響するので、かなり重要です。
- masterpiece:傑作
- best quality, high quality:最高品質、高品質
- very high resolution:超高解像度
- ultra detailed:超精細な
- 4k(8k):4k(8k)のような画像
一方で、ラフスケッチの絵のような画像を生成したい場合には、品質の呪文(プロンプト)は適していないので使わない方が良いでしょう。
呪文(プロンプト)で重要な要素②:コアプロンプト
呪文(プロンプト)で重要な要素の2つ目は、コアプロンプトです。コアプロンプトとは、「生成したい画像の主題」です。例えば、「a girl」で女の子の画像、「background illustration」で背景イラストなどです。
呪文(プロンプト)で重要な要素③:追加の要素
呪文(プロンプト)で重要な要素の3つ目は、追加の要素です。追加の要素とは、コアプロンプトに付随する属性や状況を示す要素です。例えば、女の子の画像の場合、髪型や服装や表情、背景イラストの場合、そこに映る人々の様子、建物の特徴、小道具などです。
※髪型、服装、表情に関する呪文(プロンプト)まとめを知りたいは、以下の記事を参考にしてください。
呪文(プロンプト)で重要な要素④:背景・風景
呪文(プロンプト)で重要な要素の4つ目は、背景・風景です。単色の背景、湖、季節、廃墟、カフェなど様々試してみましょう!
※背景・風景に関する呪文(プロンプト)まとめを知りたい方は、以下の記事を参考にしてください。
呪文(プロンプト)で重要な要素⑤:画像のスタイル
呪文(プロンプト)で重要な要素の5つ目は、画像のスタイルです。具体的には以下の単語などを使用し、画風を指定することが可能です。
- hyper realistic:超現実的な
- 3D render:3DCG調
- icon:アイコン
- illustration:イラスト
- cel anime:日本アニメ風
- chibi anime:ちびキャラ風
他にも色々な単語がありますが、画家名・アートスタイル・イラストの手法・画材の名前などが使われています。
呪文(プロンプト)で重要な要素⑥:構図・アングル
呪文(プロンプト)で重要な要素の6つ目は、構図・アングルです。同じ対象物でも、構図・アングルの違いで印象の異なる画像になります。具体的には、以下のような単語があります。
- High angle shot:被写体よりも高い位置からの画像
- dynamic angle:ダイナミックな構図
- Full shot:被写体全体
- Close-up shot:被写体の顔のアップ
- upper body:上半身
カメラアングルに関する呪文(プロンプト)が使いこなせると、生成できる画像の幅が広がります。
※構図・ポーズに関する呪文(プロンプト)まとめを知りたい方は、以下の記事を参考にしてください。
呪文(プロンプト)で重要な要素⑦:照明・エフェクト・フィルター
呪文(プロンプト)で重要な要素の7つ目は、照明・エフェクト・フィルターです。さまざまな芸術的表現で使用される手法で、画像に明るさやムードを与えることができ、作品の雰囲気を変化することができます。具体的には、以下のような単語があります。
- sharpness:画像の明瞭度を調整して、より鮮明にする。
- low/high contrast:最も明るい領域と最も暗い領域の差を制御する。
- monochromatic:モノクロ(単色)にする。色を指定しない場合は白黒にする。
- Shallow depth of field:被写体の一部にピントを合わせる。
- Deep Focus:広い範囲にピントを合わせる。
- bokeh:焦点の合っていない背景にぼかしを加える。
- motion blur:画像を一方向にぼかして、動きがあるように見せる。
ここまでで、呪文(プロンプト)で重要な要素を説明しました。ぜひ、これら7つの要素を組み合わせて画像生成してみてください。
※リアルな画像生成をするための呪文(プロンプト)のコツを知りたい方は、以下の記事も参考にして下さい。
ネガティブプロンプトとは?
「ネガティブプロンプト」とは、AIによる画像生成において「描いてほしくない要素」を排除するためのものです。反対呪文と呼ばれることもあります。
四肢が欠損したエラー画像や職場閲覧注意(nsfw)画像が生成されないようにするのに有効です。
※おすすめのネガティブプロンプトと使い方を知りたい方は、以下の記事も参考にしてください。
呪文(プロンプト)を操るテクニック
ここからは、実際に呪文(プロンプト)を使用する時のコツをお伝えいたします。具体的には、以下の4点です。
- 強調構文
- 呪文(プロンプト)の保存
- 呪文(プロンプト)参考サイト
- トークン数の意識
呪文(プロンプト)を操るテクニック①:強調構文
プロンプトの単語には、「重み(weight)」を付けることができます。例として、「筋肉のある男性」について、筋肉の影響を変えて作成したいと思います。
まず、
Prompt;a man, muscle
と入力した場合、適度に筋肉のあるイケメンな男性が生成されました。
続いて、さらに筋肉のある男性の画像を作成したいと思います。
単語を強調する方法は、単語を括弧()で閉じることです。(単語)は1.1倍、(単語:〇)は〇倍の影響を及ぼします。ここでは、(muscle:1.5)と入力してみます。
Prompt;a man, (muscle:1.5)
すると、かなり筋肉のある男性が生成されました。逆に呪文(プロンプト)の作用を弱める場合は、コロンの後の数字を小さくしましょう。
このように呪文(プロンプト)の強弱を応用すれば、色のバランス調整や、要素の強さの調整をすることができます。ぜひ活用してみてください。
また、呪文(プロンプト)を入力する順番も画像生成に影響します。具体的には、はじめに入力された呪文(プロンプト)ほど優先度が高くなります。順番を変えるだけで優先度が変わり、絵柄が変化することもあるので色々工夫してみて下さい。
※『強調構文』についてさらに詳しく知りたい方は、以下の記事を参考にしてください。
呪文(プロンプト)を操るテクニック②:呪文(プロンプト)の保存
呪文(プロンプト)を書いていると、よく使う単語や定型文がいくつか出てくると思います。そういった際に毎回単語を書くのは面倒なので、呪文(プロンプト)を保存・復元する方法を活用しましょう!
以下の記事で解説していますので、ぜひ参考にしてください。
呪文(プロンプト)を操るテクニック③:呪文(プロンプト)参考サイト
以下3つのサイトには、世界中のユーザーが画像生成AIで作成した画像と呪文(プロンプト)が投稿されています。イメージ通りの呪文(プロンプト)が思い浮かばなければ、参考にしてみましょう。
- chichi-pui
- Unprompt AI
- MajinAI
chichi-puiは、AIイラストの有名な投稿サイトです。美少女系などのイラストが多くアップされています。呪文(プロンプト)を確認するためにはユーザー登録(無料)が必要です。
Unprompt AIは、「テキストによる検索」や「画像のアップロードによる検索」があります。後者は、アップロードした画像の類似コンテンツを表示することができる機能ですので便利です。
MajinAIは、人の画像に特化した投稿サイトです。使用モデルや年齢制限などでフィルターがかけられます。ログインなしで利用可能ですので、ぜひ試しにご覧になってください。
呪文(プロンプト)を操るテクニック④:トークン数の意識
トークンの意味は、Stable Diffusionの”文字列”です。例えば、
Prompt;masterpiece, 1girl, beautiful, smile
という呪文(プロンプト)を入力した場合、『masterpiece』『,』『1』『girl』『,』『beautiful』『,』『smile』の8つがトークンとしてカウントされます。英単語や数字はもちろんですが、『,』もトークンとしてカウントされることに注意しましょう。
実際に上記の呪文(プロンプト)で画像を作成すると、笑顔の女性が生成されました。
Stable Diffusionの単語(トークン)数は原則75以下にするのがおすすめです。
トークンに上限があるわけではないですが、扱いが複雑になってしまいます。
75トークンを超える長文のプロンプトが書かれている場合、
- 1回目:1~75トークンまで
- 2回目:76~150トークンまで
- 3回目:151~225トークンまで
という区切りでStable Diffusionに指示が送られます。
例えば、「short hair」という単語の『short』が75個目のトークンだったとすると、『hair』が76個目のトークンとなり、送信するタイミングがずれるため、思うような結果が得られないことがあります。
おすすめの呪文(プロンプト)一覧
おすすめの呪文(プロンプト)について、ジャンルごとに記事でまとめていますので、ぜひ参考にしてください。
服装に関するおすすめの呪文(プロンプト)はコチラ。
髪型・髪色・髪質に関するおすすめの呪文(プロンプト)はコチラ。
リアルな表情に関するおすすめの呪文(プロンプト)はコチラ。
ポーズ・構図に関するおすすめの呪文(プロンプト)はコチラ。
目線・視線に関するおすすめの呪文(プロンプト)はコチラ。
アニメ調の画像生成に関するおすすめの呪文(プロンプト)はコチラ。
まとめ
いかがだったでしょうか?呪文(プロンプト)について理解は深まったでしょうか。
今回のポイントをまとめると、以下のようになります。
- 呪文(プロンプト)は、生成する画像の内容を指示するために入力するテキストのこと
- 呪文(プロンプト)で重要な要素として、品質、コアプロンプト、追加の要素、背景・風景、画像のスタイル、構図・アングル、照明・エフェクト・フィルターなどがある。
- プロンプトを扱うテクニックとして、強調構文、呪文(プロンプト)の保存、呪文(プロンプト)の参考サイト、トークン数の意識がある。
呪文(プロンプト)を使いこなすことは、AI画像生成するにあたって重要なポイントの1つです。まずは、他ユーザーが使用している呪文(プロンプト)の書き方を参考に画像生成してみると良いと思います。
これから、本記事などを参考に楽しみながら画像生成していきましょう!
- Stable Diffusionのプロンプトの見本が知りたい
- 画像生成が思ったようにできない
- 色々なプロンプトを探したい