AIで画像を生成していると、色々と知らない事にぶち当たります。
新しい技術なのでそれは極々当たり前のことです。
Stable Diffusionを使いこなすには、知らないものに出会った時にその都度調べる根気が大切です。
今回は「Embedding」という機能についてご紹介します。
「Embedding」とは?
「Embedding」=「埋め込み」なんて訳されています。
「Embedding」は機械学習の基本的な手法で、単語や文といった自然言語をベクトル空間に配置して、その位置関係から要素間の関係性を数値化するものです。
「Embedding」の手法で生成されたデータは、AI画像生成でも非常に有効性が高く、Stable Diffusion でも多くの「Embedding」データが公開され、画像生成の助けとなっています。
具体的には人間が「汚い」「不快」と感じるようなデータのみを学習させて、ネガティブプロンプトとして使用する事で生成される画像のクォリティーを上げたり、一人の人物を学習させてとその人物に寄った画像を生成する(loraのような使い方です)、そんな使われ方をしています。
本記事では「Embedding」の導入から使用までと、おすすめの「Embedding」をいくつかご紹介していきます。
「Embedding」の導入方法・使い方
「Embedding」はCIVTAI もしくは Hugging face からダウンロードするのが一般的な方法です。
「Embedding」のダウンロード
・CIVITAI ではダウンロードボタンがあるのでそれを押しましょう。
ちなみに上の「Embedding」は「ジョーカー・ザ・ムービースタイル」になれるそうです。
モデルファイルはそんなに大きくないのでさほど時間はかかりません。
・Hugging faceではモデルとセットになっていることもあります。
embedding のフォルダを選択して下さい。
するとその先に目的のファイルがあります。
ダウンロードしたファイルの置き場所は「stable-diffusion-webui」⇨「emeddings」です。
モデルやらLoraやら置き場所がそれぞれ違うので間違わないように気をつけて下さいね。
「Embedding」の使い方
Stable Diffusionの画面内にある「Textual inversion」のタグの中に、先ほど「emeddings」のファイルに保存したものが入っているので、選択して下さい。
今回は「Easy Negative」を選びます。
「Easy Negative」はネガティブプロンプトとして使用するので、カーソルをネガティブプロンプト欄に合わせてから「Easy Negative」を選択して下さい。
こんな感じで「Textual inversion」から選んで「プロンプト」として使います。
「Embedding」にはプロンプトとして使用するものと、ネガティブプロンプトとして使用するものがあります。間違うと真逆の効果が現れるので注意しましょう。
- Stable Diffusionのプロンプトの見本が知りたい
- 画像生成が思ったようにできない
- 色々なプロンプトを探したい
おすすめの「Embedding」を紹介!
「Embedding」は多くの種類が公開されています。
その中から、ベーシックに使えるおすすめのものをいくつかご紹介します。
①EasyNegative
ネガティブプロンプトとして使用する「Embedding」の代表とも言える存在です。
画像のクオリティーを高めてくれます。これが無いと、ネガティブプロンプトに
(((not-oscar-winning-masterpiece-anatomy, not-supermodel-anatomy, not-accurate-anatomy, not-master-degree-anatomy, not-superstar-anatomy, not-worldstar-anatomy, bent-in-all-directions-anatomy, more-than-5-anatomy, less-than-5-anatomy, not-anatomy-recognized-by-professors, not-always-extreme-perfect-anatomy, not-always-stunning-beautiful-5-anatomy, arms-always-up-to-show-hands, not-world’s-best-supermodel-anatomy, dynamic-anatomy-poses, ・・・・・・・
とにかくたくさん書かなくてはいけません。
「EasyNegative」これ一つをネガティブプロンプトに入れるだけで、大体OKなくらいのクオリティーになります。
あるいは、試作時は「EasyNegative」だけをネガティブプロンプトに入れておいて、生成具合を見て書き足す感じで使えます。
※詳しく知りたい方はこちらの記事をご覧ください。
「EasyNegative」はこちらからダウンロード可能です。
②bad_prompt
「EasyNegative」と同様にこれ1つにネガティブ要素をふんだんに詰め込んだ「Embedding」です。
より快適に使えるように改良されたバージョン2が出ているので、こちらをお勧めします。
バージョン1は強度(0.8)で使うことが推奨されていて、使うのがめんどくさいです。
「bad_prompt」は以下からダウンロードできます。
③bad-hands-5
AI画像生成で課題となっているのが細部の破綻、特に手の破綻です。
この問題に対して今の所一番有効とされているのが、「Embedding」を使っての修正です。
「bad-hands-5」は手の破綻に特化した学習をしています。
「bad-hands-5」は以下からダウンロードできます。
④badhandv4
こちらも手の破綻に特化した「Embedding」です。
イラストだけでなく、実写でもそこそこ機能します。
ただ、手の破綻の「Embedding」は基本的に1個あれば十分です。
複数使用すると、そこのベクトルが濃くなりすぎるので、生成結果に悪い影響を与える可能性があります。
「badhandv4」は以下からダウンロードできます。
⑤ulzzang-6500
この「ulzzang-6500」は女性の容姿をアジア系(より韓国系)に修正する「Embedding」です。
プロンプトとして使用します。
ただ、現在CIVITAIからは削除されています。というのも通常の「Embedding」は生成時のベクトルとして働くだけですが、この「ulzzang-6500」は生成後にさらに画像を修正するように作られています。
わかりやすく言うと、拡張機能「ADetailer」のように通常の生成後に機能します。
当然時間が余分にかかりますし、他の「Embedding」と挙動が違うので表舞台からは消えてしまいました。
でも一応Hanging Faceにはまだあるので使うことはできます。
でもこの「ulzzang-6500」の使用は現在お勧めしません。
あくまで知識としての”おすすめ”としてここに書いておきます。
「Embedding」の探し方はCivitaiがオススメ!
CIVITAIはStable Diffusionで利用するさまざまなデータファイルが、見た目で理解しやすいように作られています。
Haggis Faceには無い「見た目」のわかりやすさがあり、探し物をするのならCIVITAIが絶対にお勧めです。
検索欄に「Embedding」と打ち込めば「Embedding」が大量に表示されます。
それぞれが画像の生成時に特定のベクトルを強化するように学習されています。
汗を表現する物や、溶岩を表現する物、特定のキャラクターに寄せる物などさまざまです。
気になるものがあればご自身の目で、ぜひ見に行って下さい。
まとめ
いかがでしたでしょうか?
Stable Diffusionのおすすめ『embedding』を紹介!使い方も解説について解説してきました。
今回のポイントをまとめると、以下のようになります。
- 「Embedding」を使用することで、画像のクォリティーが上がる
- 効果はさまざま「CIVITAI」で探してみよう
破綻修正用の「Embedding」制作をされている方は
変な「手」や「足」あるいは「不気味」な画像データを、みんなの為にせっせと集めていると考えると
本当に頭が下がります(しかも無料で公開とは・・・)
皆さんも心から感謝して使いましょう。
- Stable Diffusionのプロンプトの見本が知りたい
- 画像生成が思ったようにできない
- 色々なプロンプトを探したい