Stable Diffusionでより効率的にハイクオリティな画像を生成するために必要な拡張機能ですが、たくさんありすぎてどれを入れたらいいか分からない方が多いですよね。
本記事では、今回ご紹介する拡張機能を一覧表示しながら★5つの評価でおすすめ度を表して紹介していきます。
そして、ジャンルごとにおすすめ順でそれぞれの拡張機能の概要や使い方を詳しく解説するという流れで紹介していきます。
※Stable Diffusionの立ち上げ方・使い方については、以下の記事で詳しく解説しています。
拡張機能とは
Stable Diffusionの「拡張機能」とは、Stable Diffusionにデフォルトで備わっていない機能を追加することができるものです。
元々クオリティの高い画像を生成するStable Diffusionですが、「拡張機能」を導入することでさらにハイクオリティに、かつ効率よく画像を生成することができます。
拡張機能の導入方法
Stable Diffusionの拡張機能のインストール方法は、以下の2つになります。
①URLからインストールする方法
②拡張機能リストから導入する方法
詳しい導入方法は以下の記事で解説していますので、分からない方は参考にしてください!
- Stable Diffusionのプロンプトの見本が知りたい
- 画像生成が思ったようにできない
- 色々なプロンプトを探したい
おすすめの拡張機能①:プロンプト系
ここからはおすすめの拡張機能をジャンルごとに表にまとめ、1つ1つ解説していきます!
拡張機能 | 特徴 | おすすめ度 |
---|---|---|
SD WebUI Tag Autocomplete | ・プロンプトを入力するときに、入力候補を表示してくれる ・言い換えのプロンプトも表示してくれるので、知らなかったプロンプトを知ることも可能 | ★★★★★ |
Dataset Tag Editor | 画像からプロンプトを自動で出力し、テキストとして保存できる | ★★★★☆ |
Prompt All in One | プロンプトに関わる設定がワンクリックでできるようになる | ★★★★☆ |
text2prompt | 簡単な単語を入力するだけで、それを再現する複数のプロンプトを自動で出力してくれる | ★★★☆☆ |
Umi AI | あらかじめ準備されているプリセットの中からプロンプトを自動適用して、ランダムでさまざまな構図の画像を生成してくれる | ★★★☆☆ |
Better Prompt | プロンプト入力や編集を楽にしてくれる | ★★★☆☆ |
Easy Prompt Selector | 日本語で表記されているプロンプトのジャンルを選択し、単語を選ぶとプロンプト欄に入力してくれる | ★★★☆☆ |
Tagger | 生成した画像を自動で分析し、画像の特徴をタグ付けしてくれる | ★★★☆☆ |
Prompt Format | Stable Diffusionで使用するプロンプトに含まれる、単語の重複や余分なコンマ、アンダーバーなどを修正してくれる | ★★☆☆☆ |
Global Prompts | プロンプトのテンプレート部分を入力欄以外の場所に記載し、長いプロンプトを整理できる | ★★☆☆☆ |
OneButtonPrompt | さまざまな候補の中からランダムで複数のプロンプトを選択し、自動で適用してくれる | ★★☆☆☆ |
Dynamic Prompts | 自動でプロンプトを生成してくれたり、予め指定したプロンプトをランダムに組み合わせて画像を生成することができる | ★★☆☆☆ |
Regional Prompter | 画面を複数の領域に分割し、それぞれの領域に対し異なるプロンプトを指定することができる | ★★☆☆☆ |
SD WebUI Tag Autocomplete
●特徴
呪文(プロンプト)の検索を手助けしてくれる機能。プロンプトに関するいろんな表現を知りたい、連想するのが苦手という人におすすめ。
●メリット
1.呪文(プロンプト)のアイデアの手助けをしてくれる:この拡張機能を使うとプロンプトの入力候補が表示され、さらに、他のStable Diffusionユーザーがよく使う表現が検索ボリュームとして表示されるので、考える・探す時間を短縮することができます。
2.プロンプトのスペルミスを防げる:この拡張機能を使えば、スペルミスを未然に防ぐことができます。
例えば、武器のプロンプトである“weapon”のスペルに自信がないとして、この拡張機能を使って“we”と入力すると“weapon”が検索候補に表示されます。
この拡張機能がないと、都度スペルがあっているかを確認する必要があり、毎回スペルを調べていたら時間がかかってしまうので、時短に繋がる機能。
※詳しい使い方は、以下の記事で解説しています。
Dataset Tag Editor
●特徴
画像からプロンプトを自動で出力し、テキストとして保存できる機能。最初からプロンプトを考えるという手間をなくすことができる。
●メリット
・プロンプトを考えたり、入力する手間が省ける。
・理想の画像を生成するまでの時間や労力の消費を抑えることができる。
・プロンプトの知識が少ない状態でも画像生成できるようになる。
Prompt All in One
●特徴
プロンプトに関わる設定がワンクリックでできるようになる機能。(例えば、プロンプトの自動翻訳、削除、強弱の設定、並べ替え、など)
●メリット
・プロンプトのあらゆる設定をボタン・ワンクリックでできるようになる
・プロンプトの翻訳を自動でしてくれる
・ChatGPTと連携することができる(有料)
※詳しい使い方は、以下の記事で解説しています。
text2prompt
●特徴
単語を入力すると、関連する単語を予測してくれる機能で、AIが自動的にプロンプトを考えてくれる。
●メリット
・プロンプトを考える手間が省ける
※詳しい使い方は、以下の記事で解説しています。
Umi AI
●特徴
あらかじめ用意されたキーワードを入力することで、ランダムにプロンプトを抽出して画像を生成するごとに異なるプロンプトを使用することが出来る機能
●注意点
「Enable Checker」という拡張機能が動かなくなる
※詳しい使い方は、以下の記事で解説しています。
Better Prompt
●特徴
プロンプトの入力や編集するのを助けるツールです。
・プロンプトの入力や編集がしやすいように、新しい画面が追加される
・入力の際に、関連する呪文プロンプトやフレーズのヒントが表示される
・プロンプトの順番をカーソルで好きなように変えることができる
・プロンプトを右クリックすることで、そのプロンプトの強調度を変更することができる
●注意点
・「Tag Autocomplete」との併用はオススメしない
・<lyco:○○>の形に対応していない
※詳しい使い方は、以下の記事で解説しています。
Easy Prompt Selector
●特徴
・プロンプトの入力を効率化してくれる機能で、ボタンをクリックするだけで登録・保存しておいたプロンプトを簡単に入力することができるようになる
・プロンプトをジャンルごとにカテゴリとして分ける機能や、自分だけのオリジナルプロンプトも登録・保存する機能がある
※詳しい使い方は、以下の記事で解説しています。
Tagger
●特徴
生成した画像を自動で分析し、画像の特徴をタグ付けしてくれ、画像からプロンプトを詳細に抽出してくれる
●用途
・画像から自作のLoraを作るとき
・ControlNetの「reference_only」を使うとき
※詳しい使い方は、以下の記事で解説しています。
Prompt Format
●特徴
プロンプト入力時に重複した同じワードや、複数重なるコンマなどを削除してくれる
例:「1girl, solo, smile, 1girl」と入力した場合、「1girl, solo, smile」のように同じ単語を削除してくれる
※詳しい使い方は、以下の記事で解説しています。
Global Prompts
●特徴
プロンプトの基本パートを通常の入力欄以外の場所に書き込むことで、複雑なプロンプトもきれいに整理することができる
「Positive Prefix」 「Positive Postfix」「Negative Prefix」「Negative Postfix」の4つの欄が用意され、これらを利用してプロンプトを整理する
●メリット
プロンプト入力画面がすっきりとして視認性が向上する
※詳しい使い方は、以下の記事で解説しています。
OneButtonPrompt
●特徴
複数のプロンプトをランダムで選択して、自動的にプロンプトを作成してくれる機能
●メリット
自分では思いつかないようなプロンプトを自動的に作成してくれる
※詳しい使い方は、以下の記事で解説しています。
Dynamic Prompts
●特徴
プロンプトをランダムに組み合わせられるweb UI用の拡張機能です。
この拡張機能を使えば、自動でプロンプトを生成してくれたり、予め指定したプロンプトをランダムに組み合わせて画像を生成することができます。
※詳しい使い方は、以下の記事で解説しています。
Regional Prompter
●特徴
画面(キャンバス)を複数の領域に分割し、それぞれの領域に対し異なる呪文(プロンプト)を指定することが可能となります。
●メリット
複数の人物を指定の位置に配置することができるようになり、さらにそれぞれの人物に異なる服装や行動を適用させることが可能となります。
※詳しい使い方は、以下の記事で解説しています。
おすすめの拡張機能②:画像生成系
拡張機能 | 特徴 | おすすめ度 |
---|---|---|
HakuImg | Stable Diffusion WebUIに画像の編集機能を追加して、明るさや彩度を変更したり、トーンカーブの調節やぼかしを追加できる | ★★★☆☆ |
Easy Generate Forever | Stable Diffusion WebUI上で無限に画像を生成できる「Generate forever」の機能を、さらに使いやすくカスタマイズしてくれる | ★★★☆☆ |
sd-webui-ar | 画像サイズをワンクリックで変更するボタンを追加できる | ★★★☆☆ |
ToMe | データの処理が高速化され、画像の生成速度をあげることができる | ★★★☆☆ |
Pixelization | 元の画像をドット絵風のイラストに変換することができる | ★★☆☆☆ |
pfg | プロンプト不要で画像を生成することができる | ★★☆☆☆ |
Dynamic Thresholding (CFG Scale Fix) | CFG Scaleを大きくしても画像が破綻することなく綺麗に生成できる | ★★☆☆☆ |
Aesthetic Gradients | 元の画像の特徴を大きく変えることなく、指定したスタイルや画風の要素を融合させ、全体として調和のとれたイラストを生成することが可能 | ★★☆☆☆ |
sd_save_intermediate_images | 生成される画像の途中過程の画像を保存してくれる | ★★☆☆☆ |
FABRIC | 自分が生成した画像を「Like」と「Dislike」に振り分けることで、次に生成する画像をより自分のイメージした通りのものに近づけることができる | ★★☆☆☆ |
HakuImg
●特徴
Stable Diffusion Web UIに画像の編集機能を追加して、明るさや彩度を変更したり、トーンカーブの調節やぼかしを追加できる機能
※詳しい使い方は、以下の記事で解説しています。
Easy Generate Forever
●特徴
画像を無限に生成し続けることができる。
(仮想環境の場合、生成した画像を自動保存する設定にしていないと意味がないです。)
●メリット
通常では右クリックしないと表示されない「Generate forever」のボタンを、あらかじめ視覚化してくれる
※詳しい使い方は、以下の記事で解説しています。
sd-webui-ar
●特徴
画像のアスペクト比率を変更することができる
ワンクリックで予め設定した比率に画像サイズを変更することが可能
※詳しい使い方は、以下の記事で解説しています。
ToMe
●特徴
「redundant tokens」(=文中に必要のない冗長なトークン)を取り除き、それらを一つに統合することで、処理を高速化したり、メモリの効率を図ったりすることができる技術のことを指します。
つまり、データの処理が高速化され、画像の生成速度をあげることができる機能。
※詳しい使い方は、以下の記事で解説しています。
Pixelization
●特徴
元の画像をドット絵風のイラストに変換することができる
※詳しい使い方は、以下の記事で解説しています。
pfg
●特徴
“Prompt Free Generation”の略でプロンプト不要で画像を生成することができる機能
※詳しい使い方は、以下の記事で解説しています。
Dynamic Thresholding(CFG Scale Fix)
●特徴
この画像のように、CGF Scaleの数値のみ大きくしてしまうと画像が崩れてしまいます。
そこで、こちらの拡張機能を使うことで、CFG Scaleを大きくしても画像が破綻することなく綺麗に生成されます。
※詳しい使い方は、以下の記事で解説しています。
Aesthetic Gradients
●特徴
元の画像の特徴を大きく変えることなく、指定したスタイルや画風の要素を融合させ、全体として調和のとれたイラストを生成することが可能になる
※詳しい使い方は、以下の記事で解説しています。
sd_save_intermediate_images
●特徴
生成される画像の途中過程の画像を保存してくれる機能。
つまり、Stable Diffusionによって生成された画像がどんなふうに画像を作りあげていくのかを一枚一枚見ることが出来ます。
※詳しい使い方は、以下の記事で解説しています。
FABRIC
●特徴
自分が生成した画像を「Like」と「Dislike」に振り分けることで、次に生成する画像をより自分のイメージした通りのものに近づけることができる
特定のプロンプトを入力して何枚か画像を生成し、それらの画像に「Like」、または、「Dislike」をつけていくことで、その後に生成する画像に入っていてほしい要素と取り除きたい要素を指定していくことができます。
そうすることで、より自分がイメージした通りの画像を生成しやすくすることができるというわけです。
※詳しい使い方は、以下の記事で解説しています。
おすすめの拡張機能③:修正系
拡張機能 | 特徴 | おすすめ度 |
---|---|---|
ADetailer | 顔や手など体のパーツを自動認識して修正してくれる | ★★★★★ |
Lama Cleaner | 画像に含まれる余計なものを削除してくれる | ★★★★★ |
Depth map library and poser | 人の骨格を抽出した後に手や足などの部位をAIイラストで上書きすることで、その他の部位を変えずに手や足を修正できる | ★★★★☆ |
ADetailer
●特徴
生成した画像の顔や手を自動で検出して修正をしてくれる
●メリット
・これまではinpaintで修正していた顔や手の乱れを、自動的にマスク化し修正します。
・顔の書き込み量が上がるので、画像のクォリティーが上がります。
※詳しい使い方は、以下の記事で解説しています。
Lama Cleaner
●特徴
生成した画像の不要な要素を排除してしてくれる
例えば、下記の画像の「髪飾りを排除したい」場合、Lama Cleanerを使用することで違和感なく綺麗に画像を生成してくれます。
※詳しい使い方は、以下の記事で解説しています。
Depth map library and poser
●特徴
depthの機能を使用して、人の骨格を抽出した後に手や足などの部位をAIイラストで上書きすることで、その他の部位を変えずに手や足を修正できる拡張機能です。
※詳しい使い方は、以下の記事で解説しています。
おすすめの拡張機能④:高画質系
拡張機能 | 特徴 | おすすめ度 |
---|---|---|
Loopback scaler | 下の「MultiDiffusion」に比べてさらに詳細な描写、大きいサイズで高画質の画像を生成することができる・画像の設定(明るさ・色・コントラストなど)を細かく指定できる | ★★★★★ |
Ultimate SD Upscale | 生成された画像を高解像度化するための拡張機能 | ★★★★★ |
Tiled Diffusion | エラーも出ることなく安定して、元のイラストを維持したまま、高解像度化・高画質化してくれる | ★★★★☆ |
MultiDiffusion-upscaler-for-automatic1111 | メモリの消費を抑えながら画像を高画質化してくれる | ★★★★☆ |
sd-dynamic-thresholding | 「CFG Scale」を上げても画像が崩壊するのを防いでくれる | ★★★★☆ |
LLuL | 生成した画像の指定部分だけ高画質化することができる | ★★★★☆ |
Loopback scaler
●特徴
“scaler“という単語から想像がつくかもしれませんが、画像を高画質化・アップスケールする機能です。
画像を高画質化・アップスケールする機能として、『Hires.fix』 や 『MultiDiffusion』 もありますが、それと並ぶクオリティで高画質な画像を生成し、生成速度も早いです。
※詳しい使い方は、以下の記事で解説しています。
Ultimate SD Upscale
●特徴
生成された画像を高解像度化するための拡張機能です。
この拡張機能を利用することで、web UI単体ではできない高解像度の画像生成を、細かい設定を行うことで実現できます。
※詳しい使い方は、以下の記事で解説しています。
Tiled Diffusion
MultiDiffusion-upscaler-for-automatic1111
sd-dynamic-thresholding
●特徴
この画像のように、CGF Scaleの数値のみ大きくしてしまうと画像が崩れてしまいます。
そこでこの拡張機能を使うことで、CFG Scaleを大きくしても画像が破綻することなく綺麗に生成されます。
※詳しい使い方は、以下の記事で解説しています。
LLuL
●特徴
指定した部分のみだけにディテールを追加することができる拡張機能です。
画像全体ではなく、服装だけ・アイテムだけなど限定して詳細な描写を追加することができます!
※詳しい使い方は、以下の記事で解説しています。
おすすめの拡張機能⑤:構図系
拡張機能 | 特徴 | おすすめ度 |
---|---|---|
ControlNet | 複雑なポーズの指定や、細かい描写まで指定した画像生成をすることができる | ★★★★★ |
Latent Couple | 2人以上の人物を生成する際に、各人物ごとに適用するプロンプトを指定することができる | ★★★★☆ |
Regional Prompter | プロンプトやLoRAを適用する領域を指定できる | ★★★★☆ |
Cutoff | 生成される画像の特定部位の色を指定できる | ★★★☆☆ |
Openpose Editor | ControlNetの中に組み込まれた拡張機能で、Openposeのプリプロセッサで出力した棒人間の画像をStable Diffusion上でリアルタイムで編集できる | ★★★☆☆ |
ControlNet
●特徴
新たな条件を指定することで細かなイラストの描写を可能にする拡張機能です。具体的には、プロンプトでは指示しきれないポーズや構図の指定などができます。数ある拡張機能の中でも最重要と言えるでしょう。
ControlNetでパースやスケッチなどを作成することも可能ですので、仕事に使える方もいらっしゃるのではないでしょうか。
●メリット
- キャラクターの特徴を維持したまま、色や画風だけ変える
- 線画に着色・彩色する
- 同じ顔や服装を指定する
- ポーズや構図を指定する
- 下書きからリアルな画像を作る
- 写真からイラストを作る
※詳しい使い方は、以下の記事で解説しています。
Latent Couple
●特徴
「Latent Couple」を使うことで、キャンパスを任意の数に分割することができるようになります。
そのため、分割した画面1つ1つに対して個別で命令できるようになり、複数人をそれぞれの1つのキャンパスで命令してたものを合わせるような使い方ができます。
※詳しい使い方は、以下の記事で解説しています。
Regional Prompter
●特徴
「Regional Prompter」を利用することで、画面(キャンバス)を複数の領域に分割し、それぞれの領域に対し異なる呪文(プロンプト)を指定することが可能となります。
「Regional Prompter」を利用することで、複数の人物を指定の位置に配置することができるようになり、さらにそれぞれの人物に異なる服装や行動を適用させることが可能となります。
※詳しい使い方は、以下の記事で解説しています。
CutOff
●特徴
普通にイラストを生成すると、思いどおりの配色にならないことが多いですが、『Cutoff』を使用することで、プロンプトの指示がより正確に反映される可能性が高まります。
- 色の指定: Cutoffを使用すると、生成する画像の特定の部分の色を指定することができます。これにより、Stable Diffusionがランダムに色を選択するのを防ぐことができます。
- Target tokens: この機能を使用して、色を指定したい部分のキーワードを入力します。例えば、”blue hair”や”yellow shirt”などのキーワードを指定することができます。
- 強度の調整: Cutoffの影響の強さを調整することができます。一般的には0.5から0.7の範囲で設定することが推奨されています。
※詳しい使い方は、以下の記事で解説しています。
OpenPose Editor
●特徴
Stable Diffusionの拡張機能『ControlNet 』に、画像から人物のポージング情報を拾う「Openpose 」機能があります。
通称「棒人間」です。
「Openpose Editor」とはこの棒人間を自由に動かしてポージングを決める事ができる拡張機能です。
特定のポージングを取らせることが可能になる為、制作の幅が広がります。
※詳しい使い方は、以下の記事で解説しています。
おすすめの拡張機能⑦:画像ビューワー系
拡張機能 | 特徴 | おすすめ度 |
---|---|---|
Infinite Image Browsing | ・outputフォルダ内に保存してある画像を、無限スクロールでの閲覧が可能 ・優れた検索機能も持っており、特定のプロンプトやモデルでの条件検索も可能 | ★★★★★ |
Image Browser | outputsフォルダに保存された画像をStable Diffusionで簡単に確認・検索・削除できる | ★★★★☆ |
Infinite Image Browsing
●特徴
Stable Diffusionで生成した画像の、一括閲覧ができる拡張機能です。outputフォルダ内に保存してある画像を、無限スクロールでの閲覧可能です。
また、優れた検索機能も持っており、特定のプロンプトやモデルでの条件検索も可能です。
※詳しい使い方は、以下の記事で解説しています。
Image Browser
●特徴
「Image Browser」は、過去に生成された写真を閲覧するための画像ブラウザで、生成された情報を表示し、txt2imgまたはimg2imgにプロンプトを送信し、「お気に入り」の画像を収集し、不要になった画像を削除し、任意の仕分けで画像を閲覧することもできます。
「Image Browser」には検索機能もあるので、条件検索をすれば簡単に画像が見つかります。
※詳しい使い方は、以下の記事で解説しています。
おすすめの拡張機能⑧:モデル・LoRA系
拡張機能 | ジャンル | 特徴 | おすすめ度 |
---|---|---|---|
model-toolkit | モデル | CivitaiやHuggingFaceで配布されているモデルデータから、自動で不要な要素を削除してデータを軽量化してくれる | ★★★★☆ |
Civitai Helper | モデル | Civitaiから一括でサムネイルをダウンロードしたり、保存したモデルやLoRAの最新バージョンを自動で検索してくれる | ★★★☆☆ |
Civitai Shortcut | モデル | Civitaiのサイト内にある学習モデルのURLを効率的に管理できる | ★★★☆☆ |
Model Scanner | モデル | pt形式、bin形式、ckpt形式のモデルデータのファイルを事前にスキャンして安全性を確認してくれる | ★★☆☆☆ |
SuperMerger | モデル | 自分だけのマージモデルを作れるもので、作る際に保存せずに画像生成用のモデルとしてお試しでイラストを出力でき、HDDやSSDの消耗を軽減することができる | ★★☆☆☆ |
a1111-sd-webui-lycoris | LoRA | 通称「Lycoris」と呼ばれる機能は、「Lora」の上位互換版のようなもので、使い方も「LoRA」と同じ | ★★★★☆ |
LoRA Block Weight | LoRA | LoRAの階層を調査でき、応用させれば、LoRAの重みを調整して、顔や服など一部分のみに反映することが可能 | ★★★☆☆ |
sd-webui-train-tools | LoRA | Stable Diffusion上でで簡単にLoRAを自作することができる | ★★☆☆☆ |
sd-webui-simplenote | モデル・LoRA | 「Model」・「LoRA」・「TextualInversion(Embeddings)」・「Hypernetworks」に対してメモができる | ★★★☆☆ |
model-toolkit
●特徴
『model-toolkit』とは、モデルの軽量化ができる拡張機能です。
●メリット
- 容量(ストレージ)を節約できる:通常の1/2〜1/3の容量(ストレージ)でモデルをダウンロードが可能です。
- 読み込み時間を減らせる:通常6分のところ、約2分でダウンロードが完了します。
※詳しい使い方は、以下の記事で解説しています。
Civitai Helper
●特徴
『Civitai Helper』とは、『Civitai』からダウンロードしたモデルやLoRAを管理できる拡張機能です。
できることは大きく2つ
- サムネイル化できる
- 最新版の情報がわかる
『Civitai Helper』を使うと、サムネイル化ができるので管理が楽になります。
サムネイルで管理できると雰囲気をすぐに把握できるので便利です。
※詳しい使い方は、以下の記事で解説しています。
Civitai Shortcut
●特徴
「Civitai Shortcut」は、Civitaiのサイト内にある学習モデルのURLを効率的に管理できる拡張機能です。
「Civitai Shortcut」には以下のような特徴があります。
- ショートカットの作成:CivitaiサイトのモデルURLを保存し、簡単にアクセスできます。
- モデルブラウジング:保存されたモデルをサムネイル形式で表示し、選択するとモデルの詳細情報が表示されます。
- 分類機能:ショートカットを分類別に管理する機能です。
「Civitai Shortcut」は、学習モデルの管理とアクセスを容易にし、Stable Diffusion WebUIの使用をより効率的に実現します。
※詳しい使い方は、以下の記事で解説しています。
Model Scanner
●特徴
「Model Scanner」は、モデルの安全性やサニティチェックを行うことができるツールです。
特に「.ckpt」などの拡張子を持つモデルの安全性を事前に確認することができます。
※詳しい使い方は、以下の記事で解説しています。
SuperMerger
●特徴
「SuperMerger」は、AUTOMATIC1111のstable-diffusion-webuiのためのモデルマージ拡張機能です。
階層マージを効率的に行うだけでなく、マージしたモデルを保存せず、その場限りで使用することができます。これにより、ユーザーはモデルを保存する手間を省き、HDDやSSDの使用を削減できます。
※詳しい使い方は、以下の記事で解説しています。
a1111-sd-webui-lycoris
●特徴
『LyCORIS』はLoRAの発展系にあたります。基本的な使い方は同じですが、以下の点に違いがあります。
- 拡張機能の導入が必要
- 「Trigger Words」という特定のワードを呪文(プロンプト)の欄に記載が必要
※詳しい使い方は、以下の記事で解説しています。
LoRA Block Weight
●特徴
「LoRA Block Weight」とは、LoRAの階層を調査できる拡張機能です。応用させれば、LoRAの重みを調整して、顔や服など一部分のみに反映させられます。
LoRAは17階層に位分かれており、それぞれの階層が顔や服、背景などに反映される仕組みです。
※詳しい使い方は、以下の記事で解説しています。
sd-webui-train-tools
●特徴
Loraを自作できるStable Diffusionの拡張機能になります。
画像サイズの調整やタグ付けをする必要もなく、10枚程度の画像をドラッグ&ドロップするだけで簡単にLoraを作ることができます。
※詳しい使い方は、以下の記事で解説しています。
sd-webui-simplenote
●特徴
sd-webui-simplenoteとは、「Model」・「LoRA」・「TextualInversion(Embeddings)」・「Hypernetworks」に対してメモが出来る拡張機能になります。
沢山のモデルやLoRAをダウンロードするとどれが何か分からなくなってしまいますが、この機能を使用することで、モデルなどの情報を保存しておくことが出来るのでとても便利です。
※詳しい使い方は、以下の記事で解説しています。
おすすめの拡張機能⑨:WebUIの設定
拡張機能 | 特徴 | おすすめ度 |
---|---|---|
Styles-Editor | Stable Diffusion WebUIに登録したStyleを直接編集・削除出来るようにしてくれる | ★★★☆☆ |
webui-bilingual-localization | 操作画面を英語と日本語が同時表記された状態に変えることができる | ★★★☆☆ |
Canvas Zoom | Inpaint・Sketch・Inpaint sketchタブにドラッグアンドドロップした画像を、拡大・縮小して表示してくれる | ★★☆☆☆ |
Enable Checker | 現在有効化している拡張機能を色分けして、一目で分かるように教えてくれる機能 | ★★☆☆☆ |
sd-webui-send-to-ControlNet | 生成した画像を、txt2imgもしくはimg2imgのControlNetに送るボタンを追加できる | ★★☆☆☆ |
CLIP Changer | Stable Diffusionで、プロンプトを画像に反映させるCLIPと呼ばれるテキストエンコーダーを別のものに変更できる | ★★☆☆☆ |
Config-Presets | 自分のお気に入りの各種設定条件をプリセットとして保存したり復元することができる | ★★☆☆☆ |
sd-web-ui-quickcss | Stable Diffusionの操作画面の見た目を自由にカスタマイズすることができる | ★★☆☆☆ |
SD Webui Moar Generate | Stable Diffusion Web UI上に画像生成ボタン(「Generate」ボタン)を増設できる | ★★☆☆☆ |
Styles-Editor
●特徴
プロンプトの登録、呼び出しに「Styles」 がデフォルトで採用されています。
ただ、Styles は登録と呼び出しは簡単にできますが、編集や削除はstyles.csv を編集する必要があります。その面倒な作業を WebUI 上で可能にするのが「Styles Editor」です。
※詳しい使い方は、以下の記事で解説しています。
webui-bilingual-localization
●特徴
Stable Diffusionの操作画面を英語と日本語が同時表記された状態に変えることができる拡張機能です。
英語と日本語を同時表記することで、意味がわかりにくい単語についても格段と理解しやすくなります。
Stable Diffusionの操作方法や設定方法などについて何か調べ物をする際は、英語表記で検索をかけた方が、知りたい情報を得やすいです。
※詳しい使い方は、以下の記事で解説しています。
Canvas Zoom
●特徴
Stable DiffusionのCanvas Zoomとは、画像のみの拡大・縮小をすることができる機能です。
※詳しい使い方は、以下の記事で解説しています。
Enable Checker
●特徴
「Enable Checker」とは、拡張機能の設定項目に色付けをして、拡張機能の有効・無効を一目でわかるようにする機能です。
一目で拡張機能のON・OFFの見分けがつくので利便性がグンッと上がりますよ。
※詳しい使い方は、以下の記事で解説しています。
sd-webui-send-to-ControlNet
●特徴
「send-to-controlnet」は非常にシンプルな拡張機能で、生成した画像を「ControlNet」に送信するためのボタンをStable Diffusion内に追加することができる拡張機能です。
この拡張機能をインストールすることで、先ほど記載したような「ControlNet」などに画像をアップロードするための手間を大幅に省くことができるようになります。
※詳しい使い方は、以下の記事で解説しています。
CLIP Changer
●特徴
「CLIP Changer」は元々WebUIに備わっている「CLIP」をより強力なものに変更することができます。
この拡張機能を使用することで、以下のことが可能となります。
- CLIPの変更: デフォルトのCLIPを他の種類のCLIPに変更し、異なるCLIPの性能や特性を活用して画像生成の結果を変えることができます。
- 効果の強化: より強力なCLIPに変更することで、入力した呪文(プロンプト)に基づく画像生成の効果や質を向上させることが期待されます。
- 設定のカスタマイズ: 設定画面を通じて、使用するCLIPの種類を簡単に選択・変更することができます。
※詳しい使い方は、以下の記事で解説しています。
Config-Presets
●特徴
「Config-Presets」を使用すると、自分のお気に入りの各種設定条件をプリセットとして保存したり復元することができて、とても便利です。
Stable Diffusionの起動のたびにワンクリックで設定を呼び出すことができるため、いちいち手作業で入力する手間を省くことができます。
※詳しい使い方は、以下の記事で解説しています。
sd-web-ui-quickcss
●特徴
「sd-web-ui-quickcss」とは、一言で表すと、Stable Diffusionの操作画面の見た目を自由にカスタマイズすることができるようになる拡張機能です。
※詳しい使い方は、以下の記事で解説しています。
SD Webui Moar Generate
●特徴
「SD Webui Moar Generate」とは、Stable Diffusion Web UI上に画像生成ボタン(「Generate」ボタン)を増設できる拡張機能のことです。
「ページの最下部」、「画像生成結果ウィンドウの下部」、「ページの右下(スクロールに追従する)」の3パターンのいずれかに、画像生成ボタンを設置することができます。
※詳しい使い方は、以下の記事で解説しています。
おすすめの拡張機能⑪:動画生成系
拡張機能 | 特徴 | おすすめ度 |
---|---|---|
mov2mov | Multi ControlNetと連携することで、素材動画をもとにして別の動画を作りだせる | ★★★☆☆ |
Infinite Zoom | 画面の奥に向かう、あるいは奥から向かってるように、画像が動いていく動画を作成できる | ★★★☆☆ |
Deforum | パラパラ漫画のような感じで、数秒の動画を簡単に生成できる | ★★☆☆☆ |
TemporalKit | アニメーション(動画)を生成できる | ★★☆☆☆ |
mov2mov
●特徴
「mov2mov」は、動画をAI動画に生成してくれる機能です。
●仕組み
「mov2mov」は、元の動画をひとコマごとの画像にし直して画像をつなぎ合わせることで、新たに動画を生成します。
・AI動画の生成の流れ
- 既存の動画をワンカットごとに解析する
- ControleNetのモデルで情報を抽出します。
- 抽出情報をもとにしてイラストを生成する
- イラストをつなぎ合わせて動画を生成する(イメージとしては、パラパラ漫画のような感じです。)
※詳しい使い方は、以下の記事で解説しています。
Infinite Zoom
●特徴
「Infinite Zoom」とはstable diffusionで画面の奥に向かう、あるいは奥から向かってるように、画像が動いていく動画を作成する拡張機能です。
Stable Diffusionで作成した画像をつないで、カメラがその真ん中を進んでいく。あるいは戻ってくるような表現を行うことで、静止画があたかも動いているかのように見ることができます。
※詳しい使い方は、以下の記事で解説しています。
Deforum
●特徴
「Deforum」とは、数秒の動画を簡単に生成する、Stable Diffusionの拡張機能です。複数の画像を生成して、パラパラ漫画の要領で更新します。
8秒の動画の場合、120枚の画像を生成しています。
※詳しい使い方は、以下の記事で解説しています。
TemporalKit
●特徴
「TemporalKit」はStable Diffusion web ui を使ってアニメーション(動画)を生成する拡張機能です。
基本的には、すでにある動画から画像を分割して、その分割した画像をimg2imgに入れ新たに画像を生成し、それをつなぎ合わせる形でアニメーションを生成します。
※詳しい使い方は、以下の記事で解説しています。
おすすめの拡張機能⑩:その他便利な拡張機能
拡張機能 | ジャンル | 特徴 | おすすめ度 |
---|---|---|---|
webui-qrcode-generator | QR作成 | Stable Diffusion WebUIでQRコードを作れるようになる | ★★☆☆☆ |
sd-webui-faceswap | 顔変換 | 画像の顔部分を別の人に入れ替えることができる | ★★★☆☆ |
sd_katanuki | 背景透過 | 生成した画像の背景を処理できる | ★★★☆☆ |
Rembg | 背景透過 | 画像の背景を消すことができる | ★★★☆☆ |
PBRemTools | 背景透過 | 生成した画像の一部を切り抜くことができる | ★★★☆☆ |
Txt/Img To 3D Model | 3D | OpenAIのShape-Eというモデルを使って、テキストや画像から3Dモデルを生成できる | ★★☆☆☆ |
3D Model&Pose Loader | 3D | 3Dモデルを読み込んでControlNetで元の画像として利用できる機能 | ★★☆☆☆ |
webui-qrcode-generator
●特徴
「QRcode Generator」とは、QRコードを含めた画像を生成する、Stable Diffusionの拡張機能です。
※詳しい使い方は、以下の記事で解説しています。
sd-webui-faceswap
●特徴
「sd-webui-faceswap」とは、画像の顔部分を別の人に入れ替えることのできる機能のことです。
●例
▪️入れ替え元の女性:Stable Diffusionで生成した画像
▪️入れ替え先の女性:フリー素材サイトより
・「sd-webui-faceswap」使用後
おわかりいただけたでしょうか。拡張機能「sd-webui-faceswap」を利用することで元画像の服装や髪などの特徴を残しながら、顔の変換がされていることがわかります。
このように顔を入れ替えることができる拡張機能です!
※詳しい使い方は、以下の記事で解説しています。
sd_katanuki
●特徴
「sd_katanuki」は、生成した画像の背景を処理する拡張機能です。背景を透過にしたり、白一色にできます。
※詳しい使い方は、以下の記事で解説しています。
Rembg
●特徴
「Rembg」とは、画像の背景を消す拡張機能です。たとえば以下の画像の場合、背景の窓や引き出し、壁を計して透過の画像に書き換えます。
背景を透過した結果が、以下の画像です。
こんな感じで使うことができます。
※詳しい使い方は、以下の記事で解説しています。
PBRemTools
●特徴
「PBRemTools」とは、生成した画像の一部を切り抜くことができる拡張機能です。
この拡張機能を使うことで、人物の画像から背景を取り除いて人物のみにしたり、人物の所持品のみを切り抜いたりすることができるようになります。
※詳しい使い方は、以下の記事で解説しています。
Txt/Img To 3D Model
●特徴
「Txt/Img To 3D Model」とは生成した画像を3Dモデルに変換する拡張機能のことです。
※詳しい使い方は、以下の記事で解説しています。
3D Model&Pose Loader
●特徴
3D Model & Pose Loaderとは、Stable Diffusionの拡張機能の一つになります。3Dモデルを読み込んでControlNetで元の画像として利用できる機能です。
呪文(プロンプト)を打ち込んで画像を生成する必要がないので、呪文(プロンプト)を考える手間が省け簡単に元画像を生成できます。
※詳しい使い方は、以下の記事で解説しています。
まとめ
いかがでしたでしょうか?
Stable Diffusionのおすすめ拡張機能を70個まとめてご紹介してきました。
今回のポイントをまとめると、以下のようになります。
- Stable Diffusionの「拡張機能」とは、Stable Diffusionにデフォルトで備わっていない機能を追加することができるもの
- Stable Diffusionの拡張機能のインストール方法
- ①URLからインストールする方法
- ②拡張機能リストから導入する方法
- おすすめの拡張機能は約70種類!
Stable Diffusionで画像生成の幅を広げるためには、拡張機能は欠かせないものになってきます。ぜひ、今回の記事を参考にして、自分の用途に合った拡張機能で効率よくハイクオリティな画像を生成しましょう!
- Stable Diffusionのプロンプトの見本が知りたい
- 画像生成が思ったようにできない
- 色々なプロンプトを探したい