Stable Diffusion XL(SDXL)を基にしたLoRAを作成する方法！

「Stable Diffusion XL(SDXL)のLoRAを作りたいけど、作成方法が分からない」といった疑問を持っている方も多いのではないでしょうか。

こういった疑問にお答えするため、この記事では「Stable Diffusion XL(SDXL)用LoRAの作成方法」「LoRAを作成するための準備」について解説していきます。

この記事を最後まで読むと、Stable Diffusion Web UIをグラボなしで使う方法が分かります！

Stable Diffusion XL(SDXL)とは？
SDXLを基にする際の注意点！
SDXLを基にしてLoRAを作成する前の準備
- ①Tagger for Automatic1111’s WebUIの導入方法
- ②Tagger for Automatic1111’s WebUIの使い方
拡張機能『Kohya_ss GUI』を使ったSDXLを基にしたLoRAの作成方法
まとめ

Stable Diffusion XL(SDXL)とは？

Stable Diffusion XL(SDXL)とは、Stability AI社が開発した高画質な画像を生成してくれる最新のAI画像生成モデルのことです。

既存のStable Diffusionとは、以下の違いがあります。

パラメーター数が2倍以上になった
デフォルトの画像生成サイズが１０２４ｘ１０２４
BaseモデルとRefinerモデルの2段階の画像処理で、より高画質な画像を生成できる
コントラストや影などが改善されより鮮やかで正確な描写ができる
「masterpiece(傑作)」などの修飾語を使用する必要がなく、短いプロンプトで画像性ができる

※詳しいStable Diffusion XL(SDXL)の解説は、以下の記事で解説しています。

SDXLを基にする際の注意点！

SDXLを利用する場合、VRAMが12GB以上のグラッフィックボードが必要です。VRANとは画面に描写するためのデータを記録するパーツで、容量が大きいほど同時に処理するデータ量が増えます。

VRAMが低いグラフィックボードでは、Stable Diffusion XL用のLoRAの作成は難しいので、低スペックのグラッフィックボードを使用している場合は買い替えましょう。

SDXLを基にしてLoRAを作成する前の準備

SDXLを基にしてLoRAを作成する場合、拡張機能「Tagger for Automatic1111’s WebUI」（WD 1.4 Tagger）」を導入しましょう。

Tagger for Automatic1111’s WebUIとは、自動でキャプションを生成してくれる便利な拡張機能です。

①Tagger for Automatic1111’s WebUIの導入方法

Tagger for Automatic1111’s WebUIは、以下の手順で導入します。

Stable Diffusionを開く
「Extension」→「Available」と進む
「Lord from:」をクリック
検索窓（わかりにくい）に「tagger」と入力
表示された「stable-diffusion-webui-wd14-tagger」右の「Install」をクリック
「installed」のタブに移動し、「Apply and restart UI」をクリック
再起動されて導入完了

まずStable Diffuisonを立ち上げて、「Extension」→「Available」とタブを開いていきます。Availableを開いたら、「Lord from:」のボタンをクリックしましょう。

わかりにくいですが検索窓があるので、「tagger」と入力してください。

「stable-diffusion-webui-wd14-tagger」が表示されるので、右にある「Install」をクリックします。

「installed」のタブに移動して、stable-diffusion-webui-wd14-taggerが追加されていることを書くにできたら、「Apply and restart UI」をクリックしてください。

再起動させれば導入完了です。

②Tagger for Automatic1111’s WebUIの使い方

Tagger for Automatic1111’s WebUIは、以下の手順で使用します。

「Batch from directory」タブを開く
「Input directory」にタグ付けしたい画像を入れているフォルダを入力
「Additional tags (comma split)」でLoRAのトリガーワードを指定
「Weight threshold」を設定
「interrogate」のボタンをクリック

トリガーワードは、なんでもOKです。しきい値は1にしておきましょう。最後に「interrogate」のボタンをクリックすれば、キャプションファイルの作成が完了します。

拡張機能『Kohya_ss GUI』を使ったSDXLを基にしたLoRAの作成方法

ここからは、拡張機能「Kohya_ss GUI」を使って、LoRAの作成方法を紹介します。

「Kohya_ss GUI」のバージョンが古い場合は更新する
フォルダを作成して学習する画像とキャプションを入れる
フォルダを作成して学習する画像とキャプションを入れる
ベースモデルの設定をする
パラメータ設定を行う

①「Kohya_ss GUI」のバージョンが古い場合は更新する

Kohya_ss GUIのバージョンが古い時は、アップデートしてください。2023年6月以降、ピンパンにアップデートが行われているようなので、すでに古いバージョンになっている可能性があります。

古いバージョンでは不具合が多発してしまうので、Kohya_ss GUIの公式サイト（URL：https://github.com/bmaltais/kohya_ss）でバージョンの情報をチェックしてみてください。

②フォルダを作成して学習する画像とキャプションを入れる

Google Drive上に、フォルダを作成します。フォルダは学習用と出力用の2つが必要です。以下の形で、フォルダを作成してください。

⚫️学習用のフォルダ
　⚪️学習用のフォルダとキャプションフォルダ用のフォルダ

⚫️LoRA出力用のフォルダ

学習用に使用する画像は、フリー素材から探しておきましょう。

③ベースモデルの設定をする

Kohya_ss GUIを起動して、ベースモデルを設定します。主には、以下2つの項目を設定してください。

Model Quick Pick	custon
Pretraoned model name of Path	Stable Diffusion XLのモデルを入れた場所

最後に、SDXL Mdelにチェックを入れましょう。

④「Kohya_ss GUI」で必要なフォルダのパスを指定する

手順②で作成したフォルダを、以下の項目に入力してください。

Image folder	学習用フォルダ（親）
Output folder	LoRA出力用フォルダ

⑤パラメータ設定を行う

最後に、パラメーターを設定します。Presetsは「SDXL – LoRA adafactor v1.0」をベースすればOKです。

以下の項目を調整しながら、いろいろ試してみてください。

バッチサイズ
エポック数
最大エポック数
学習率
Network Rank
Network Alpha

⑥学習処理を行う

ここまでの設定が完了したら、「Start training」のボタンをクリックします。場合によってはかなり時間がかかって位しまうので、待ちましょう。

まとめ

いかがでしたでしょうか？

「Stable Diffusion XL(SDXL)のLoRAを作成する方法について解説してきました。

今回のポイントをまとめると、以下のようになります。

VRAMが12GB以上のグラッフィックボードが必要
Tagger for Automatic1111’s WebUIを利用するのがおすすめ
Kohya_ss GUIは最新バージョンでないと不具合が起こりやすい

Stable Diffusionの最新モデル「SDXL」について詳しく知りたい方は、以下の記事をご覧ください。

romptn aiが提携する「SHIFT AI」では、AIの勉強法に不安を感じている方に向けて無料オンラインセミナーを開催しています。

AIを使った副業の始め方や、収入を得るまでのロードマップについて解説しているほか、受講者の方には、ここでしか手に入らないおすすめのプロンプト集などの特典もプレゼント中です。

AIについて効率的に学ぶ方法や、業務での活用に関心がある方は、ぜひご参加ください。

\累計受講者10万人突破/

無料AIセミナーを申し込んでみる