2026年最新版!Stable Diffusion LoRAの作り方と手順を徹底解説
ヨミアゲAI編集部
AI音声・動画制作に関する情報をお届けします
2026年現在、Stable Diffusion XL(SDXL)モデルは、その高い画像生成能力からLoRA作成の主流となっています。従来のStable Diffusionモデルと比較して、SDXLはより高品質な画像を生成し、短いプロンプトでも鮮やかで正確な描写を可能にします。しかし、その性能ゆえに、LoRA作成には特定の環境と手順が求められます。
⚠️ 注意: SDXL用LoRAの作成には、最低でもVRAM 12GB以上のグラフィックボードが必須です。低スペックGPUでは、学習処理が非常に困難、または不可能です。
SDXLモデルの主な特徴は以下の通りです。
| 特徴 | 内容 |
|---|---|
| パラメータ数 | 既存SDモデルの2倍以上 |
| デフォルト画像サイズ | 1024x1024 |
| 生成プロセス | BaseモデルとRefinerモデルの2段階処理 |
| プロンプト効率 | 短いプロンプトで高画質生成が可能(「masterpiece」などの修飾語は不要) |
本記事では、2026年3月時点でのSDXLモデルに対応したLoRAを効率的に作成するための具体的な手順を解説します。主要ツールとして、Automatic1111の拡張機能「Tagger for Automatic1111’s WebUI (WD 1.4 Tagger)」とLoRA学習ツール「Kohya_ss GUI」を使用します。
ステップ1: 学習画像の準備とキャプション生成
LoRA学習の成否は、質の高い学習画像と正確なキャプション(タグ)に大きく左右されます。ここでは、Automatic1111の拡張機能を使って画像を準備し、自動でキャプションを生成する手順を説明します。
1.1 Tagger for Automatic1111’s WebUIの導入
まず、Automatic1111のStable Diffusion Web UIに「WD 1.4 Tagger」を導入します。
- Stable Diffusion Web UIを起動します。
- 「Extension」タブをクリックし、「Available」タブへ進みます。
- 「Lord from:」ボタンをクリックして拡張機能リストを読み込みます。
- 検索窓に
taggerと入力し、「stable-diffusion-webui-wd14-tagger」を探します。 - 右にある「Install」ボタンをクリックしてインストールします。
- 「installed」タブに移動し、「Apply and restart UI」をクリックしてWeb UIを再起動します。
1.2 学習画像の準備とキャプション生成
Taggerの導入が完了したら、学習用画像のフォルダパスを指定し、キャプションを生成します。
- Web UIの「WD 1.4 Tagger」タブを開きます。
- 「Batch from directory」タブを選択します。
- 「Input directory」に、タグ付けしたい画像ファイルが格納されているフォルダのパスを入力します。
- 必要に応じて「Additional tags (comma split)」に、LoRAを呼び出すためのトリガーワード(例:
my_character)を指定します。これは、生成されるキャプションの先頭に付与されます。 - 「Weight threshold」を1に設定します。これにより、より詳細なタグが生成されやすくなります。
- 「Interrogate」ボタンをクリックすると、指定したフォルダ内の各画像に対してキャプションファイル(.txt)が自動生成されます。
💡 ポイント: 生成されたキャプションファイルは、手動で確認・修正することで、LoRAの学習精度をさらに向上させることができます。不要なタグや誤ったタグは削除・修正しましょう。
ステップ2: Kohya_ss GUIを用いたLoRA学習
キャプション付きの学習画像が準備できたら、いよいよ「Kohya_ss GUI」を使ってLoRAの学習を行います。
2.1 Kohya_ss GUIの準備
Kohya_ss GUIは頻繁にアップデートされるため、常に最新バージョンを使用することが推奨されます。
- 公式サイト (https://github.com/bmaltais/kohya_ss) で最新バージョンを確認し、必要に応じて更新してください。古いバージョンでは不具合が発生する可能性があります。
- 学習用フォルダと出力用フォルダを作成します。例えば、Google Drive上などに以下の2つのフォルダを用意します。
LoRA_Training_Images(学習画像とキャプションファイルを入れる)LoRA_Output(生成されるLoRAモデルの出力先)
2.2 Kohya_ss GUIでの設定
Kohya_ss GUIを起動し、以下の手順で設定を進めます。
- ベースモデルの設定:
- 「Model Quick Pick」または「customPretraoned model name of Path」に、使用するStable Diffusion XLモデルのパスを入力します。
- 「SDXL Mdel」のチェックボックスにチェックを入れます。
- フォルダパスの指定:
- 「Image folder」に、先ほど作成した学習用フォルダ(例:
LoRA_Training_Images)のパスを入力します。 - 「Output folder」に、LoRAの出力先となるフォルダ(例:
LoRA_Output)のパスを入力します。
- 「Image folder」に、先ほど作成した学習用フォルダ(例:
- パラメータの設定:
- Presetsは「SDXL – LoRA adafactor v1.0」をベースに選択します。これはSDXL LoRA学習に適した初期設定を提供します。
- 以下の項目は、学習の進行状況や結果を見ながら調整することが一般的です。
- Batch size: GPUメモリに合わせて調整(VRAM 12GBの場合、1-2程度から試す)。
- Epochs / Max Epochs: 学習回数。最初は少なめ(例: 5-10)から始め、過学習に注意。
- Learning rate: 学習の進み具合を制御。0.0001〜0.00001程度が一般的。
- Network Rank (Dimension) / Network Alpha: LoRAモデルの複雑度と安定性。デフォルト値を参考に、生成されるLoRAのファイルサイズや品質を見ながら調整します。
💡 ポイント: 各パラメータは学習結果に大きく影響します。最初はPresetsの推奨値から始め、テスト生成を繰り返しながら最適な設定を見つけることが重要です。
2.3 学習の開始
すべての設定が完了したら、「Start training」ボタンをクリックして学習を開始します。学習には数時間から数十時間かかる場合があります。
# 学習が開始されると、コンソールに進行状況が表示されます。
# GPUのVRAM使用量や学習率、損失関数(loss)の値などを確認し、
# 問題がないか監視しましょう。
LoRA学習のポイントと注意点
LoRA学習は、試行錯誤の連続です。以下のポイントに留意しながら、より良いLoRAモデルの作成を目指しましょう。
- 学習画像の質と量: 高品質な画像を20枚〜50枚程度用意することが推奨されます。画像のバリエーションも重要です。
- 過学習の回避: エポック数が多すぎると、特定の画像に特化しすぎて汎用性が失われる「過学習」が発生します。学習中に定期的にテスト画像を生成し、過学習の兆候(生成画像が学習画像と酷似しすぎる、破綻するなど)がないか確認しましょう。
- トリガーワードの選定: LoRAを呼び出すためのトリガーワードは、既存のプロンプトと競合しない、ユニークなものを選びましょう。
- 学習率の調整: 学習率が高すぎると学習が不安定になり、低すぎると学習が進みません。徐々に調整して最適な値を見つけましょう。
2026年3月時点では、SDXLモデルの進化に伴い、LoRA作成ツールも日々改善されています。これらの手順とポイントを参考に、ぜひあなただけのオリジナルLoRAを作成してみてください。