高速に画像生成できるSDXL Turbo-LoRAの使い方を解説します

剣を持った女性剣士のAIイラスト

Stable Diffusionで使用できる、SDXL Turbo-LoRAモデルが公開されたので使い方を紹介します。

この記事で理解できること
  • SDXL Turbo-LoRAの入手方法
  • Stable Diffusion WebUI(AUTOMATIC1111)でSDXL Turbo-LoRAを使う方法
  • SDXL Turbo-LoRAの各設定値の画像に対する影響
目次

SDXL Turbo-LoRAとは

SDXL Turbo-LoRAは、SDXL Turboで採用した敵対的拡散蒸留(Adversarial Diffusion Distillation:ADD)と呼ばれる新しい蒸留技術を使ったLoRAモデルです。

SDXL Turboモデルの特徴である、低ステップ高画質な画像が生成できる点は同じです。

SDXL Turboモデルは以下の記事で紹介しています。

あわせて読みたい
Stable Diffusion WebUIでSDXL Turboを使う方法を紹介します SDXL Turboモデルが公開されたので、Stable Diffusion WebUI(AUTOMATIC1111)で使用する方法を紹介します。 この記事で理解できること SDXL Turboの入手方法 Stable Diff...

LoRAモデルだから、いろいろなチェックポイントモデルでSDXL Turboの効果が得られるね!

ダウンロード・インストールについて

SDXL Turbo-LoRAはcivitaiHugging Faceで公開されています。

LoRAのダウンロード、インストール方法については以下の記事で紹介しています。

あわせて読みたい
Stable Diffusion WebUIのLoRAの入れ方・使い方を解説します 本記事では、Stable Diffusion LoRAの使い方について詳しく解説します。 LoRAを使えば思い通りの画像を出力できるようになるから、是非マスターしよう! この記事で理解...

SDXL Turbo-LoRAの使い方

SDXL Turbo-LoRAはstep数を減らしても高画質な画像が生成できる点が特徴ですが、使用するには特別な設定が必要です。

使い方もSDXL Turboモデルと似ているよ。

以下に列挙します。

  • step数を低めにする(おすすめは4)
  • CFGスケールを低めに設定する(おすすめは1.5以下)
  • 解像度は512×512が基本
  • 名前の通りSDXLベースモデル用のLoRA

設定項目が画像にどのような影響があるのか調査しました。

step数の影響

step数を1~10まで振って画像生成しました。

猫のAI写真がstep数毎に並んでいる

SDXL Turboモデルはstep数を2以下に設定していましたが、SDXL Turbo-LoRAでは推奨の通り4が良いですね。

4を超えると彩度が高くなっていることがわかります。

CFGスケールの影響

CFGスケールを1~5まで振って画像生成しました。

猫のAI写真がCFGスケール毎に並んでいる

高くするほど彩度も上がっていますね。
3まで行くと崩れてくるので、2.5までは使えそうですね。

解像度の影響

いくつか解像度を変えて画像生成してみました。

猫のAI写真
512×512
猫のAI写真
768×512
猫のAI写真
512×768
猫のAI写真
900×506
猫のAI写真
1024×576
猫のAI写真
1024×1024

試した結果SDXL Turboモデルと同じく、解像度が1024を超えると画像が破綻するようです。

サンプラーの影響

サンプラーについても調査しました。

猫のAI写真がサンプラー毎に並んでいる
猫のAI写真がサンプラー毎に並んでいる
猫のAI写真がサンプラー毎に並んでいる

Euler a以外に使えそうなのは、DPM++ 2S a、DPM++ SDE、DPM++ 2S a Karrasでしょうか。

LCMサンプラーでも試してみました。

猫のAI写真がサンプラー毎に並んでいる

LCMサンプラーも問題なく使えますね。

LCM Testサンプラーは以下の記事でインストール方法を紹介しています。

あわせて読みたい
LCM samplerをStable Diffusionに追加する方法 はじめに Stable DiffusionのLCM-LoRAに最適なLCM samplerを追加する方法を紹介します。 この記事で理解できること LCM samplerの入手方法 Stable Diffusion WebUIでLCM...

LCM-LoRAと似たような特徴だね。

LoRAの重み

LCM-LoRAの重みを変更して、画像にどのような影響があるのか確認しました。

猫のAI写真がLoRAの重み毎に並んでいる
猫のAI写真がLoRAの重み毎に並んでいる

LoRAの重みを下げるほど、彩度と解像感が落ちていきますね。

0.8~1.2が実用範囲でしょうか。
モデルとの相性もあるので、普段お使いのモデルでお試しください。

画像生成速度を確認

解像度を512×512、step数を4、バッチカウント10の設定で比較しました。
(テストに使用したモデルはSDXL、GPUは4070tiです)

スクロールできます
SDXL Turbo-LoRA有無生成速度生成時間使用VRAM(参考)
なし4.78it/s10.2sec8.4GB
あり4.72it/s9.2sec8.4GB

LoRAを適用しても生成時間に影響は無いようですね。
もちろんLoRA無しだと、モザイク画像が生成されますけど。

4070tiでも、1秒未満で画像生成できるから魅力的だね。

SDXL Turboモデルと違い、LoRAモデルなので様々なチェックポイントモデルで使える点が嬉しいね。
ただモデルとの相性があるのか、解像感が悪い画像が生成される可能性が高いです。

使ってみた中ではSDXL 1.0との相性が良かったです。

サンプル画像

どんな画像が生成されるのか作例を紹介します。

モデルはSDXL 1.0とfudukimixを使用しました。

あわせて読みたい
fuduki_mixの使い方を紹介します【綺麗な日本人が簡単に生成できる!】 こたじろうさん制作のSDXLベースモデル「fuduki_mix」がとうとう公開されました! 非常に綺麗な日本人が簡単に生成できるので、ぜひ最後までチェックしてみてくださいね...
あわせて読みたい
SDXLの使い方を解説します!【新世代のStable Diffusionモデル】 この記事ではバージョン1.0となったSDXLはどんな画像を生成できるのか、インストール方法から使い方、サンプル画像を紹介していきます。 この記事で理解できること SDXL...
廃墟のAI写真

使用モデル:SDXL 1.0

使用したプロンプトを確認する
photo, ruined town ,Nikon Z9,<lora:sd_xl_turbo_lora_v1:1>
山間部を走るスーパーカーのAI写真

使用モデル:SDXL 1.0

使用したプロンプトを確認する
Raw photo, 8k uhd, dslr, soft lighting, high quality, film grain,, Supercar running in the mountains, Fujifilm XT3,<lora:sd_xl_turbo_lora_v1:1>
雪の中で立つブロンドヘアー女性のAI写真

使用モデル:SDXL 1.0

使用したプロンプトを確認する
1 girl, blonde hair, snow<lora:sd_xl_turbo_lora_v1:1>
町の中で立つ日本人女性のAI写真

使用モデル:fudukimix

使用したプロンプトを確認する
1japanese_woman,(28yo), realistic, photo, film grain, detail skin textures, sharp focus, dynamic angle<lora:AIGirlXL_V1:0.3><lora:sd_xl_turbo_lora_v1:1>

まとめ

今回はStable DiffusionのSDXL Turbo-LoRAを紹介しました。

Turboモデルと比べると、step数を少し高くしないと使えないですが、いろいろなチェックポイントモデルで使えるから便利だよね。

解像度についてはHires Fixでアップスケールすればよいですが、その分生成時間が長くなるので、LCM-LoRAのほうが現状は使い易い印象です。

あわせて読みたい
Stable Diffusion WebUIでLCM-LoRAを使用する方法を紹介します Stable Diffusion WebUI(AUTOMATIC1111、Forge)で使用できる、LCM-LoRAが公開されたので使い方を紹介します。 この記事で理解できること LCM-LoRAの入手方法 Stable Dif...

SDXL Turbo-LoRAの使い方について、youtube動画を投稿しています。
合わせてご参考ください。

よかったらシェアしてね!
  • URLをコピーしました!

コメント

コメントする

目次