Stable Diffusion WebUIでSDXL Turboを使う方法を紹介します

炎の魔法を唱える、魔導士の女性のAI写真

SDXL Turboモデルが公開されたので、Stable Diffusion WebUI(AUTOMATIC1111)で使用する方法を紹介します。

この記事で理解できること
  • SDXL Turboの入手方法
  • Stable Diffusion WebUI(AUTOMATIC1111)でSDXL Turboを使う方法
  • SDXL Turboの各設定値の画像に対する影響
目次

SDXL Turboとは

SDXL Turboは、Stability AIが開発した、テキストから画像を生成するモデルです。

SDXL Turbo は、敵対的拡散蒸留(Adversarial Diffusion Distillation:ADD)と呼ばれる新しい蒸留技術に基づいています。
この技術により、SDXL Turbo は1つのステップで画像出力を合成し、高いサンプリング忠実度を維持しながらリアルタイムでテキストから画像への出力を生成することができます。

Stability AI Japan公式サイト

簡単にいってしまえば、step数1で高画質な画像が生成できるモデルだね。

SDXL Turboのダウンロード・インストールについて

ローカルPCにStable Diffusionをインストールしていない場合は、以下の記事を参考にインストールしましょう。

あわせて読みたい
Stable Diffusion WebUI(AUTOMATIC1111)をローカルPCに導入しよう! この記事では、Stable Diffusion WebUI(AUTOMATIC1111)をローカルPC(Windows)にインストールする方法を紹介します。 記事に沿って作業することで、簡単にStable Diffusi...

SDXL TurboはcivitaiHugging Faceで公開されています。

それぞれ、軽量モデル(約7GB)とフルバージョン(約14GB)が公開されています。

モデルのダウンロード、インストール方法については以下の記事で紹介しています。ご参考ください。

あわせて読みたい
Stable Diffusion WebUIのモデルの入れ方を解説します! みなさんこんにちは!novです。Stable Diffusionで画像生成楽しんでますか? Stable Diffusionは、AIによる画像生成ツールで、モデルを使えば、サムネイルのような画像...

SDXL Turboの使い方

SDXL Turboはstep数を減らしても高画質な画像が生成できる点が一番の特徴ですが、使用するには独特な設定が必要です。

以下に列挙します。

  • step数を低めにする(おすすめは2)
  • CFGスケールを低めに設定する(おすすめは1.5以下)
  • 解像度は512×512が基本

それぞれ画像にどのような影響があるのか調査しました。

step数の影響

step数を1~10まで振って画像生成しました。

ブロンドヘアーの女性のAI写真がstep数別に並んでいる

SDXL Turboはstep数を1にするのが基本ですが、2までは使える印象です。

3以上になるとノイズが目立ってきて、使えないことがわかります。

CFGスケールの影響

CFGスケールを1~5まで振って画像生成しました。

ブロンドヘアーの女性のAI写真がCFGスケール別に並んでいる

1.5までは使えますね。

2以上は不気味な画像になるので1.5以下がおすすめです。

解像度の影響

いくつか解像度を変えて画像生成してみました。

ブロンドヘアーの女性のAI写真
512×512
ブロンドヘアーの女性のAI写真
768×512
ブロンドヘアーの女性のAI写真
512×768
ブロンドヘアーの女性のAI写真
900×506
ブロンドヘアーの女性のAI写真
画像が崩れている
1024×576
ブロンドヘアーの女性のAI写真
画像が崩れている
1024×1024

試した結果、解像度が1024を超えると画像が破綻するようです。

SDXLという名前なのに解像度は低いんだねぇ。

高解像度で出力したい場合は、Hires Fix等のアップスケーラー併用がおすすめです。

サンプラーの影響

念のためサンプラーについても調査しました。

ブロンドヘアーの女性のAI写真がサンプラー別に並んでいる
ブロンドヘアーの女性のAI写真がサンプラー別に並んでいる
ブロンドヘアーの女性のAI写真がサンプラー別に並んでいる

いくつか破綻してしまうサンプラーが存在しますが、多くのサンプラーが使えることがわかりました。

SDXL Turboの画像生成速度を確認

解像度を512×512、step数を2、バッチカウント10の設定でSDXLとSDXL Turboモデルで比較しました。
(テストに使用したGPUは4070tiです)

スクロールできます
モデル生成速度生成時間使用VRAM(参考)
SDXL2.82it/s7.1sec9.3GB
SDXL Turbo2.81it/s7.2sec9.4GB

どちらも生成速度は同じですね。
もちろんSDXLのほうは、モザイク画像が生成されますけど。

4070tiでも1秒未満で画像生成出来る訳ですから、驚きですね。

SDXLで30step → SDXL Turboで2stepなら約15倍速くなるわけだ!

SDXL Turboの作例

どんな画像が生成されるのか作例を紹介します。

使用したプロンプトを確認する
cinematic photo of a rustic beautiful woman, beautiful detailed face, 35mm photograph, film, bokeh, professional, blonde hair, , office suit, upper body
使用したプロンプトを確認する
cinematic photo of a ramen in a Bowl, 35mm photograph, film, bokeh, professional, 4k, highly detailed,
使用したプロンプトを確認する
cinematic photo, An old man with a beard wearing a robe 35mm photograph, film, bokeh, professional, 4k, highly detailed,

まとめ

今回はStable Diffusionの新しいモデルSDXL Turboを紹介しました。

1stepで高速に画像生成できる点は素晴らしいですが、対応解像度が低い点がネックですね。

解像度と高速性をかねたLCM-LoRAモデルのほうが、現状は汎用性が高く使い易いです。

あわせて読みたい
Stable Diffusion WebUIでLCM-LoRAを使用する方法を紹介します Stable Diffusion WebUI(AUTOMATIC1111、Forge)で使用できる、LCM-LoRAが公開されたので使い方を紹介します。 この記事で理解できること LCM-LoRAの入手方法 Stable Dif...

SDXL TurboのLoRAモデルも公開されました。
LoRAなら別のチェックポイントモデルでも使用可能です。

あわせて読みたい
高速に画像生成できるSDXL Turbo-LoRAの使い方を解説します Stable Diffusionで使用できる、SDXL Turbo-LoRAモデルが公開されたので使い方を紹介します。 この記事で理解できること SDXL Turbo-LoRAの入手方法 Stable Diffusion W...

SDXL Turboの使い方についてyoutube動画を投稿しています。
合わせてご参考ください。

よかったらシェアしてね!
  • URLをコピーしました!
AUTOMATIC1111 Ver1.10と書かれたアイキャッチ画像
  • ついにA1111が高速化されforgeなどと同等に!
  • スケジューラ、サンプラーが新規追加
  • SD3に対応
Ver1.10でさらに万能となったクライアントツール

この記事を書いた人

IT技術者でありDTMer
EDMの作曲を始めたところ楽しさに気づき、ロック以上にハマっています。
楽器はギターを弾いており、バンドではギタリストとしても活動しています。

コメント

コメントする

目次