MENU

DTM、ガジェットレビュー、画像生成AI総合サイト

SD TurboをStable Diffusion WebUI(AUTOMATIC1111)で使用する方法を紹介します【SD2.1ベースの高速生成モデル】

広告

2023年12月9日2024年3月24日

白銀の鎧を着た女性のAIイラスト

はじめに

SD Turboモデルが公開されたので、Stable Diffusion WebUI(AUTOMATIC1111)で使用する方法を紹介します。

この記事で理解できること

SD Turboの入手方法
Stable Diffusion WebUI(AUTOMATIC1111)でSD Turboを使用する方法
SD Turboの各設定値の画像に対する影響

目次

SD Turboとは

SD Turboは、Stability AIが開発した、テキストから画像を生成するモデルです。

先日、品質に優れるSDXL Turboが公開されたばかりですが、早くもSD 2.1ベースのTurboモデルが公開されました。

SDXL Turboモデルについては以下の記事で詳しく紹介しています。

SD TurboはSDXL Turboと比較すると品質は少し劣りますが、VRAM使用量が少ないので多くの方が扱えるTurboモデルになります。

<img decoding="async" src="https://itdtm.com/wp-content/uploads/2024/03/fukidashi-150x150.webp" alt="" class="c-balloon__iconImg" width="80px" height="80px">

低いVRAMでもTurboモデルが使える点は嬉しいよね。

SD TurboはSDXL Turboと同じように、1stepで高品質な画像が生成できることが一番の特徴です。
従来モデルで20stepで生成していたなら、単純計算で20倍速で画像生成が完了できることになります。

SD Turboのダウンロード・インストールについて

SD TurboはCivitaiとHugging Faceで公開されています。

モデルのダウンロード、インストール方法については以下の記事で紹介しています。

Stable Diffusion WebUI(AUTOMATIC1111)でSD Turboを使用する方法

SD TurboはSDXL Turboと同じように独特な設定が必要です。

以下手順で高画質な画像が生成可能です。

AUTOMATIC1111 Ver1.7で SD 2.1 Turboを使用する方法

AUTOMATIC1111 Ver1.7からSD 2.1 Turboモデルが正式サポートされました。

AUTOMATIC1111 Ver1.7の詳細については以下の記事で紹介しています。

Stable Diffusion WebUI(AUTOMATIC1111)のアップデート方法については、以下の記事をご参考ください。

AUTOMATIC1111 Ver1.6以下で SD 2.1 Turboを使用する方法

AUTOMATIC1111 Ver1.6以下でSD 2.1 Turboを使用するには、yamlファイルの変更が必要です。

Stable Diffusion WebUI(AUTOMATIC1111 Ver1.6以下)でSD Turboモデルを読み込むと「sd_xl_refiner.yaml」ファイルが適用されてモデルのロートが完了できません。

※本来は「sd_2_1.yaml」を指定してほしい

この不具合については以下手順で回避が可能です。

以下手順を実施するとSD Turboモデル以外のモデルが使用できなくなりますが、元に戻せば作業前の状態に戻すことが可能です。
(お試しで使用することが可能)

不安が残る場合は、以下の記事を参考に別のWebUI環境をインストールしましょう。

STEP1
sd_xl_refiner.yamlをバックアップする

「webuiインストールフォルダ」 → 「repositories」 → 「generative-models」 → 「configs」 → 「inference」フォルダ内の「sd_xl_refiner.yaml」を適当な名前に変更します。

例：sd_xl_refiner_.yaml
STEP2
sd_2_1.yamlをコピーする

上記フォルダ内に「sd_2_1.yaml」が存在するので、このファイルをコピーします。
STEP3
sd_2_1.yamlをsd_xl_refiner.yamlにリネームする

コピーした「sd_2_1.yaml」を「sd_xl_refiner.yaml」にリネームします。

これでSD Turboモデルがsd_2_1.yamlを介して読み込まれるわけです。

作業完了後のinferenceフォルダ内

CHECK
通常のモデルを使用したい場合(作業前の環境に戻す)は、「sd_xl_refiner.yaml」を削除して、バックアップしたファイルを「sd_xl_refiner.yaml」にリネームします。

画像生成設定について

画像生成時も、独特な設定が必要になります。

step数を低めにする(おすすめは1)
CFGスケールを低めに設定する(おすすめは1.5以下)
解像度は512×512が基本

それぞれ画像にどのような影響があるのか調査しました。

step数とCFGスケールの影響

step数を1～5、CFGスケールを1～5まで振って画像生成しました。

猫のAI画像がstep数とCFGスケール別にタイル状に並んでいる

step数を増やしてもあまり画質は向上しませんね。

CFGスケールは1.5くらいがバランスよく感じます。

サンプラーの影響

サンプラーについても調査しました。

猫のAI画像がサンプラー別に並んでいる

猫のAI画像がサンプラー別に並んでいる

猫のAI画像がサンプラー別に並んでいる

いくつか破綻してしまうサンプラーが存在しますが、多くのサンプラーが使えることがわかりました。

SDXL TurboのVRAM使用量を確認

SD TurboとSDXL Turboモデルで、VRAM使用量にどの程度差があるのか比較してみました。

テストで生成した画像の解像度は512×512です。

モデル	VRAM使用量
SD Turbo	4.3GB
SDXL Turbo	7.6GB

やはりSD2.1ベースなので、VRAM使用量はかなり少ないですね。

<img decoding="async" src="https://itdtm.com/wp-content/uploads/2024/03/fukidashi-150x150.webp" alt="" class="c-balloon__iconImg" width="80px" height="80px">

SD TurboならVRAM8GB以下のGPUでも余裕があるね。

SD Turboの作例

どんな画像が生成されるのか作例を紹介します。
全て後処理無し、補正無しのとって出し画像で、1stepで出力しています。

段ボールに入った猫のAIイラスト

プロンプト

photorealistic a cat in box

ネガティブプロンプト

無し

お皿に乗った美味しそうなスパゲティのAIイラスト

プロンプト

photo, Delicious spaghetti on a plate

ネガティブプロンプト

無し

山の中を4WDクロカンが走っているAIイラスト

プロンプト

photo, Mountainous region, 4wd cross country

ネガティブプロンプト

無し

まとめ

今回はStable Diffusionの新しいモデルSD Turboを紹介しました。

SD Turboでも品質は十分に感じましたね。
ただSD2.1ベースなので、人物の品質ははっきりいって微妙です。

少し経てばLoRAやSD Turboベースのファインチューニングモデルも公開されると思うので、そこからが盛り上がるポイントでしょうか。

よかったらシェアしてね！

URLをコピーしました！

AUTOMATIC1111 Ver1.10と書かれたアイキャッチ画像

ついにA1111が高速化されforgeなどと同等に！
スケジューラ、サンプラーが新規追加
SD3に対応

必見A1111 Ver1.10の詳細

Ver1.10でさらに万能となったクライアントツール

この記事を書いた人

IT技術者でありDTMer
EDMの作曲を始めたところ楽しさに気づき、ロック以上にハマっています。
楽器はギターを弾いており、バンドではギタリストとしても活動しています。

コメント

コメントするコメントをキャンセル

メニュー
ホーム
お問い合わせ
検索
トップへ