Stable Diffusion WebUIでLCM-LoRAを使用する方法【最新の高速化技術】 | IT技術者のDTM奮闘記
画像生成AI

Stable Diffusion WebUIでLCM-LoRAを使用する方法【最新の高速化技術】

カフェに座っている日本人女性のAI写真画像生成AI

※本ページはプロモーションが含まれています

スポンサーリンク

はじめに

Stable Diffusion WebUI(AUTOMATIC1111)で使用できる、LCM-LoRAが公開されたので使い方を紹介します。

この記事では以下のことが理解できます。

  • LCM-LoRAの入手方法
  • Stable Diffusion WebUIでLCM-LoRAを使う方法・推奨設定
  • LCM-LoRAでどの程度高速化されるのか
スポンサーリンク

LCM-LoRAとは

黒板に書かれたクエスチョンマーク

LCM-LoRAは、LCM(潜在的一貫性モデル)の拡張モデルとして登場したLCMのLoRAモデルです。

従来のモデルは生成stepを20~50程度で画像生成していましたが、LCM-LoRAを使用すれば4~8ステップで画像生成できるため、画像生成時間が高速化されます。

また通常のLoRAモデルと同じ感覚で使用できる点もポイントで、さまざまなチェックポイントモデルで高速に画像生成できます。

LCM-LoRAについて詳しく知りたい場合には「論文まとめ:LCM-LoRA: A Universal Stable-Diffusion Acceleration Module」の記事が、日本語でまとめられていて分かりやすいです。

LCM-LoRAを使用するにあたり

この記事ではStable Diffusion WebUIでLCM-LoRAを使用する方法を解説しますが、Stable Diffusion WebUI(AUTOMATIC1111)ver1.6には、LCMに最適なLCM samplerがインストールされていません。

LCM samplerはインストールすることが可能なので、興味のある方は以下の記事を参考にインストールしてみましょう。

また、Stable Diffusion SDXL専用クライアントアプリ「Fooocus」でもLCM-LoRAが使用可能なので、ぜひお試しください。

LCM-LoRAが登場したばかりですが、LCM-LoRAのマージモデルが早くも登場しました。

Stable Diffusion WebUIでLCM-LoRAを使う方法

LCM-LoRAはSD1.5ベースモデル用、SDXL用、ssd-1b用が公開されています。

※ssd-1bは現状のStable Diffusion WebUIでは効果的ではない為、今回テストしていません

LCM-LoRAのダウンロード、インストール方法

  • STEP1
    LCM-LoRAのダウンロード

    LCM-LoRAはHugging faceCivitaiで公開されています。

    LCM-LoRAはSD1.5ベースモデル用と、SDXLベースモデル用の2種類が存在するので用途に合わせてダウンロードしましょう。

    以下はHugging faceでのダウンロード方法です。
    (Civitaiはモデルページにアクセスしてダウンロードボタンを押すだけです)

    LCM-LoRAモデルが3つ表示されているページ

    lcm-lora-sdxlはSDXLベースモデル用、
    lcm-lora-sd1-5はSD1.5ベースモデル用となっています。

    モデルページにアクセスしたら、File and versionsをクリックします。

    File and versionsクリックを促している
    SDXL用LCM-LoRAのページ

    ファイルページが表示されたら、pytorch_lora_weights.safertensorsの右側にあるダウンロードボタンをクリックします。

    ダウンロードボタンのクリックを促している
    ダウンロードボタンのクリック
  • STEP2
    LCM-LoRAのインストール方法

    通常のLoRAモデルとインストール方法は同じです。

    「webui」→「models」→「Lora」フォルダにファイルを保存します。

    Hugging faceからダウンロードした場合はファイル名がわかりにくいので、「sdxl_lcm.safetensors」などに変更しておきましょう。
    (Civitaiのファイルは既にリネームされているので必要ありません)

    ファイル名の変更を促している
    ファイル名の変更(おすすめ)

その他、LoRAの詳細については↓の記事でまとめています。

LCM-LoRAの使い方

LCM-LoRAで画像生成する場合、普段と異なる設定が必要になります。

以下の手順で設定します。

  • STEP1
    プロンプトにLoRAを入力する

    モデル一覧からLCM-LoRAをクリックしてプロンプトに反映します。

    LoRAモデルカードのクリックを促している
    プロンプトにLoRAを反映

    LoRAの重みは0.5~1程度がおすすめです。
    使用モデルによって調整しましょう。

  • STEP2
    画像生成設定を行う

    以下設定を行います。

    • サンプラーはEuler a
    • サンプリングステップ数は4~8
    • cfgスケールは1~2

    解像度はお好みで問題ありません。

    あとは画像生成するだけです。

ここまでのLCM-LoRAの使用方法について、動画でも解説しているので合わせてご参考ください。

LCM-LoRAでどの程度高速化されるのか計測してみた

LCM-LoRAを使った際の画質と、画像生成時間をテストしてみました。
(テストで使用したGPUはRTX4070tiです)

SD1.5モデルで画像生成テスト

meinamixを使用してテストしました。

解像度は512×512、バッチカウント5で生成しました。
結果は以下の通りです。

LCM-LoRA有無STEP数生成効率生成時間
無し25step9.26it/s13.7sec(100%)
有り6step8.12it/s3.8sec(27%)

少し生成効率は落ちますが、まさに爆速です。
約4倍の速度で、画像一枚の場合、約0.8秒で生成されています。

生成された画像に問題は無いのか、比較してみました。
左から順に以下の通りです。

  • LCM-LoRA無し25step
  • LCM-LoRA無し6step
  • LCM-LoRA有り6step
銀髪女性のAIイラスト
LCM-LoRA無し25step
銀髪女性のAIイラスト ぼやけている
LCM-LoRA無し6step
黒髪女性のAIイラスト
LCM-LoRA有り6step

LCM-LoRAの効果は凄いですね。十分高画質といえます。

ただCFGスケールを低く設定する必要があるので、プロンプトで細部を指定することは難しいです。

SDXLモデルで画像生成テスト

juggernautXLを使用してテストしました。

解像度は1024×1024、バッチカウント5で生成しました。
結果は以下の通りです。

LCM-LoRA有無STEP数生成効率生成時間
無し30step2.61it/s59.8sec(100%)
有り6step1.29it/s24.8sec(41%)

こちらもSDXLとは思えないほど高速化されています。
画像一枚は、約5秒で生成されました。

次に画像比較です。

左から順に以下の通りです。

  • LCM-LoRA無し30step
  • LCM-LoRA有り6step
茶髪女性のAI写真
LCM-LoRA無し30step
茶髪女性のAI写真
LCM-LoRA有り6step

SDXLでも高画質で、十分使える画像が生成できました。

nov
nov

LCM-LoRAを使用した画像のほうが、肌がリアルに見えるね

LCM-LoRAの各設定値の影響を確認

LCM-LoRAを使用する際に設定する、LCM-LoRAの重み、サンプラー、step数、CFGスケールがどのように画像に影響するのか確認しました。

LCM-LoRAの重み

LCM-LoRAの重みを変更して、画像にどのような影響があるのか確認しました。

LCM-LoRAの重みを1.0~0.1まで変化させた結果は以下の通りです。

LCM-LoRAの重みを1.0~0.1で変化させた画像 銀髪女性のAIイラスト
LCM-LoRAの重み1.0~0.1(画像クリックで拡大できます)

次に2.0~1.1まで変化させてみました。

LCM-LoRAの重みを2.0~1.1で変化させた画像 銀髪女性のAIイラスト
LCM-LoRAの重み2.0~1.1(画像クリックで拡大できます)

この結果を見ると0.4以下は画像がぼやけているので、使えないことがわかります。

重みを大きくした場合は、LoRAが構図に影響してくるので、使うにしても1.2程度が限界でしょうか。

nov
nov

おすすめの値は0.5~1だね

LCM-LoRAで使用するサンプラー

LCM-LoRAを使用する際の、サンプラーの影響を調査しました。

サンプラーを変化させた画像 銀髪女性のAIイラストが10個並んでいる
LCM-LoRA使用時のサンプラー1(画像クリックで拡大できます)
サンプラーを変化させた画像 銀髪女性のAIイラストが10個並んでいる
LCM-LoRA使用時のサンプラー2(画像クリックで拡大できます)
サンプラーを変化させた画像 銀髪女性のAIイラストが10個並んでいる
LCM-LoRA使用時のサンプラー3(画像クリックで拡大できます)

Euler a以外に使えそうなのは、DPM++ 2S a、DPM++ SDE、DPM++ 2S a Karrasでしょうか。

人により印象が異なると思うので、画像から判断頂ければ幸いです。

LCM-LoRA使用時のstep数

LCM-LoRAで画像生成する際の、step数の影響を調査しました。

step1~10まで変化させた結果は以下の通りです。

step数を変化させた画像 銀髪女性のAIイラストが10個並んでいる
LCM-LoRA使用時のstep数1~10(画像クリックで拡大できます)

step3以下は、解像感が悪いので使えませんね。

注目するのは8以上です。
少し変化していますが、画質に関しては、ほぼ変化していませんね。

次に15~50stepまで5刻みでテストしました。

step数を変化させた画像 銀髪女性のAIイラストが10個並んでいる
LCM-LoRA使用時のstep数5~50(画像クリックで拡大できます)

step20以上は構図が大きく変化していくことがわかります。
また書き込み量が減っているようにも見えますね。

以上のことからstep数は4~8がおすすめです。

nov
nov

LCM-LoRAを使用しているのに、step数を20など大きな値にすると、高速化の意味が無くなってしまうから注意してね。

LCM-LoRA使用時のCFGスケール値

LCM-LoRAで画像生成する際の、CFGスケール値の影響を調査しました。

CFGスケールを1~5まで変化させた結果は以下の通りです。

CFGスケールを変化させた画像 銀髪女性のAIイラストが10個並んでいる
LCM-LoRA使用時のCFGスケール1~5(画像クリックで拡大できます)

1もしくは1.5の画像が一番高画質に感じますね。
2までは使える印象ですが、2を超えると解像感が落ちていくことがわかります。

ちなみに使用頻度が高い、CFGスケール7の場合は以下のようになります。

ぼやぼやのAIイラスト
LCM-LoRA使用時のCFGスケール7

7だと全く使えませんね。

以上のことからCFGスケールは1~2がおすすめです。

AI画像生成のスピードはグラボが重要

Stable Diffusionでは一枚の画像生成に数十秒の時間を要します。
また、生成したい画像を一発で生成することは出来ないのでトライ&エラーを繰り返すことになります。

そうなんです。一枚の画像を作成するのに思った以上に時間がかかるのです。
だったら画像生成スピードを上げてしまえばいいんです!

画像生成スピードに一番影響するのはグラフィックボードです。
スピードだけ求めるなら発売されている一番のグラフィックボードを選べば良いのですが、非常に高価なので、ここではコスパに優れるモデルも合わせて紹介します。

AI画像生成が捗る高コスパグラフィックボード

最高の生成スピードを求めるならコレ!

最新の4000シリーズから、バランスが丁度いいグラボ!

スポンサーリンク

まとめ

今回は、Stable Diffusion WebUIでLCM-LoRAを使用する方法を紹介しました。

sd-webui-lcmは現状使えるモデルが限定されていますが、LCM-LoRAであれば好みのモデルで使用できる点が良いですね。

高い信頼性かつ大容量でランキング上位の常連HDD、AI画像生成にぴったり!

高速かつ大容量SSDでAI画像生成もノンストレス!

大容量かつ超高速なM.2 NVMe SSD、AI画像生成で更なるスペックを求める方に

ノートPCで増設するなら高速なSSDです

ノートPCで増設したいけど価格を抑えたい方におすすめ!

注目
セーターを着た日本人女性のAI写真
Stable Diffusionの使い方・記事まとめ【Stable Diffusion WebUIの使い方】
Stable Diffusion関連の記事が増えてきたので、使い方に関する記事をまとめました。
注目
黒髪のアニメ調女性のAIイラスト
Stable Diffusionのアニメ系イラストが得意なモデル5選!
アニメ調のイラストが得意なStable Diffusionのおすすめモデルを紹介していきます
注目
黒のロングヘアー女性のAIイラスト
美少女2次元イラストに最適なモデル5選!!【Stable Diffusion モデル紹介】
2Dイラストに最適なStable Diffusionのおすすめモデルを紹介していきます。
注目
コートを着た日本人女性のAI写真
Stable Diffusionのおすすめモデルを用途別に紹介するよ
Stable Diffusionで使用できるおすすめモデルを用途別に紹介していきます
注目
ショートヘアーの日本人女性のAI写真
綺麗なお姉さんは好きですか? ハイクオリティな日本人女性が生成できるhaduki_mixを紹介します【Stable Diffusion SDXLモデル紹介】
日本人女性が綺麗に生成できるStable Diffusionのモデルを9つ紹介していきます。
注目
茶髪女性が町中に立っているAI写真
Fooocusのインストールから簡単な使い方を紹介【SDXLを手軽に高速に使える】
Fooocusのインストールから簡単な使い方を解説していきます。Fooocusは数あるStable Diffusion WebUIの中でも、軽量かつシンプルなクライアントアプリです。
注目
ピンク髪のアジア人女性のAI写真
SDXL 1.0が公開開始されました!Stable Diffusion WebUIでの使い方を紹介します【低VRAMでも使えます!】
バージョン1.0となったSDXLはどんな画像を生成できるのか、インストール方法から使い方、サンプル画像を紹介していきます。
注目
タートルネックを着た黒髪女性のAI写真
Stable Diffusionを高速化するSDPAを紹介します【Stable Diffusion WebUIの使い方】
高速化が可能となるSDPAの使い方を紹介します。
注目
タートルネックに茶色の上賀を着た日本人女性のAI写真
Stable DiffusionでRefinerを使用する方法
Refinerに対応したAUTOMATIC1111の使い方を紹介していきます。
注目
黒いジャケットを着た女性のAI写真
FreeUでお手軽高画質化!【Stable Diffusion WebUI拡張機能 FreeUの使い方】
生成速度はそのままに高画質化が可能なFreeUの使い方を紹介します
注目
ライダージャケットを着た日本人女性のAI写真
Stable Diffusionを2倍高速化できるTensorRTを紹介します
Stable Diffusion WebUIの拡張機能「TensorRT」のダウンロード方法、インストール方法、使い方を紹介します。 TensorRTアクセラレーションに対応したことにより、2倍以上(実測)画像生成時間の高速化が可能です。

Comment

タイトルとURLをコピーしました