【Stable Diffusion 3.5】ComfyUIでのインストールと画像生成手順を紹介

茶髪の透明感のある肌の女性のAI写真

stability aiの新モデル「Stable Diffusion 3.5」が公開されました!

この記事ではローカルPCでStable Diffusion 3.5とComfyUI を使って、画像生成する手順を紹介します。

目次

Stable Diffusion 3.5 とは?

2024年10月に公開されたstability aiの最新画像生成モデルです。

本日は、Stable Diffusion 3.5 をご紹介します。このオープン リリースには、Stable Diffusion 3.5 Large や Stable Diffusion 3.5 Large Turbo など、複数のモデル バリアントが含まれています。さらに、Stable Diffusion 3.5 Medium は 10 月 29 日にリリースされる予定です。

これらのモデルはサイズに応じて高度にカスタマイズ可能で、コンシューマー ハードウェア上で実行され、許容度の高いStability AI Community Licenseに基づいて商用および非商用の両方で無料で使用できます。

stability ai
STEP
満を持してStable Diffusion 3の登場

2024年に公開されたStable Diffusion 3は、はっきりいって失敗作でした。
わくわくしていたみなさんも、がっかりしたことでしょう・・・

あわせて読みたい
Stable Diffusion 3 MediumをAUTOMATIC1111で使用する方法を紹介します みなさんSD3は試してみましたか? SD3は複数のモデルが公開されています。その中でもStable Diffusion 3 MediumはローカルPCで実行できるようカスタムされています。 こ...
STEP
FLUX.1が公開

その後、Stable Diffusionを開発したメンバーがリリースしたFLUX.1は期待通りの性能で、盛り上がっています。
このときStable Diffusion 3は完全に負けたといってよいでしょう。

あわせて読みたい
FLUX.1はStable Diffusionを超えるのか!?【ローカルPCでの使用方法を紹介】 みなさんStable Diffusion楽しんでますか?それともマンネリ気味ですか? 今回紹介するFLUX.1は現状で最高品質の画像が生成できるモデルです! これだけで気になるでし...
STEP
Stable Diffusion 3.5が公開!(今ココ)

そして、stability aiはStable Diffusion 3の失敗を挽回するべく、「Stable Diffusion 3.5」を公開したわけです。

どこまで品質が上がったのか気になるよね。

Stable Diffusion 3.5は、前バージョンと同様に3つのモデルで展開されます。
それぞれ以下のような特徴があります。

Stable Diffusion 3.5 各モデルの特徴

Stable Diffusion 3.5 Large

80億のパラメータで基本となる高品質なモデルです。

Stable Diffusion 3.5 Large Turbo

Largeの蒸留版で4stepの高速生成でも、高品質な画像が生成できるモデルです。

Stable Diffusion 3.5 Medium

26億のパラメータで、カスタマイズ性と画質を両立させたモデルです。
個人用PCで実行できるよう軽量なモデルとなっています。

商用利用について

個人や企業でライセンスが異なるようです。
詳細は以下の通りです。

非営利目的の場合は無料:個人および組織は、科学研究を含む非営利目的であれば、モデルを無料で使用できます。

商用利用は無料(年間収益が 100 万ドルまで):スタートアップ企業、中小企業、クリエイターは、年間総収益が 100 万ドル未満であれば、無料でこのモデルを商用目的で使用できます。

stability ai

以上のことから、個人の場合は年間収益が100万ドルを超えることは無いと考えられるので、
問題無く商用利用可能と判断できますね!

ComfyUIでのインストール手順

ここからは、Stable Diffusion 3.5で使用するモデル等のインストール方法を紹介します。

記事執筆時点ではComfyUIがStable Diffusion 3.5にネイティブ対応しています

ComfyUIのインストールとアップデート

ComfyUIのインストールが済んでいない方は、下記の記事を参考にインストールしましょう。

あわせて読みたい
ComfyUIのインストール手順を画像付きで解説【軽量、高速なStable Diffusionクライアント】 この記事はComfyUIをインストールしたい人向けに、画像付きで手順を解説しています。 また、ComfyUIの特徴や、StableDiffusionクライアントとしての利用方法についても...

インストール済みの方は、ComfyUIを最新バージョンにアップデートしましょう。

アップデート手順については以下の記事で紹介しています。

あわせて読みたい
ComfyUIのアップデート手順を徹底解説! この記事では、Stable Diffusionのクライアントアプリ「ComfyUI」のアップデート手順を徹底解説します。 ComfyUIは、Stable Diffusionモデルから画像を生成するWebブラ...

Stable Diffusion 3.5モデルのインストール方法

Stable Diffusion 3.5は複数のモデルで展開されており、PCのスペックにより使用するモデルを選択します。
PCスペックに不安のある方は低RAM環境のモデルを使用しましょう。

32GB以上のRAMを搭載している場合には、通常環境がおすすめです

通常環境(fp16)

チェックポイントモデル

models \ checkpoint フォルダーに保存する

sd3.5 largeモデルのダウンロードリンクをフォーカスしている
sd3.5 large turboモデルのダウンロードリンクをフォーカスしている
テキストエンコーダー

models \ clip フォルダーに保存する

低RAM環境(fp8)

チェックポイントモデル

models\checkpoint フォルダーに保存する

sd3.5 large fp8モデルのダウンロードリンクをフォーカスしている
テキストエンコーダー

models/clip フォルダーに保存する

t5xxl*.safetensorsはどちらか一つで問題ありません(scaledは実験的モデル)
またclip_g,clip_lは上記通常環境で紹介したモデルと同様です

ComfyUIでの画像生成手順

STEP
ワークフローの読み込み

Hugging Faceのページからワークフローをダウンロードします。
ダウンロードしたワークフローは任意のフォルダーに保存します。

  • sd3.5-t2i-fp16-workflow.json(通常環境(fp16)用ワークフロー)
  • sd3.5-t2i-fp8-scaled-workflow.json(低RAM環境(fp8)用ワークフロー)

ワークフローをダウンロードしたら、ComfyUIのコントロールパネル内の「Load」をクリックして開きます。

comfyuiのlワークフローoadボタンクリックを促している
sd3.5 のcomfyui用ワークフローの画像
workflowを開いた状態
STEP
パラメータの設定
モデルの選択

テキストエンコーダーは指定したフォルダに保存するだけで問題ありませんが、低RAM用のfp8モデルは選択する必要があるので注意してください。

ワークフローの左下のノードでチェックポイントモデルを選択します。

プロンプトの設定

ワークフローの真ん中あたりのノードでプロンプトを設定します。
Negative Prompt(ネガティブプロンプト)も設定可能ですが、Stable Diffusion 3.5では特に必要性を感じません。

解像度の設定

ワークフローの真ん中、下部のノードで画像解像度の設定が可能です。

解像度は64の倍数で設定しましょう。
64の倍数から外れると画像の品質が低下します。

ステップ数、サンプラーの設定

ワークフローの真ん中右のノードで設定が可能です。

通常モデルはstep数30~50、cfg4.5~5.5くらいがおすすめです。
Turboモデルを使用する場合は、step数4、cfg1の設定がおすすめです。

STEP
画像生成

設定が完了したらコントロールパネル内の「Queue Prompt」をクリックして画像生成を開始しましょう!

comfyuiのlワークフローoadボタンクリックを促している

Stable Diffusion 3.5で生成したサンプル画像

fp16、fp8、Turboモデルで各サンプル画像を生成しました。
FLUX.1で生成した画像も掲載するので、使えるレベルなのか確認していきましょう!

パネルを持った女性

test Fluxと書かれたボードを持つ女性のAI写真
FLUX.1
test sd3.5と書かれたカードを持った女性のAI写真 sd3.5 largeモデルで生成
sd 3.5 fp16
test sd3.5と書かれたカードを持った女性のAI写真 sd3.5 large turboモデルで生成
sd 3.5 turbo
test sd3.5と書かれたカードを持った女性のAI写真 sd3.5 large fp8モデルで生成
sd 3.5 fp8
使用したプロンプトを確認する
A photorealistic 4K image of a japanese girls, A Japanese girls holding a card that says "Test SD3.5"

アニメ調女性

サイバーパンクなネオン街に立つ女性のAIイラスト
FLUX.1
サイバーパンクな都市に立つ女性のAIイラスト sd3.5 largeモデルで生成
sd 3.5 fp16
サイバーパンクな都市に立つ女性のAIイラスト sd3.5 large turboモデルで生成
sd 3.5 turbo
サイバーパンクな都市に立つ女性のAIイラスト sd3.5 large fp8モデルで生成
sd 3.5 fp8
使用したプロンプトを確認する
Illustration,anime,Beautiful woman standing with her arms crossed, cyberpunk, in a city

都市を走るスーパーカー

夜の街を走るスポーツカーのAI写真
FLUX.1
都市を走るスーパーカーのAI写真 sd3.5 largeモデルで生成
sd 3.5 fp16
都市を走るスーパーカーのAI写真 sd3.5 large turboモデルで生成
sd 3.5 turbo
都市を走るスーパーカーのAI写真 sd3.5 large fp8モデルで生成
sd 3.5 fp8
使用したプロンプトを確認する
Supercar running through the city at night,in a city, tokyo

草原に寝転ぶ女性

草原に寝転ぶ女性のAI写真 sd3.5 largeモデルで生成
sd 3.5 fp16
草原に寝転ぶ女性のAI写真 sd3.5 large turboモデルで生成
sd 3.5 turbo
草原に寝転ぶ女性のAI写真 sd3.5 large fp8モデルで生成
sd 3.5 fp8
使用したプロンプトを確認する
A photorealistic 4K image of young woman lying on a meadow

ひまわりの種を食べるハムスター

ひまわりの種を食べるハムスターのAI写真 sd3.5 largeモデルで生成
sd 3.5 fp16
ひまわりの種を食べるハムスターのAI写真 sd3.5 large turboモデルで生成
sd 3.5 turbo
ひまわりの種を食べるハムスターのAI写真 sd3.5 large fp8モデルで生成
sd 3.5 fp8
使用したプロンプトを確認する
Hamster eating sunflower seeds

いかがでしょうか。
あくまでファーストインプレッションですが、私的にはFLUX.1の方が優れているように感じます・・・

fp8、turboモデルの画像の方が魅力的に見えます。

FLUX.1のほうが自然でリアルに感じるのは私だけでしょうか?
後発だったのでFLUX.1を抜いていく勢いがあるのかと思いましたが、少し残念です。

すでにFLUX.1はファインチューンモデルも展開されているので、Stable Diffusion 3.5が今後どうなるのか気になるよね。

まとめ

今回はComfyUIでStable Diffusion 3.5を使用する方法を紹介しました。

FLUX.1と肩を張れるかというと微妙に感じますね・・・

LargeモデルはPCスペックが要求されますが、Mediumモデルは扱いやすいし品質も高いので、どちらかというとMediumモデルがおすすめです。

Stable Diffusion 3.5 Mediumの使い方については以下の記事で紹介しています。

あわせて読みたい
Stable Diffusion 3.5 mediumの使い方を紹介!【個人PCでも扱いやすいSD3.5】 先日公開されたStable Diffusion 3.5ですが、mediumだけ後日公開だったんです。 この記事では、やっと公開されたStable Diffusion 3.5 mediumをローカルPCで実行する手...
よかったらシェアしてね!
  • URLをコピーしました!

この記事を書いた人

IT技術者でありDTMer
EDMの作曲を始めたところ楽しさに気づき、ロック以上にハマっています。
楽器はギターを弾いており、バンドではギタリストとしても活動しています。

コメント

コメントする

目次