Stable Diffusion WebUIのtxt2imgの使い方を徹底解説します

2023年6月9日2024年5月4日

Stable Diffusion WebUIでメインとなるtxt2imgの使い方を解説します。

この記事で理解できること

txt2img内のパラメーター詳細
画像生成手順について
画像生成例・プロンプト紹介

txt2imgのパラメーターについて

Stable Diffusion WebUIを起動すると「txt2img」が表示されます。
各部を解説していきます。

No	機能名	内容
1	Stable Dissusion checkpoint	モデルの選択を行う
2	機能タブ	機能の切替を行う
3	プロンプト	生成してほしい画像の特徴を記載する
4	ネガティブプロンプト	生成してほしくない画像の特徴を記載する
5	Sampling method	サンプラーの選択
6	Sampling steps	サンプリングステップの設定
7	Restore faces	画像生成時に顔の修正を実施する
8	Tiling	出力画像をタイルのように並べる
9	Hires.fix	高解像度出力する
10	Width	画像の幅
11	Height	画像の高さ
12	Batch count	バッチ回数(画像の出力枚数)
13	Batch size	１回のバッチで何枚の画像を生成するか
14	CFG Scale	どれだけプロンプトに忠実か低いほどプロンプトに寛容
15	Seed	ランダマイザーシードシード値を設定する
16	ランダムボタン	Seedをランダム値である-1に変更する
17	Seed固定ボタン	Seedを固定値にする
18	Extra	Seedの詳細設定を行う
19	Script	スクリプト機能の設定を行う

No	機能名	内容
20	Genarate	画像生成開始ボタン
21	チェックボタン	直前に生成したプロンプトを呼び出す
22	ゴミ箱ボタン	入力したプロンプトを削除する
23	花札ボタン	LoRA等のモデルカードを表示する ※1
24	バインダーボタン	選択したスタイルをプロンプトに反映する ※1
25	フロッピーボタン	入力したプロンプトを保存する ※1
26	Styles	スタイル選択
27	フォルダボタン	画像保存フォルダを開く
28	Save	生成した画像を保存する
29	Zip	生成した画像をZipで圧縮する
30	Send to img2img	選択した画像をimg2imgに送る
31	Send to inpaint	選択した画像をinpaintに送る
32	Send to extras	選択した画像をextrasに送る

※1 Stable Diffusion WebUI Ver1.6以降では表示されません

解り難い機能を少し補足します。

Sampling method

ノイズ除去アルゴリズムを選択します。
と、これだけだと何のこっちゃ解らないですよね。

Stable Dissusionはノイズ画像からノイズを消しながら画像を作っていきます。
この時のノイズ除去方法を選択するわけです。
なので、生成画像に強く影響します。

Sampling stepsはノイズを除去する回数になります。
少なすぎると、ぼやぼやの画像が出来て、高い程鮮明になる傾向ですが画像生成時間が長くなります。

モデルによって最適なサンプラーが異なるので、モデルの推奨サンプラーの使用が無難です。

Hires.fix

生成画像を高解像度化します。

Stable Diffusionのモデルは基本的に512*512サイズで学習されているので、画像生成も基本的には512*512で行います。
(それ以外は生成時間もかかるし、破綻する可能性有り)

だけど512*512だとアイコンくらいにしか使えないよね・・・
そんな時にHires.fix機能を使用します。

Hires. fixについては以下記事で解説しています。

Batch count、Batch size

Batch sizeは1回画像生成するときに何枚同時に処理するかを指定します。
基本的に1で使用することをおすすめします。
数を増やすとその分VRAM容量が必要になります。

Batch countは何回画像生成するかを指定します。

なので私のおすすめは、Batch sizeを「1」にしてBatch countで画像生成枚数を調整します。

Genarateを押した時の、生成画像枚数はBatch count×Batch sizeになるんだね。

バッチサイズとバッチカウントの関係については↓の記事でまとめています。

CFG Scale

プロンプトの規制力を指定します。
値を高くするとプロンプトの影響が高くなるが、出力画像が破綻する可能性も高くなります。

基本的には7で問題ありません。

Seed

画像生成時に使用する乱数のシード値を指定します。
-1を入力するとランダム値となり、生成画像が毎回変化します。
固定値を入力すると、同じ画像が出力されるわけです。

使い方としては、ランダムで沢山画像を出力し、お気に入りの画像が生成されたら、その画像のSeed値で固定して高解像度化する・・・といった手順がおすすめです。

Styles

お気に入りのプロンプトを管理できます。

Stylesついては以下の記事で解説しています。

Stable Diffusion WebUIで画像生成する方法

では、実際に画像生成していきましょう！
以下手順に沿って実行するだけで簡単に出来ますよ。

STEP

モデルの選択

使用したいモデルを「Stable Dissusion checkpoint」から選択しましょう。

STEP

プロンプトの入力

出力したい画像の指定をプロンプトエリアに、
出力したくない画像の指定をネガティブプロンプトエリアに入力していきます。

STEP

Sampling method、Schedule typeの選択

モデルで推奨されているサンプラーを選択しましょう。

スケジューラについてはAutomaticのままで問題ありません。

選択に迷った場合のおすすめ設定を確認する

Sampling method: Euler a(ほとんどモデルで高画質な画像が生成可能)
Schedule type: Karras(サンプラーと同じくほとんどのモデルで良い結果が得られる)

STEP

幅と高さの指定

出力したい画像に合わせて設定してみて下さい。
画像の大きさが構図に影響します。

例えば横長で体全体を出力しようとすると、寝そべった状態になり易いです。

SD1.5ベースモデルであれば512 x 512、
SDXLベースモデルであれば1024×1024が基本解像度になります。

STEP

Sampling steps数の指定

とりあえず20で生成してみましょう。
気に入った画像が出力できたらSeed値を固定して、ステップ数を調整することをおすすめします。

ステップ数を高くすると、画像生成時間も長くなります。

STEP

バッチ数の指定

Batch sizeを1、Batch countを一度に生成したい画像の枚数にしましょう。

STEP

画像生成開始

Genarateボタンを押して画像生成スタート！

STEP

保存した画像を確認してみよう

Stable Diffusion WebUIのデフォルト設定では生成した画像が全て保存されています。
生成画像の下にあるフォルダボタンを押して、保存したファイルを確認してみましょう。

画像生成例・プロンプト紹介

プロンプトに慣れていない間は何を記載すればよいのかわかりませんよね。

ここからは作例と実際に使用したプロンプトを紹介します。

ブロンド女性

商用利用が可能な「chilled‗remix」というモデルを使って生成しました。

使用したプロンプトを確認する

masterpiece, best quality, ultra high res, (photorealistic:1.4), ((puffy eyes)), looking at viewer,1girl ,upper body, close up of face shot, blonde hair, outdoor, standing, in the street, cute, seductive smile, lustrous skin, white blouse,

nsfw, paintings, sketches, cleavage , (worst quality:2), (low quality:2), (normal quality:2), lowres, normal quality, ((monochrome)), ((grayscale)), split view, grid view,

サイバーパンクなスポーツカー

使用したプロンプトを確認する

dark photo of single futuristic Metallic texture cyberpunk sports car with futuristic cyberpunk landscape, cinematic concept art,cyberpunk color, masterpiece, rainy day, ray tracking, RTX, intricate, 3d, highly detailed, trending on artstation, 4k,extremely high details, ultra hd, hdr, 8k, extremely high details

blurry, lowres, text, error, cropped, worst quality, low quality, jpeg artifacts, ugly, duplicate, morbid, mutilated, out of frame, extra fingers, mutated hands, poorly drawn hands, poorly drawn face, mutation, deformed, blurry, dehydrated, bad anatomy, bad proportions, extra limbs, cloned face, disfigured, gross proportions, malformed limbs, missing arms, missing legs, extra arms, extra legs, fused fingers, too many fingers, long neck, username, watermark, signature, label, words,over-saturated,multible vehicles,helicopters,bright

SF、サイバーパンク、近未来に走っていそうなスポーツカーを意識しています。
イメージにぴったりな画像でしょ？

実在しそうなスポーツカー

使用したプロンプトを確認する

A realistic illustration of a sports car in Berlin, Germany. Noon time and Rainy weather. Ultra detailed, 8K, HDR, Octane Render, Redshift, Unreal Engine 5. Professionally color graded, atmosphere, amazing depth, rich colors, powerful imagery, psychedelic overtones, 4K, 8K.

3d, cartoon, anime, sketches, (worst quality:2), (low quality:2), (normal quality:2), lowres, normal quality, ((monochrome)), ((grayscale)), skin spots, acnes, skin blemishes, bad anatomy, girl, loli, young, large breasts, red eyes, muscular

現代で走っていそうなスポーツカーです。
ボディの反射光がリアルで、AIで生成した画像とは思えないでしょ？

その他、プロンプトについては沢山の記事で解説しているので、ご参考下さい。

プロンプトに関する記事を確認する

まとめ

今回は、Stable Diffusionの基本的な使い方を紹介しました。
この他にもStable Diffusion WebUIの使い方の記事をアップしているので是非参考にしてみて下さい。

記事の内容をYouTube動画でも公開中です。操作の流れを確認したい場合にご活用ください。

よかったらシェアしてね！

URLをコピーしました！

Stable Diffusion WebUIのtxt2imgの使い方を徹底解説します

txt2imgのパラメーターについて

Sampling method

Hires.fix

Batch count、Batch size

CFG Scale

Seed

Styles

Stable Diffusion WebUIで画像生成する方法

画像生成例・プロンプト紹介

ブロンド女性

サイバーパンクなスポーツカー

実在しそうなスポーツカー

まとめ

コメント

コメントするコメントをキャンセル

Stable Diffusion WebUIのtxt2imgの使い方を徹底解説します

txt2imgのパラメーターについて

Sampling method

Hires.fix

Batch count、Batch size

CFG Scale

Seed

Styles

Stable Diffusion WebUIで画像生成する方法

画像生成例・プロンプト紹介

ブロンド女性

サイバーパンクなスポーツカー

実在しそうなスポーツカー

まとめ

コメント

コメントする コメントをキャンセル

コメントするコメントをキャンセル