Stable Diffusion WebUIでメインとなるtxt2imgの使い方を解説します。
- txt2img内のパラメーター詳細
- 画像生成手順について
- 画像生成例・プロンプト紹介
txt2imgのパラメーターについて
Stable Diffusion WebUIを起動すると「txt2img」が表示されます。
各部を解説していきます。
No | 機能名 | 内容 |
1 | Stable Dissusion checkpoint | モデルの選択を行う |
2 | 機能タブ | 機能の切替を行う |
3 | プロンプト | 生成してほしい画像の特徴を記載する |
4 | ネガティブプロンプト | 生成してほしくない画像の特徴を記載する |
5 | Sampling method | サンプラーの選択 |
6 | Sampling steps | サンプリングステップの設定 |
7 | Restore faces | 画像生成時に顔の修正を実施する |
8 | Tiling | 出力画像をタイルのように並べる |
9 | Hires.fix | 高解像度出力する |
10 | Width | 画像の幅 |
11 | Height | 画像の高さ |
12 | Batch count | バッチ回数(画像の出力枚数) |
13 | Batch size | 1回のバッチで何枚の画像を生成するか |
14 | CFG Scale | どれだけプロンプトに忠実か 低いほどプロンプトに寛容 |
15 | Seed | ランダマイザーシード シード値を設定する |
16 | ランダムボタン | Seedをランダム値である-1に変更する |
17 | Seed固定ボタン | Seedを固定値にする |
18 | Extra | Seedの詳細設定を行う |
19 | Script | スクリプト機能の設定を行う |
No | 機能名 | 内容 |
20 | Genarate | 画像生成開始ボタン |
21 | チェックボタン | 直前に生成したプロンプトを呼び出す |
22 | ゴミ箱ボタン | 入力したプロンプトを削除する |
23 | 花札ボタン | LoRA等のモデルカードを表示する ※1 |
24 | バインダーボタン | 選択したスタイルをプロンプトに反映する ※1 |
25 | フロッピーボタン | 入力したプロンプトを保存する ※1 |
26 | Styles | スタイル選択 |
27 | フォルダボタン | 画像保存フォルダを開く |
28 | Save | 生成した画像を保存する |
29 | Zip | 生成した画像をZipで圧縮する |
30 | Send to img2img | 選択した画像をimg2imgに送る |
31 | Send to inpaint | 選択した画像をinpaintに送る |
32 | Send to extras | 選択した画像をextrasに送る |
※1 Stable Diffusion WebUI Ver1.6以降では表示されません
解り難い機能を少し補足します。
Sampling method
ノイズ除去アルゴリズムを選択します。
と、これだけだと何のこっちゃ解らないですよね。
Stable Dissusionはノイズ画像からノイズを消しながら画像を作っていきます。
この時のノイズ除去方法を選択するわけです。
なので、生成画像に強く影響します。
Sampling stepsはノイズを除去する回数になります。
少なすぎると、ぼやぼやの画像が出来て、高い程鮮明になる傾向ですが画像生成時間が長くなります。
モデルによって最適なサンプラーが異なるので、モデルの推奨サンプラーの使用が無難です。
Hires.fix
生成画像を高解像度化します。
Stable Diffusionのモデルは基本的に512*512サイズで学習されているので、画像生成も基本的には512*512で行います。
(それ以外は生成時間もかかるし、破綻する可能性有り)
だけど512*512だとアイコンくらいにしか使えないよね・・・
そんな時にHires.fix機能を使用します。
Hires. fixについては以下記事で解説しています。
Batch count、Batch size
Batch sizeは1回画像生成するときに何枚同時に処理するかを指定します。
基本的に1で使用することをおすすめします。
数を増やすとその分VRAM容量が必要になります。
Batch countは何回画像生成するかを指定します。
なので私のおすすめは、Batch sizeを「1」にしてBatch countで画像生成枚数を調整します。
Genarateを押した時の、生成画像枚数はBatch count×Batch sizeになるんだね。
バッチサイズとバッチカウントの関係については↓の記事でまとめています。
CFG Scale
プロンプトの規制力を指定します。
値を高くするとプロンプトの影響が高くなるが、出力画像が破綻する可能性も高くなります。
基本的には7で問題ありません。
Seed
画像生成時に使用する乱数のシード値を指定します。
-1を入力するとランダム値となり、生成画像が毎回変化します。
固定値を入力すると、同じ画像が出力されるわけです。
使い方としては、ランダムで沢山画像を出力し、お気に入りの画像が生成されたら、その画像のSeed値で固定して高解像度化する・・・といった手順がおすすめです。
Styles
お気に入りのプロンプトを管理できます。
Stylesついては以下の記事で解説しています。
Stable Diffusion WebUIで画像生成する方法
では、実際に画像生成していきましょう!
以下手順に沿って実行するだけで簡単に出来ますよ。
使用したいモデルを「Stable Dissusion checkpoint」から選択しましょう。
出力したい画像の指定をプロンプトエリアに、
出力したくない画像の指定をネガティブプロンプトエリアに入力していきます。
モデルで推奨されているサンプラーを選択しましょう。
スケジューラについてはAutomaticのままで問題ありません。
選択に迷った場合のおすすめ設定を確認する
- Sampling method
-
Euler a(ほとんどモデルで高画質な画像が生成可能)
- Schedule type
-
Karras(サンプラーと同じくほとんどのモデルで良い結果が得られる)
出力したい画像に合わせて設定してみて下さい。
画像の大きさが構図に影響します。
例えば横長で体全体を出力しようとすると、寝そべった状態になり易いです。
SD1.5ベースモデルであれば512 x 512、
SDXLベースモデルであれば1024×1024が基本解像度になります。
とりあえず20で生成してみましょう。
気に入った画像が出力できたらSeed値を固定して、ステップ数を調整することをおすすめします。
ステップ数を高くすると、画像生成時間も長くなります。
Batch sizeを1、Batch countを一度に生成したい画像の枚数にしましょう。
Genarateボタンを押して画像生成スタート!
Stable Diffusion WebUIのデフォルト設定では生成した画像が全て保存されています。
生成画像の下にあるフォルダボタンを押して、保存したファイルを確認してみましょう。
画像生成例・プロンプト紹介
プロンプトに慣れていない間は何を記載すればよいのかわかりませんよね。
ここからは作例と実際に使用したプロンプトを紹介します。
ブロンド女性
商用利用が可能な「chilled‗remix」というモデルを使って生成しました。
使用したプロンプトを確認する
masterpiece, best quality, ultra high res, (photorealistic:1.4), ((puffy eyes)), looking at viewer,1girl ,upper body, close up of face shot, blonde hair, outdoor, standing, in the street, cute, seductive smile, lustrous skin, white blouse,
サイバーパンクなスポーツカー
使用したプロンプトを確認する
dark photo of single futuristic Metallic texture cyberpunk sports car with futuristic cyberpunk landscape, cinematic concept art,cyberpunk color, masterpiece, rainy day, ray tracking, RTX, intricate, 3d, highly detailed, trending on artstation, 4k,extremely high details, ultra hd, hdr, 8k, extremely high details
SF、サイバーパンク、近未来に走っていそうなスポーツカーを意識しています。
イメージにぴったりな画像でしょ?
実在しそうなスポーツカー
使用したプロンプトを確認する
A realistic illustration of a sports car in Berlin, Germany. Noon time and Rainy weather. Ultra detailed, 8K, HDR, Octane Render, Redshift, Unreal Engine 5. Professionally color graded, atmosphere, amazing depth, rich colors, powerful imagery, psychedelic overtones, 4K, 8K.
現代で走っていそうなスポーツカーです。
ボディの反射光がリアルで、AIで生成した画像とは思えないでしょ?
その他、プロンプトについては沢山の記事で解説しているので、ご参考下さい。
まとめ
今回は、Stable Diffusionの基本的な使い方を紹介しました。
この他にもStable Diffusion WebUIの使い方の記事をアップしているので是非参考にしてみて下さい。
記事の内容をYouTube動画でも公開中です。操作の流れを確認したい場合にご活用ください。
コメント