Stable Diffusion WebUIのtxt2imgの使い方を徹底解説します

ロングヘアー女性のAI写真 how to use txt2imgと記載されている

Stable Diffusion WebUIでメインとなるtxt2imgの使い方を解説します。

この記事で理解できること
  • txt2img内のパラメーター詳細
  • 画像生成手順について
  • 画像生成例・プロンプト紹介
目次

txt2imgのパラメーターについて

Stable Diffusion WebUIを起動すると「txt2img」が表示されます。
各部を解説していきます。

Stable Diffusion WebUI ver1.9の txt2img設定画面
txt2img設定画面

メインエリア

この領域では、画像生成の事前設定を行います。

以下エリアの設定を以降で解説します。

txt2imgの画像生成設定メインエリア
メインエリアのパラメータの詳細を確認する
Stable Diffusion checkpoint

チェックポイントモデルの変更が可能です。

この他LoRAタブの左側にあるCheckpointsタブでは、モデルカードで選択が可能です。

モデルの紹介記事も投稿しているので、合わせてご参考ください。

Prompt

生成してほしい画像の特徴を記載する。

Negative prompt

生成してほしくない画像の特徴を記載する

Generate(ボタン)

ボタンをクリックすると画像生成を開始します。

チェックマーク(ボタン)

クリックすると前回画像生成時の設定を呼び出す。

ゴミ箱(ボタン)

クリックするとPromptとNegative promptの内容をクリアします。

バインダー(ボタン)

クリックすると選択しているstylesをPromptとNegative promptに反映します。

Sampling method

画像生成に使用するサンプラー(ノイズ除去アルゴリズム)を指定します。
サンプラー毎に生成される画像の傾向が変化します。

Schedule type

画像生成に使用するスケジューラ(ステップに対するノイズ量)を指定します。
サンプラーと同じく生成される画像の傾向が変化します。

Sampling steps

サンプリングステップ数を指定する。

ステップ数(ノイズ除去回数)が低いと、ノイズを除去しきれないため低画質な画像が生成される。
逆に高いと高画質になる。

ただし、ステップ数が増えるほど画像生成時間が長くなる。

デフォルトの20stepで生成して、微調整する方法がおすすめです。

Hires.fix

構図を維持して高解像度出力する機能です。

使い方については以下記事で解説しています。

あわせて読みたい
Hires. fixの使い方を徹底解説します【Stable Diffusion WebUIで高解像度画像を生成する方法】 この記事ではStable Diffusion webUIで使用できるHires. fixの使い方を解説します。 この記事で理解できること Hires. fixの設定値の詳細 おすすめアップスケーラーモデ...
Width

生成画像の幅を指定します。

Height

生成画像の高さを指定します。

CFG Scale

プロンプトの規制力を指定します。
値を高くするとプロンプトの影響が高くなるが、出力画像が破綻する可能性も高くなります。

基本的には7で問題ありません。

Batch count

バッチ回数(画像の出力枚数)を指定する。

Batch size

1回のバッチで何枚の画像を生成するか指定する。

Batch countとBatch sizeについては以下記事で詳細を解説しています。

あわせて読みたい
Stable DiffusionのBatch countとBatch sizeを徹底解説します! 今まで何気なくBatch size(バッチサイズ)とBatch count(バッチカウント)を設定していませんでしたか? 僕もその一人です! 今回の記事はStable Diffusion WebUI(AUTOMAT...
Seed

画像生成時に使用する乱数のシード値を指定します。

-1を入力するとランダム値となり、生成画像が毎回変化します。
固定値を入力すると、同じ画像が出力されます。

右に表示されている「Extra」をチェックするとSeedの詳細設定が可能です。

Upscale

生成画像を高解像度化する機能です。

Script

画像生成スクリプト機能が使用可能です。

バッチ処理中にプロンプトを切り替えたり、設定項目を切り替える、といった機能が使えます。

stylesエリア

stylesはプロンプトのテンプレート機能です。
(プロンプトのパターンを保存可能)

stylesは以下画像エリアを指します。

styles機能をフォーカスしている
styles

stylesの使い方については以下記事で解説しています。

あわせて読みたい
Stable Diffusionでプロンプトを保存する方法を解説します【styles機能の使い方】 Stable Diffusion WebUIでお気に入りの画像が作成できた場合、プロンプトを保存して再使用したり管理出来たら便利ですよね。 と、いうことで今回はStable Diffusion Web...

生成画像エリア

Stable Diffusion WebUIでは生成した画像に対して後処理を行うことが科可能です。

生成画像エリアには、後処理の機能がボタンで用意されています。

生成画像に対する機能がボタンで用意されている
後処理を行うボタン類
各ボタンの詳細を確認する

画像左側のボタンから順に列挙します。

フォルダ(ボタン)

クリックすると生成画像保存フォルダを開く。

フロッピー(ボタン)

クリックすると生成した画像を保存します。

zip(ボタン)

生成した画像をzipファイルに圧縮します。

send to img2img(ボタン)

選択した画像をimg2imgに送ります。

Send to inpaint(ボタン)

選択した画像をinpaintに送ります。

Send to extras(ボタン)

選択した画像をextrasに送ります。

改善(ボタン)

複数画像を生成した場合に、選択した画像にのみHires. fixを実行する。

ボタン押した時点でのHires. fixの設定が適用されます。

Stable Diffusion WebUIで画像生成する方法

では、実際に画像生成していきましょう!
以下手順に沿って実行するだけで簡単に出来ますよ。

STEP
モデルの選択

使用したいモデルを「Stable Dissusion checkpoint」から選択しましょう。

チェックポイント選択部にフォーカスしている
STEP
プロンプトの入力

出力したい画像の指定をプロンプトエリアに、
出力したくない画像の指定をネガティブプロンプトエリアに入力していきます。

プロンプトとネガティブプロンプト入力部にフォーカスしている
STEP
Sampling method、Schedule typeの選択

モデルで推奨されているサンプラーを選択しましょう。

スケジューラについてはAutomaticのままで問題ありません。

サンプラーとスケジューラのリストボックスを表示している
選択に迷った場合のおすすめ設定を確認する
Sampling method

Euler a(ほとんどモデルで高画質な画像が生成可能)

Schedule type

Karras(サンプラーと同じくほとんどのモデルで良い結果が得られる)

STEP
幅と高さの指定
幅と高さ設定部にフォーカスしている

出力したい画像に合わせて設定してみて下さい。
画像の大きさが構図に影響します。

例えば横長で体全体を出力しようとすると、寝そべった状態になり易いです。

SD1.5ベースモデルであれば512 x 512、
SDXLベースモデルであれば1024×1024が基本解像度になります。

推奨解像度を確認する
  • 512 x 512(1:1)
  • 768 x 768(1:1)
  • 768x 576(4:3)
  • 576 x 768(3:4)
STEP
Sampling steps数の指定
サンプリングステップ設定部にフォーカスしている

とりあえず20で生成してみましょう。
気に入った画像が出力できたらSeed値を固定して、ステップ数を調整することをおすすめします。

ステップ数を高くすると、画像生成時間も長くなります。

STEP
バッチ数の指定
バッチサイズとバッチカウント設定部にフォーカスしている

Batch sizeを1、Batch countを一度に生成したい画像の枚数にしましょう。

STEP
画像生成開始

Genarateボタンを押して画像生成スタート!

Generateボタンクリックを誘導している
STEP
保存した画像を確認してみよう

Stable Diffusion WebUIのデフォルト設定では生成した画像が全て保存されています。
生成画像の下にあるフォルダボタンを押して、保存したファイルを確認してみましょう。

フォルダボタンをクリックするよう促している

画像生成例・プロンプト紹介

プロンプトに慣れていない間は何を記載すればよいのかわかりませんよね。

ここからは作例と実際に使用したプロンプトを紹介します。

ブロンド女性

商用利用が可能な「chilled‗remix」というモデルを使って生成しました。

ブロンド女性のバストアップAI生成画像
木々の生えた公園で立っている
使用したプロンプトを確認する
masterpiece, best quality, ultra high res, (photorealistic:1.4), ((puffy eyes)), looking at viewer,1girl ,upper body, close up of face shot, blonde hair, outdoor, standing, in the street, cute, seductive smile, lustrous skin, white blouse,

サイバーパンクなスポーツカー

近未来なスポーツカーのAI生成画像
近未来なビルが建っている
使用したプロンプトを確認する
dark photo of single futuristic Metallic texture cyberpunk sports car with futuristic cyberpunk landscape, cinematic concept art,cyberpunk color, masterpiece, rainy day, ray tracking, RTX, intricate, 3d, highly detailed, trending on artstation, 4k,extremely high details, ultra hd, hdr, 8k, extremely high details

SF、サイバーパンク、近未来に走っていそうなスポーツカーを意識しています。
イメージにぴったりな画像でしょ?

実在しそうなスポーツカー

黄色の現代的なスポーツカーのAI生成画像
雨の降った自動車道で止まっている
使用したプロンプトを確認する
A realistic illustration of a sports car in Berlin, Germany. Noon time and Rainy weather. Ultra detailed, 8K, HDR, Octane Render, Redshift, Unreal Engine 5. Professionally color graded, atmosphere, amazing depth, rich colors, powerful imagery, psychedelic overtones, 4K, 8K.

現代で走っていそうなスポーツカーです。
ボディの反射光がリアルで、AIで生成した画像とは思えないでしょ?

その他、プロンプトについては沢山の記事で解説しているので、ご参考下さい。

まとめ

今回は、Stable Diffusionの基本的な使い方を紹介しました。
この他にもStable Diffusion WebUIの使い方の記事をアップしているので是非参考にしてみて下さい。

記事の内容をYouTube動画でも公開中です。操作の流れを確認したい場合にご活用ください。

よかったらシェアしてね!
  • URLをコピーしました!

この記事を書いた人

IT技術者でありDTMer
EDMの作曲を始めたところ楽しさに気づき、ロック以上にハマっています。
楽器はギターを弾いており、バンドではギタリストとしても活動しています。

コメント

コメントする

目次