Hires. fixの使い方を徹底解説します【Stable Diffusion WebUIで高解像度画像を生成する方法】

Hires. Fixでアップスケールした白い鎧を着た女性のAIイラスト

この記事ではStable Diffusion webUIで使用できるHires. fixの使い方を解説します。

この記事で理解できること
  • Hires. fixの設定値の詳細
  • おすすめアップスケーラーモデル
  • Hires. fixの効果(サンプル画像、生成時間比較)
目次

Hires. fixとは

黒地に赤字のクエスチョンマークの画像

Hires. fixは日本語に訳すと「高解像度補助」です。。
Hires. fixはtxt2imgで使用できる機能で、一度低解像度画像を生成し、その画像に対してアップスケールを行います。

Stable Diffusion webUIで高解像度画像を作成する方法は沢山ありますが、Hires. fixには以下のメリット、デメリットが存在します。

メリット
デメリット
  • 元の画像の構図をある程度維持できる
  • 沢山の画像をアップスケール可能
  • 崩れた顔なども修正可能
  • VRAM使用量が増大する
  • 画像生成時間が増大する

Hires. fixのパラメータについて

Hires. fixの設定はtxt2imgタブのGenerationエリア内の「Hires. fix」をクリックすることで可能になります。

チェックボックスとスライダーで構成されるHires. Fixの設定項目
Hires. Fixの設定項目
Hires. fix

チェックすることでHires. fixが有効化されます。

Upscaler

アップスケーラーモデルを選択します。

モデルがインストールされていない初回生成時は、モデルのダウンロードシーケンスにより画像生成に時間がかかります。

次項で各モデルの効果を紹介します。

Hires steps

Hires. fixのサンプリングステップ数を指定します。

0設定の場合は、「Sampling steps」の値と同じになります。

例:Sampling steps = 20、Hires steps = 0の場合は合計40stepで画像生成されます。
LDSR、ScuNET、SwinIRモデルは例外で別途処理が加わるため処理ステップ数はさらに増大します。

Denoising strength

ノイズ除去強度を設定します。
高いほど綺麗になりますが、構図が元画像から変化します。

おすすめは0.2~0.3の間です。

Denoising strengthの効果を確認する

以下は512 x 512の画像をR-ESRGAN 4x+ Anime6Bで2倍にアップスケールした比較画像です。

城の前で白い鎧を着た女性のAIイラスト
高解像度化前
アップスケール前
城の前で白い鎧を着た女性のAIイラスト
高解像度化後だが、元画像から構図が変化している
Denoising strength0.7
城の前で白い鎧を着た女性のAIイラスト
高解像度化後、構図を維持したままアップスケールできている
Denoising strength0.2

0.7は高すぎで、アップスケール前の画像から大部分が変化してることがわかります。

Upscale by

アップスケール倍率を指定します。
2の場合、2倍の解像度で生成されます。

※Resize width/height toと排他設定です

Resize width to

アップスケール解像度の幅を指定します。

※Upscale byと排他設定です

Resize height to

アップスケール解像度の高さを指定します。

※Upscale byと排他設定です

Hires. fixの生成結果と生成時間について

Hires. fixを使用すると、VRAM使用量と生成時間が増大します。
また使用するアップスケーラーモデルで生成される画像が変化します。

以降では各モデルの画像生成結果とリソース使用状況を紹介します。
(使用するGPUにより結果が大きく異なるので参考程度でお願いします)

画像生成はDenoising strengthを0.25、アップスケール倍率を2で生成しています。

スクロールできます
Upscale
モデル
生成
時間
VRAM
特徴生成画像
無し
(Hires.fix非適用)
2.1sec6GB城の前で白い鎧を着た女性のAIイラスト
Latent8sec6GB標準
Denoising strengthが低いとぼやける
城の前で白い鎧を着た女性のAIイラスト Latent でアップスケールしている
Latent
(antialiased)
8sec6GBアンチエイリアスかけるためか
Denoising strengthが低いとぼやける
城の前で白い鎧を着た女性のAIイラスト Latent (antialiased) でアップスケールしている
Latent
(bicubic)
8sec6GB同上城の前で白い鎧を着た女性のAIイラスト Latent (bicubic) でアップスケールしている
Latent
(bicubic antialiased)
8sec6GB同上城の前で白い鎧を着た女性のAIイラスト Latent (bicubic antialiased) でアップスケールしている
Latent
(nearest)
8sec6GBDenoising strengthが低いとジャギる城の前で白い鎧を着た女性のAIイラスト Latent (nearest) でアップスケールしている
Latent
(nearest-exact)
8sec6GBDenoising strengthが低いとジャギる城の前で白い鎧を着た女性のAIイラスト Latent (nearest-exact) でアップスケールしている
Lanczos9.2sec6GB少し遅い城の前で白い鎧を着た女性のAIイラスト Lanczos でアップスケールしている
Nearest9.2sec6GBすこしジャギる城の前で白い鎧を着た女性のAIイラスト Nearest でアップスケールしている
DAT x217.5sec6GB遅すぎ
すこしぼやける
城の前で白い鎧を着た女性のAIイラスト DAT x2 でアップスケールしている
DAT x317.6sec6GB遅すぎ
すこしぼやける
城の前で白い鎧を着た女性のAIイラスト DAT x3 でアップスケールしている
DAT x417.4sec6GB遅すぎ
すこしぼやける
城の前で白い鎧を着た女性のAIイラスト DAT x4 でアップスケールしている
ESRGAN_4x10.8sec6GB綺麗で使い易い城の前で白い鎧を着た女性のAIイラスト ESRGAN_4x でアップスケールしている
LDSR35.2sec6GBステップ数が多すぎで遅い
色味が少し変化する
城の前で白い鎧を着た女性のAIイラスト LDSR でアップスケールしている
R-ESRGAN 4x10.8sec6GB綺麗
フォトリアル系と相性が良い
城の前で白い鎧を着た女性のAIイラスト R-ESRGAN 4x+でアップスケールしている
R-ESRGAN 4x
+ Anime6B
9.6sec6GB綺麗
イラスト,アニメ系と相性が良い
城の前で白い鎧を着た女性のAIイラスト R-ESRGAN 4x+ Anime6Bでアップスケールしている
ScuNET GAN10sec6GB少しぼやける城の前で白い鎧を着た女性のAIイラスト ScuNET GAN でアップスケールしている
ScuNET PSNR10sec6GB少しぼやける城の前で白い鎧を着た女性のAIイラスト ScuNET PSNR でアップスケールしている
SwinIR_4x14.8sec6GB遅すぎ
綺麗
城の前で白い鎧を着た女性のAIイラスト SwinIR_4x でアップスケールしている
4x-UltraSharp10.7sec6GB細部までくっきり城の前で白い鎧を着た女性のAIイラスト 4x-UltraSharp でアップスケールしている

VRAM使用量はモデル間で特に差はありませんでした。
単純に生成する解像度に影響するようです。

私のおすすめはR-ESRGAN 4x+、R-ESRGAN 4x+ Anime6B、4x-UltraSharpの3つです。
それぞれ特徴が異なるので、生成する画像によって切り替えることをおすすめします。

おすすめアップスケールモデルの大きなサンプル画像を確認する
城の前で白い鎧を着た女性のAIイラスト R-ESRGAN 4x+ でアップスケールしている
R-ESRGAN 4x+
城の前で白い鎧を着た女性のAIイラスト R-ESRGAN 4x+ Anime6B でアップスケールしている
R-ESRGAN 4x+ Anime6B
城の前で白い鎧を着た女性のAIイラスト 4x-UltraSharp でアップスケールしている
4x-UltraSharp

※4x-UltraSharpは標準採用されていません、使用する場合は次項をご確認ください。

Hires. fixにアップスケーラーモデルを追加する方法

4x-UltraSharpなどのモデルは標準採用されていないので、手動でインストールする必要があります。

Hires. fixにアップスケーラーモデルを追加するには、
モデルデータを「webUI」→「models」→「ESRGAN」フォルダに保存します。

アップスケールモデルの保存フォルダを表示している
アップスケールモデルの保存先

おすすめの4x-UltraSharpはHugging Faceで公開されています。

まとめ

今回はStable Diffusion webUIのHires. fixの使い方を紹介しました。

Hires. fixを使用すれば、画像全体のディテールが細かく描写されるので非常に綺麗な画像が生成可能です。
この記事を参考にチャレンジしてみましょう!

よかったらシェアしてね!
  • URLをコピーしました!

この記事を書いた人

IT技術者でありDTMer
EDMの作曲を始めたところ楽しさに気づき、ロック以上にハマっています。
楽器はギターを弾いており、バンドではギタリストとしても活動しています。

コメント

コメントする

目次