OpenDalleの使い方を紹介します【DALL-E 3のオープンモデルで画像生成】

ドラムセットを叩くカワウソ

はじめに

この記事では、OpenDalleを使ってStable Diffusion WebUIで画像生成する方法を紹介します。

生成された画像の例も掲載しており、実際にどのような画像が生成されるのかを確認できます。

この記事で理解できること
  • OpenDalleの特徴
  • OpenDalleのインストール方法・使い方
目次

OpenDalleとは?

OpenDalleは、DALL-E 3のようなプロンプトに忠実に再現することを目指したモデルです。

DALL-E 3は有料ですが、OpenDalleは名前の通り無料で使用できる点も特徴です。

プロンプトの理解度はSDXLを超えているとされ、DALLE-3 に一歩近づいているようです。

独特なプロンプトを使うことで、今までにないような独特な画像を生成できるよ

DALL-E 3とは?

DALL-E 3は、OpenAIが開発したAIシステムの1つで、自然言語の説明に基づいて現実的な画像やアートを作成できます。

DALL-E 3は、DALL-E 2とChatGPTをベースに構築されたテキストから画像を生成するモデルであり、高度な詳細を理解し、正確な画像を生成できます。

OpenDalleのインストール方法

OpenDalleはcivitaiHugging Faceからダウンロード可能です。

モデルのインストールについては以下の記事で解説しています。

あわせて読みたい
Stable Diffusion WebUIのモデルの入れ方を解説します! みなさんこんにちは!novです。Stable Diffusionで画像生成楽しんでますか? Stable Diffusionは、AIによる画像生成ツールで、モデルを使えば、サムネイルのような画像...

OpenDalleをStable Diffusion WebUIで使ってみた

今回はStable Diffusion WebUI上でOpenDalleを使って画像生成してみました。

Stable Diffusion WebUIをインストールしていない方は、以下の記事で解説しているのでインストールしてみてください。

あわせて読みたい
Stable Diffusion WebUI(AUTOMATIC1111)をローカルPCに導入しよう! この記事では、Stable Diffusion WebUI(AUTOMATIC1111)をローカルPC(Windows)にインストールする方法を紹介します。 記事に沿って作業することで、簡単にStable Diffusi...

公式の推奨設定は以下の通りです。

  • CFGスケール 7~8
  • ステップ数 60~70(早く生成したい場合は35)
  • サンプラー DPM2
  • スケジューラ Karras

特にプロンプトに注目してください。

アイキャッチ画像もOpenDalleで生成しています。

サンタ猫

そりで飛ぶサンタ猫のAI写真
使用したプロンプトを確認する

Cat riding a sleigh and wearing a Santa hat,
sky, sled flying in the sky

サンタを猫で指定したつもりが、トナカイも猫になりました。

今までのSDXL系モデルと比較すると、プロンプトに忠実でお利口な感じがします。

ダンスを踊るおじいさん

暖炉で踊るおじいさんのAI写真
使用したプロンプトを確認する

An old man happily dancing a Cossack dance,
in front of the fireplace

コサックダンスは学習されていないようですが、それ以外はプロンプト通りですね。

ダブルチーズバーガー

チーズバーガーとフレンチフライのAI写真
使用したプロンプトを確認する

Delicious double cheeseburger and french fries

料理の画像もテストしましたが、かなりレベル高いですね。
プロンプトにも忠実です。

ゴーカートに乗るゴリラ

水上を走るゴーカートに乗るゴリラ
使用したプロンプトを確認する

Gorilla enjoying a go-kart,
go kart running on water

非現実的なプロンプトを指定しましたが、バッチリな画像が生成できました。

ITDTMのロゴ

DTMと書かれたサイバーパンクなデザインのロゴ
使用したプロンプトを確認する

((“IT DTM!”)text logo:1), cyberpunk

上のようなプロンプトで、テキストも生成できるのですが・・・テキストの忠実度はそれほど高くないようです。

まとめ

今回はStable Diffusion WebUIでOpenDalleを使う方法を紹介しました。

SDXL系のモデルのようですが、プロンプトに忠実で扱いやすいモデルでした。

SDXL系はあまりプロンプト通りに生成してくれないイメージですが、OpenDalleなら自由自在です。

用途別におすすめモデルを以下記事で紹介しています。

あわせて読みたい
Stable Diffusionのおすすめモデルを用途別に紹介するよ はじめに Stable Diffusionで使用できるおすすめモデルを用途別に紹介していきます。 ※各モデルについて評価ポイントを付けていますが、あくまで私個人の印象です。 こ...
よかったらシェアしてね!
  • URLをコピーしました!
AUTOMATIC1111 Ver1.10と書かれたアイキャッチ画像
  • ついにA1111が高速化されforgeなどと同等に!
  • スケジューラ、サンプラーが新規追加
  • SD3に対応
Ver1.10でさらに万能となったクライアントツール

この記事を書いた人

IT技術者でありDTMer
EDMの作曲を始めたところ楽しさに気づき、ロック以上にハマっています。
楽器はギターを弾いており、バンドではギタリストとしても活動しています。

コメント

コメントする

目次