入力したテキストから画像を生成したり、自分が描いた落書きに説明テキストを加えれば思い通りの絵に変えたりできるAI「Stable Diffusion」
↑a sleeping cat in the hot spring (温泉で眠るにゃんこ) というテキストから自動生成した写真🐱
これを自分のPCで実行できれば、無料で好きな絵や画像を好きなだけ作れます。
(既に Stable Diffusion をオンラインかつコマンド操作不要で利用できるサービスはありますが、一定枚数以上は有料だったり生成速度が遅かったりと制限もあります)
従来は Windows でのローカル実行には煩雑なインストール作業とコマンドによる Stable Diffusion 操作が必須でしたが、有志によりコマンド操作不要で簡単にインストール&使用できるGUIツールが開発されました!
NMKD Stable Diffusion GUI という Windows 用ソフトウェアです。本当にありがたい…!!
以下、インストール手順やソフトウェアの使い方、一緒に使うと便利なツールやサイトについて記載します。
(※既に Stable Diffusion の動作環境を別手順で構築済みでもこちらのソフトはインストール&同居可能です。)
最新版ソフトのインストール方法
現在の最新版はバージョン 1.4.0 です。(2022/09/22) 2022/10/04 にバージョン 1.5.0 が公開されました。
最新版ではインストールが簡単になったほか動作条件が緩和されより多くの環境で使用できるため、最新版の使用を強くおすすめします。
NMKD Stable Diffusion GUI 1.4.0 のダウンロード・インストール方法をこちらにまとめたので、これから初めてインストールする方はまずこちらをお読みください。
画像生成AIの「Stable Diffusion」をコマンド操作不要で簡単に使えるソフト「NMKD Stable Diffusion GUI」が 2022/09/20 に大型アップデートしました! 現在の最新版がバージョン 1.4.0[…]
既に 旧バージョンをお使いの方も上記ページの手順で簡単に更新(追加インストール)できます。所要時間は最短5分です。
※以下の旧バージョンのインストール方法は新バージョンが動作しない環境のための補足情報なので、必要な方以外は飛ばして次の「NMKD Stable Diffusion GUI の使い方」までスクロールしてください。
(旧バージョンの動作条件)
※最新版の動作条件は上記ページをご参照ください。
(旧バージョン:Ver 1.2.0 のインストール方法)
何らかの事情で旧バージョンを使いたい場合の手順説明です。基本的に最新版をお使いください。
※本ページに記載されていた旧情報が必要な場合は、こちらのアーカイブをご参照ください。
NMKD Stable Diffusion GUI の使い方
まずは1回使ってみる (動作チェック)
Prompt のところが画像生成に使うテキストです。(ユーモアを交えて「呪文」と呼ばれることもあります)
Prompt は英語で記述します。
ここに「a sleeping red tabby cat」(眠っている茶トラ猫)と入力し、右下の「Generate!」(生成!)ボタンを押すと画像の生成が始まります。
生成中は右下に進捗バーが表示されるので少し待ちます。
生成が完了すると無事にゃんこ画像が表示されました!!ฅ/ᐠ˶>ω<˶ᐟ\ฅ
右下のフォルダマークのボタンをクリックすれば、画像の保存先フォルダを開けます。
(怖いねこ画像になってしまった場合は、「sleeping」 の語句を消せばかわいいねこちゃんが安定して出せるかもしれません…!)
画像を生成してくれない場合…
詳細はこちらのエラー一覧ページをご参照ください。
画像が緑一色・黒一色になり正しく生成されない場合…
各項目の要点
※各設定項目やボタンについては次の項で詳しく説明します。ここでは要点だけ。
- Load Image ボタン:絵や画像の読み込み
(自分が描いた絵などから Prompt で指示したスタイルで新しい画像を生成できる機能「img2img」用) - Amount Of Images To Generate:生成したい画像の枚数
- Detail (Steps):画像生成に費やすステップ数。多いほど結果が良くなりやすいが時間がかかる
- Creativeness (Guidance Scale):大きくするほどpromptで指示したテキストをより正確に表す画像が得られる。
※低いほどpromptに関係ない要素が含まれやすくなるが、その分「クリエイティブ」な画像になる - Resolution (Width x Height):生成したい画像のサイズ (幅×高さ)。大きくしすぎるとVRAM不足で画像が生成されないことも。
あと、表示されている画像を右クリックすれば便利なメニューを呼び出せます。
(画像をコピー、シード値をコピー、今表示している画像を img2img に使う など)
Stable Diffusion と一緒に使うと便利なツールたち (Pick Up)
結局はどんなプロンプトを入力するかが鍵になるので、以下のサービスを利用したり検索かけて情報を集めたりなど…!
(以下、一部ツールのみピックアップしました。今後これ以外の便利なものも含めてまとめ、使い方を説明する予定です)
Lexica
リンク:Lexica
Promptの入力例を検索できるサイト。
Promptに入れたい文字列で検索をかけると、それを含むPromptで実際に生成された画像と使用されたPrompt全文が表示される。
自分が作りたいスタイルの画像が見つかればPromptを参考にできる。
PromptMANIA Prompt Builder
Start using the best prompt builder for Stable Diffusion - i…
メインのプロンプトを簡単に入力した後、ベースになるスタイルや追加したいスタイルを表示される画像を見ながら押していけばプロンプトを組み立ててくれる。
いつものプロンプトに何かスタイルを加えて工夫したい時などに使える。
(プロンプトのコピーは下の方にある「Copy it」ボタンから)
Stable Diffusion Akashic Records
A compendium of informations regarding Stable Diffusion (SD)…
※サービスというか情報源
Stable Diffusion関連の情報が大量にまとめられたリンク集。(随時更新される)
特に「Studies」(研究)の項にはStep数を段階的に変えた時の生成画像の変化や、プロンプトに使う区切り文字(カンマやコロンなど)の変更による影響など、プロンプトや設定パラメータが生成画像に及ぼす影響の調査実験がまとまっておりStable Diffusionの挙動を知るのに有効。
画像から画像を生成したい
概要
Stable Diffusionでは文章から画像を生成するだけでなく、画像(+説明文章)から画像を生成することもできます。(img2img)
自分の描いた適当な落書きをAIが自動で清書! なんて夢のようなこともできちゃいます。
例えばMSペイントで描いたこんな適当な落書きから
こんな感じに綺麗な写真を生成させることができます。
方法
詳しい方法を以下ページに記載しました
画像生成AI「Stable Diffusion」は入力したテキストから画像を生成するだけでなく、画像と説明テキストを入力すればそこから思い通りの画像を生成できる img2img も利用できます。 例えばMSペイントで描いたこん[…]
特に、落書きを(絵ではなく)写真に変換するためにはひと工夫必要(img2imgの複数回適用など)なので、詳しい方法は上記ページをご確認ください。
(以下、簡易説明です)
- 元の絵(画像)を512×512のサイズで用意
- 「Load Image」ボタンを押し、用意した画像を読み込む
- 用意した画像に映っている物や、画像をどのようなスタイルに変えたいかなどをプロンプトに入力する
- その他の設定値を調整。画像独自の設定値は「Init Image Strength (Influence)」
- Generate! ボタンを押して生成
Init Image Strength (Influence) について
これが大きいほど、与えた画像の影響を強く受けた画像が生成します。(大きすぎると与えた画像とほぼ変わらない出力になります)
小さければ、元の絵からアレンジされた(元の絵と離れた)ものになるので、テキトーな落書きを良さげに化かすには小さい値のほうがおすすめです。(0.150など)
0.025~1.000 までの範囲で調節できます。
画像を繰り返し img2img
できた画像を右クリックして「Use as Init Image」を選べば、その画像を読み込んでまた同じことができます。
ソフト各機能や設定値の説明
画像生成パラメータ
※画像は旧バージョンの物なので、一部見た目が異なる箇所があります。
Prompt
画像の生成に使うプロンプト(呪文)。思い通りの絵を生成させるためには生成させたい画像をできるかぎり具体的に詳しく表す文章にする必要がある。
良さげなプロンプトの例や作成のコツは検索すればたくさん出てくるはずなので詳しくはそちら参照。
Amount Of Images To Generate
生成する画像の枚数を指定できる。
最初は数枚~十数枚の画像を生成させながらプロンプトの出来をチェック。
ある程度良いプロンプトが用意できたと思ったら、あとは数十枚~数百枚単位で大量に作って良さげな画像を選別する作業に入る。
(プロンプトによって難易度がかなり異なりますが、自分の場合はだいたい100枚あたり5枚くらい良さげな画像ができればOK!くらいの感じでやっています)
Detail (Steps)
画像生成に費やすステップ数。多いほど結果が良くなりやすいが生成に時間がかかる。
おすすめのステップ数は 50
Stable Diffusion のデフォルトのStep数が50 なので、とりあえず50にしてみて後で速度・品質のどちらをとるかに応じて上げ下げすればOK。
↑デフォルトの設定値についてはStable DiffusionのGitHubリポジトリのREADME.mdに記載されている。
Creativeness (Guidance Scale)
値が大きければプロンプトで指示したテキストにより忠実な画像が得られる。(ただし大きすぎるととんでもないことになる)
逆に小さくするほどプロンプトに関係ない要素が含まれやすくなるが、その分「クリエイティブ」な画像になる。
おすすめの値は 7.5
これも Stable Diffusion のデフォルト値。
Stable Diffusion の利用解説記事によると、7~8.5 の範囲にするのが良いらしい。
値を大きくするほどちゃんとした画像に収束するまでに必要なStep数が増えるので注意。
Seed
(プロンプトや各パラメータが同じ状態で) Seedが同じ値なら同じ画像が生成される。
つまり他の人が自分と全く同じプロンプト・各設定でSeedも同じ値にすれば、同一の画像を生成できる。
よって、このSeedやその他条件を含めて記録しておけば自分の画像がStable Diffusionで生成したものであることを示すこともできる。
※デフォルトの空欄状態ではランダム指定なので、勝手にSeedの値を変えて画像を生成してくれている。
なお、一度に複数枚の画像をソフトで生成したときはSeed値が連番になる。
(次に再びGenerate!を押すとまた別のランダムなSeed値から始まる連番になる)
Resolution (Width x Height)
生成したい画像のサイズ (幅×高さ)。
推奨値は 512×512
大きくしすぎるとご使用のグラフィックボードによってはVRAM不足で画像が生成されない。
値は64刻みで指定可能。
Sampler
Step数を増やしていけば生成される画像はいずれ特定の見た目に収束するが(多分)、各Samplerごとに収束までの速度や収束過程の画像が異なる。
指定可能な8つのSampler (k_euler_a, k_euler, k_lms, ddim, plms, k_heun, k_dpm_2, k_dpm_2_a) ごとに生成画像を比較した画像表があるので以下のリンクを参考に。
8サンプラーの生成画像を9種類のプロンプトで、Step数50, 64, 200 で比較
リンク:画像
ソフト側の初期設定は k_euler_a で、Stable Diffusion での初期値は plms。
収束が速ければ少ないステップ数でもpromptに近い内容の画像が生成されやすくなるので速度重視の場合はいいのかも。
ただ収束前であっても良い感じの画像が得られることがたくさんあるので収束速度は絶対ではない。
結局Sampler選びは好みになるかも。(しかも生成させる絵によって傾向が全然異なる)
なおソフトでは k_euler_a が推奨されています。比較的少ないステップ数でも良さげな画像が生成されやすいと思います。
※以上ざっくり記載しましたが、全く厳密な説明になっていないのでその点をお詫び申し上げます。
(肝心な技術仕様を何一つ理解できていない。例えば diffusion model の要点 とか前提知識なんだろうけど何一つ知らない…。)
画像右クリックメニュー
項目名 | 機能 |
Open File | 画像を(フォトビューアなどで)開く |
Open Output Folder | 画像の生成先フォルダを開く |
Copy Image | 画像をクリップボードにコピーする |
Copy Seed | その画像の生成時に設定されていたSeed値をコピー |
Use as Init Image | 画像を img2img 用に設定 |
もっと便利な/楽しい機能
本ページにまとめきれなかった機能たちは以下のページにまとめました!
画像の高画質化・顔修復・シームレス素材化
画像生成AIの「Stable Diffusion」をコマンド操作不要で使えるソフト「NMKD Stable Diffusion GUI」が 2022/09/06 についにバージョン更新…! 現在の最新版がバージョン 1.3.0 になり[…]
アニメ風な別モデルの使用・重み付きプロンプト
画像生成AIの「Stable Diffusion」をコマンド操作不要で使えるソフト「NMKD Stable Diffusion GUI」で利用可能な便利機能をまとめました。 プロンプト中の語句に数値で重み付けできたり Creative[…]
動物キャラ用モデルでかわいいマスコットキャラを作る
画像生成AIの「Stable Diffusion」で人間キャラクターを作成した例はたくさん見かけますが、動物キャラクターは情報が非常に少ないのでこちらに方法をまとめました。 かわいい動物キャラクター・マスコット・ケモノキャラを生成させ[…]
情報源
※本ページもソフト側のバージョンアップに合わせて随時更新 って感じなので、現時点で不足している情報や最新情報などは以下リンクをご参照ください(英語)
ソフト公式ページ
リンク:NMKD Stable Diffusion GUI - AI Image Generator
↓開発者さん本人が随時情報を更新しています。
リンク(Ver. 1.4.0):NMKD Stable Diffusion GUI 1.4.0 is here!
リンク(Ver. 1.3.0):My Stable Diffusion GUI update 1.3.0 is out now!
リンク(Ver. 1.2.0):My easy-to-install Windows GUI for Stable Diffusion is ready for a beta release!
開発者さんのDiscordサーバー
リンク:NMKD Software
GitHub リポジトリ
リンク:text2image-gui
※オープンソースソフトウェアです。
その他感じたことなど
- Stable Diffusion の公開直後はコマンド入力でずっと画像を生成させていたけど、1週間も経たないうちにGUIで簡単に操作できるソフトが出現して驚き…!!
- そして次々色々な技術が増え続けて、今はもう完全に追いきれていないです…!
- 少し前に手動でStable Diffusionのファインチューニングをやっていたので、NMKD Stable Diffusion GUI でも機能追加で対応してくれたら嬉しい! (適用ではなく訓練の方)