画像生成AIの「Stable Diffusion」をコマンド操作不要で簡単に使えるソフト「NMKD Stable Diffusion GUI」が 2022/09/20 に大型アップデートしました!
現在の最新版がバージョン 1.4.0 になりました。
↑追記(10/4):最新版 バージョン 1.5.0 が公開されました。情報は後日追記予定。
1.3.1 と比べて更に多くの機能追加や改善が行われ使い勝手が更に向上したので、以下に概要と更新方法を記載します。
なおソフトの概要・詳しい使い方に関してはこちらのページをご参照ください。
入力したテキストから画像を生成したり、自分が描いた落書きに説明テキストを加えれば思い通りの絵に変えたりできるAI「Stable Diffusion」 ↑a sleeping cat in the hot spring (温泉で眠る[…]
Ver. 1.3.1 → Ver 1.4.0 の変更点
※以下要点です。詳しい公式発表はこちら。待望の Masked Inpainting (画像一部変更) 機能や圧倒的な高速化、プロンプト履歴など嬉しい機能が追加されましたね! ฅ/ᐠ˶>ω<˶ᐟ\ฅ
※各機能の詳しい説明はインストール方法の項の次に記載しています。
劇的な高速化
- 画像生成時の待ち時間が大幅に短縮。生成開始までの従来の十数秒の待ち時間が0秒に
↑新しい画像を生成するたびにモデルを再読み込みする従来の内部仕様が変更され、再読み込みの待ち時間が不要に - VRAM 使用量が更に削減され高速化 (特に通常モード)
新機能の追加
- 画像の一部領域だけを指定して、そこだけ描き変えられる機能が追加:Masked Inpainting
- プロンプト履歴機能:以前実行したプロンプトや設定値を履歴から簡単に再入力できる
- プロンプトキュー機能:現在のプロンプトと設定値をリストに追加して後でリスト内を一括実行できる
- ファインチューニングで生成したモデルの読み込み可能形式が追加 (.bin)
↑従来の .ptファイルに加え、HuggingFace の Textual Inversion で作成した .binファイルも利用可能に - 前回のシード値を使用するボタン(Use Previous) / 入力されたシード値欄をリセットするボタン(Reset) の追加
利便性改善・不具合修正
- VRAM使用量の削減により、従来よりも大きなサイズの画像が生成できるように
- 低VRAMモードでも Post-processing (アップスケーリング・顔修復) が利用可能に
-
GFPGAN (顔修復) モデルを 1.4 に更新
- 画像生成の進行状況を示すプログレスバーを追加
-
画像生成終了時にお知らせサウンドを再生、または通知を表示するオプションを追加
-
プロンプト入力欄を2倍の高さに拡張するボタンを追加
- DPI スケーリング が100% 以外のディスプレイでもソフト画面が正常に表示されるように
- 空の「unknown prompt」フォルダが生成される不具合を修正
※グラボ RTX2060 (VRAM:6GB)で、バージョン1.3.1では画像サイズの限界が 640×640 だったところ、本バージョンでは 1280×1280 まで生成できたというコメントもありました。
動作条件 (Ver 1.4.0)
- 動作OS は Windows 10, Windows 11
- 最大 11 GB のディスク空き容量
- Nvidia製GPU が必要
- ★重要★:Windowsのユーザー名に日本語・半角スペースを含まない
ビデオメモリ(VRAM)容量が4GB以上8GB未満の場合は低速低メモリモードで動作可能で、8GB以上であればより多くの機能を利用できる高速モードで動作可能です。
※ユーザー名に日本語・半角スペースが入ってしまっている方は新しいユーザーを作ってそちらにインストールするか、このリンク先の「対処法」の部分をご参照ください。
自分が使用しているGPUの種類やVRAM容量はこちらの方法で確認できます。
チップの種類が「NVIDIA ○○」になっていることをご確認ください。
残念ながら、現時点では「Intel(R) HD Graphics ○○」といった Intel製CPUの内蔵GPUや、AMD製GPUには非対応です。
Ver 1.4.0 以降のインストール・更新方法
※バージョン 1.4.0 時代の説明ですが、それ以降 (バージョン 1.5.0など) も同じ手順でインストール可能です。1.4.0 を最新バージョンに読み替えてご参照ください。
新規に NMKD Stable Diffusion GUI 1.5.0 をインストールする方も、既に旧バージョン(1.2.0 / 1.3.0 / 1.3.1/1.4.0) をインストールしていた方も導入方法は同じです。
ソフト本体にアップデート機能がないため現時点ではもう一度インストールする以外に方法はありません。
新しいフォルダにインストールするので旧バージョンのフォルダ・ソフトは消さなくて大丈夫です。
※環境によってはインストールがうまくいかない場合があります。その場合はこちらを参照↓
画像生成AIの「Stable Diffusion」をコマンド操作不要で使えるソフト「NMKD Stable Diffusion GUI」でインストール時やその後の画像生成がうまくいかないという報告が沢山挙げられていたので対処法を仮まとめ。 […]
ソフト NMKD Stable Diffusion GUI のダウンロード
ダウンロードは次のリンク先から行えます。
リンク:NMKD Stable Diffusion GUI - AI Image Generator
ページの下の方にある「Download Now」をクリックします。
開発者さんのサポート画面になります。サポートしたい場合は赤枠の支払い設定に進み、そうでない場合は青枠部分のリンクをクリックしてダウンロードページに進みます。
Download を押すとダウンロードが始まります。Ver 1.4.0 の容量は約1.69GBです。
NMKD Stable Diffusion GUI のインストール
ダウンロードした.7zファイルを解凍します。(.7z の解凍方法はこちら)
解凍先は任意ですが、日本語名のフォルダ内や深すぎる場所にあるフォルダ内でソフトを実行するとエラーが生じる可能性があるので、ドライブ直下に新しく英語名フォルダを作ってその中で解凍するのがいいかもしれません。
(例:Cドライブ直下に「AI」という名前の新しいフォルダを作り、その中で 7z ファイルを解凍)
HDDよりもSSD上で動作させた方が高速に動くので、ディスク容量に余裕がある場合はSSDドライブに解凍してください。
今回初めて NMKD Stable Diffusion GUI を Windows に入れる方はそのまま次の手順にお進みください。
既に前のバージョンをお持ちの方のうち、操作に少し自信がある場合は以下の手順で Stable Diffusion の巨大なモデルファイルの再ダウンロードを飛ばせるのでインストール時間を大幅短縮できます。
解凍後、中にある「StableDiffusionGui.exe」を起動します。
※画像はバージョン1.4.0のもの。1.5.0以降も起動する対象は同じ。
NMKD Stable Diffusion GUI が起動して、もし次のようなメッセージが表示されたら「OK」をクリックしてください。自動で Installer画面が起動します。
(上記メッセージの代わりに次のようなウェルカムスクリーンが表示されたら右下の「OK」をクリックします。)
Installer画面を起動します (自動で起動した場合は以下の操作は不要です)
画面右上にある「パソコン画面に下矢印」のアイコンをクリックして Installer 画面を開いてください。
Installer 画面の下にある「Install」ボタンを押すと、Installation Status でチェックが付いていない未インストールの物がインストールされます。
※先ほど説明した時短インストール法を行った場合、既に「Stable Diffusion Model File」にチェックが入った状態になっています。
後は Stable Diffusion の面倒な環境構築作業を全部ソフトが自動でやってくれます。
一応ソフトの左下にインストール作業の進捗が表示されます(英語)
注意:環境によっては上記画像のように
という行の表示のまま、インストール作業が全く進んでいないように見えることがあります。
しかし、ちゃんとバックグラウンドでインストールは進んでいるので気長にお待ちください。
1~2分待っているとそのうち「Done.」といった次のメッセージが表示され、ちゃんとインストールが進んでいることがわかります。
時短インストールを行った私の環境ではインストール所要時間が5分以内でした。
ただし新規インストール時は約 4GB のAIモデルデータのダウンロードが必要になるので、お使いのネット回線状況によっては1時間~数時間かかるかもしれません。
インストール完了までは放っておいて大丈夫なのでPCから離れても問題ありません。
全てのインストール作業が終わると再び Installer の画面が表示されます。
画像のようにインストールが必要な項目全てにチェックが入っていればインストール完了です。
右上の×ボタンを押して閉じてください。
インストールが上手くいかなかった場合…
インストール時に発生するエラー一覧とその対処法についてこちらにまとめたのでご参照ください。
※本ページのコメント欄にインストール時に出たエラーメッセージや、インストールが止まったタイミングなど詳細を記載していただければ原因が特定できるかもしれません。
解決は約束できませんが、調べられる範囲でお調べします。(現在、私用で時間が足りないので対応できない場合があります。ご了承ください。)
動作チェック
まず、Prompt に適当なプロンプト 例:「a sleeping silver tabby cat」を入力し、ソフト右下の「Generate!」ボタンをクリックして画像生成を始めてください。
そして 2~3 分ほど待機します。(初回実行時のみ画像生成に時間がかかります)
画像生成に成功するとプレビュー画面に生成された画像が表示されます。サバトラにゃんこ!!ฅ/ᐠ˶>ω<˶ᐟ\ฅ
これで動作チェック完了です。
(怖いねこの画像ばっかり出てきちゃったら、「sleeping」の単語を消して生成すれば安定してかわいいねこちゃんが出てくれるかも)
ソフトの使い方
初めて使う時は
初めて NMKD Stable Diffusion GUI を使う方は基本的な使い方・各設定項目の意味や推奨値・基本機能など一通りまとめた以下のページを必ずご確認ください。
入力したテキストから画像を生成したり、自分が描いた落書きに説明テキストを加えれば思い通りの絵に変えたりできるAI「Stable Diffusion」 ↑a sleeping cat in the hot spring (温泉で眠る[…]
楽しい機能たち
ラクガキを絵画や風景写真に変える
画像(+説明文章)から画像を生成する(img2img)を使ってみたい! という方は以下のページをご覧ください。
画像生成AI「Stable Diffusion」は入力したテキストから画像を生成するだけでなく、画像と説明テキストを入力すればそこから思い通りの画像を生成できる img2img も利用できます。 例えばMSペイントで描いたこん[…]
画像の高画質化・顔修復・シームレス素材化
画像生成AIの「Stable Diffusion」をコマンド操作不要で使えるソフト「NMKD Stable Diffusion GUI」が 2022/09/06 についにバージョン更新…! 現在の最新版がバージョン 1.3.0 になり[…]
アニメ風な別モデルの使用・重み付きプロンプト
画像生成AIの「Stable Diffusion」をコマンド操作不要で使えるソフト「NMKD Stable Diffusion GUI」で利用可能な便利機能をまとめました。 プロンプト中の語句に数値で重み付けできたり Creative[…]
以下、本ページではバージョン1.4.0の新機能に絞って概要や使い方を説明していきます。
画像の一部分だけ描き変え (Masked Inpainting)
Masked Inpainting は画像の一部領域だけを指定して、そこだけ Stable Diffusion に描き変えてもらえる機能です。
手順
まず、描き変えたい画像をソフトで読み込みます。
(ソフトに画像をドラッグ&ドロップ / Load Image ボタン / 画像プレビュー部分で右クリックして「Use as Init Image」)
今回はこちらの画像を描き変えて、花を追加してみたいと思います。
( beautiful moutains and blue sky with clouds, photo というプロンプトで生成させた画像)
次に、このあと描き変える部分に描いて欲しい物をプロンプトに入力します。(例えば many colorful flowers)
そして「Masked Inpainting」にチェックを入れます
そして右下の「Generate!」ボタンを押すと描き変えたい部分を指定できる画面が開きます。
変更したい場所を黒く塗ってください。
塗るペンの大きさは ①「Brush Size」のバーで変更できます。
②「Mask Blur」バーを右にすれば、塗る場所と塗らないところの境界線をぼかしてくれます。
※1:戻るボタンや消しゴムは無いので塗る場所を間違えたら一度この画面を閉じ、再度「Generate!」ボタンを押してやり直してください
※2:画像の下端だけ一部塗れない場所があるので注意
描き変え場所を指定したら「OK」ボタンを押せば画像生成が始まります。
指定した場所だけ花に描き変えられました。
描き変え場所の変更
一度、描き変え領域(マスク)を指定したら次の生成時も同じマスクが指定された状態になります。
別の場所を描き変えたくなった場合は「Reset Mask」ボタンを押してください。
Tips
描き変え元の画像は Stable Diffusion で生成した物だけでなく別の画像でもOKです。(サイズに注意。512×512が推奨)
あるプロンプトで画像を生成した後 Masked Inpainting で一部だけ描き変える時には、もちろん生成時とは別のプロンプトが使用できます。
(今回の例も "beautiful moutains and blue sky with clouds, photo" で生成した写真を一部だけ "many colorful flowers" で描き変えています)
違和感なく一部を描き変えるのはなかなか難しそうです。プロンプト内容や設定値に工夫が必要そうです…!
( Mask Blur 大きめで境界をぼかしてマスクを指定したほうが違和感が減るかも)
外部のペイントソフトでマスクを指定 (未検証)
どうしてもソフト本体のマスク指定機能だと狙った範囲を指定しにくい&やり直しができないので代わりに外部のペイントソフトでマスク指定ができれば便利です。
どうやら画像中の透過度100%の部分を描き変える対象と認識しているみたいなので、あらかじめ描き変えたい場所を外部ソフトで透過度100%で塗りつぶして透過PNGで保存し NMKD Stable Diffusion GUI に読み込ませればその部分がマスクとして認識されそうです。
ただし、透過ピクセルの色情報が消えているとマスクとして読み込めないのでペイントソフト側で画像保存時に別途設定が必要になります。
GIMP および Adobe Photoshop での手順が左記リンク先に記載されていたのでご参照ください。(私はまだ試せていません)
プロンプト履歴機能 (Prompt History)
以前実行したプロンプトや設定値を履歴から呼び出して簡単に再入力できる機能です。
画面右下の時計アイコンのボタンをクリックしてください。
入力したプロンプトの履歴一覧が表示されます。
項目を右クリックすると表示されるメニューから、プロンプトまたはプロンプト&設定値を呼び出すことができます。
Load Prompt Into GUI:プロンプトを呼び出し
Load Prompt And Settings Into GUI:プロンプトと設定値を呼び出し
履歴はソフトを閉じても残るので、別日の履歴も参照できて便利です。
右上のゴミ箱ボタンから履歴を消すこともできます。メニュー項目は以下の通りです。
Delete Selected:チェックボックスで選択された履歴だけ消す
Delete All:すべての履歴を消す
プロンプトキュー機能 (Prompt Queue)
現在のプロンプトと設定値をリストに追加して、後でリスト内を一括実行できる機能です。
画面右下の「+」アイコンのボタンをクリックしてください。
Prompt Queue 画面が表示されたら右上のプロンプト追加ボタンを押すと、今ソフト上で設定していたプロンプトや設定値がキュー(リスト)に追加されます。
次のプロンプトや設定値を追加するには一度この画面を閉じ、ソフトのプロンプト/設定値を変更して再びこの画面を開いてプロンプト追加ボタンを押せばOKです。
キューがある状態で「Generate!」ボタンを押すとメニューが表示されます。
Generate Current Prompt:今ソフト画面上で設定されているプロンプトを実行
Generate Queued Prompts:キューに入れたプロンプトを一括実行
「Generate Queued Prompts」を選べば、キューに登録したプロンプト&設定が一括実行されます。
画像生成後、キューはリセットされます。
(画像生成中にキューに新しい設定値を追加できたら便利なのですが、それはできないようです)
注意
単に複数種類のプロンプトを一括実行したいだけの場合はプロンプトキュー機能は不要で、単純にプロンプト入力欄で複数のプロンプトを改行で区切って入力するだけでOKです。
もう少し詳しい仕様はこちらの「プロンプトの複数入力&実行」で説明しています。
※同一プロンプトで設定値(Sampler や Step数など)だけ変えて複数一括実行したい場合にプロンプトキュー機能をお使いください。
他の人がファインチューニングで生成した独自モデルを読み込む (.pt/.bin ファイル)
※Textual Inversion の .ptファイル・.binファイル をソフトで読み込んで利用する方法です
Textual Inversion により Stable Diffusion をファインチューニングすれば、例えば絵のキャラクターや画風を追加で学習させてそれを基に Stable Diffusion で画像生成を行うことができます。
(利用イメージはこちらを参照)
ただしこの Textual Inversion 自体は NMKD Stable Diffusion GUI で実行することはできず、それどころかGUI操作でファインチューニングが行えるソフトは現時点で無いようです。
自分でファインチューニングすることは難しくても、他の人が作成したモデルを利用することは(本ソフトで)簡単にできるので、以下に手順を記載します。
ファインチューニングファイルの共有場所
We’re on a journey to advance and democratize artificial int…
↑こちらに色々な.binファイル (Textual Inversion Concepts) が掲載されているのでそこからダウンロードして、NMKD Stable Diffusion GUI に読み込ませることができます。
「Models」の一覧から興味のあるモデルのリンクをクリックするとファインチューニングに使用された画像が一覧表示されます。
その画像に写っているものや、その画像のスタイルに基づいた絵を生成させることができます。
モデルのダウンロード方法
例えばこちらの絵文字モデルを例に説明します。ダウンロード先に移動するために「Files and versions」をクリックします。
「learned_embeds.bin」といった .binファイルへのリンクをクリックします。
「download」を押せば .bin ファイルをダウンロードできます。
ダウンロードした .bin ファイルは NMKD Stable Diffusion GUI をインストールしたフォルダの中にある「ExampleConcepts」フォルダに「MyConcepts」的な名前のフォルダを作成してそこに入れておくと、ソフト側から呼び出しやすいです。
(ちなみに「ExampleConcepts」フォルダ内の「Objects」フォルダや「Styles」フォルダには上記サイトに載っていた .bin ファイルのうち185個が収録されています)
モデルの読み込みと利用
次に NMKD Stable Diffusion GUI ソフト側で画面の「Load Concept」ボタンを押して、今ダウンロードした .bin を開いてください。
読み込まれると「Prompt」の下のところに読み込まれた .bin ファイル名が表示されます。
この状態でプロンプトを入力するのですが、アスタリスク「*」が読み込ませた訓練ファイルが表すものを指す文字として使用できます。
今回の場合は学習データが絵文字アイコンなので、「*」は学習した絵文字画像たち(から学んだ概念)を表します。
例えばプロンプトに
と入力すれば絵文字アイコンの笑顔風のものが生成するはずです。
※プロンプト入力後、通常通り画像を生成させればOKです。(img2img でも使えます。)
で、生成された画像がこちら。
なんか怖いもの生まれちゃったよ。
この通り、なかなかモデルに合った画像は生成されません(笑)
もし精度が素晴らしいファインチューニングモデルをご存じの方がいましたら教えていただけるとありがたいです!
※Generate! を押した後、アスタリスクが「 <ファイル名> 」という文字列に変わりますがそのままで大丈夫です。
シード値の便利ボタン
Seed の設定項目欄に2つの便利なボタンが追加されました。
Use Previous
これを押すと、前回使用されたシード値が Seed 欄に自動入力されます。
Reset
Seed 欄が空欄になります。空欄の場合、使用される Seed値はランダムになります。
画像生成終了お知らせサウンド・通知設定
画像生成終了時にお知らせサウンドを再生、または通知を表示するオプションが追加されました。
ソフト画面右上の歯車アイコンボタンから設定画面に行き、一番下の項目「Notify When Image Generation Has Finished」をお好みで変更してください。
Disabled | 何もしない (通知無効) |
Play Sound | 音を再生 |
Show Notification | 通知を表示 |
Play Sound and Show Notification | 音を再生し通知も表示 |
ちなみに通知はこのようにデスクトップ右下に小さく表示されます。