NovelAIのPromptsを収集するWikiです。



よかったらご参加お願いします。GPUによる生成差異の検証

はじめに

  • ゲーミングノートパソコンは絶対に買うな
ノーパソ用はでかいPC用のグラボと型番がすごい似てたりするけど性能は全然違うで。
  • 脳死でRTX4090とか勧めるな
他人の意見に左右されず自分の環境にあったグラボ/PCを買いましょう。

Hello Asuka Benchmark

AUTOMATIC1111版Stable Diffusion WebUI用



あのアスカの画像をBatch count 10にして10枚一気に生成させて
Generateを押して画面にアスカが表視されるまでを計測してください。100%になった瞬間ではありません。
可能であれば自分で編集、ここのコメントやスレに報告していただけると助かります。

アスカ生成用パラメータ


infotext
下記のテキストをコピーして、txt2imgタブのPromptとNegative Promptが空欄の状態で右側にある左下矢印を押すことでも入力できます。
おそらく、Etaは自動的には反映されないので自分で設定する必要があります。Settingsタブ→Sampler Parametersセクション→eta (noise multiplier) for ancestral samplers
masterpiece, best quality, masterpiece, asuka langley sitting cross legged on a chair
Negative prompt: lowres, bad anatomy, bad hands, text, error, missing fingers, extra digit, fewer digits, cropped, worst quality, low quality, normal quality, jpeg artifacts,signature, watermark, username, blurry, artist name
Steps: 28, Sampler: Euler, CFG scale: 12, Seed: 2870305590, Size: 512x512, Model hash: 925997e9, Eta: 0.67, Clip skip: 2, ENSD: 31337

メタ情報付きのアスカ画像や

特に3080,2060,1060,Mobile,そして3060の人はVRAM書いてくれると嬉しい
    • 時間(計測値)はGenerateを押してからアスカが表視されるまでの時間で、Time takenはWebUI中央下部に表示される値です。
    • Time takenは秒単位で記入。不明な場合は時間(計測値)を転記して末尾に.をつけた。ソートすると速い順に並んで楽しい。

結果一覧

参考値(本家・クラウドコンピューティング)



注意

RTX40シリーズの注意事項


補助電源コネクタの異常発熱により融解することがある
NVIDIA公式の調査結果によると、コネクタが完全に挿入されていないことが原因
購入者はコネクタをしっかり差し込み、確認すべき

cudnnライブラリの更新をしないと速度が出ないっぽい。
ローカル高速化メモ

パーツ評

GPU


基本的にGPUの世代が新しく、メモリ帯域幅が多いほど生成が速くなる。
なお、メモリ容量やシェーダー数が多いからと言って速いわけではない(RTX3060が最たる例)。

RTX 2060 6GB以上を推奨。理由はFP16演算が速いから。
ベンチマークの結果もここで3倍程度の壁が出来ている。
将来的にTensorRTによる高速化もありうる、かも。

学習は、処理速度もVRAMもあればあるだけ良い。
VRAM 8GBでも学習できるが解像度が欲しくなる。3060 12GBは評価が高い。

Radeon、Intel Arc、Macでも動作はするが新規購入はお勧めしない。
ケチるんならGeForce GTX 1000番台の中古。ただしRTX系のGPUより数倍遅いし、学習も厳しい。

ちなみにGeForce GTX 600番台(一部の780番等も該当)やTesla K80等のKeplerアーキテクチャより前はCUDAがサポート対象外で使えないので注意。(誰もいないと思うが...)

RAM(メインメモリ)


モデルのマージ、WSL2、学習のいずれかに手を出すなら32GB以上が推奨。
速度はそこまでシビアではない。
RamDisk(仮想メモリ,スワップ領域)はほぼ意味ないが、SuperMergerのためにメモリを余分に(モデル3つ分くらい)積むのはアリ。また、RAMが少ないPCで発生するフリーズし続ける状況を一応回避できる。

生成だけならモデルの容量を小さくすることで節約が可能だし、無料Colabを使ってモデルを小さくする便利なNotebookもある。

生成だけなら8GBでもギリギリ動作するが、モデルデータの読み込み時や初回起動時にPCが一瞬か一定時間フリーズする。

CPU


上位ではCPUがボトルネックになる。
下位はSandyおじさんでも動いてるが多少遅い。DDR3世代だから?GPUの性能がそれほど高くないので間に合ってる?

GPU性能をフルに発揮し、処理中に他の作業がしたいなら、
iGPUつきのCPUにして、ブラウザ等はiGPUに割り振るのがおすすめ。

処理速度が18it/s以下ではほとんど影響しないが、18it/sを超えたあたりから急激にシングルスレッド性能によるボトルネックが出やすくなる
目安としてCinebench R23のシングルコアのスコア×0.0176でそのCPUの最大速度がわかる

ストレージ


1111の起動時間が気になるなら出来るだけ速いNVMeのSSDがおすすめ。
待ってもいいならSATA SSDでも支障はない。
消耗はそこまで問題にならなくなったはず。
総書込量(TBW)を使い切る前に経年劣化で壊れるほうが多い。

バックアップを兼ねて2つ目のストレージを持っておくと安心。
コスパ的なおすすめは6~8TBくらいのHDD。USBの外付けとかでもいいと思う。
速度重視のためにSSDオンリーにするのもいい。
モデルとデータセットについては🤗が受け入れてくれる。
(プロバイダーによっては大容量アップロードで警告が来るらしいので注意?)

個人輸入、保証なし、超高額(960GBが6万円!!)、AMD環境で動作しないのでおすすめしないが、Intel製SSDのOptane 905pもアリかも。
異次元の10000TBを超える耐久性があり、何をしても性能が下がらないので激しい書き込みをする用途にうってつけ。

OS


ガチでやるならLinuxは良い。
Windowsで普段使いするならWSL2も良い。

クラウドとの併用


生成はローカル、学習はクラウドという構成もアリ
  • LoraとHNの学習結果は容量が少ないのでクラウドからダウンロードしやすい
  • 学習中は生成もゲームも出来なくなるし電気代もかかるのでクラウド化は合理的
  • GPU買う前にまず無料Colabを試してみよう ローカルの学習入門

実際の所どれ買えばいいの?

A. お前の予算が許す限りのNVIDIAの上位モデルを買え


以下詳細

A. どれを買うかで迷ってるなら3060 12GBを買え

A. 3050 8GBを検討?

A. 学習するかどうかから考えて買え

中古のグラボ買っても大丈夫?

ゲーミングノートパソコンをお勧めできない理由

ローコストお絵かきAIPCを組む:中古相場とPC自作を使って

高みを目指すのもいいけど、俺と一緒にチープなスリルを味わおうぜ!

中古の1000番台なら

ローエンドGPUのVRAMと画像サイズ

このページへのコメント

最近の学習法はメモリを食わなくても済むみたいな。
3060 12GBで、下手に設定を弄らなくても、
StableTunerで640*640で、
kohya版DBで720*720で、
そしてkohya版LoRAは1024*1024の画像を学習可能だわ。
全て学習終了と、絵の出力まで確認したり

特にkohya版では長方形の解像度でも学習可能なので
VRAMに収まるなら、縦横の比率が変則的なのも入るのが強みね。

0
Posted by 名無し(ID:sfrkRBi+dw) 2023年02月09日(木) 11:02:28 返信数(1) 返信

kohya版DBで768*768も
さっきやり直したら出来た
サイズ的にはここがギリギリみたい

0
Posted by 名無し(ID:sfrkRBi+dw) 2023年02月09日(木) 11:21:19

EVGAの3090 FTW3 16.38s 平均20.10it/Sぐらい Afterburnerでcore+150 Memory+1000

これ以上OC上げると学習でクラッシュすることがあるのでこれが安定して使える限界。VRAMは24GBあると学習時にBatchあげられるので同じ時間での学習結果は全然良くなります。4070Tiと同じ値段で買えるならこっちのほうが学習にはおすすめと思います。

1
Posted by 名無し(ID:gWbmCkbKDw) 2023年01月30日(月) 14:51:12 返信

EVGAの3090 FTW3 16.38s 平均20.10it/Sぐらい Afterburnerでcore+150 Memory+1000

これ以上OC上げると学習でクラッシュすることがあるのでこれが安定して使える限界。VRAMは24GBあると学習時にBatchあげられるので同じ時間での学習結果は全然良くなります。4070Tiと同じ値段で買えるならこっちのほうが学習にはおすすめと思います。

0
Posted by 名無し(ID:gWbmCkbKDw) 2023年01月30日(月) 14:33:13 返信

PC新調の相談です
おすすめのRTX 3060(12GB)でPCを注文しようと考えています
これまでノートCP勢だったので、デスクトップは初です
グラボ以外に注文で気を付ける箇所があれば教えてください
※CPUやマザボ、電源周り等、これを確認しないと失敗するぞ、みたいなの

0
Posted by 名無し(ID:YQEQFjzwpg) 2023年01月30日(月) 13:52:21 返信数(1) 返信

別の場所で質問をしました
マルチポストになってしまうのでこちらは取り下げさます

0
Posted by 名無し(ID:YQEQFjzwpg) 2023年01月30日(月) 15:15:54

もしグラボ欲しいけど高くてためらってる人いたら
RTX2060super(8GB)のバルク品がアキバの某ショップで
今だけ26500円で売ってるよ
性能的には3060の8GB版と捉えていいから値段を考えればありだと思うな

3
Posted by 通りすがりのひと 2023年01月21日(土) 11:56:18 返信

コメントをかく


「http://」を含む投稿は禁止されています。

利用規約をご確認のうえご記入下さい

Menu

Prompts

  1. 非R18詠唱全文
  1. 顔(目・口・表情)
  2. 構図
  3. 場所・背景
  4. 環境表現
  5. 特徴・年齢・体型・髪型
  6. ポーズ集
  7. 服飾
  8. 亜人・モンスター娘・人外
  9. 食品
  10. その他
  11. 画風
  12. 絵文字
  13. 色一覧
  14. 頻用ネガティブプロンプト
  15. 大量検証結果
  16. 整理用倉庫

編集中メニュー

  1. 未発見のプロンプト
  2. 旧ページ

table拡張js

どなたでも編集できます

メンバー募集!