| RTX 2070 SUPER | 8GB | Ryzen 7 5800X | | 23.63 | --xformers --opt-channelslast | WSL2, Torch2.0, モデルコンパイル有効 Batch Count5, Batch size 2 OCすると22.83s | 編集 |
| RTX 2070 SUPER | 8GB | Ryzen 7 5800X | | 26.93 | --xformers --opt-channelslast | WSL2, Torch2.0, モデルコンパイル有効 WSL2にしてもコンパイル無しでは早くならない上コンパイルが遅いので無意味 | 編集 |
| RTX 4070 Ti | 12GB | Ryzen7 5800X | | 15.65 | --xformers --opt-channelslast | Batch Count 2、Batch Size 5 | 編集 |
| RTX 4090 | 24GB | Core i5-13600KF | 9 | 9.14 | --xformers --opt-channelslast --no-half-vae | Batch Count 2、Batch Size 5 | 編集 |
| RTX 4080 | 16GB | Core i7-13700F | 13 | 12.35 | xformers opt-channelslast | Batch Count 2、Batch Size 5 cudnn8.7.0に置き換える前は21秒くらいだった | 編集 |
| RTX3080Laptop | 16GB | Ryzen9 5900HX | | 29.29 | --xformers | ノートPC Lenovo Legion760 2021年モデル Windows10 メモリ32gb | 編集 |
| RTX 3090TI | 24GB | Ryzen 9 7950X | | 17.95 | --xformers --autolaunch --opt-channelslast --no-half-vae | WIN 10, mem 64gb, torch: 1.13.1+cu117,xformers: 0.0.16rc425 | 編集 |
| RTX 3060 | 12GB | Core i5-7200U | 36 | 36.36 | --xformers --no-half-vae --optchannelslast | Core clock+223MHz, Memory clock+400MHz, Batch count 2, Batch size 5, live preview&gridなし, torch: 1.13.1+cu117 eGPU環境でRAM 8GB。おま環との戦いだが、生成速度はCPU関係ないらしい。モデル読み込み時にCPUとメモリの不足により30秒以上を要する。 | 編集 |
| RTX 4090 | 24GB | Core i7-12700K | 8 | 8.73 | --xformers --opt-channelslast --no-half-vae | PL70% + Core clock+150MHz, Batch count 2, Batch size 5, live preview&gridなし, torch: 1.13.1+cu117, cudnn 8.6 | 編集 |
| RTX 3080 | 10GB | Core i7-12700K | 17 | 17.95 | --xformers --opt-channelslast --no-half-vae | PL85% + Core clock+120MHz, Batch count 2, Batch size 5, gridなし, torch: 1.13.1+cu117とcudnn 8.6で早くなったかもしれない | 編集 |
| RTX 3060 | 12GB | Ryzen 9 3900XT | | 42.47 | --opt-channelslast --xformers | プレビュー:Approx cheap。4Stepごと。Torch active/reserved: 2521/2868 MiB, Sys VRAM: 5173/12288 MiB。プレビューなしで41.11s。--xformersのみで45.65s(--opt-channelslast効き目あり?) | 編集 |
| RTX 3090 | 24GB | Core i7-12700K | 18秒 | 17.16 | --xformers --opt-channelslast --administrator | Windows11・メモリ128GB・WSL2(Ubuntu22.04)・ブラウザはWin11のEdge環境 torch: 1.13.1+cu117,xformers: 0.0.16rc425 | 編集 |
| RTX 2070 SUPER | 8GB | Ryzen 7 5800X | | 28.77 | xformers opt-channelslast | pytorch2.0に更新したが言うほど速くならなかった。OCすると26.22s batch count 5 batch size 2 | 編集 |
| GT 1030 | 2GB | Ryzen 5 5600G | 26分 | 1550.21 | --lowvram | マザボ側HDMIから画面出力、GT1030はGDDR5でファンレス | 編集 |
| RX 6700XT | 12GB | Core i5-13600KF | 47.6秒 | 47.09 | | ubuntu22.04, ROCm 5.2, RAM32GB, GPU定格, CPU電力制限@160W | 編集 |
| RTX 3090 | 24GB | Core i9-10900K | 19秒 | 17.74 | xformers opt-channelslast no-half-vae | Batch Count 5 Batch Size 2, Windows10 WSL2 RAM 32GB AfterBurnerで低電圧化 1620MHz @0.7v | 編集 |
| RTX 3090 | 24GB | Core i9-10900K | 20秒 | 19.88 | xformers opt-channelslast no-half-vae | Batch Count 10 Batch Size 1, Windows10 WSL2 RAM 32GB AfterBurnerで低電圧化 1620MHz @0.7v | 編集 |
| RTX 3080 | 10GB | Core i7-8700K | 19秒 | 19.31 | --xformers --opt-channelslast | BatchCount 2 BatchSize 5 RAM 24GB PL80% | 編集 |
| RTX 4090 | 24GB | Ryzen 9 3900X | 16秒 | 15.47 | xformers opt-channelslast | GPUを電力制限70%で実行してもTime takenはほぼ変わらず誤差の範囲。 | 編集 |
| RTX 4090 | 24GB | Ryzen 9 3900X | 10.8秒 | 10.17 | xformers opt-channelslast | Batch Count 5、Batch Size 2 | 編集 |
| RTX 4090 | 24GB | Ryzen 9 3900X | 10秒 | 9.11 | xformers opt-channelslast | Batch Count 2、Batch Size 5 | 編集 |
| RTX 4090 | 24GB | Ryzen 7 5800X | 12.29秒 | 10 | xformers opt-channelslast | Batch Count 2、Batch Size 5 | 編集 |
| RTX 2080Ti | 11GB | Core i9-9900K | 28.09秒 | 26.79 | --xformers --opt-channelslast | WSL2 | 編集 |
| GTX 1060 | 6GB | Core i7-12700K | 6分34秒 | 394. | --xformers --no-half --no-half-vae | | 編集 |
| GTX 1060 | 6GB | Core i7-12700K | 7分51秒 | 471. | --xformers | | 編集 |
| RTX 2060 | 12GB | Xeon E5-2650 v2 | 37.13 | 36.24 | xformers gradio-img2img-tool color-sketch deepdanbooru autolaunch | Batch Count 2, Batch Size 5 | 編集 |
| RTX 2070 SUPER | 8GB | Ryzen 7 5800X | | 28.35 | --xformers --opt-channelslast | ライブラリ更新(torch1.12.1+cu116,torchvision0.13.1+cu116) Batch count 5, Batch size 2 | 編集 |
| RTX 2060 | 12GB | Core i7-8700K | 38秒 | 38 | xformers | Windows11 メモリ32GB anaconda3 | 編集 |
| Radeon VII | 16GB | Ryzen 9 3900X | 57秒 | 56.24 | | ubuntu 22.04, ROCm 5.2 | 編集 |
| RTX 3050 | 8GB | Core i5-8400 | 1分5秒 | 65.21 | xformers | | 編集 |
| RTX A4000 | 16GB | Ryzen 7 3700X | 23.56秒 | 22.83 | --xformers --opt-channelslast --opt-split-attention | WSL2環境でBatch Count 2、Batch Size 5、Windowsよりちょっと速くなる | 編集 |
| RTX A4000 | 16GB | Ryzen 7 3700X | 29.25秒 | 28.76 | --xformers --opt-channelslast --opt-split-attention | WSL2環境、特に速度変わらず。 | 編集 |
| RTX 3080Ti | 12GB | Core i5-1135G7 | 41秒 | 39.19 | --listen --port 7860 --allow-code --deepdanbooru --xformers --enable-insecure-extension-access --api | Windows11 メモリ32GB Docker版WebUI WSL2(Ubuntu22.04)からの起動 ノートPC+USB4経由のegpuとか言う変態仕様なので参考レベルに(真似は強く非推奨)、egpuはおま環との戦い | 編集 |
| RTX A4000 | 16GB | Ryzen 7 3700X | 24.32秒 | 23.57 | --xformers --opt-channelslast --opt-split-attention --gradio-img2img-tool=color-sketch | Batch Count 2、Batch Size 5 | 編集 |
| RTX A4000 | 16GB | Ryzen 7 3700X | 29.31秒 | 28.49 | --xformers --opt-channelslast --opt-split-attention --gradio-img2img-tool=color-sketch | 下のGTX1080から載せ替え A4000はRTX3070Tiのダウンクロック版 | 編集 |
| RTX 4090 | 24GB | Core i9-13900K | 9秒 | 7.83 | xformers opt-channelslast | Batch Count 2、Batch Size 5 | 編集 |
| RTX 4090 | 24GB | Core i9-13900K | 9秒 | 8.18 | xformers opt-channelslast | Batch Count 5、Batch Size 2 | 編集 |
| RTX 4090 | 24GB | Ryzen 9 7950X | 10秒 | 9.33 | xformers opt-channelslast | Batch Count 2、Batch Size 5 並列処理サイズを大きくしてもあまり意味がない? | 編集 |
| RTX 4090 | 24GB | Ryzen 9 7950X | 10秒 | 9.58 | xformers opt-channelslast | Batch Count 5、Batch Size 2 | 編集 |
| RTX 4090 | 24GB | Ryzen 9 7950X | 12秒 | 11.81 | xformers opt-channelslast | | 編集 |
| RTX 4090 | 24GB | Core i9-13900K | 11秒 | 9.41 | xformers opt-channelslast | | 編集 |
| RTX 4080 | 16GB | Core i9-13900KF | 13秒75 | 13.23 | xformers opt-channelslast | Windows10 Batch count10 Batch size1 メモリはDDR5 | 編集 |
| RTX3060 | 12GB | Core i7-12700K | 38秒 | 37.73 | --xformers --opt-channelslast | Windows10・メモリ32GB WSL2 Ubuntu22.04 ※同環境Windowsでは43秒なので11.6%速い、opt-channelslast無しだと41秒・40.53s | 編集 |
| RTX3060 | 12GB | Core i7-12700K | 39秒 | 38.91 | --xformers --opt-channelslast | Windows11・メモリ64GB・WSL2(Ubuntu22.04)・AfterburnerでPL58%(44秒、Time taken: 43.85s)環境構築はWikiの手順を参照 | 編集 |
| RTX3090 | 24GB | Core i9-13900KF | 19秒 | 17.51 | --deepdanbooru --xformers --opt-channelslast | Windows11・メモリ128GB・WSL2(Ubuntu22.04)・ブラウザはWin11のEdge環境 | 編集 |
| RTX3090 | 24GB | Core i9-13900KF | 23秒 | 21.65 | --deepdanbooru --xformers --opt-channelslast | Windows11・メモリ128GB | 編集 |
| RTX3090 | 24GB | Core i9-12900KF | 18.6秒 | 18.19 | --xformers --no-half-vae --deepdanbooru --gradio-img2img-tool=color-sketch --opt-channelslast | RAM64GB,cuDNN8.6.0,pcie4.0 x16 | 編集 |
| RTX 2070 SUPER | 8GB | i5 10400F | 43秒 | 43.36 | なし | メモリ64GB | 編集 |
| GTX 1080 | 8GB | Ryzen 7 3700X | 2分26秒 | 145.58 | --xformers --opt-channelslast --opt-split-attention --gradio-img2img-tool=color-sketch | count5 size2なら123.25秒、count2 size5で118.3秒、意外とVRAM使用量も5GB未満に収まるのでsize増やして回した方が得 | 編集 |
| RTX 3060 | 12GB | Core i5-7400 | 56.55秒 | 52.60 | なし | PCI-Express 1x-16xのライザーカード使用 | 編集 |
| RTX A2000 | 12GB | Core i5-11400 | 63.85秒 | 62.73 | --xformers --opt-channelslast | AfterburnerでGPUを-214MHz,VRAMを-502MHzクロックダウンGPUは最大64.5℃,VRAMは最大72℃で駆動 | 編集 |
| GTX 750Ti | 2GB | Core i5-10400F | 23分26秒 | 1404.15 | --lowvram | | 編集 |
| RTX A2000 | 12GB | Core i5-11400 | 50.06秒 | 48.55 | --xformers --opt-channelslast | RAM16GB | 編集 |
| RTX 2060 | 12GB | ryzen 3700x | 53.42秒 | 49.94 | | メモリ32GB | 編集 |
| RTX A2000 | 12GB | Core i5-11400 | 51.83秒 | 50.55 | --xformers | | 編集 |
| RTX A2000 | 12GB | Core i5-11400 | 1分4秒 | 62.83 | なし | | 編集 |
| RTX 3060 | 12GB | Core i7-12700KF | 43秒 | 41.34 | --xformers --opt-channelslast | メモリ32GB 2022/11/22git pull実施 | 編集 |
| RTX 3090 | 24GB | Core i9-13900KF | 23秒 | 21.42 | xformers deepdanbooru | | 編集 |
| RTX 3060 | 12GB | Core i7-6700 | 38.64秒 | 37.42 | xformers opt-channelslast | Linux Mintで定格時。opt-channelslast無しで39.57秒。nvidia-smiでパワーリミット下限の100Wで40.93秒。 | 編集 |
| RX 6900XT | 16GB | Ryzen 7 3900X | 36秒 | 34.51 | --listen | Debian11(GUIなし) rocm-5.2.0 GPUはリファ板・定格 | 編集 |
無し (CPU内蔵、HD 5500) | | Core i5-5200U | | 12743.36 | | CPUで生成。グラボなしのノートPC。RAM12G。以下の変更でWEBUI実施。生成される絵ちょっと違う。1枚生成で21分かかる https://rentry.org/nai-speedrun#cpu-only-steps | 編集 |
無し (CPU内蔵、Vega 7) | 512MB | Ryzen 7 4700U | | 4624.09 | skip-torch-cuda-test no-half no-half-vae | Dreambooth動かなかったやつ | 編集 |
| RTX 2060 | 12GB | Ryzen 7 5700G | 51.51秒 | 46 | --listen --enable-insecure-extension-access --api --xformers --deepdanbooru --gradio-img2img-tool color-sketch | メモリ32GB | 編集 |
| RTX 4090 | 24GB | Ryzen 7 3700X | 18秒 | 16.09 | gradio-img2img-tool=color-sketch deepdanbooru xformers opt-channelslast | 21it/sくらい出るけど3090Tiの結果より少し早いだけだからCPUの限界かも | 編集 |
| RTX 3060 | 12GB | Core i7-10700 | 46秒 | 43.76 | --xformers --deepdanbooru | | 編集 |
| RTX 3090Ti | 24GB | Ryzen 7 5700X | 19秒 | 17.71 | xformers deepdanbooru | Ryzen 1800XからCPU変更 | 編集 |
| RTX 2070 | 8GB | Ryzen 7 1700X | | 37.87 | xformers opt-channelslast | safetensors vae内蔵 | 編集 |
| RTX 2070 | 8GB | Ryzen 7 1700X | | 39.73 | xformers opt-channelslast | WSL2 | 編集 |
| RTX 2070 | 8GB | Ryzen 7 1700X | | 42.43 | xformers | WSL2 | 編集 |
| RTX 2070 | 8GB | Ryzen 7 1700X | | 42.89 | xformers deepdanbooru | | 編集 |
| RTX 2070 | 8GB | Ryzen 7 1700X | | 59.83 | medvram xformers opt-channelslast deepdanbooru | opt-channelslastは効き目なさげ | 編集 |
| RTX 3060 | 12GB | Core i7-12700K | 43秒 | 40.82 | xformers deepdanbooru opt-channelslast | メモリ64GB AfterburnerでPL75%時(45秒、Time taken: 42.29s)PL58%(49秒、Time taken: 46.10s)opt-channelslastを有効にした事により2~3秒短縮出来ました | 編集 |
| RTX 4090 | 24GB | Core i9-13900KF | 12秒40 | 10.79 | xformers | | 編集 |
| RTX 4090 | 24GB | Core i9-12900K | 13秒 | 11 | xformers | | 編集 |
| RTX 4090 | 24GB | Core i9-11900 | 14秒 | 14.25 | xformers | Batch count10 Batch size1 メモリ64GB PL65 | 編集 |
| RTX 4090 | 24GB | Ryzen 9 5900X | 14秒 | 14.10 | xformers opt-channelslast | | 編集 |
| RTX 3090Ti | 24GB | Ryzen 7 1800X | 24秒 | 22.60 | xformers | | 編集 |
| RTX 3090 | 24GB | Ryzen 7 3700X | 26秒 | 26.97 | xformers deepdanbooru | アフターバーナーでパワーリミット65% | 編集 |
| RTX 3090 | 24GB | Ryzen 7 3700X | 23秒 | 23.79 | xformers deepdanbooru | アフターバーナーでパワーリミット65% Settings→User interfaceのShow progressbarのチェックを外しShow image creation progress every N sampling steps.を0に | 編集 |
| RTX 3090 | 24GB | Ryzen 7 3700X | 20秒 | 20.85 | xformers deepdanbooru | アフターバーナーでパワーリミット100% Settings→User interfaceのShow progressbarのチェックを外しShow image creation progress every N sampling steps.を0に | 編集 |
| RTX 3090 | 24GB | Core i5-13600K | 24秒 | 23.56 | xformers deepdanbooru | アフターバーナーでパワーリミット100% RAM 36GB | 編集 |
| RTX 3090 | 24GB | Core i5-13600K | 28秒 | 27.61 | xformers deepdanbooru | アフターバーナーでパワーリミット65% RAM 36GB | 編集 |
| RTX 3090 | 24GB | Core i5-13600K | 46秒 | 46.08 | xformers deepdanbooru | アフターバーナーでパワーリミット50% RAM 36GB | 編集 |
| RTX 3090 | 24GB | Core i9-12900KF | 20秒 | 20. | | grid生成切ってました。 | 編集 |
| RX 6900XT | 16GB | Ryzen 7 5800X | 52秒 | 48 | | Ubuntu20.04定格にて 150wに下げた場合は1分程 | 編集 |
| RTX 3080Ti | 12GB | Core i7-11700F | 24秒 | 22.43 | | メモリ32GB | 編集 |
| RTX 3080 | 12GB | Ryzen 7 5800X | 26秒 | 26. | | RTX 3080 GAMING Z TRIO 12G LHR, メモリ64GB | 編集 |
| RTX 3080 | 12GB | Ryzen 7 5800X | 21秒 | 21. | Batch size 5, Batch count 2 | RTX 3080 GAMING Z TRIO 12G LHR, メモリ64GB | 編集 |
| RTX 3080 | 10GB | Ryzen 7 5800X3D | 24秒 | 23.93 | xformers | メモリ32GB | 編集 |
| RTX 3080 | 10GB | Ryzen 7 5800X3D | 30秒 | 28.06 | | メモリ32GB | 編集 |
| RTX 3080 | 10GB | Core i7-10700K | 32秒 | 30.35 | | メモリ32GB | 編集 |
| RTX 3080 | 10GB | Core i9-12900K | 25.9秒 | 23.20 | xformers | メモリ32GB。PL70%にすると27.5秒、time taken24.75s | 編集 |
| RTX 3080 | 10GB | Core i9-11900F | 28秒 | 26.25 | xformers PL70% | メモリ64GB | 編集 |
| RTX 3080 | 10GB | Core i7-8700K | 26秒 | 24.00 | xformers PL70% | ROG STRIX GeForce RTX 3080 GUNDAM EDITION, メモリ32GB | 編集 |
| RTX 3070Ti | 8GB | Core i5-7500 | 32秒 | 28.93 | xformers | | 編集 |
| RTX 3070Ti | 8GB | Core i5-7500 | 33秒 | 28.93 | xformers PL70% | | 編集 |
| RTX 3070Ti | 8GB | Core i5-7500 | 58秒 | 28.93 | xformers medvram | | 編集 |
| RTX 3070 | 8GB | Core i5-12600K | 31.65秒 | 29.24 | xformers | ASUS GeForce RTX 3070 Noctua OC Edition 8GB GDDR6 | 編集 |
| RTX 3070 | 8GB | Core i7-10700 | 31.44秒 | 30.08 | xformers | メモリ32GB | 編集 |
| RTX 3070 | 8GB | Ryzen 5 5600X | 43.85秒 | 41.42 | deepdanbooru no-half-vae | | 編集 |
| RTX 3070 Laptop | 8GB | Ryzen 7 5800H | 46秒 | 47.37 | | TGP95W | 編集 |
| RTX 3060Ti | 8GB | Core i5-12400 | 35秒 | 33.19 | xformers | | 編集 |
| RTX 3060Ti | 8GB | Core i5-12400 | 41秒 | 39.08 | | | 編集 |
| RTX 3060Ti | 8GB | Ryzen 9 5900X | | 35.94 | xformers | | 編集 |
| RTX 3060Ti | 8GB | Ryzen 9 5900X | 44秒 | 42.04 | | | 編集 |
| RTX 2070 SUPER | 8GB | Ryzen 7 5800X | | 28.25 | xformers opt-channelslast | コアクロック+65, メモリクロック+1000, PL120% | 編集 |
| RTX 2070 SUPER | 8GB | Ryzen 7 5800X | | 32.99 | xformers | PL90%,メモリクロック+1000でも同様 | 編集 |
| RTX 2070 SUPER | 8GB | Ryzen 7 5800X | 41秒 | 39.33 | | PL90%,メモリクロック+1000でも同様 | 編集 |
| RTX 2070 SUPER | 8GB | Ryzen 7 3700X | 38.55秒 | 35.05 | xformers | | 編集 |
| RTX 2070 SUPER | 8GB | Core i9-9900K | 41秒 | 38.02 | xformers | | 編集 |
| RTX 2070 | 8GB | Core i7-9700K | 43秒 | 40.06 | xformers | | 編集 |
| RTX 3060 | 12GB | Core i5-12400F | 43秒 | 41.15 | xformers | | 編集 |
| RTX 3060 | 12GB | Core i7-7700 | 46秒 | 43.27 | xformers | | 編集 |
| RTX 3060 | 12GB | Core i7-6700 | 48秒 | 44.63 | xformers | | 編集 |
| RTX 3060 | 12GB | Core i7-6700 | 54秒 | 51.65 | | | 編集 |
| RTX 3060 | 12GB | Core i7-4790K | 53秒 | 49.72 | xformers | | 編集 |
| RTX 3060 | 12GB | Core i7-2600K | 54秒 | 50.64 | xformers | Sandyおじさん | 編集 |
| RTX 3060 | 12GB | Core i7-2600K | 56秒 | 52.53 | | Sandyおじさん | 編集 |
| RTX 3060 | 12GB | Ryzen 7 5800X | 44.91秒 | 42.82 | xformers | | 編集 |
| RTX 3060 | 12GB | Ryzen 5 3600 | 45.34秒 | 42.48 | xformers | | 編集 |
| RTX 2080Ti | 11GB | Core i9-9900K | 36秒 | 32.55 | xformers | | 編集 |
| RTX 2060 SUPER | 8GB | Ryzen 9 3900XT | 41秒 | 41.58 | xformers | | 編集 |
| RTX 2060 | 6GB | Core i5-6500 | 1分1秒 | 58.05 | xformers | | 編集 |
| RTX 3050 | 8GB | Core i5-8400 | 1分13秒 | 70.63 | | | 編集 |
| GTX 1660Ti | 6GB | Ryzen 9 3900XT | | 151.77 | --no-half --xformers | --medvram削除 | 編集 |
| GTX 1660Ti | 6GB | Ryzen 9 3900XT | | 192.89 | --medvram --no-half --xformers | --precision full削除(1660系の問題で--no-halfを抜くと生成されません) | 編集 |
| GTX 1660Ti | 6GB | Ryzen 9 3900XT | | 357.53 | --medvram --precision full --no-half --xformers | | 編集 |
| GTX 1080Ti | 11GB | Core i9-9900K | 1分56秒 | 114.28 | | | 編集 |
| GTX 1080 | 8GB | Core i9-12900 | | 159.39 | | | 編集 |
| GTX 1070Ti | 8GB | Core i3-12100F | 2分38秒 | 155.64 | xformers | Palit GTX1070 Ti Dual(定格),メモリ32GB | 編集 |
| GTX 1070 | 8GB | Core i7-7700 | 3分12秒 | 190.22 | | | 編集 |
| GTX 1070 Laptop | 8GB | Core i7-7700HQ | 3分16秒 | 192.85 | xformers | | 編集 |
| GTX 1660Ti(Mobile) | 6GB | Core i7-10750H | | 178.06 | --precision full --no-half --xformers | Max-Qではない | 編集 |
| GTX 1660Ti(Mobile) | 6GB | Core i7-10750H | | 219.10 | --precision full --no-half --xformers --medvram | Max-Qではない | 編集 |
| GTX 1060(OC) | 6GB | Ryzen 5 1600 | | 234.97 | xformers | | 編集 |
| GTX 1660Ti(Max-Q) | 6GB | Ryzen 7 4800HS | | 252.26 | --precision full --no-half --xformers --medvram | ゲーミングノートパソコンやで! | 編集 |
| GTX 1660Ti(Max-Q) | 6GB | Ryzen 7 4800HS | | 464.86 | xformers no-half-vae | no-half不要になったので試してみた | 編集 |
| GTX 1660Ti(Max-Q) | 6GB | Ryzen 7 4800HS | | 197.39 | xformers no-half no-half-vae | no-halfつけなおしてみた | 編集 |
| GTX 970 | 4GB | Core i5 6500 | 6分17秒 | 373.70 | | | 編集 |
| GTX 970 | 4GB | Core i5 6500 | 4分8秒 | 244.91 | --medvram | medvramつけたほうが速い。ちなみにxformer有効にすると倍時間がかかる | 編集 |
| RX VEGA 56 | 8GB | Ryzen 7 1700 | 2分1秒 | 118 | --precision full --no-half --deepdanbooru | Debian11 rocm-5.2.0 電源の関係でPL=0,1(1150MHz)に制限 | 編集 |
このページへのコメント
最近の学習法はメモリを食わなくても済むみたいな。
3060 12GBで、下手に設定を弄らなくても、
StableTunerで640*640で、
kohya版DBで720*720で、
そしてkohya版LoRAは1024*1024の画像を学習可能だわ。
全て学習終了と、絵の出力まで確認したり
特にkohya版では長方形の解像度でも学習可能なので
VRAMに収まるなら、縦横の比率が変則的なのも入るのが強みね。
kohya版DBで768*768も
さっきやり直したら出来た
サイズ的にはここがギリギリみたい
EVGAの3090 FTW3 16.38s 平均20.10it/Sぐらい Afterburnerでcore+150 Memory+1000
これ以上OC上げると学習でクラッシュすることがあるのでこれが安定して使える限界。VRAMは24GBあると学習時にBatchあげられるので同じ時間での学習結果は全然良くなります。4070Tiと同じ値段で買えるならこっちのほうが学習にはおすすめと思います。
EVGAの3090 FTW3 16.38s 平均20.10it/Sぐらい Afterburnerでcore+150 Memory+1000
これ以上OC上げると学習でクラッシュすることがあるのでこれが安定して使える限界。VRAMは24GBあると学習時にBatchあげられるので同じ時間での学習結果は全然良くなります。4070Tiと同じ値段で買えるならこっちのほうが学習にはおすすめと思います。
PC新調の相談です
おすすめのRTX 3060(12GB)でPCを注文しようと考えています
これまでノートCP勢だったので、デスクトップは初です
グラボ以外に注文で気を付ける箇所があれば教えてください
※CPUやマザボ、電源周り等、これを確認しないと失敗するぞ、みたいなの
別の場所で質問をしました
マルチポストになってしまうのでこちらは取り下げさます
もしグラボ欲しいけど高くてためらってる人いたら
RTX2060super(8GB)のバルク品がアキバの某ショップで
今だけ26500円で売ってるよ
性能的には3060の8GB版と捉えていいから値段を考えればありだと思うな