ComfyUIでガチめにhires.fixを実装する

2024年9月29日 13:52

hires.fixとは

　Automatic1111 StableDiffusionWebUIで、大きな画像を作成するテクニックである。SD1.x系列は512x512が基準であり、このサイズより大きくなると画像が破綻しやすくなる。一方SDXLは、1024x1024が基準になっている。逆に512x512の方を苦手にしている。この基準サイズより大きな絵を破綻させずに生成するにはまず基準のサイズを作成し、そのサイズを拡大してimg2imgすると言うのがhires.fixの基本的な実装である。かつてhigher.fixと言う名前で実装されていたがSD2が出た時に実装方法が変更されている（最終出力サイズからオリジナルのサイズを逆算すると言う複雑な実装していたからむしろ使いにくかったヤツ）

hires.fixの拡大アルゴリズム

　基本的にはLatentのみの実装で、オプションでAI拡大が利用出来る。アニメ絵の拡大にはRealESRGAN_x4plus_anime_6Bが使われることが多い。

実際の実装

　実は、LatentとAI拡大でhires.fixの実装が異なる。Latentは潜在空間のままで拡大処理を行う。つまりComfyUIでは生成した画像（VAEを通す前）にLatent Scalerを使う。ところがAI拡大はLatentに対して利用出来ないのでVAEエンコードをしてImageに変換してから拡大処理をし再びVAEデコードしLatentに戻す必要がある。

　さらに拡大サイズが固定のためさらにサイズ変換が必要になる。例えば、RealESRGAN_x4plus_anime_6Bの場合、拡大率は4倍固定のため、画像を2倍にしたい場合は後処理として0.5倍する必要がある。

　このアルゴリズムはarea（説明を読む限りPixel Mixingっぽい）が推奨になる（実際には1から0.5倍の間はどのアルゴリズムでも大差ない。以前zennに書いたのでそちらを参照）

ComfyUIにおけるサンプル実装

サンプルは以下にある

　二通りのサンプルが存在するが、ComfyUIでhires.fixを実装するには実は2つのワークフローを手動切り替えないといけないのである（ワークフローをスイッチできるカスタムノードが有ればオンオフで切り替えられるだろう）

　ここで、拡大率を指定するか、サイズを直接指定するかはお好みだが、拡大率の方が使い回しが楽なので拡大率で行っている（hires.fixは、両方実装しないといけないのであるが）

AI拡大

　AI拡大にはモデルが必要になる。WebUIとモデルを共有する場合は以下のようにextra_model_paths.yamlを設定すると良い（どこからモデルを取得したか忘れた）

models:
    base_path: <モデルのベースパス> # e:\ai\modelsなど
# <省略>
    upscale_models: | # ComfyUIは upscale_modelsで管理するが、WebUIはモデルごとにまちまち
        ESRGAN
        RealESRGAN
        SwinIR
        LDSR
        ScuNET
# <省略>

2passの実行

　デフォルトは1回目と2回目のパラメータは同じで、step数は後から変更出来るがサンプラーは変えられないがComfyUIの場合、両方違っても良いので適当に修正して欲しい。img2imgはtxt2imgよりstep数が減らせるはず。

ワークフロー

　こんな感じになろう。完全に実装するにはカスタムノードが必須だろう

#AIとやってみた

いいなと思ったら応援しよう！

この記事が参加している募集

#AIとやってみた

45,359件

ログインまたは会員登録するとコメントできます。

ComfyUIでガチめにhires.fixを実装する

hires.fixとは

hires.fixの拡大アルゴリズム

実際の実装

ComfyUIにおけるサンプル実装

AI拡大

2passの実行

ワークフロー

いいなと思ったら応援しよう！

この記事が参加している募集

コメント

画像生成あれこれ

Anim4gineのComfyUIワークフロー配布+使用する時に気を付けた方が良い事

reForgeがかなり頑張ってるという話@追加機能とか(2025/1)

[ComfyMaster41] ControlNet Tileで画像を高解像度化しよう！

【ComfyUI】Animate-xで画像にモーションを適応する方法

写真品質のAI画像ーLoraを作ってオリジナルを作ろうー

ComfyUIのカスタムノードの作成でImageの取り扱いに苦労した話し。

ComfyUI IPAdapter 同じキャラでシチュエーションを変えてみる

comfyuiを使ってショート動画を作つてみよう！

FLUX.1 DevのLLMプロンプト検証（プロンプトアップスケール法）

ComfyUIでSanaを試す・再（VRAM 8GB、推奨12GB）

Akumaで生成した画像をComfy UIで再現できるのかチャレンジ（備忘録）

【超便利】Stable Diffusionの必須拡張機能一覧まとめ！インストール方法から使い方まで解説

[ComfyUI] FLUX.1 ToolsのReduxでの合成時の設定の確認

AnimagineXL(4.0)試してみた

「AIイラストが難しい」はもうウソ。

AI日和-#22 Colosoの「ComfyUIマスター：カスタムノードとアプリ開発」講座を受講してComfyUI沼にはまった話

Stable Diffusionのtxt2imgで作った大量の画像をADetailerとアップスケールを一括で処理する方法

Stable Diffusionの実践的な画像生成テクニック：理想のビジュアルを手に入れる方法

メタデータ付きjpgを自動振り分けしたい

【AIイラスト】CheckPointを変えたり、追加で反映させたりとアレコレやってみた。あとバージョンはちゃんと確認しろ

Forge再導入の個人的メモ

【3DモデルAI生成】ComfyUIで「Hunyuan3D-2」をためす

【初心者向け】Stable Diffusion｜プロンプト入力で自在に作画を変えられる画像生成AIを使ってみよう！

AIが進化しすぎて焦るエンジニア。さわってみたら少し前に進めた話

2025年最新。美女の顔固定、ポーズ固定、服装変更のプロンプト【imageFX flux】

画像を3DモデルにできるAI stable-point-aware-3d試してみた 写真を3Dプリンタで立体印刷!?

Macや低スペックPCでもOK！画像生成AIの環境構築から動かし方

画像大量生成に「ワイルドカード」はもう古い！？Stable Diffusionでワイルドカードを使わずに超効率的なプロンプトバリエーション作成＆大量生成を実現！【Stable Diffusionの新常識】ルーモス式プロンプト管理

StabilityMatrixのComfyUIが動かなくなったので素直に仮想環境で環境構築した件（ついでにLayer DiffusionとHunyuan 3D V2でお手軽にMAD用オブジェクト生成するワークフローつくった）

Draw thingsの教科書（随時更新）

AIイラスト生成のネタに困ったら…

AIイラストで稼ぐために最低限押さえておきたいnovelAIの使い方

AIイラストの生成手順とポイント【プロンプトあり】｜ひとりサロン社長日記

【ImageFX】ツールを使うとAI画像がもっと楽しくなる☆水着にチェンジも

【便利すぎる】アニメ・ドラマ視聴管理Notionテンプレート

画像を3DモデルにできるAI stable-point-aware-3d試してみた写真を3Dプリンタで立体印刷!?