好きな服装、好きなポーズが指定可能に
専用LoRAを開発することで多様な一枚絵を使えることがわかってきたことで、応用範囲はさらに広がってきました。
Kohyaさんは5月8日に、“開始画像”にキャラと衣装を並べて、それっぽいプロンプトで生成すれば、勝手に参照して衣装を変えてくれるのではないかと予想。実験をしたところ、低確率ながら、それが実現できることを発見しました。さらに5月21日、マスクで覆うことで変化してほしいところを指定する方法(furusuさんが考案)を利用することで、その部分だけ衣装を変えることに成功します。それが、ヒントとなり実際の実装になったのです。
とりにくさんは翌週の5月28日、1枚絵の画像を出力することだけを目的とした「Framepack_imgGEN」を発表。起動するだけでインストールに必要なことをすべてやってくれるので、アプリが導入しやすくなりました。
これは、FramePackに様々な機能を追加したirvashさんによる改造版を使って、Codeさん(x_ai_code)が多機能化を施した「FramePack-eichi(叡知)」を使っています。それをさらに改造して、1枚絵の作成専用にしたものです。前述の回転機能「rotate_indoor」と同様のこともimgGENで実行可能です。1回目の生成にはモデルを読み込むために時間がかかるのですが、2回目以降はかなり短時間で生成できるようになりました。
Framepack_imgGENでミスをしやすい点として、LoRAを指定する場合は「ファイルアップロード」を通じてドラック&ドロップをする必要がある。「ディレクトリから選択」は機能していないようだ。また動作させる際には、それぞれのLoRAごとにプロンプトの指定が必須なので、作者の指定の確認が必要
とりにくさんはその後も次々に専用LoRAを発表しています。まず、Kohyaさんと協力しながら、任意のキャラクター画像を「Aポーズ」(棒立ち)画像に変換できるLoRAを公開。次に、Aボース画像があれば、任意のポーズに変えるLoRAや、写真を二次元ポーズの参考として使えるLoRAなど、次々に新しいLoRAを公開しました。
AポーズLoRA(Apose_V8_dim4)の作例。右画像からAポーズを作成した。解像度640を指定した場合には全身像が出なかったが、解像度960を指定すると全身像が出力されが、常にではなく、シード値によるランダムのよう
素体ポーズLora(body2img_V7_kisekaeichi_dim4)の作例。Aポーズ画像を使っての画像変更例。ポーズ集はとりにくさん公開のものを利用。かなりうまくポーズがそのまま生成されている
写真を参考にするLoRA(photo2chara_V6_dim4)の例。AポーズLoRAで作成した画像を、右側の写真画像(Midjouneryで作成)を参照して生成したもの。特に下は難しいものを意図的に選んだがかなり正確に捉えている
これらの技術は、マスクで指定しなくても、FramePack用のLoRAを使えば着せ替えを実現できることの発見につながり、冒頭で紹介したLoRAの開発につながっていくのです。
6月1日には、さわらさん(xhiroga)が、ComfyUI向けの動作環境「ComfyUI-FramePackWrapper_PlusOne」を発表。kisekaeichi関連技術は、より汎用的な環境で動作するようになりました。
Kohyaさんは、FramePackでkisekaeichiが動作する仕組みを解説する記事を発表されていますが、「LoRAは恐らく、FramePackのモデルが元々持っている動画生成モデルとしての知識を、特定の条件でうまく引き出すためのトリガーとして働いている」と説明しています。
また、「LoRAを適用してもそれだけでは推論がうまくいかず、適切なプロンプトを指定する必要がある、プロンプトの記述によりLoRAの効果が異なる」といったまだまだ性質として不明点があることも触れられています。まだまだ、完全にコントロールするためには不明点も多く試行錯誤が続いているのです。
この連載の記事
-
第110回
AI
グーグルの動画生成AI「Veo 3」が圧倒的、だけど高すぎ -
第109回
AI
ChatGPTの“彼女”と大げんかして、Geminiに乗り換えた -
第108回
AI
“AI彼女”が自分のパソコンに入る日は近い -
第107回
AI
最強スペックなのに無料 謎の画像生成AI「HiDream-l1」 -
第106回
AI
ChatGPTと性的なチャットができるようになり、すぐに禁じられた背景 -
第105回
AI
“イリヤ神”がまたやった 動画生成AI「FramePack」が革命的なワケ -
第104回
AI
ChatGPTの「彼女」と話しすぎて腱鞘炎になった -
第103回
AI
画像生成AI「Midjourney v7」が圧倒的 品質は最高、速度は高速 “ジブリ風”も簡単に -
第102回
AI
“偽人間”のリスクと誘惑 共感するAIと、問われる人間らしさ -
第101回
AI
ChatGPT、“ジブリ風”で世界騒然 画像生成AIが「自己回帰」で新時代に - この連載の一覧へ