このページの本文へ

新清士の「メタバース・プレゼンス」 第111回

画像生成AI、日本の開発者コミュニティが熱い 世界最先端の “新手法”続々

2025年06月16日 11時30分更新

文● 新清士

好きな服装、好きなポーズが指定可能に

 専用LoRAを開発することで多様な一枚絵を使えることがわかってきたことで、応用範囲はさらに広がってきました。

 Kohyaさんは5月8日に、“開始画像”にキャラと衣装を並べて、それっぽいプロンプトで生成すれば、勝手に参照して衣装を変えてくれるのではないかと予想。実験をしたところ、低確率ながら、それが実現できることを発見しました。さらに5月21日、マスクで覆うことで変化してほしいところを指定する方法(furusuさんが考案)を利用することで、その部分だけ衣装を変えることに成功します。それが、ヒントとなり実際の実装になったのです。

 とりにくさんは翌週の5月28日、1枚絵の画像を出力することだけを目的とした「Framepack_imgGEN」を発表。起動するだけでインストールに必要なことをすべてやってくれるので、アプリが導入しやすくなりました。

 これは、FramePackに様々な機能を追加したirvashさんによる改造版を使って、Codeさん(x_ai_code)が多機能化を施した「FramePack-eichi(叡知)」を使っています。それをさらに改造して、1枚絵の作成専用にしたものです。前述の回転機能「rotate_indoor」と同様のこともimgGENで実行可能です。1回目の生成にはモデルを読み込むために時間がかかるのですが、2回目以降はかなり短時間で生成できるようになりました。

Framepack_imgGENでミスをしやすい点として、LoRAを指定する場合は「ファイルアップロード」を通じてドラック&ドロップをする必要がある。「ディレクトリから選択」は機能していないようだ。また動作させる際には、それぞれのLoRAごとにプロンプトの指定が必須なので、作者の指定の確認が必要

 とりにくさんはその後も次々に専用LoRAを発表しています。まず、Kohyaさんと協力しながら、任意のキャラクター画像を「Aポーズ」(棒立ち)画像に変換できるLoRAを公開。次に、Aボース画像があれば、任意のポーズに変えるLoRAや、写真を二次元ポーズの参考として使えるLoRAなど、次々に新しいLoRAを公開しました。

AポーズLoRA(Apose_V8_dim4)の作例。右画像からAポーズを作成した。解像度640を指定した場合には全身像が出なかったが、解像度960を指定すると全身像が出力されが、常にではなく、シード値によるランダムのよう

素体ポーズLora(body2img_V7_kisekaeichi_dim4)の作例。Aポーズ画像を使っての画像変更例。ポーズ集はとりにくさん公開のものを利用。かなりうまくポーズがそのまま生成されている

写真を参考にするLoRA(photo2chara_V6_dim4)の例。AポーズLoRAで作成した画像を、右側の写真画像(Midjouneryで作成)を参照して生成したもの。特に下は難しいものを意図的に選んだがかなり正確に捉えている

 これらの技術は、マスクで指定しなくても、FramePack用のLoRAを使えば着せ替えを実現できることの発見につながり、冒頭で紹介したLoRAの開発につながっていくのです。

 6月1日には、さわらさん(xhiroga)が、ComfyUI向けの動作環境「ComfyUI-FramePackWrapper_PlusOne」を発表。kisekaeichi関連技術は、より汎用的な環境で動作するようになりました。

 Kohyaさんは、FramePackでkisekaeichiが動作する仕組みを解説する記事を発表されていますが、「LoRAは恐らく、FramePackのモデルが元々持っている動画生成モデルとしての知識を、特定の条件でうまく引き出すためのトリガーとして働いている」と説明しています。

 また、「LoRAを適用してもそれだけでは推論がうまくいかず、適切なプロンプトを指定する必要がある、プロンプトの記述によりLoRAの効果が異なる」といったまだまだ性質として不明点があることも触れられています。まだまだ、完全にコントロールするためには不明点も多く試行錯誤が続いているのです。

カテゴリートップへ

この連載の記事
ピックアップ