見出し画像

【nunchaku版】Krita-ai-diffusionがQwen-Imageに対応した話②【FLUX Kontextも使う】

はじめに

前回の記事のつづきです。

Krita-ai-diffusionにQwen-Imageが統合されて、実際にどの程度使い物になるのかを確認しました。

ローカルアイドルを生成

Qwen-Imageは、FLUX.1と比べると、日本語プロンプトで、日本的な画像を簡単に生成できます。

※ 日本語を利用する場合は、Krita-ai-diffusionの翻訳機能をOFFにするか、ENにする必要があります。日本語翻訳機能がONになっていると、強制的に英語に変換されてしまいます

- 3人の日本の地方アイドル(ロコドル)が古く寂れた田舎の商店街の舞台でコンサートする
- アイドルをアップで表示する

Qwen-Imageプロンプト
画像
Qwen-Image生成画像

Qwen-Imageの弱点は、日本的なものを生成するとカタカナだらけになる事です。中国と日本漢字の区別が難しいので、ステレオタイプにしているのだと思います。ちなみに韓国的にするとハングルだらけになります。(日本と違い漢字を使わないので正しいのかもしれませんが)

看板を変えてみる

画像
FLUX Kontextで消します
画像
Qwen-Image-Editでも消えますが、遅いのでFLUXの利用です

Qwen-Image-Editの参照機能での合成を試しましたが、上手くできませんでした。

画像

仕方がないので、古典的な手法で文字を入れます

貼り付けただけのクソコラ感を無くすためにEditモデルを利用します。

画像
FLUX.1 Kontext: Apply a distressed or weathered effect to all characters on the wooden plate.
画像
Qwen-Image-Edit(2509)

漢字を認識できてしまうからでしょうが、Qwen-Imageでは浮いた感じを消す事ができません。

ちなみにGoogle Nano-bananaです。リアルな看板感を出すのは大したものです。

画像

髪型を変える

Change her hair style to ponytail

画像
Qwen-Imageでは全く変化しません。恐らく既にポニーテール判断しているのでしょう
画像
FLUX.1 Kontextでは変化します

ツインテイルに変更します

Change her hair style to short twintails

画像
変更しましたが、境界がズレてしまいます。

しかし、ペイントソフトウェアのレイヤー機能が利用できるので、

画像

レイヤーを半透明にして、頭部を合わせます

画像
境界がズレるので、
画像
グラデーションありの消しゴムツールで
画像
画像
ずれた部分を元に戻します。

文字を修正する

中国漢字になりますが、Qwen-Imageは漢字を利用できます。

画像
謎文字を修正します

Change letter to "駄菓子"

画像
しかし看板と同じで浮いた感じになってしまいます。簡体字的なのは諦めます
画像
Qwen-Image-Editでは馴染ませる事ができないので、FLUX Kontextで
Apply a distressed or weathered effect to all characters on the Japanese lantern.

全体を調整して完成

画像
完成

まとめ

Qwen-Image-Editは、画像文脈を理解し、より複雑で大きな変更が可能ですが、デメリットは(オリジナルを活かした)部分編集が苦手で工夫が必要になる事です。

簡単な変更はオリジナルに忠実で高速に処理できるFLUX.1 Kontext、複雑で大きな変更はQwen-Image-Editが基本になりそうです。

また、FLUX.1でも言える事ですが、一般的なミドルレンジ・ゲーミングPC環境において、複雑なControlNetを駆使したりLoraを作ったりするのは現実的ではありません。特に、インタラクティブな試行錯誤を行う場合に、一つの処理で数分かかるようでは使い物になりません。

高速に動作するnunchaku版のEditモデルは、それらのほとんどを解決してくれる可能性を秘めています。

以下、関連する記事の【PR】です。


いいなと思ったら応援しよう!

ピックアップされています

ブログ

  • 368本

コメント

コメントするには、 ログイン または 会員登録 をお願いします。
3Dアート作品や3Dモデルデータも扱っています。最近は専らAIを利用した作品が多いです。 ※ BOOTHにて各種販売も行なっております。 https://lit.link/catappart3d
【nunchaku版】Krita-ai-diffusionがQwen-Imageに対応した話②【FLUX Kontextも使う】|Catapp-Art3D
word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word

mmMwWLliI0fiflO&1
mmMwWLliI0fiflO&1
mmMwWLliI0fiflO&1
mmMwWLliI0fiflO&1
mmMwWLliI0fiflO&1
mmMwWLliI0fiflO&1
mmMwWLliI0fiflO&1