ChatGPTで「複雑な手のポーズ」に挑戦してみる【画像生成AI】
今回もChatGPTでの新しい画像生成AIの実力を探っていきます。
今回は、「プロンプト精度の高さ」と「破綻しにくさ」という観点で、複雑な手のポーズについてどこまで出来るのか見ていきたいと思います!
◯前回記事リンク
✅ChatGPTでの画像生成は手のポーズが破綻しにくい
一般的に画像生成AIによって生成したイラストでは、手が破綻しやすい傾向にあります。
よく起こるのが六本指になったり、あらぬ方向に曲がっていたり、指の形が崩れていたり、などですね。
そのため、手指を強調しない構図にしたり、あるいはinpaintで修正掛けたりするわけです。
これまでのDALL-E3も手に関しては強くて破綻しにくかったのですが、ChatGPTの画像生成AIがネイティブモデルに変わってからは、更に破綻しにくくなっている傾向があります。
例えば、今回のアイキャッチ画像の例で見ていくと、「片手で銃の形を作り、もう片手で横ピースする」というポーズは本来AIにとっては難易度がかなり高いはずなのですが、難なく自然に出来ています。
ちなみに、ポーズの再現性もかなり高くて、被写体・画風・画像サイズなどを変えても、同じポーズのプロンプトを使い回せば、下記のように破綻なく再現できます。
このように、このレベル感の難易度であれば、ほとんど手や指が破綻することがありません。
一昔前に言われてた「AIは手が苦手」という状況とは雲泥の差だなと思います。
ただ、そうなるとどこまで複雑なことが出来るのかが気になりますよね。
ということで、今回は手のポーズの複雑さについて、可能性を検証してみました。
今回は下記キャラクターを作りましたので、これをベースにして、上手く生成出来たポーズ、出来なかったポーズを紹介していきます。
①生成が上手くいったポーズの例
・少し開いた手を口元を覆う
まずは難易度低めなポーズから。
手の位置も指示通りで、これは特に問題はないですね。
・人差し指を立てて、指先から魔法を出す
こちらもそこまで難しくないポーズなので、問題なさそうですね。
・手を組んだ祈りのポーズ
手を組んだポーズはそもそも複雑ですし、上下関係もおかしくなりがちなのですが、こちらは割と綺麗に生成出来ています。
・人差し指と親指で三角形を作る
指で三角形を作るのってこれまで難しかった記憶があるのですが、これも破綻なく出来ています。
人差し指と親指で、というのもプロンプト通りです。
・両手でもみあげを引っ張る
何気に衝撃を受けたのは、この画像です。
掴む動作が難しいのはもちろんのこと、そもそも「もみあげ(横髪か?)」をきちんとAIに認識させるのって難しかったんですよね。
やはりGPT 4oと統合されて、相当理解度が高くなってると感じます。
・両手をクロスさせながら、もみあげを引っ張る
先程の例を更に複雑化したもの。
腕を交差するところで破綻しやすいのですが、問題なさそうです。
ただ、これがどういうシチュエーションで必要になるのかは謎ですね。
・トランプを扇状にして持つ
カードの持ち方って難しそうかなって思ったのですが、これも特に問題ないですね。
・片手でポニテを触り、片手で頬に人差し指を当てる
これも左右の手で別の動作しているので複雑ではあるのですが、若干親指が怪しいくらいで、明確には破綻してないですね。
・おまけ:四コマ型式で、指で「L,O,V,E」の文字を作る
指で文字を表現するのも出来るんじゃないかと思ってやってみたもの。
これも割と上手く生成出来ています。
ちなみに、「Eの字」を単独で指示すると、下記のように無理矢理頑張ってくれます。
指がつりそうですね。
②生成が難しかったポーズの例
・キツネの影絵
意外とできなかったのが、「キツネの影絵」。
何度か試してみたのですが、上手くいかず…。
ここまでの例に比べてそこまで難易度高いとは思えないので、プロンプトの仕方が悪かったかもしれません。
・あやとりでタワーを作る
あやとりも上手くいかないですね。
東京タワー作れるのは凄いけど、色々な物理法則を無視してます。
指というよりは、複雑な状態の紐が再現出来なさそうです。
・ルービックキューブを半回転する
ルービックキューブも上手く回せない。
揃えられないからといって、ナチュラルに力づくで解決しようとする姿勢はやめて頂きたいところ…。
まとめ:複雑な手のAIイラストもできそう?
今回は、「複雑な手のポーズ」について見てきました。
割と難易度高そうなポーズでも、全体的に破綻しにくいなと思います。
もちろん完璧ではなくて、裏でちらほらおかしなものもあったのですが、総じて言えばプロンプト精度は高いので、凝った表現にも使えそうですね。
参考になったらスキしてもらえると嬉しいです。
それではまた。
〇関連リンク
いいなと思ったら応援しよう!
もし気に入っていただけたら、チップで応援して頂けると嬉しいです。その気持ちが次の創作の大きな励みになります!





コメント
9とても素晴らしい実験をありがとうございます。
あやとりとルービックキューブのときは、手も少しおかしくなってますね。
この手のおかしさが、プロンプトなどで修正できるのか、少し気になりました。
こんばんは😊 Copilotで手をつなぐ、手を組む、小指に赤い糸を繋ぐ、などを試したことがあるんですが、手ってちょっとした角度で感情が出やすいというか、難しそうだと思いました。バリエーションがいくつもあって、楽しかったです😄
Yukiさん、こんにちは!
コメントありがとうございます✨
一応、部分修正が使えますので、手だけ修正掛けることも可能です⭐
ただ、修正して上手くいくは別問題ですが…。
あかりさん、こんにちは!
コメントありがとうございます✨
構図とか、ポーズによっても手の表現って変わってくるので、組み合わせの難しさもありますよね😌
小指に赤い糸とかは難易度的にも、描写的にも面白そうですね😊