見出し画像

ChatGPTで「複雑な手のポーズ」に挑戦してみる【画像生成AI】

今回もChatGPTでの新しい画像生成AIの実力を探っていきます。
今回は、「プロンプト精度の高さ」と「破綻しにくさ」という観点で、複雑な手のポーズについてどこまで出来るのか見ていきたいと思います!


◯前回記事リンク



✅ChatGPTでの画像生成は手のポーズが破綻しにくい

一般的に画像生成AIによって生成したイラストでは、手が破綻しやすい傾向にあります。
よく起こるのが六本指になったり、あらぬ方向に曲がっていたり、指の形が崩れていたり、などですね。

そのため、手指を強調しない構図にしたり、あるいはinpaintで修正掛けたりするわけです。

これまでのDALL-E3も手に関しては強くて破綻しにくかったのですが、ChatGPTの画像生成AIがネイティブモデルに変わってからは、更に破綻しにくくなっている傾向があります。


例えば、今回のアイキャッチ画像の例で見ていくと、「片手で銃の形を作り、もう片手で横ピースする」というポーズは本来AIにとっては難易度がかなり高いはずなのですが、難なく自然に出来ています。

画像
手のポーズ以外に、元のキャラクターを保持しつつ、更に文字入りまで出来ている…


ちなみに、ポーズの再現性もかなり高くて、被写体・画風・画像サイズなどを変えても、同じポーズのプロンプトを使い回せば、下記のように破綻なく再現できます。

画像


このように、このレベル感の難易度であれば、ほとんど手や指が破綻することがありません。
一昔前に言われてた「AIは手が苦手」という状況とは雲泥の差だなと思います。


ただ、そうなるとどこまで複雑なことが出来るのかが気になりますよね。
ということで、今回は手のポーズの複雑さについて、可能性を検証してみました。

今回は下記キャラクターを作りましたので、これをベースにして、上手く生成出来たポーズ、出来なかったポーズを紹介していきます。


画像


①生成が上手くいったポーズの例

・少し開いた手を口元を覆う

画像

まずは難易度低めなポーズから。 
手の位置も指示通りで、これは特に問題はないですね。


・人差し指を立てて、指先から魔法を出す

画像

こちらもそこまで難しくないポーズなので、問題なさそうですね。


・手を組んだ祈りのポーズ

画像

手を組んだポーズはそもそも複雑ですし、上下関係もおかしくなりがちなのですが、こちらは割と綺麗に生成出来ています。


・人差し指と親指で三角形を作る

画像

指で三角形を作るのってこれまで難しかった記憶があるのですが、これも破綻なく出来ています。
人差し指と親指で、というのもプロンプト通りです。


・両手でもみあげを引っ張る

画像

何気に衝撃を受けたのは、この画像です。
掴む動作が難しいのはもちろんのこと、そもそも「もみあげ(横髪か?)」をきちんとAIに認識させるのって難しかったんですよね。

やはりGPT 4oと統合されて、相当理解度が高くなってると感じます。


・両手をクロスさせながら、もみあげを引っ張る

画像

先程の例を更に複雑化したもの。
腕を交差するところで破綻しやすいのですが、問題なさそうです。

ただ、これがどういうシチュエーションで必要になるのかは謎ですね。


・トランプを扇状にして持つ

画像

カードの持ち方って難しそうかなって思ったのですが、これも特に問題ないですね。


・片手でポニテを触り、片手で頬に人差し指を当てる

画像

これも左右の手で別の動作しているので複雑ではあるのですが、若干親指が怪しいくらいで、明確には破綻してないですね。


・おまけ:四コマ型式で、指で「L,O,V,E」の文字を作る

画像

指で文字を表現するのも出来るんじゃないかと思ってやってみたもの。
これも割と上手く生成出来ています。


ちなみに、「Eの字」を単独で指示すると、下記のように無理矢理頑張ってくれます。
指がつりそうですね。

画像


②生成が難しかったポーズの例

・キツネの影絵

画像
いわゆるキツネの形の手が再現できない…

意外とできなかったのが、「キツネの影絵」。
何度か試してみたのですが、上手くいかず…。
ここまでの例に比べてそこまで難易度高いとは思えないので、プロンプトの仕方が悪かったかもしれません。


・あやとりでタワーを作る

画像
謎の超絶テク

あやとりも上手くいかないですね。
東京タワー作れるのは凄いけど、色々な物理法則を無視してます。
指というよりは、複雑な状態の紐が再現出来なさそうです。


・ルービックキューブを半回転する

画像
破壊神

ルービックキューブも上手く回せない。
揃えられないからといって、ナチュラルに力づくで解決しようとする姿勢はやめて頂きたいところ…。


まとめ:複雑な手のAIイラストもできそう?

今回は、「複雑な手のポーズ」について見てきました。
割と難易度高そうなポーズでも、全体的に破綻しにくいなと思います。
もちろん完璧ではなくて、裏でちらほらおかしなものもあったのですが、総じて言えばプロンプト精度は高いので、凝った表現にも使えそうですね。


参考になったらスキしてもらえると嬉しいです。
それではまた。


〇関連リンク


いいなと思ったら応援しよう!

Alpaka もし気に入っていただけたら、チップで応援して頂けると嬉しいです。その気持ちが次の創作の大きな励みになります!

ピックアップされています

生成AI関係の解説・エッセイ

  • 33本

緋色のメモ帳|思考と創作のハルモニア

  • 2,968本

何度も読みたい記事達🍀

  • 202本

Wife is Beautiful

  • 219本

画像生成

  • 16本

コメント

9
Yuki
Yuki

とても素晴らしい実験をありがとうございます。
あやとりとルービックキューブのときは、手も少しおかしくなってますね。
この手のおかしさが、プロンプトなどで修正できるのか、少し気になりました。

こんばんは😊 Copilotで手をつなぐ、手を組む、小指に赤い糸を繋ぐ、などを試したことがあるんですが、手ってちょっとした角度で感情が出やすいというか、難しそうだと思いました。バリエーションがいくつもあって、楽しかったです😄

Alpaka
Alpaka

Yukiさん、こんにちは!
コメントありがとうございます✨
一応、部分修正が使えますので、手だけ修正掛けることも可能です⭐
ただ、修正して上手くいくは別問題ですが…。

Alpaka
Alpaka

あかりさん、こんにちは!
コメントありがとうございます✨
構図とか、ポーズによっても手の表現って変わってくるので、組み合わせの難しさもありますよね😌
小指に赤い糸とかは難易度的にも、描写的にも面白そうですね😊

コメントするには、 ログイン または 会員登録 をお願いします。
生成AI(エッセイ・解説)、AIイラスト、note運営など創作や役立つ情報を発信中。月間9万PVブログ運営・SEO上位獲得・雑誌寄稿経験あり。 イラスト制作・執筆など、お気軽に「クリエイター問い合わせ」からご相談頂けます。■ブログ︰https://lib-erty.com/
ChatGPTで「複雑な手のポーズ」に挑戦してみる【画像生成AI】|Alpaka
word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word

mmMwWLliI0fiflO&1
mmMwWLliI0fiflO&1
mmMwWLliI0fiflO&1
mmMwWLliI0fiflO&1
mmMwWLliI0fiflO&1
mmMwWLliI0fiflO&1
mmMwWLliI0fiflO&1