GPT-4oの画像生成がすごいというので、学習元画像の案を探してみた。 Tシャツはアマゾンなどの画像、ホワイトボードに文字を書く女性、サンフランシスコのベイブリッジも似たアングルで先行画像があった。


写り込みのカメラマンの姿は画像検索しずらかったが、生成するスタイルの指定(写り込み部分をどう表現するか)と、 生成する対象(男性で両手持ちの撮影者)を合成している可能性がある。そこは進歩していそう。


個別の要素を単純に並べるのではなく、全体の合成に対するパースのコントロールを効かせようとしている気がする。 言語だと「丁寧に」「正確に」「親切に」などとポスト処理で補正するが、画像もそのような処理ができてきている可能性がある。


生成AIは、ポスト処理で、参照した可能性のある学習元画像を明記してくれれば良いのに。透明性がない。 プログラムコードについても、参照元URLやGitHubアカウント名、参照の程度を示す%の数値など明示してくれたら使いやすくなる。


学習元に明確に対価を支払う仕組みにすれば良いのに、特にコンテンツ系では、そのコストを負担できるほどの価値をまだ生み出せない。結局、コンテンツ系の生成AIは海賊版みたいになる。 生成AIのおかげで、だれもが自由に海賊版公開アカウントになれます!って、明るい未来なのか。


Loading...

Something went wrong.


Something went wrong.