AI

OpenAIとGoogleの画像生成AIを大量のサンプルで比較した結果をカメラアプリ開発者が公開


カメラアプリ「Photon Camera」や画像編集アプリ「Photon Enhance」を開発するLateNiteSoftが、複数のサンプル写真を用いて各種画像編集AIの性能を比較した結果を公開しました。

We ran over 600 image generations to compare AI models - LateNiteSoft Blog
https://latenitesoft.com/blog/evaluating-frontier-ai-image-generation-models/

LateNiteSoftは以下の5枚の写真を画像生成AIに入力し、多様なプロンプトで編集して結果を比較しました。比較したAIはOpenAIの「gpt-image-1」、Googleの「gemini-2.5-flash-image(Nano Banana)」、ByteDanceの「seedream-4-0-250828」の3種で、2025年10月8日に日本の公称10Gbpsの光回線で検証を実施したとのこと。


以下はネコの写真を「Grungy vintage photo(汚れたヴィンテージ写真)」というプロンプトで編集した結果で、右から順に「gpt-image-1」「Nano Banana」「seedream-4-0-250828」の編集結果が並んでいます。gpt-image-1はプロンプトに合わせて画像を柔軟に編集するものの、柔軟すぎて元の被写体の構図から離れてしまうことがあります。一方で、Nano Bananaは元の画像の情報を維持しすぎて、プロンプトの効き目が弱いのが特徴的。seedream-4-0-250828は中間的な結果です。


「Apply a heat map effect(ヒートマップエフェクトを適用)」というプロンプトでも、Nano Bananaだけヒートマップっぽい画像になりませんでした。


「Pinhole camera(ピンホールカメラ)」というプロンプトだとこんな感じ。ピンホールカメラで撮影したような周辺減光の激しいぼやけた画像になることを狙ったプロンプトでしたが、Nano Bananaは「デバイスの左上にカメラを追加する」という動作になりました。


プロンプトを「Pinhole camera effect(ピンホールカメラのエフェクト)」に変更すると、Nano Bananaでもピンホールカメラで撮影した画像風になりました。


「Make it look like the photo is etched in glass(写真をエッチングガラス風に)」という指示だと、それぞれまったく異なる結果になりました。seedream-4-0-250828はデバイス全体がガラス製になったような独特の結果です。


「Give the object a metallic sheen(被写体をメタリックに)」だと、seedream-4-0-250828が最もメタリック感を強調できました。Nano Bananaとseedream-4-0-250828は「撮影者のスマートフォンが光沢部分に写り込む」という効果も再現しています。


「Remove background(背景を削除)」という指示ではgpt-image-1だけ元の構図を大胆に変更してしまいました。


「Transform into low poly art(ローポリアートに変換)」の結果はこんな感じ。seedream-4-0-250828は秀逸な出来栄えです。


「Apply a ukiyo-e Japanese woodblock print style(日本の木版浮世絵スタイルを適用)」だと、Nano Bananaだけ浮世絵っぽくなりませんでした。


「Turn them into an action figure in the blister pack(ブリスターパックに入ったアクションフィフュアに変えて)」というプロントでは三者三様な結果になりました。gpt-image-1はかなりデフォルメした画風になり、gpt-image-1では元画像の姿勢や体型を維持しています。


LateNiteSoftは「少なくとも現時点では万能なモデルは存在しません。gpt-image-1はスタイル変換や創造的な生成といったフィルターとして最適です。一方で、Nano Bananaはリアルな編集に適しています。seedream-4-0-250828はgpt-image-1とNano Bananaの中間です」と結論付けています。

この記事のタイトルとURLをコピーする

・関連記事
画像生成AIがテキスト指示による画像編集でどれだけ指示を守ることができるかを実際の生成画像を見て評価できる「GenAI Image Editing Showdown」 - GIGAZINE

Googleの画像生成AI「Nano-banana」をめちゃくちゃ活用できるプロンプトとサンプル画像実例まとめ - GIGAZINE

ChatGPTに高精度な画像生成機能「4o Image Generation」が追加される、GPT-4oの知識を活用しつつ画像を生成可能で著名人を含む画像も可 - GIGAZINE

ByteDanceが画像生成AI「Seedream 4.0」をリリース、4K解像度の画像を生成可能&画像編集機能も備えてGoogleやOpenAIを一部テストで上回る - GIGAZINE

高品質な画像編集AI「FLUX.1 Kontext [dev]」が登場、元の画像を保ったまま指示通りに加工できるオープンモデル - GIGAZINE

キャラクターを維持したまま別のシチュエーションに描き直せる画像編集AI「Qwen-Image-Edit」が登場、文字の描き直しや「被写体の回転」も可能 - GIGAZINE

in AI, Posted by log1o_hf

You can read the machine translated English article Camera app developer releases results co….