Imagen 4 と Imagen 4 Ultra の概要
「Imagen 4」と「Imagen 4 Ultra」の概要をまとめました。
・Imagen 4 is now available in the Gemini API and Google AI Studio
1. はじめに
これまでで最高のテキスト画像変換モデル「Imagen 4」(imagen-4.0-preview-06-06)「Imagen 4 Ultra」(imagen-4.0-ultra-preview-06-06) を、「Gemini API」の有料プレビューと「Google AI Studio」の限定無料テストで利用できるようになりました。
2. Imagen 4 と Imagen 4 Ultra
「Imagen 4」は、2種類のモデルがあります。
2-1. Imagen 4
「Imagen 4」は、「Imagen 3」と比べて特にテキスト生成の品質が大幅に向上し、幅広い画像生成タスクを処理できるように設計された、Googleの主力のText-to-Imageモデルです。
「Imagen 4」の価格は、出力画像1枚あたり $0.04 です。
2-2. Imagen 4 Ultra
指示に正確に従う画像が必要な場合は、「Imagen 4 Ultra」が最適です。テキストプロンプトに正確に沿った出力を生成するように設計されいます。「Imagen 4 Ultra」の価格は、出力画像1枚あたり $0.06 です。
今後数週間以内に、追加の課金ティアを導入する予定です。それまでの間、「Imagen 4」「Imagen 4 Ultra」のレート制限の引き上げをリクエストできます。
3. Imagen 4 をためす
「Imagen 4」で作成可能なサンプルをいくつか紹介します。「Imagen 4 Ultra」を使用して作成された以下のプロンプトは、様々なスタイルやコンテンツに対応するモデルの汎用性を示しています。
【例1】
Theme: 4-panel comic. Panel 1: An anime-style girl with short pink hair and a ribbon is running down a suburban Japanese road with a piece of toast in her mouth. The speech bubble reads "Late, late!" Panel 2: The girl collides with something. A loud sound effect suggests the collision. Sound effect: "Crash!" Panel 3: The girl has fallen and is sitting on the ground. She looks a little hurt. The speech bubble reads "Ouch, ouch, ouch..." Panel 4: A short distance away, a young man in a blazer uniform is sitting. The two have just bumped into each other around a corner and are looking at each other.
【翻訳】
テーマ:4コマ漫画。1コマ目:ピンクのショートヘアにリボンをつけたアニメ調の少女が、トーストをくわえて日本の郊外の道路を走っています。吹き出しには「遅刻、遅刻!」と書かれています。2コマ目:少女は何かに衝突します。大きな効果音が衝突を示唆します。効果音:「ガチャン!」 3コマ目:少女は転んで地面に座り込んでいます。少し怪我をしているように見えます。吹き出しには「痛っ、痛っ、痛っ…」と書かれています。4コマ目:少し離れたところに、ブレザーの制服を着た若い男性が座っています。二人は角を曲がったところでぶつかり合い、見つめ合っています。
【例2】
A digital anime style illustration with a soft, hand-drawn, sketch-like aesthetic, watercolor and pastel textures, and a muted, desaturated, cool color palette of soft blues and grays. A light-skinned anime girl with long black hair and red eyes is sitting in a resting area of an abandoned village's unmanned train station. She is wearing a white summer dress that reaches to her knees and sandals. On her head, she wears a straw hat with a wide brim, adorned with a blue ribbon tied into a bow around the base of the crown. The train tracks, a clear blue sky, and clouds occupy more than half of the foreground, stretching out before her. Soft, diffused lighting creates a serene and somewhat melancholic mood.
【翻訳】
手描きのような柔らかなスケッチ風の美的感覚、水彩画とパステル調のテクスチャ、そして落ち着いた青とグレーの彩度を抑えたクールなカラーパレットを備えたデジタルアニメ風のイラスト。長い黒髪に赤い目をした色白のアニメ少女が、廃村の無人駅の休憩所に座っています。彼女は膝丈の白いサマードレスとサンダルを身に着けています。頭にはつばの広い麦わら帽子をかぶり、帽子の根元には青いリボンが蝶結びで飾られています。線路、澄み切った青空、そして雲が、彼女の目の前に広がる前景の半分以上を占めています。柔らかく拡散した照明が、穏やかでどこかメランコリックな雰囲気を醸し出しています。
【例3】
Front of a vintage travel postcard for Kyoto: iconic pagoda under cherry blossoms, snow-capped mountains in distance, clear blue sky, vibrant colors.
【翻訳】
京都のビンテージ旅行ポストカードの表面: 桜の下の象徴的な五重塔、遠くの雪を頂いた山々、澄んだ青い空、鮮やかな色彩。
【例4】
Photograph of an adventurous couple hiking on a mountain peak at sunrise, arms raised in triumph, epic panoramic view of valleys below, dramatic light.
【翻訳】
日の出の山頂でハイキングをする冒険好きなカップルの写真。勝利の腕を上げ、眼下に谷の壮大なパノラマビュー、ドラマチックな光。
【例5】
Avant-garde fashion editorial shot: a model in a voluminous, architectural gown standing on a shimmering, alien landscape under a binary sunset, surreal colors, high-concept, cinematic.
【翻訳】
前衛的なファッション編集ショット: 二重の夕日の下、きらめく異星の風景に立つ、ボリュームのある建築的なガウンを着たモデル、シュールな色彩、ハイコンセプト、映画的。
4. Imagen をはじめる
信頼性と透明性を維持するため、「Imagen 4」で生成されるすべての画像には、「SynthID」デジタル透かしが含まれます。
詳しくは、公式ドキュメントとクックブックを参照してください。



コメント