【Animagine XL 3.0】誰でも簡単にアニメ美少女の画像を生成できるAIの使い方や料金を解説

2024-01-12

WEELメディア事業部LLMリサーチャーの中田です。

1月10日、Cagliostro Research Labが、拡散モデルベースのText-to-Imageの画像生成モデル「Animagine XL 3.0」を公開しました。

このAIツールを使うことで、テキスト指示から高画質なアニメ画像を、簡単に生成できるんです…！

HuggingFaceでのモデルダウンロード数は、すでに5,048を超えており、多くの人に使われていることが分かります。素人でも簡単にアニメーション画像を作れるため、アニメ制作などにも活用できそうです。

まるで、VTuberの『キズナアイ』のようなビジュアルも、簡単に作れるんです。

この記事ではAnimagine XL 3.0の使い方や、有効性の検証まで行います。本記事を熟読することで、Animagine XL 3.0の凄さを実感し、普通の画像生成AIには戻れなくなるでしょう。

ぜひ、最後までご覧ください。

なお弊社では、生成AIツール開発についての1時間無料相談を承っています。こちらからお気軽にご相談ください。
→無料相談で話を聞いてみる

Animagine XL 3.0の概要

Cagliostro Research Labが、拡散モデルベースのText-to-Imageの画像生成モデル「Animagine XL 3.0」を公開しました。2ヶ月前に、同研究チームは「Animagine XL 2.0」を発表しており、それを「最高のオープンアニメ画像生成モデル」に改良するために、ファインチューニングしたのだとか。

加えて、Stable Diffusion XLをベースに開発されており、以下のようなアニメ画像を生成するのに特化しています。

なお、Animagine XL 2.0について詳しく知りたい方は、下記の記事を合わせてご確認ください。
→【Animagine XL 2.0】解像度が高すぎるアニメ画像を生成できちゃうAIを使って推しの女の子を作ってみた

Animagine XL 3.0の料金体系

Animagine XL 3.0はオープンソースであるため、誰でも無料で利用可能です。

ただ、「Fair AI Public License 1.0-SD」というライセンスのもとで提供されており、モデルの変更を行った場合、その変更と元のライセンスを共有する必要があります。また、変更されたバージョンがネットワーク経由でアクセス可能な場合、他者がソースコードを入手できるようにする必要があります。

Animagine XL 3.0の使い方

今回はGoogle ColabのT4で実行しました。

また、以下のGradioのデモページで、簡単に試すことができます。

参考記事：ANIMAGINE XL 3.0 Gradio Demo Page

まずは、以下のコードを実行して、必要なライブラリをインストールしましょう。

!pip install -q --upgrade diffusers invisible_watermark transformers accelerate safetensors

次に、以下のコードを実行して、モデルのロード等を行いましょう。

import torch
from torch import autocast
from diffusers import StableDiffusionXLPipeline, EulerAncestralDiscreteScheduler

model = "linaqruf/animagine-xl"

pipe = StableDiffusionXLPipeline.from_pretrained(
    model,
    torch_dtype=torch.float16,
    use_safetensors=True,
    variant="fp16",
    )
pipe.scheduler = EulerAncestralDiscreteScheduler.from_config(pipe.scheduler.config)
pipe.to('cuda')

そして、以下のコードを実行することで、画像を生成できます。

import matplotlib.pyplot as plt
from PIL import Image

prompt = "face focus, cute, masterpiece, best quality, 1girl, green hair, sweater, looking at viewer, upper body, beanie, outdoors, night, turtleneck"
negative_prompt = "lowres, bad anatomy, bad hands, text, error, missing fingers, extra digit, fewer digits, cropped, worst quality, low quality, normal quality, jpeg artifacts, signature, watermark, username, blurry"
output = "/content/anime_girl.png"

image = pipe(
    prompt,
    negative_prompt=negative_prompt,
    width=1024,
    height=1024,
    guidance_scale=12,
    target_size=(1024,1024),
    original_size=(4096,4096),
    num_inference_steps=50
    ).images[0]

image.save(output)
image = Image.open(output)
plt.imshow(image)
plt.axis('off') # to hide the axis

生成結果は、以下の通りです。

かなり精度が高く、しっかりとアニメ調ですね！

ちなみに、30秒くらいで生成できました。

なお、公式ブログによると、以下のようなプロンプト設計がおすすめだそうです。

1boy/1girl, what character, from which series, everything else in random order*

Animagine XL 3.0を動かすのに必要なPCのスペック

■Pythonのバージョン

Python 3.8以上

■必要なパッケージ

diffusers
invisible_watermark
transformers
accelerate
safetensors

なお、ChatGPTの新プランについて詳しく知りたい方は、下記の記事を合わせてご確認ください。
→【ChatGPT Team Plan】法人用ChatGPTプランの使い方や料金、できることを解説

Animagine XL 3.0を実際に使ってみた

ここでは、キズナアイさんのような「VTuber」を作ってみようと思います。

プロンプトを以下の様に変更し、再度実行してみます。

"face focus, cute, masterpiece, best quality, 1girl, pink hair, virtual youtuber, playing a game, upper body, beanie, indoors"

結果は以下の通りです。

VTuberにはならなかったですが、pink hairやbeanie（ニット帽）の部分、「playing a game」の部分は上手く反映されているようです！

virtual youtuberというよりも、ゲーム配信をするYouTuberっぽくなりましたね。そもそもVTuberの概念を知らないのでしょうか？

【無料】2023年11月版｜生成系AIの業務活用なら！

・生成系AIを活用したPoC開発

・生成系AIの業務活用コンサルティング

・システム間API連携

無料ダウンロード

生成系AIの業務活用なら！

・生成系AIを活用したPoC開発

・生成系AIのコンサルティング

・システム間API連携

無料ダウンロード

Animagine XL 3.0の推しポイントであるアニメ画像生成は本当なのか？

Animagine XL 3.0は本当に、以前のバージョンのAnimagine XL 2.0よりも進化したのかを、検証してみます。そのために、先ほどと同様のプロンプトを、Animagine XL 2.0にも入力してみます。結果は以下の、右の通りです。

左：Animagine XL 3.0の生成結果
右：Animagine XL 2.0の生成結果

どちらもプロンプトの内容を、うまく捉えられていると思います。

ただ、やはり今回の（左画像の）Animagine XL 3.0の方が、よりリアルなアニメ画像を生成できるようですね！確かに、前回バージョンよりも進化しているのが分かります。

率直に、将来のアニメ制作においても、本モデルは大いに活用できると思いました。

なお、Google SGEについて詳しく知りたい方は、下記の記事を合わせてご確認ください。
→Google SGEとは？生成AI時代の検索ツールの日本からの使い方や機能一覧を紹介

まとめ

Cagliostro Research Labが、拡散モデルベースのText-to-Imageの画像生成モデル「Animagine XL 3.0」を公開しました。本モデルは、アニメ画像を生成するのに特化しています。確かに、前回バージョンよりも進化しており、今回のAnimagine XL 3.0の方が、よりリアルなアニメ画像を生成できるようです。

率直に、将来のアニメ制作においても、本モデルは大いに活用できると思いました。

数年後には、キズナアイのようなVTuberのビジュアルも、簡単に作れるようになっているのかもしれないですね。

【経営者必見】生成AI時代に企業が今とるべき行動とは？社内活用のリスクとその対策

自社サービスに生成AIを活用したいと思っている経営者、経営幹部、情シスに向けた無料オンラインセミナーです。

スクロールできます

開催日程	2024年1月21日(木) 20:00 – 21:00
受講料	無料
定員	20名程度
対象者	・経営者、経営幹部、情報システム部門責任者・社内で生成AIを導入したい方・自社サービスに生成AIを活用したいと思っている方・生成AI時代に置いてかれないようにしたいと思っている方・ライバル企業よりも早く生成AIを活用したいと思っている方

セミナーの内容

⚫️オリエンテーション
講師の紹介、弊社のご紹介、本セミナーのご説明を行います。

⚫️社内で生成AIを活用するメリット
生成AIを活用するとどのような効果があるかを説明します。

⚫️生成AIを社内で導入する流れ
生成AIを社内で導入する際のプロセスをステップ毎に説明します。

⚫️生成AIを社内で活用する方法
生成AIを社内で活用する方法を体型的にまとめます。

⚫️自社でできる範囲と生成AI企業でないとできない範囲
GPTs/playground/PoC開発でできる範囲を説明します。

⚫️自社サービスに生成AIツールを活用した実績
弊社の実績をご紹介します。

⚫️QA
生成AI業界で経験豊富な講師がどんなご質問にもお答えします。

セミナーに参加する

投稿者

中田

データサイエンス専攻の大学院生。大学では、生成系AIの拡散モデルを用いた音楽生成について研究。趣味は作曲、サッカー、コーヒー。

View all posts

URLをコピーしました！

URLをコピーしました！

【Animagine XL 3.0】誰でも簡単にアニメ美少女の画像を生成できるAIの使い方や料金を解説

Animagine XL 3.0の概要

Animagine XL 3.0の料金体系

Animagine XL 3.0の使い方

Animagine XL 3.0を動かすのに必要なPCのスペック

Animagine XL 3.0を実際に使ってみた

Animagine XL 3.0の推しポイントであるアニメ画像生成は本当なのか？

まとめ

【経営者必見】生成AI時代に企業が今とるべき行動とは？社内活用のリスクとその対策

セミナーの内容

投稿者

Pick up

GPT Storeとは？使い方や収益化の方法、GPTsの検索方法を解説

「日本一透明性の高いAIプロフェッショナル集団」
を目指して

【Animagine XL 3.0】誰でも簡単にアニメ美少女の画像を生成できるAIの使い方や料金を解説

Animagine XL 3.0の概要

Animagine XL 3.0の料金体系

Animagine XL 3.0の使い方

Animagine XL 3.0を動かすのに必要なPCのスペック

Animagine XL 3.0を実際に使ってみた

Animagine XL 3.0の推しポイントであるアニメ画像生成は本当なのか？

まとめ

【経営者必見】生成AI時代に企業が今とるべき行動とは？社内活用のリスクとその対策

セミナーの内容

投稿者

関連記事

Pick up

GPT Storeとは？使い方や収益化の方法、GPTsの検索方法を解説

「日本一透明性の高いAIプロフェッショナル集団」を目指して

「日本一透明性の高いAIプロフェッショナル集団」
を目指して