【Animagine XL 3.0】誰でも簡単にアニメ美少女の画像を生成できるAIの使い方や料金を解説
WEELメディア事業部LLMリサーチャーの中田です。
1月10日、Cagliostro Research Labが、拡散モデルベースのText-to-Imageの画像生成モデル「Animagine XL 3.0」を公開しました。
このAIツールを使うことで、テキスト指示から高画質なアニメ画像を、簡単に生成できるんです…!
HuggingFaceでのモデルダウンロード数は、すでに5,048を超えており、多くの人に使われていることが分かります。素人でも簡単にアニメーション画像を作れるため、アニメ制作などにも活用できそうです。
まるで、VTuberの『キズナアイ』のようなビジュアルも、簡単に作れるんです。
この記事ではAnimagine XL 3.0の使い方や、有効性の検証まで行います。本記事を熟読することで、Animagine XL 3.0の凄さを実感し、普通の画像生成AIには戻れなくなるでしょう。
ぜひ、最後までご覧ください。
なお弊社では、生成AIツール開発についての1時間無料相談を承っています。こちらからお気軽にご相談ください。
→無料相談で話を聞いてみる
Animagine XL 3.0の概要
Cagliostro Research Labが、拡散モデルベースのText-to-Imageの画像生成モデル「Animagine XL 3.0」を公開しました。2ヶ月前に、同研究チームは「Animagine XL 2.0」を発表しており、それを「最高のオープンアニメ画像生成モデル」に改良するために、ファインチューニングしたのだとか。
加えて、Stable Diffusion XLをベースに開発されており、以下のようなアニメ画像を生成するのに特化しています。
なお、Animagine XL 2.0について詳しく知りたい方は、下記の記事を合わせてご確認ください。
→【Animagine XL 2.0】解像度が高すぎるアニメ画像を生成できちゃうAIを使って推しの女の子を作ってみた
Animagine XL 3.0の料金体系
Animagine XL 3.0はオープンソースであるため、誰でも無料で利用可能です。
ただ、「Fair AI Public License 1.0-SD」というライセンスのもとで提供されており、モデルの変更を行った場合、その変更と元のライセンスを共有する必要があります。また、変更されたバージョンがネットワーク経由でアクセス可能な場合、他者がソースコードを入手できるようにする必要があります。
Animagine XL 3.0の使い方
今回はGoogle ColabのT4で実行しました。
また、以下のGradioのデモページで、簡単に試すことができます。
参考記事:ANIMAGINE XL 3.0 Gradio Demo Page
まずは、以下のコードを実行して、必要なライブラリをインストールしましょう。
!pip install -q --upgrade diffusers invisible_watermark transformers accelerate safetensors
次に、以下のコードを実行して、モデルのロード等を行いましょう。
import torch
from torch import autocast
from diffusers import StableDiffusionXLPipeline, EulerAncestralDiscreteScheduler
model = "linaqruf/animagine-xl"
pipe = StableDiffusionXLPipeline.from_pretrained(
model,
torch_dtype=torch.float16,
use_safetensors=True,
variant="fp16",
)
pipe.scheduler = EulerAncestralDiscreteScheduler.from_config(pipe.scheduler.config)
pipe.to('cuda')
そして、以下のコードを実行することで、画像を生成できます。
import matplotlib.pyplot as plt
from PIL import Image
prompt = "face focus, cute, masterpiece, best quality, 1girl, green hair, sweater, looking at viewer, upper body, beanie, outdoors, night, turtleneck"
negative_prompt = "lowres, bad anatomy, bad hands, text, error, missing fingers, extra digit, fewer digits, cropped, worst quality, low quality, normal quality, jpeg artifacts, signature, watermark, username, blurry"
output = "/content/anime_girl.png"
image = pipe(
prompt,
negative_prompt=negative_prompt,
width=1024,
height=1024,
guidance_scale=12,
target_size=(1024,1024),
original_size=(4096,4096),
num_inference_steps=50
).images[0]
image.save(output)
image = Image.open(output)
plt.imshow(image)
plt.axis('off') # to hide the axis
生成結果は、以下の通りです。
かなり精度が高く、しっかりとアニメ調ですね!
ちなみに、30秒くらいで生成できました。
なお、公式ブログによると、以下のようなプロンプト設計がおすすめだそうです。
1boy/1girl, what character, from which series, everything else in random order*
Animagine XL 3.0を動かすのに必要なPCのスペック
■Pythonのバージョン
Python 3.8以上
■必要なパッケージ
- diffusers
- invisible_watermark
- transformers
- accelerate
- safetensors
なお、ChatGPTの新プランについて詳しく知りたい方は、下記の記事を合わせてご確認ください。
→【ChatGPT Team Plan】法人用ChatGPTプランの使い方や料金、できることを解説
Animagine XL 3.0を実際に使ってみた
ここでは、キズナアイさんのような「VTuber」を作ってみようと思います。
プロンプトを以下の様に変更し、再度実行してみます。
"face focus, cute, masterpiece, best quality, 1girl, pink hair, virtual youtuber, playing a game, upper body, beanie, indoors"
結果は以下の通りです。
VTuberにはならなかったですが、pink hairやbeanie(ニット帽)の部分、「playing a game」の部分は上手く反映されているようです!
virtual youtuberというよりも、ゲーム配信をするYouTuberっぽくなりましたね。そもそもVTuberの概念を知らないのでしょうか?
【無料】2023年11月版|生成系AIの業務活用なら!
・生成系AIを活用したPoC開発
・生成系AIの業務活用コンサルティング
・システム間API連携
生成系AIの業務活用なら!
・生成系AIを活用したPoC開発
・生成系AIのコンサルティング
・システム間API連携
Animagine XL 3.0の推しポイントであるアニメ画像生成は本当なのか?
Animagine XL 3.0は本当に、以前のバージョンのAnimagine XL 2.0よりも進化したのかを、検証してみます。そのために、先ほどと同様のプロンプトを、Animagine XL 2.0にも入力してみます。結果は以下の、右の通りです。
- 左:Animagine XL 3.0の生成結果
- 右:Animagine XL 2.0の生成結果
どちらもプロンプトの内容を、うまく捉えられていると思います。
ただ、やはり今回の(左画像の)Animagine XL 3.0の方が、よりリアルなアニメ画像を生成できるようですね!確かに、前回バージョンよりも進化しているのが分かります。
率直に、将来のアニメ制作においても、本モデルは大いに活用できると思いました。
なお、Google SGEについて詳しく知りたい方は、下記の記事を合わせてご確認ください。
→Google SGEとは?生成AI時代の検索ツールの日本からの使い方や機能一覧を紹介
まとめ
Cagliostro Research Labが、拡散モデルベースのText-to-Imageの画像生成モデル「Animagine XL 3.0」を公開しました。本モデルは、アニメ画像を生成するのに特化しています。確かに、前回バージョンよりも進化しており、今回のAnimagine XL 3.0の方が、よりリアルなアニメ画像を生成できるようです。
率直に、将来のアニメ制作においても、本モデルは大いに活用できると思いました。
数年後には、キズナアイのようなVTuberのビジュアルも、簡単に作れるようになっているのかもしれないですね。
【経営者必見】生成AI時代に企業が今とるべき行動とは?社内活用のリスクとその対策
自社サービスに生成AIを活用したいと思っている経営者、経営幹部、情シスに向けた無料オンラインセミナーです。
開催日程 | 2024年1月21日(木) 20:00 – 21:00 |
受講料 | 無料 |
定員 | 20名程度 |
対象者 | ・経営者、経営幹部、情報システム部門責任者 ・社内で生成AIを導入したい方 ・自社サービスに生成AIを活用したいと思っている方 ・生成AI時代に置いてかれないようにしたいと思っている方 ・ライバル企業よりも早く生成AIを活用したいと思っている方 |
セミナーの内容
⚫️オリエンテーション
講師の紹介、弊社のご紹介、本セミナーのご説明を行います。
⚫️社内で生成AIを活用するメリット
生成AIを活用するとどのような効果があるかを説明します。
⚫️生成AIを社内で導入する流れ
生成AIを社内で導入する際のプロセスをステップ毎に説明します。
⚫️生成AIを社内で活用する方法
生成AIを社内で活用する方法を体型的にまとめます。
⚫️自社でできる範囲と生成AI企業でないとできない範囲
GPTs/playground/PoC開発でできる範囲を説明します。
⚫️自社サービスに生成AIツールを活用した実績
弊社の実績をご紹介します。
⚫️QA
生成AI業界で経験豊富な講師がどんなご質問にもお答えします。