AIとのつきあい方(画像生成AI編)
近年、クリエイターたちにとってAIに関する動向は無視できないものになってきております。
AIを利用するにしてもしないにしても、
クリエイターとしてどのような方針で活動していくのか、しっかり立場を自覚しておくことが大切なのではないでしょうか?
クリエイターズマガジンは作家のみなさんに、そのための根拠をより精度高く持ってもらうための情報を提供したいと思っていて、AIニュースに詳しい方に記事をお願いしました。
AI関連の事業やってる方で、常に情報追ってるので頼めてラッキーと思ってます!!
毎月一本、AI関連のニュースのキュレーションや考察など頼んでおりますので、ぜひ活動に役立てていただけたらと思います!
イントロダクション
昨年8月頃から急速に盛り上がりを見せてきた、Stable DiffusionやChatGPTなどの生成AIたち。興味はありながらもなかなか手が出せていない……という方も多いのではないでしょうか。AIの能力は今までの常識を根底から覆すほど強力なもので、もはやAIの登場以前と以後とで時代を分けて考える必要すらあります。
今回は、Stable DiffusionやMidjourney、DALL-E 2に代表される「画像生成AI」の基礎知識とそれらが漫画制作へ与える影響についてご紹介します。
画像生成AIの概要
画像生成AIには様々な種類がありますが、現在最も盛り上がっているものが「拡散モデル (Diffusion model)」という手法です。拡散モデルとは、学習時と生成時に「ノイズ除去」の原理を利用して、文字通りピクセルを潜在空間から拡散させていくことによって画像の生成を試みます。
引用元:https://twitter.com/999cc/status/1643603761133412353
学習時には、学習元のイラストを潜在空間に圧縮した上でノイズ付与を繰り返し、テキストとノイズ除去の過程をベクトル空間上に重みのパラメーター(ウェイト)として学習していきます。このとき学習するのは「この画像は『緑色のツインテールの女の子が立っているイラスト』で、こういう特徴があるな!」という傾向です。逆に生成時には、ランダムなノイズ画像から、学習した結果にもとづいてノイズ除去を繰り返すことによって、イラストや写真を作り出しています。
最終的にAIが学習したモデルは、ノイズ除去のために使うパラメーターだけが保存されるため、何億枚もの画像を学習していても、モデルサイズはたった数GBに収まるのです。
引用元:https://twitter.com/999cc/status/1643787291956228096
※もっと詳しく知りたい!という方は、こちらの記事をおすすめします。
■ 世界に衝撃を与えた画像生成AI「Stable Diffusion」を徹底解説!
https://qiita.com/omiita/items/ecf8d60466c50ae8295b
このような、何もないまっさらな状態から今までにない新たな生成物を生み出すAIを、特に生成AI(ジェネレ―ティブAI)と呼ぶのです。
画像生成AIの始め方
もしあなたが、NVIDIAのグラフィックボードを搭載したWindows PCを所有しているのであれば、Stable Diffusion WebUIの導入をおすすめします。グラフィックボードは、ゲーミングPCはVR Ready PCであれば搭載されているはずです。StableDiffusionなどのAIをお手元の環境で動かす際には多くのVRAMを使用するため、グラフィックボードが必要です。
一方で、Macでも利用する方法や、NovelAIなど画像生成できるWebサービスを活用する方法もあります。※なお、Google Colabを使用してWebUIを起動する方法は現在無料では使えなくなってしまったようです。
現在最も最新の技術に触れられるのはStable Diffusion WebUIというソフトです。AUTOMATIC1111という人物によって公開されています。話題のControlNetやAIアニメなどは、このWebUIを使用して実現されています。
(導入方法は以下のような記事が詳しいです。
https://kurokumasoft.com/2023/02/06/stable-diffusion-web-ui/ )
ただしこれらの導入は、まだまだハードルも高いです。
そこで、本稿ではMidjourneyの導入をおすすめします。
Midjourneyは、StableDiffusionよりも先に発表された、画像生成AIブームの火付け役ともいえる存在ですよね。未だにアップデートで世の中を驚かせ続けています。ちなみに、Midjorneyの派生版であり二次元イラスト特化版であるNiji・journeyも、Midjourneyの中でモードを切り替えて使用することができます。(追加料金はかかりません)
Midjourneyは以下のような特徴があります。
月額制で有料である(無料お試しは廃止されました)
きれいでそれっぽい画像を簡単かつ多様に出すことができる
Discord上で使用するため、Discordが使用できるならスマホ含めどんな環境からも使用できる
プロンプト(呪文)の書き方はStable Diffusionほど難しくなく、日本語でプロンプトを入力してもある程度動作する。
参考画像を読み込ませて、それっぽい画像を生成することができる(/describeコマンド)
出力画像を細かく調整したりコントロールすることは苦手
ただし、Midjourneyは生成された画像が原則として全てネットに公開されるので注意が必要です。(公開チャンネルではなくbotとのDMで生成をすればやりとり自体が見られることはありません。生成結果を完全に非公開にするためには料金が高いプランに入る必要があります)
画像生成AIの応用例
それでは、そんな画像生成AIが、漫画家やクリエイターの皆さんにとってどのように役に立つのかをご紹介します。
① キャラクターデザインのアイデア発案
Stable DiffusionやNijijourneyを活用すれば、キャラクターデザインのブレストがとても効果的に行えます。
キャラクターデザイン、特に主要でないキャラクターのデザインでは、手癖で描くとどうも似通ってしまう……といったお悩みがある方もいるでしょう。
↓Midjourneyでの「/imagine prompt:a old man, holding sword, reference sheet, --ar 4:3 --niji 5」
プロンプトに「Reference sheet」を含めると、このようなキャラクター設定資料のような結果を得ることが出来ます。パラメーターとして「--ar 4:3」のように値をプロンプト末尾に付け足すと、4:3など好きなアスペクト比(Aspect Ratio)で生成することができます。
こんな感じのガチャを軌道修正しながら何度でも回すことができるので、あなたの創作活動にインスピレーションを与える新しい刺激になること間違いなしです。
※ただし、版権キャラクターに類似したものが出てきてしまう可能性があるので、そのままの使用は避けたほうが無難です。
例ではキャラクターデザインを試していますが、同様に武器や小道具などのアイテムやマスコットキャラクターについても同じようにブレストできそうです。
イメージとしては、今までPinterestなどで行っていた画像検索による資料探しがより柔軟かつ効率的になる! という感覚が近いかな、と思います。
② 背景や小物の作画補助
StableDiffusionを使用すれば、背景や小物などの作画を効率的に行える可能性があります。
もっとも、よく言われているように画像生成AIの出力は不安定だったり細部が破綻していたりして「ぱっと見の印象は良いけどよくよく見るとヘン!」というものが多いです。AIはファンタジー(城など)や自然っぽい背景は割と得意な傾向にあり、逆に人工物や室内(店内・教室など)は破綻しやすい傾向にある、と考えてよさそうです。
https://twitter.com/abubu_newnanka/status/1642808234900873216
https://twitter.com/abubu_newnanka/status/1642811830316965896
しかし、昨今話題になっているControlNetという技術を使用すると、たとえばラフをもとに作画させたり、領域を定義して作画させたりということが可能です。
ControlNetは、先述のWebUIの拡張機能という形で提供されており、現在ControlNet1.1という最新版が出ています。
ControlNetは簡単にいうと「様々な方法によって、画像生成AIで出力される画像に対してヒントを与えることができる」という技術です。たとえば、元画像の輪郭線をヒントにすることができるCannyや深度情報をヒントにできるDepth Map、落書きをヒントにできるScribble、棒人間で姿勢指定ができるOpen Pose、領域を指定できるSegmentationなどです。
詳しい使い方や効果は以下の記事に分かりやすくまとまっています。
https://kurokumasoft.com/2023/02/16/stable-diffusion-controlnet/
https://kurokumasoft.com/2023/04/19/controlnet-new-features/
まとめ
画像生成AIは日進月歩で新たな技術が開発されたり高性能なモデルが公開されたりと、話題が尽きない領域です。一方、倫理的な面やトレスといった悪用なども度々取り沙汰されています。特にイラスト業界やマンガ業界などはAIに対する反発の声もまだまだ大きく、理解が進んでいるとは言い難い現状があります。とはいえ、画像生成AIが新たなツールとして人類の創作活動に寄与していくことは確実であり、現にアートコンテストを受賞していたり、PhotoshopやCLIP STUDIO PAINTなどにツールとして組み込まれていたり、次々と生活に浸透しています。
いかにAIだと悟られずAIを活用して、活動を拡張するか。当面はこの観点を持つことが肝要です。AI化の波に乗り遅れずとも呑み込まれないように、AIの動向や「いまのAIのレベル」を正確に把握していきましょう。
いかがだったでしょうか(>_<)
続けていくためにも、記事おもしろかったらマガジンの購読をお願いします!月額500円です。
とりあえず内容を知ってもらうために、今月は記事全部読めるようにしてあります。
また、noteアカウントのいいね・フォロー・他SNSへの拡散もとても嬉しいです。
よろしくお願いします。
続きをみるには
この記事が気に入ったらサポートをしてみませんか?