マウスコンピューターのクリエイター向けPC「DAIV」シリーズで検証:
画像生成AI 速いマシンは世界が違う
AI時代の開発で成功するには「速いマシン」が不可欠
実際のプロトタイプの開発作業は、小さなサイズ(2048×768ドット)で大量に様々な画像を生成し、基準となる画像を決めます。その画像を生成するランダム値(Seed値)を固定し、ハイレゾ設定を2倍(4096×1536ドット)に拡大していくという方法を取りました。検証も兼ね、どこまでサイズが生成可能なのかを0.25倍刻みで増加させて出力しています。
RTX 4090機 | RTX A6000機 | ||||
---|---|---|---|---|---|
画像サイズ | 画像倍率 | 生成時間(秒) | VRAM使用率 | 生成時間(秒) | VRAM使用率 |
2048x768 | 1倍 | 15.19 | 64.83% | 20.8 | 40.89% |
2560x960 | 1.25倍 | 58.07 | 84.83% | 75.2 | 54.98% |
3072x1152 | 1.5倍 | 79.47 | 100.00% | 113.73 | 72.13% |
3584x1344 | 1.75倍 | 127.66 | 100.00% | 188.64 | 95.06% |
4096x1536 | 2倍 | エラー | 100.00% | 309.53 | 100.00% |
生成した画像はPhotoshopで画像解像度を縮小し、Blenderに持ち込み、プラグインの「I-Mesh」で深度画像と組み合わせて3Dモデル情報へと変換して調整します。そしてFBXデータで出力し、UE5に持ち込みます。元の画像もUE5にインポートし、マテリアル化することで、背景のモデルとして設置できるようにしています。
プロトタイプでの検証としては、まだまだ細かな調整は必要になりそうなものの十分な結果だと考えています。調整としては、DepthもWebUIの拡張機能の一つとして公開されているDepth Extensionで作成した画像の方がきれいに生成できるため、そちらのデータを使うように切り替えています。また、ランダムで実施するよりも、ControlNetを使って構図を決めてから、描画した方が効率は良さそうです。ControlNetを利用した場合に、必要なVRAM量が増加する上に計算時間も2分程度長くなる傾向がありますが、それでも、結果的には効果は高くなると考えています。
開発チームの結論としては、画像生成AIは十分にゲーム開発にも応用可能であり、今後、さらにツールとして重要になってくると考えています。成功を作り出すためには、より速いマシンを用意することで試行錯誤のペースを上げ、質と量とを兼ね備えることで、生産性の向上にも結び付けられると結論付けています。速いマシンは、すさまじいペースで進行する画像生成AIの進化の中で、時間を買っているのと同じ効果があります。
最後にDAIVの新筐体について。これまで開発用に使っていたどのPCより大きなマシンですが、前面に取っ手、後面下方に車輪が2個付いていて、簡単に移動できるよう工夫されていました。本体上部にUSB 3.0が2個、USB Type-Cが1個付いているのも前面にあるより使いやすいですね(DAIV新デザイン詳細)。
内部空間が広がり、大型のビデオカードを2基搭載できるほどのスペースが確保されたのもポイントです。搭載できる空冷ファンは2基から6基に、水冷なら120mmラジエーター1基から240mmラジエーター2基に増えました。電源ユニットは吸気・排気口を備えたチャンバーに格納されて、CPUとGPUの熱干渉が少ない状態で冷却可能。次世代CPU&GPUの稼働も問題なしということでした。
画像生成AIはやはり「速さこそ正義」の世界。本格的に取り組むなら、クリエイター向けPCとしての「DAIV」は自信を持ってお勧めできます。
筆者紹介:新清士(しんきよし)
1970年生まれ。株式会社AI Frog Interactive代表。デジタルハリウッド大学大学院教授。慶應義塾大学商学部及び環境情報学部卒。ゲームジャーナリストとして活躍後、VRマルチプレイ剣戟アクションゲーム「ソード・オブ・ガルガンチュア」の開発を主導。現在は、新作のインディゲームの開発をしている。著書に『メタバースビジネス覇権戦争』(NHK出版新書)がある。
(提供:マウスコンピューター)