Googleの人工知能(AI)研究者らが、静止画写真と同じように、自撮り動画に新しい背景を付けられるようにする機能を準備しているようだ。
背景を変える技術は以前から存在するが、大抵は複雑で時間のかかる処理だ。映画制作で、スーパーヒーローが緑色のスクリーンの前でアクションし、後からコンピュータで、緑色の部分を爆発するビルなどのデジタル効果で置き換える処理を思い浮かべてほしい。
Googleは、慎重にラベル付けした多数の画像を使ってニューラルネットワークをトレーニングし、目、髪、メガネ、口などの顔の特徴をそれ以外のあらゆるものから区別する方法を学習させた。それによって、動画に十分に対応できる速度で背景を置き換えられるシステムを完成させた。Googleの技術によって、「Google Pixel 2」で40fps、「iPhone 7」では100fpsを超える速度で動作するという。
この機能は、YouTubeのストーリーサービスを利用する非常に少数のユーチューバーのみに提供されている。ストーリーサービスでは、「Snapchat」の「ストーリー」機能に似たショートビデオを共有する機能が提供されている。
Googleはこの研究について、ブログ記事で詳細を説明している。
GoogleのソフトウェアエンジニアであるValentin Bazarevsky氏とAndrei Tkachenka氏は、「当社の新しいセグメンテーション技術によって、クリエイターらは背景を置き換えて変更できるようになり、特殊な装置がなくても労なく動画の制作価値を高めることができる」と述べた。
この技術は、複雑な演算問題を解決する上でAIと機械学習技術がどれだけ多様に利用できるかを示している。ニューラルネットワーク技術は、「顔には目が2つあり、その下には鼻があるが、顔を横から見た場合はそうはならず、目が1つしか見えない場合があり、また、対象者が暗いサングラスをかけている場合もそうはならない」というような無限に続く規則を把握している必要はない。ただ、顔というものを実際に認識している人間によってラベル付けされた十分な写真でトレーニングすれば、徐々にそのパターンを学習する。スパムメールの検出から、スマートフォンに入力しようとしている単語の予測にいたるまでのあらゆる場面で、きわめて有効な技術であることが実証されている。
Googleは現時点でこれまでに、Pixel 2スマートフォンの関連機能にAIを利用している。この端末にはカメラが1つしかないが、縦向き写真の背景ぼかしにAIが使われている。
この記事は海外CBS Interactive発の記事を朝日インタラクティブが日本向けに編集したものです。
B2B市場への参入を目指すスタートアップを
強力に支援するプログラムが登場!
“4つのユースケース”からひも解く
DX時代のビジネスを支えるADCとは?
最先端企業であるために何をすべきか?
注目のデータ管理ソリューション最前線
ローカライズ対応で必要なデータ流出
を守る鍵は「機密環境」作りにあり