TOPページへ戻る
次世代ビジネスに貢献するイノベーター NTTコムウェア
【サーバー連携によって広がりを持ったイメージベースAR】マーカ不要でセンサー精度も影響しない画像認識をベースとしたARシステム NTTコムウェア 基盤技術本部 研究開発部 中村 誠

新たなビジネスの可能性を求めてARに挑戦

近年、ICTを活用した新しい表現手法として「AR」に注目が集まっている。これは、「Augmented Reality(オーグメンテッドリアリティ)」=「拡張現実感」と呼ばれるもので、カメラなどを通して入力された映像に、情報を付加して表示するといった技術やその応用サービスを指す。「主人公が特殊なゴーグルを装着して敵を眺めると、その強さが表示される」といった、SFやアニメでお馴染みのシーンをイメージするとわかり易いかもしれない。もちろん、実際はまだそこまでではないが、一般人でも利用できる商品やサービスが次々と登場している。
携帯電話では、文字を入力する代わりに「2次元バーコード」と呼ばれる四角いマーカを読み取ることで、素早く確実に情報を取得できる仕組みが当たり前のものになっている。ARは、その延長に位置づけられるが、デバイスの多様化やハードウエアの進化によって、マーカの読み取りだけに限らない、さまざまな手法が用いられている。
ICTを活用した新しい表現や情報取得の方法として期待されるARだが、NTTコムウェアでも「イメージベースAR」という技術を中心に、この分野の研究開発を行っている。これに取り組むのが、基盤技術本部 研究開発部の中村誠だ。

「イメージベースARというのは、撮影した写真の中の特定の部分に動画を重ねて再生することで、まるで静止画が動き出したかのような効果を与えるというものです。もともと、私の所属している研究開発部で同じイメージベースARという名前の研究開発を企画していました。その成果を、NTTビジネス推進本部とともにビジネス化したのがこのサービスになります。」
一般的なARの手法
ページトップへ

従来にはない手法を採用したイメージベースAR

イメージベースARの手法
2009年の夏、中村はそれまで取り組んでいた研究がひと段落したため、次の研究テーマを探していた。その時、NTTビジネス推進本部から「コンテンツというキーワードで何か新しい企画を考えないか」という話を持ちかけられた。NTTビジネス推進本部は、新しいサービスを企画することがミッションの組織で、コンテンツビジネスの新たな種になりそうなものを探していた。中村の所属する研究開発チームとブレストを重ね、当時注目され始めていたARがキーワードとして浮かび上がった。

「動画コンテンツに絡めた何かを作り出せないかとブレストしていた時に、ARというキーワードが出てきました。その時は、コンテンツ表示方法として、面白そうという反応でした。
ARというもの自体は以前から知っていましたが、深く掘り下げたことはなかったので、それをきっかけにいろいろと調べてみました。既存の技術やサービスを見てみると、二次元バーコードのようなマーカを認識して情報を表示させるもの、GPSや地磁気センサーの位置・方角情報を使って情報を表示させるサービスが主流だとわかりました。
ただし、その2つには課題もありました。マーカを使う方法は、わざわざマーカを用意する手間があるということ。センサーを使うものは取得する位置・方角情報に数メートルの誤差が出ることもあるため、正確な場所に情報を表示できないということです。私たちがやりたかったのは、画像にスマートフォンをかざすだけで対象を認識し、その場所に正確に情報を重ねて表示するというものでしたので、これをどうやって実現するかが研究テーマになりました。」
ページトップへ

外部の意見や反応を積極的に取り入れながら開発

イメージベースARのシステム構成図
画像認識処理のエキスパートたちがいた中村のチームだが、ARは初めてでビジネスにどう結び付けられるかは見えていなかった。そこでプロトタイプを開発して、周りの人間に見せて反応を見ることにした。簡単なプロトタイプだったが反応は思いのほか好評で、ビジネス的にも可能性があると話は進んだ。そして2010年1月には、本格的なプロジェクトとして動き出すことになった。

「イメージベースARの特徴は、撮影した画像内の特定領域に合わせて動画を重ねて再生するというものです。ポイントとなるのは、元の画像、つまり静止画から動画へスムーズにつながって見えるということです。これによって、撮影した画像がまるで動き出したかのように見えるわけです。この表現は開発当初から意識していて、周りの人々もそこに目をひかれたようです。その後も、ブレストや社内外からの意見を参考にブラッシュアップして、現在のイメージベースARが完成しました。マーカ要素が不要ですから、デザイン性を損ねることがありません。さらに、ポスターや看板、雑誌の表紙など、既存の画像でも対象にできます。」

ポスターを認識すると言葉にするのは簡単だが、認識対象は光の具合や角度などの撮影環境によって変わる。さらに、撮影した画像に合わせて違和感なく動画をはめ込むことも、拡張現実感が得られるためには重要な要素だ。いかにして「絵が動き出す!」という演出を驚きとともに表現できるかが、重要なポイントだった。

「画像の認識率も最初は50%を切るような状況で、どうやれば精度を高められるか試行錯誤の日々でした。画像の認識処理については、特徴量を検出する技術にこれまでのノウハウが生かされています。

そしてスマートフォンの処理能力やシステムの拡張性、コンテンツ配信方法などを考慮した結果、サーバーを使って認識処理を行うシステム構成になりました。スマートフォン単体で実現しようとすると、画像の認識用データをすべてスマートフォンが持っている必要があり、スマートフォンのメモリ容量やデータ配信方法が課題となります。しかし、サーバー側で認識処理を行うならば認識対象を容易に増やせます。また、認識結果のログが取得できるのでマーケティング的な分析も可能になるという副次的な意義も生まれました。」

画像認識処理(マッチング)の仕組み

早期のプロトタイプが異例のスピードで商品化をもたらした

イメージベースARの今後の技術的展望 イメージベースARのプロジェクトは、最初のアイデアが生まれてからサービス化まで、約1年弱。通常は2〜3年かかることを考えると、これは驚くべきスピードだ。その成功要因について、早期のプロトタイプと内外からの意見をもらえたことだと中村は話す。
「研究開発は、技術がサービス化されるまでの一番最初の段階です。そこに携わる者として、その技術が日の目を見てほしいと常々思っています。今回の企画は、非常に早くサービス化までこぎつけることができて、研究者として大変貴重な経験になりました。早い段階でデモ用のプロトタイプを用意したことで、社内だけでなくお客様の生の声を聞きながら研究開発を進めることができました。これもNTTビジネス推進本部の絶大な協力があったからこそだと感謝しています。
以前から心がけていたことではありますが、ユーザーにどうしたら共感してもらえるか、どうしたら役立つことができるかを考え、常にスピード感を持って対応することが大切であると実感しました。
イメージベースARは、商品化されただけでなく、映画やテレビドラマ、雑誌、観光地のキャンペーンなど、非常に身近なところで使っていただきました。これまで、自分が関わるものは世の中に広く使ってもらいたいと思っていましたから、とても感動しました。」

画像を認識し、それに結び付られた動画を重ね合わせて再生するという研究は、商品化まで実現することができた。しかし、研究に終わりはない。イメージベースARの発展として、ランドマークや立体物、文字の認識という、さらに高い目標に向かって挑戦は続いている。
Windows Media Player の入手

当サイトで掲載されているムービーをご覧いただくには、Microsoft社「Windows Mediaョ Player」が必要です (無償)。
お持ちでない方は、こちらからダウンロードしてご利用ください。

※記載されている会社名、製品名などは、各社の商標または登録商標です。
中村誠(なかむらまこと)
NTTコムウェア 基盤技術本部 研究開発部
2000年NTTコムウェア株式会社入社。研究開発部にて動画配信プラットフォーム技術、動画像メタデータ技術、Tangible技術、IPTV映像品質測定技術、高臨場感映像技術等の動画配信や画像処理関連の研究開発に従事。2009年11月よりAR関連の研究開発を担当。
サーバー連携によって広がりを持ったイメージベースAR PDF版ダウンロード
2011.6
次世代ビジネスに貢献するイノベーター メディアプロモーションに活用されるイメージベースARのビジネスの可能性
ページトップへ
次世代ビジネスに貢献するイノベーター
第1回 NGNサービスを支えるネットワークオペレーション技術
第2回 未来オフィス実現に向けた取り組み
第3回 NGNの可能性を広げる応用サービスへの取り組み
第4回 NGN時代におけるホームICTへの取り組み
第5回 イメージベースARが生み出す新しい映像体験とビジネス
第6回 OpenFlowが変える次世代ネットワーク
関連サイト
■NTTコムウェアオフィシャルサイト
Copyright (c) NTT COMWARE CORPORATION 2009,2012