モバイルARの本格的普及の鍵となるのは「ARクラウド」
AppleのARKitに続きGoogleがARCoreをリリースしたことで、AR (拡張現実)アプリは一挙に身近なものとなりました。どちらも無料で、クールで、とにかく機能します。
しかし現在のところ「普及」といっても、AR開発者の間でYouTube動画の大量再生を生み出す程度にとどまっているようです。ARアプリが目新しさだけの流行りものではなく、広く一般社会に普及してゆけるものであることを、開発者はこれから証明していかなくてはなりません。
ARアプリをiPhoneやハイエンドAndroid携帯に配信する大規模チャネルができたことで、いくつかのメガヒット(『ポケモンGO』など)は恩恵を受けるでしょう。しかし私には、これで何億人もがARアプリを日常的に使うようになるとは思えません。
ARKitやARCoreベースのARアプリは、友達がいないネットをサーフィンするようなものです。あまりに1996年的すぎます。
誤解しないでほしいのですが、ARKitの登場はこの業界において史上最高のニュースです。ただARアプリの本格的な普及が始まるには、もうひとつ鍵となるものが必要なはずです。それは「ARクラウド」、つまり時間、空間、デバイスを超えて一貫したARエクスペリエンスを実現する環境です。
私はその役割をiPhone Xに期待していました。深度センサーを搭載した背面カメラが何千万人もの手に渡り、それぞれが持ち主を取り巻く外界を走査して、ユーザーが作成したリッチで精密な3Dマップを、他のユーザーとARクラウド上で共有できるようになるのではないかと。今回その期待は叶いませんでしたが、次のバージョンではきっと実現するでしょう。ARクラウドの実現が遅れても、需要がなくなることはないからです。
iPhone Xの深度カメラは前面のみの搭載にとどまった。背面への搭載が欲しいところ
2017年は大きな転換点
この2年間、ARの認知度が高まりモバイル機器のスペックもARの実現に必要とされる水準に追いついてくる中、多くのスタートアップがARKitやARCoreと同じようなARトラッキング機能を開発していました。しかしAppleとGoogleの発表によるワンツーパンチを受けて、時代の波に乗り続けるためには一刻も早くポジショニングを変えねばならない状況に陥っています。そこでクロスプラットフォーム機能へと舵を切るのは自然な結論かもしれません。しかし、この薄い付加機能レイヤーに将来性はどれだけあるでしょう。それに、作ったものを複数のプラットフォームにデプロイする機能ならすでにUnityが提供しています。後から同じ分野に参入したスタートアップが存在感を確立するには、二番煎じでないツールやサービス、コンテンツを提供することが必要ではないでしょうか。
私は何か劇的な発表があったとき、それがプラス方向に及ぼす影響を考えることにしています。ARKitとARCoreの件でまず思いついたのは、これでARテック系スタートアップは困難な基礎作りから解放されたわけで、賢明なところはバリューチェーンのより上の階層、より美味しいところを目指すだろうということでした。つまりARクラウドです。
ARの研究者や業界関係者は昔からこう予測していました。いつか将来、全世界のリアルタイム3D (環境)マップ、つまり「ARクラウド」が、FacebookのソーシャルグラフやGoogleのページランクインデックスよりはるかに価値のある、コンピューティングにおいて唯一の、そして最も価値あるソフトウェアインフラストラクチャになるだろうと。
私はAR業界でかれこれ10年働いています。2009年に共同設立した会社(Ogmento、現Flyby)はAppleに買収され、ARKitの基盤となりました。ちなみに、買収される前は同じテクノロジーをGoogle Tangoにもライセンスしていたんですが。私はAWE (AR専門カンファレンス)とSuper Ventures (AR特化ファンド)の共同設立者でもあるので、AR業界についてはかなり幅広い見聞を持っているつもりですし、ARが大きな価値を生み出しそうな分野を常に探し求めています。
この記事は、ARクラウドがARKitやARCoreを土台に作り出せる価値について注意を向けてもらうために書きました。
ARKit、ARCore、そしてこれらが示唆するものに関する掘り下げた考察については、Super Venturesにおける私のパートナーMatt Miesnieksがすばらしい連載記事(英語)を書いていますので、そちらをご一読ください(だいぶ話題になったのでご存じの方もおいででしょう)。
ARでのコラボレーションに関する記事については、Super Venturesにおける私のもう一人のパートナーで、この分野にかけては世界をリードする専門家でもあるMark Billinghurstの記事(英語)をご覧ください。
なぜARクラウドが必要なのか
簡単に言うと、ARクラウドがあると、全世界が立体的な共有スクリーンになり、複数ユーザーによる干渉や共同作業が可能になるからです。
ARKitやARCore上に構築されたアプリのほとんどはシングルユーザーのAR体験なので、そうした魅力が削がれてしまいます。確かに今、YouTubeにはARを使った特殊効果やら見世物やらの投稿動画が大量にあふれかえっていますが、ARエクスペリエンスの動画をシェアするのは、ARエクスペリエンス*そのもの*を共有するのとは違います。マグリットの言葉を借りれば、「これはパイプではない」のです。
ルネ・マグリットの1928年の作品。パイプを描いた下に「これはパイプではない」と書き込むことで、これはパイプの絵であって実物ではないということを見る人に考えさせる
ARクラウドとは物理世界の共有記憶であり、単なる動画やメッセージでなく経験そのもののシェアを可能にします。つまり、ゲーム、デザイン、研究、問題解決といった共同作業を、現実世界のあらゆるものに対して行えるようになるのです。
複数ユーザーによる関与の実現はARクラウドの大きな魅力の一つですが、それ以上の可能性を秘めているのは、情報が現実世界に蓄積されていくという点です。
共有スペースにおけるコラボレーションAR空間のコンセプト(2011年)
※画像内の吹き出しの訳
左上:共通のARプレイスペース(現実とバーチャルのオブジェクトが混在している)
右上:リモートからも同じ体験に制約なく参加できる
左下:拡張現実を画面表示
情報の構造化のされ方が根本から変わる時代が到来しようとしています。現在、世界の情報のほとんどはデジタルの文書、動画、情報スニペットの形でサーバーに格納され、ネット経由でどこからでも引き出すことができます。しかし、それには何らかの形の検索や発見を必要とします。
Googleの最近の調査によれば、検索の50%以上は移動中に(現在位置に即して)行われています。必要な情報を、必要な場所で、必要な時に取り出したいというニーズが高まっているのです。
ARクラウドは世界のソフト3Dコピーとしてはたらき、情報をその出所で(科学者流にラテン語で言えば、in situ(イン・サイチュ、「本来の場所で」という意で)――つまり物理世界で再編成できるようにします。
ARクラウドがあれば、物を見ればその使い方を、場所を見ればその歴史を、人を見ればその経歴を、情報として呼び出すことができます。
そしてARクラウドをコントロールする者は、世界の情報がどのように分類されアクセスされるかの決定権を握ることになるのです。
ARクラウドはいつ実現するのか
スタートアップがARクラウドに取り組んだところで、ARKitの例のように、チャンスをつかむ前にコモディティ化してしまうのではないかという危惧を抱く人もいるでしょう。
ARクラウドは心臓の弱い人には向きません。実現するにはもうしばらく時間がかかるでしょう。業界のリーダーたちは、開発者や専門家や消費者に対してそのように説明しています。しかし、ARや先端技術分野の投資家にとっては、今こそこの長距離レースに誰が勝ちそうかを見極めるべき時です。
建築分野における初期の最初のコラボレーティブARデモのひとつ、2004年
参考までに、最近ARKitとARCoreの登場でコモディティ化されたばかりの、ARトラッキング技術の歴史を見てみましょう。
– 点群が初めて考案される:19世紀
– Andrew Davidsonによる、コンピューターヴィジョンを使った初のリアルタイムSLAM:1998
– George Kleinによる、iPhone上での単眼SLAMデモ(※):2008
– Project TangoによりARに特化した初のモバイル端末が発表:2012
– OccipitalのStructure Sensorを装着したiPad上でのSLAM:2013
– Flybyによる、現在のARKitに近い機能のデモ:2013
– ARKitおよびARCoreの発表:2017
編集部注:SLAM:Simultaneous Localization and Mappingの略。自己位置推定と環境地図作成を同時に行うこと。SLAMを使ったARでは、3Dモデル等を現実世界に文字通り「置く」ことができたり、キャラクターが「地面を歩く」など、現実の認識したものとなる。
このペースで技術が進歩するとすれば、成熟したARクラウドサービスが一般利用できるようになるまで、まだ3年以上はかかるでしょう。
その間にスタートアップは全体的なヴィジョンの部分に取り組むなり、先行者利益を狙いにいくなり、特化したニーズ(エンタープライズ用など)に合わせたサービスを構築するなりできます。
これまでにARクラウドを作ろうとしたところはないのか
この10年間にARサービスをクラウドから提供してきた企業はいくつもありました。古くは2008年のWikitudeに始まり、Layar、Metaio (Junaio)、のちにはVuforia、Blippar、Catchoom。現在はさらに多くの企業が参入しています(AR業界マップをご覧ください)。しかし、そのほとんどは以下のどちらかに分類されます。
– GPSまたは位置情報に紐付けられた情報の蓄積(レストランの店内にメッセージを吹き出しで表示するなど)
– ARエクスペリエンスを起動するための画像認識サービスをクラウドで提供
こうしたクラウドサービスは、実際にその場の状況や物理環境のジオメトリを把握しているわけではありません。そうした情報なしには、バーチャルなコンテンツを物理現実の中に説得力のある形で溶け込ませることはできません。まして、(見ばえのいい動画だけでなく)体験そのものを他者と共有するなどとても無理です。
『ポケモンGO』は幅広い層の人気を勝ち取っているが?
『ポケモンGO』が驚くほどの普及を遂げたのは、たぐいまれな例外、二つとない幸運です。ゲームメカニクスを真似たところで、同じような成功を収めるのは不可能ではなくとも極めて難しいでしょう。このゲームのサーバーは、ジオロケーション情報、きわめて詳細な地域画像、プレイヤーの行動履歴を蓄積しますが、6,500万人の月間アクティブユーザーがプレイした物理的な空間の認識を共有するものではありません。したがって、物理世界における体験の共有も起こりません。
そのためにはARクラウドが必要になります。
『ポケモンGO』は幅広い層の人気を勝ち取っているが?
ARクラウドに求められる要素については、1990年代から何人もの科学者がいろいろと考えているのですが、一般人向けの簡潔な説明にはなっていません。そこで、私なりにAR業界の文脈からざっくりまとめたバージョンを以下にご紹介します。
ARクラウドシステムに求められるものとは:
1) 実世界座標に紐付けられた永続的な点群(世界の共有ソフトコピー)
2) 複数デバイスがどこでも瞬時にローカライゼーション(実世界環境と世界のソフトコピーの位置合わせ)できる機能
3) バーチャルな事物を世界のソフトコピー内に配置し、それに対してリアルタイムかつオンデバイスで、かつリモートに相互干渉する機能
一つずつ解説していきましょう。
1) 実世界座標に紐付けられた永続的な点群
点群(点群)とは、Wikipediaの定義によれば「なんらかの座標系におけるデータポイントの集合であり、各ポイントは3次元座標系においては通常(x, y, z)で記述される」もので、3Dマッピングと再構成、測量、検査など、産業や軍事に現在かなり一般的に使われている技術です。(訳注: 筆者が引用したWikipediaの定義は、2017年11月1日時点の記述とは細部が異なります。訳文は記事原文をWikipedia英語版の記述から補足しつつ訳し起こしたため、日本語版の記述どおりではありません)物理世界から点群データを収集すること自体は、エンジニア流に言えば「解決済みの問題」です。点群データの作成や処理については、すでにハードウェアとソフトウェア両方のソリューションが多数開発されています。LiDARのようにアクティブレーザースキャナーを使うものもあれば、Kinectのように深度カメラやステレオカメラを使うものも、単眼カメラ写真やドローン撮影画像や衛星写真をフォトグラメトリで処理するものも、Vayyarなどの合成開口レーダーシステム(電波)や人工衛星レーダーを使うものもあります。
ちなみに、フォトグラメトリは写真とほぼ同時期に発明されたので、点群の概念が生まれたのは19世紀と考えることができます。
HoloLensによって生成された点群を用い、リビングルームの形状に合わせて表示されるゲーム
ARクラウドのクラウドソーシング
永続的な点群データが実世界の最新の状態を最大の範囲で常時反映しつづけるためには、もう1段階複雑なしくみが必要になります。つまり、モバイル端末を含めさまざまなソースから取得した点群を統一された形式でデータベースに格納し、そのデータを多数のユーザーがリアルタイムで取り出せるものでなくてはいけません。
スキャニングやトラッキングについては高度な対応機能 (ARKit、ARCore、Tango、ZED、Occipitalなど) を備えた特定のデバイスに限定するとしても、点群データの格納先はクロスプラットフォームで利用可能なデータベースであることが求められます。
個人が取得した点群データを共有する動機は、現在のWazeユーザーに似たものになるでしょう。Wazeは渋滞情報をコミュニティで共有するカーナビアプリです。ユーザーは価値あるサービス(最適な経路案内)を受けつつ、自分のデバイスから収集された情報(現在いる道路区間における移動速度)をバックグラウンドで共有することで、他のユーザーに対するサービス(情報のアップデート頻度)を向上させます。
しかしARクラウドにおいては、これが深刻なセキュリティおよびプライバシー上の懸念をもたらす可能性があります。個人の周囲の空間という、公道や高速道路よりはるかにプライベートな環境の記録を扱うことになるからです。スタートアップにとっては、点群データの暗号化に大きなビジネスチャンスがありそうです。
深度カメラはARクラウドの形成を加速する
深度(デプス)カメラは3Dマップの作成に大きな助けとなります。はっきりいえば、深度カメラを搭載しない通常のスマートフォンはあまり役に立たないといっていいほど重要な部品です。
深度カメラを使うと、周辺空間のジオメトリをより詳細に把握することができます。使用するアルゴリズムは通常のカメラを搭載したスマートフォンと同じようなものですが、より密度や精度の高い点群データが取得できるため、それだけ精密なARクラウドを作れるわけです。
これまでにも深度カメラを搭載したデバイスはいくつか存在しましたが、本格的普及には至りませんでした。Tangoの実験的な開発機は数千台売れました。Occipitalの深度センサーもやはり数千台売れたにとどまりました。2017年に発売されたTangoベースのLenovo Phab 2 Proは市販スマートフォンとしては初めて深度カメラを搭載しましたが大々的に普及したとはいえませんし、新しいASUS ZenFone ARもやはり市場の主流とはいえません。
iPhone Xの深度カメラはフロントのみの搭載にとどまりましたが、将来本格的なものが搭載されれば、飛躍的な価値をもたらすでしょう。それも無数のユーザーに。
マルチユーザーは新しい技術ではない
ARクラウドの要件として、マルチユーザーによるリアルタイムアクセスを挙げましたが、これはある意味、MMO (大規模多人数型オンライン)ゲームの根幹となるサーバーの役割に似ています。つまり、膨大な人数のユーザーがどこからでも情報にアクセスし、リアルタイムで共同作業を行えるようにすることです。ただし、MMOではサーバーに格納された永続的な人工世界の上にキャラクターやストーリーなどのコンテンツを配置するのに対し、ARクラウドでは現実世界そのものが舞台となり、そこへ拡張情報を付与した点群データを完璧に位置を合わせて配置することになります。
3Dマップは新しい技術ではない
3Dマップはすでに自動運転車やロボット、ドローンなどに広く使われています。ルンバのようなロボット掃除機でさえ、室内を動き回るために3Dマップを使用しており、将来的に作成したマップを共有することさえ検討されています。
ARクラウドは特別
しかしARクラウド用の点群は一般的なものとは異なり、ARに適したものでなくてはいけません。3Dマップが緻密すぎればモバイルデバイスで処理するには重くなりすぎて、ユーザーが求める瞬時の反応が得られなくなります。マップに欠落があれば、角度によってはローカライゼーションを行うことができず、ユーザーエクスペリエンスを損ねてしまいます。言い換えれば、ARクラウドとは独自のパラメーターセットを持った特殊な点群なのです。
Google Tangoはこれを「空間記憶」と呼んでいます。デバイスが物理空間の視覚的特徴(輪郭や角など、目印となるもの)を見分け、記憶して、後でまた同じ場所に来たときに認識できる機能です。
ARクラウドに必要なものは、屋内と屋外で異なりますし、エンタープライズ用かコンシューマー用かでも違ってくるでしょう。
しかし、何より重要なのは高速なローカライゼーションです。
2) 複数デバイスがどこでも瞬時にローカライゼーションできる機能
ローカライゼーションとはカメラの位置や向きを推定することで、あらゆるAR体験の基盤となる機能です。
Flybyのローカライザーが点群を現実のキッチンに重ね合わせているところ
ARアプリがバーチャルの事物を現実の空間に、作成者が意図した形で配置するためには、デバイスのカメラが現実環境のジオメトリを、どこからどの向きで見ているのかを知る必要があります。
そのためにはカメラがとらえた視覚的特徴点を、ARクラウドに記録された特徴点と照合し、一致する位置や角度を見つけます。即時ローカライゼーションを実現するには、ARクラウドのローカライザーが、デバイスの向きとGPSによる位置情報(さらにはWi-Fiや携帯基地局など他の信号を用いた三角測量)に基づいて検索結果を絞り込まなければなりません。より多くのコンテキストデータやAIを使えば、さらに精密な結果が得られます。
ローカライゼーションが完了すれば、ARKitやARCoreが(IMUとコンピューターヴィジョンを用いて)後を引き継ぎ、安定した位置トラッキングを行います。先に述べたとおり、この問題はすでに解決済みでコモディティ化もされています。
現在すでに、Google TangoやOccipital Sensorなど多数のソリューションが存在しますし、ARKitやARCoreもそのひとつです。しかし、こうした「箱の外」の手段では、一度に1つのローカル点群に対してしかローカリゼーションを行えません。Microsoft HoloLensは、HoloLensが生成した点群セットに対してローカライゼーションを行えますが、「箱の外」つまり他のデバイスが生成した点群に対してはできません。
膨大なローカル点群セットに対してあらゆる角度からローカライゼーションを行え、点群をクロスプラットフォームで複数デバイスに共有できる、「究極のローカライザー」の模索は続いています。しかし、どんなローカライザーも結局は永続的点群の質しだいなので、両方の構築をめざす意義は大いにあります。
3) バーチャルな事物を3次元に配置して可視化し、それとリアルタイムに、オンデバイスで、リモートに相互干渉する機能
永続的な点群と究極のローカライザーが作れたとしても、ARクラウドシステムを完成させるにはもう一つ、3次元に登録したバーチャルなコンテンツを配置し可視化できるようにする必要があります。「3次元に登録した」とは、平たく言うと「現実世界の中に、まるで本当にそこに物があるように位置を合わせた」ということです。このバーチャルなコンテンツはインタラクティブでなければいけません。複数のユーザーがそれぞれ異なるデバイスから、現実世界の同じスライスを、それぞれ異なる角度から観察し、同じコンテンツにリアルタイムで相互干渉できる必要があります。
「ゴッドモード」
ARクラウドとそのアプリケーションを維持管理するには、「ゴッドモード」が欠かせません。つまり、3Dコンテンツ(+ インタラクション)を広大な点群のどこにでもリモート配置できる機能です。ビデオゲーム『Black & White』でプレイヤーが操作する「神の手」のように、マップ上で任意の場所を選択すると、その空間をさまざまな角度から眺めたり、そこで起きていることをリアルタイムで観察したり、そこに配置されたコンテンツに干渉できる手段が必要です。これはコンピューターやタブレットなどさまざまなデバイスで行えるでしょう。そして「現実世界のCMS (コンテンツ管理システム)」とでもいうべき新しいジャンルを作り出すことになるでしょう。
ビデオゲーム『Black & White』では、プレイヤーは「神の手」を使ってすべてを見通し、すべてを操ることができる
さて、以上がARクラウドに求められる3つの要件です。実現はかなり難しそうですが、現在、これを構築できるところは存在するのでしょうか?
ARクラウドを作れるのは誰か?
ARクラウドほどの巨大プロジェクトとなると、それに取り組めるだけの深いポケットと大きな野心を持ちあわせている企業は、おそらく世界でも3社だけでしょう。
Apple、Google、Microsoftは、いつの日か独自に完全なARクラウドを実現させるかもしれません。できなければ、先に実現した企業に足元をすくわれることになります。
しかし歴史から考えて、ARクラウドの基礎を組み立て、概念を実証するのは、おそらくどこかの(クレイジーな)スタートアップになることでしょう。その可能性に賭けるだけの大胆さを持てるのはスタートアップだけだからです。
クレイジーで、かつ優れたスタートアップが必要になるでしょう。
1社で取り組むには大きすぎる規模ですから、複数のスタートアップが別々の部分に取り組むことになるかもしれません。少なくとも最初のうちは。
ARクラウドに部分的に取り組み買収された、「クレイジーで優れた」スタートアップ
– 13th Lab (Facebookが買収)
– Obvious Engineering/Seene (Snapが買収)
– Cimagine (Snapが買収)
– Ogmento→現Flyby (Appleが買収)FlybyはTangoにも技術をライセンスしていました。
– Georg Klein* (Microsoft
*Georgはスタートアップでなく個人ですが、たった一人で多くの企業を超える業績を成し遂げました。2009年にはiPhone 3Gで初めてARKitライクなデモを動かしているのです。
現在ARクラウドまたはその一部に取り組んでいるスタートアップ
YOUar (ポートランド)
Scape (ロンドン)
Escher Reality (ボストン)
Aireal (ダラス)
Sturfee (サンタクララ)
Paracosm (フロリダ)
Fantasmo (ロサンゼルス)
Insider Navigation (ウィーン(オーストリア))
InfinityAR (イスラエル)
Augmented Pixels (ウクライナ/シリコンバレー)
Kudan (ブリストル(英国))(※)
DottyAR (シドニー(オーストラリア))
Meta (シリコンバレー)
Daqri (ロサンゼルス)
Wikitude (ウィーン(オーストリア))
6D.ai (サンフランシスコ)
Postar.io (サンフランシスコ)
編集部注:Kudanはロンドンと東京の2拠点で事業を展開しています。
<そして…あなたのスタートアップも?>
ここに挙げた企業の多くはAWEに参加予定ですので、そこで実際の取り組みをご覧になれるでしょう。
大手企業はいま何をしているのか
1) Apple
AppleのCEO、ティム・クック氏はARについて「大きなアイデアだと思っている」と述べており、AppleがARへ積極的に取り組む姿勢であることがうかがえます。
ARKitは同社にとって、手軽に達成できる成果でした。(Flybyを買収したため)自社で動かすことができ、(Metaioを買収したことで)それを製品化できる専門家も確保していたからです。AppleがARKitの公開を決めたのは、今年のWWDCのわずか6か月前だったといわれています。
将来iPhone[の背面カメラ]に深度カメラが搭載されれば、緻密で正確な点群の作成は一気に加速し、深度カメラは以後のスマートフォンにとって標準機能となることでしょう。実現するとしても、まだ先の話ですが。
自動運転車向けの道路の3Dスキャニングや、地図機能のための2Dマッピングとポジショニングへの取り組み、そして「1,000人以上のエンジニアがARに取り組んでいる」という報道もありますが、Appleは今のところ、まだ本格的なARクラウドの構築に取りかかる態勢ではないようです。もしかしたら、データに関するプライバシーおよびセキュリティ上の懸念のせいかもしれません。あるいは、秘密主義のAppleのことですから、すでに取りかかっていることを巧妙に隠しているのかもしれません。
2) Google
「世界中の情報を整理」することを使命とするGoogleが、次にARクラウドの構築に乗り出すのは自然なことでしょう。Googleはこの壮大なプロジェクトを完成させるためのピースを最も多く保有しているはずですが、今すぐ大きな動きを起こすということはなさそうです。
Tangoは2013年に、独立型研究開発プロジェクトとして始まりました。そのビジョンには3つの要素が含まれています。
- Motion tracking (モーショントラッキング) — 視覚的機能と加速度センサー/ジャイロを用いたものです。AR Coreはここから派生しました。
- Area learning (空間記憶) — これはデバイスが物理空間の視覚的特徴(輪郭や角など、目印となるもの)を見分け、記憶して、後でまた同じ場所に来たときに認識できる機能です。また、環境データをマップに格納して後で再利用したり、他のTangoデバイスと共有したり、メモや指示や関心地点(POI)といったメタデータを付加したりもできます。
こう言うとARクラウドの構想にかなり近いようですが、現在のTangoは環境データをデバイスに格納するしくみで、他のTangoデバイスやユーザーに共有するメカニズムがありません。Tango APIもクラウドでのデータ共有をネイティブサポートしていません。
- Depth perception (深度認識): 周囲の物体の距離、サイズ、形状を検出する機能です。Tangoカメラが必要です。
GoogleはI/O 2017で、新サービスVisual Positioning Service (視覚測位サービス、VPS)を発表しました。完成すればARクラウドの実現がまた一歩近づくことになりますが、話を聞くかぎりは正直まだ「ごく初期の段階」というのが現状のようです。
とはいえGoogleはストリートビュー車を使って、すでに(屋外については)かなり詳細な3Dマップを構築しています。数年のうちにはすべてのパーツを揃えてARクラウドを完成させるかもしれません。しかしGoogleのAPIは機能が制限される傾向があるので、最適なエクスペリエンスを提供するには不十分かもしれません。
ですからGoogleが来たるARクラウドの主になる可能性は極めて高いものの、それはおそらく最良ではなく、最初でもない可能性があります。
3) Microsoft
Microsoft CEOがこの分野に注力していく姿勢であることは、クラウドコンピューティングやホログラフィックコンピューティングに明らかにうかがえます。HoloLensは、かさばるとはいえ現在最も完成度の高いARグラスシステムであり、すばらしいことに、デバイス上にローカルに永続する点群を作成する機能を実現しています。しかし、それを複数デバイスへネイティブに共有することはできません。Microsoftは現在のモバイルAR競争に参加するだけの有力な切り札がないため、次世代の焦点となるスマートグラス開発にいち早く着手することでリードを築きました。しかし、スマートグラスの普及はやはりまだスローペースなので、MicrosoftによるARクラウドへのニーズが高まるのもまだ先のことでしょう。
4) Facebook、Snap、そしてもしかしたらAmazon/Alibaba/Tencent
積極的な関心は持っているかもしれませんが、最先端からは何年分も遅れをとっています(先に挙げたスタートアップ各社にとっては、買収が大いに期待できるということです)
5) Tesla、Uberなどの自動運転車/ロボティクス関連企業
現実世界の屋外や屋内の3Dマップの構築をすでに始めているという点では候補といえますが、必ずしもARに特別な関心を持っているわけではありません。
未来のインフラストラクチャを築く機会
ARクラウドに取り組む企業の中から、Magic Leap以来のGoogle級スタートアップが生まれる可能性は大いにあります。そういえば、Magic LeapもかつてARクラウドの構築を目指していたはずです。今でもその意欲があるのか、私たちがその可能性を考慮すべきかはわかりません。
しかし、先に挙げた企業はいずれもクロスプラットフォームのソリューションを作るだけの動機がありません(例外はあるとしてもFacebookでしょう)。その点でも、スタートアップがARクラウド構築の先陣を切ることは有意義だといえます。
この投稿の目的は、ARクラウドの要件を要件定義書レベルで定義することではなく、私が予想するARクラウドの形を伝えることです。今後その予想を覆すようなアプローチが出てくることを楽しみにしています。
ARクラウドの構築、利用、あるいはそこに対する投資に関心をお持ちの方はご連絡ください。パートナーになりましょう。
— — — — — — — — — — — — — — — — — — — — — — — — — — — — — — —
今後のフォローアップ/投稿予定:
ARクラウドが実現した後の用途について
ARクラウドの各構成要素やサービスに特化した記事
ARクラウドにおけるアプリストアはどのようなものになるか
インディーARクラウドのプロバイダーの可能性についてインディーARクラウドプロバイダーに必要性はあるか
ARがすべての人に共有されるもう一つの現実となるなら、その中のコンテンツを誰が維持管理するべきか? DNSのような世界共通の仕組みが必要か?
参考資料(リンク先はすべて英語)
Raph Kosterが20年にわたるMMO史から学んだ知見(氏のウェブサイトを参照)
点群のハードウェアおよびソフトウェアのソリューションに関する情報
Naval Postgraduate Schoolによる空間認識に関する背景情報
Mark Billinghurstによる、共有空間における複合現実: コラボレーティブコンピューティングのための拡張現実インターフェイスについて(ホワイトペーパー)
コンピューターヴィジョンを用いた最初のリアルタイムSLAM: Andrew Davidsonの1998年の論文(指導教授はDavid Murray)
なぜARにおける3DマップはGoogle Mapsより価値があるのか
執筆協力: Matt Miesnieks
※本記事は、Super Venturesの共同創業者、Ori Inbar氏が同社のブログに2017年9月13日に掲載した記事「ARKit and ARCore will not usher massive adoption of mobile AR」を許諾を得て翻訳し、Mogura VRに転載したものです。