Amazon、開発者向けAIカメラ “DeepLens” を249ドルで販売開始
昨年11月のre:Inventカンファレンスで、Amazon AWSはDeepLensを発表した。これは開発者向けに作られたもので、視覚に特化した機会学習モデルの開発とプロトタイピングに利用される。同社は数ヶ月前にDeepLensの予約を開始し、今デベロッパーに向けて出荷が始まった。
今日の発売に先駆け、私はシアトルのワークショップでDeepLensのシニアプロダクトマネージャー、Jyothi Nookula、および AmazonのAI担当VP、Swami Sivasubramaniaとともにハードウェアとソフトウェアサービスを体験する機会を得た。
DeepLensは実質的にはUbuntu-/Intel Atomベースのカメラ付き小型コンピューターで、単体でビジュアル機械学習を実行できる能力をもっている。DeepLensは総合性能は約106 GFLPSだ。
ハードウェアは一般的な入出力ポート(Micro HDMI、USB 2.0、オーディオ出力など)を備え、カメラが裏庭でクマを見つけたら警告を送るおもちゃアプリから、工場のベルトコンベアーを監視する産業アプリまでさまざまなアプリのプロトタイプを作ることができる。4 Mピクセルのカメラは何か注目を浴びるものではないがほとんどの用途に十分適している。当然ながらDeepLensは他のAWSサービスと深く統合されている。AWSのIoTサービスであるGreengrassはDeepLensにモデルを配信する際に利用し、Amazonの機械学習モデル構築用最新ツールであるSageMakerとも連携する。
こうした連携は、非常に簡単にカメラを使い始められるのにも役立っている。あらかじめ用意されているモデルを使えば、10分足らずでDeepLensを設定しモデルを組み込んで利用できる。プロジェクトテンプレートの中には、20種類の物体を識別する別体検出モデルや、カメラ画像をゴッホ風に変換するスタイル変換モデルや顔認識モデル、猫と犬を区別するモデル、約30種類の動作(ギターを弾く、など)を認識できるモデルなどがある。DeepLensチームは、頭部の姿勢を追跡するモデルも開発中だ。そうそう、ホットドッグ検出モードもある。
それだけではない。開発チームはワークショップの中で、機械学習の経験がまったくないデベロッパーでも既存のテンプレートを簡単に拡張できることを強調していた。ひとつには、DeepLensプロジェクトが2つの部分からなっているためだろう。モデルおよびモデルの出力に基づいてモデルのインスタンスをアクションを実行するLambda機能だ。AWSは、ベースにあるインフラストラクチャーを管理することなくモデルを簡単に作るためのツールとしてSageMakerを提供している。
DeepLensのハードウェアは実質的に小さなコンピューターなので、それ自身でさまざまな開発が可能だが、おそらくもっと強力なマシンで開発してからAWSコンソールを使ってDeepLensに転送する方がいいだろう。それでもDeepLensを低性能デスクトップマシンとして使いたいという人のために、Ubuntu 16.04がプレインストールされている。
機械学習のフレームワークに慣れているデベロッパーなら、DeepLensを使うとCaffe、TensorFlow、MxNetなどほぼすべての人気ツールから簡単にモデルをインポートできる。またAWSチームはMXNetモデルをDeepLensデバイスでより効率よく動作するための最適化ツールも作ったことも報告しておく。
ではなぜAWSはDeepLensを開発したのだろうか? 「DeepLensカメラを作った理由は、われわれが自身に問いかけたある単純な疑問にあった:機械学習もデベロッパー全員の手に届けるにはどうすればよいか?」とSivasubramanianは言う。「ブレーンストーミングを重ねた結果、最も有望な発見は、デベロッパーは実際にデバイスに手を触れて開発するのが大好きだというアイデアだった」。しかしなぜAWSはパートナーと協力するのではなく独自にハードウェアを作ったのか?「われわれには具体的な顧客体験のアイデアがあり、すべての体験が本当に簡単であることを確かめたかったからだ」と彼は言った。「このハードウェアを買って、Amazonからこのツールをダウンロードして、などと言っていると環境が揃うの2~3日かかってしまう。それでは、ディープラーニングを学んで何か楽しいものを作ろうとワクワクしている人にとっては長すぎる」
そういうわけで、、これから機械学習を使ったプロジェクトを始めたい人は、DeepLensをAmazonから購入できる。249ドルは安くはないが、すでにAWSを使っていて——しかもすでにLambdaも使っていれば——おそらく簡単に機械学習アプリケーションを作り始めることができるだろう。
[原文へ]
(翻訳:Nob Takahashi / facebook )