広がりが著しAIのコア技術、テキストから音声、映像までの理解が可能に
2015年12月28日(月)富士通 BIG CHANGEプログラムメンバー(市川 誠久、齋藤 聖高、坂井 教一、柴田 浩太郎、中村 政和)
筆者らは「Machine Intelligence LandScape」というAI分野の俯瞰図にある235社の企業について、設立年や技術、製品/サービスの要約などを調査した。実用化のレベルは様々だが、Machine Intelligence 関連技術の広がりや奥行きの深さには凄まじいものがある。本稿では、その中でも活発なスタートアップ企業を5回にわたって紹介する。今回はAI市場の全体像を俯瞰する。
2015年は、映画『バック・トゥ・ザ・フューチャー』からちょうど30年。ハリウッドに便乗しているわけではないだろうが、日本の各メディアにおいて、未来が楽しくなるようなワクワクするキーワードが目立つようになった。「自律走行車」「パーソナルアシスタント」「専門家アドバイザー」「ロボット」などである。それらの根幹にある共通点が「Machine Intelligence」である。
Machine Intelligenceとは、「Machine Learning」と「Artificial Intelligence」の両方の意味を統合した呼び方だ。日本では「AI(Artificial Intelligence)=人工知能」単独の方が通りはいいだろう。Machine IntelligenceとArtificial Intelligenceは、その定義によれば前者が後者を包含するが、本稿では日本で一般的なAIという言葉で全体を総称することにご注意いただきたい。
富士通でも様々な形でAIに取り組んでいる。だが、海外ではどうなのか、どんな企業が何を目指して技術開発しているのか?それを理解する1つの拠りどころになるのが「Machine Intelligence LandScape」という俯瞰図である(図1:関連記事)。
拡大画像表示
この俯瞰図は、米国のベンチャーキャピタリストが、いくつかの技術領域を切り口にしてAI分野の企業を投資観点でまとめたものだ。投資観点だけに、機械学習や画像認識といったコア技術に留まらず、業務や業種への応用を目指す企業もカバーしている。具体的には次の5つの領域である。
領域1:Core Technologies=機械学習や音声/画像認識などの「コア技術」
領域2:Rethinking Enterprise=営業やマーケティング、セキュリティなど企業の「業務」
領域3:Rethinking Industries=農業や教育、エネルギーなど「業種」
領域4:Rethinking Humans/HCI=人の力を拡大したり、操作を支援したりする「ヒューマンコンピュータインタラクション」
領域5:Supporting Technologies=そのほかの様々な技術支援
7つの分野に細分化されるコア技術領域
今回注目するAIのコア技術領域は、以下7つの分野に分類されている。
●Artifical Intelligence(人工知能)
●Machine Learning(機械学習)
●Deep Learning(深層学習)
●NLP Platforms(自然言語処理を行うプラットフォーム)
●Predictive APIs(予測分析を行うAPI)
●Image Recognition(画像認識)
●Speech Recognition(音声認識)
これら7つの分野は、それぞれ独立した技術というわけではない。例えば「画像認識」には「機械学習」という手法が欠かせないし、「深層学習」はそもそも多層のニューラルネットワークを用いた「機械学習」の一つである。ニューラルネットワークは、脳の特性であるニューロンと接続するシナプス接続を計算機上で表現したモデルを指す。
拡大画像表示
筆者らは、コア技術分野をより深く理解するために、これら7分野の相関関係を「認識」「問題解決」「学習」という観点で整理した。AIは(1)画像/音声を認識し、(2)自然言語処理や予測分析により問題解決を図り、(3)深層学習/機械学習で自己フィードバックを得るというサイクルを繰り返す技術と言えるからだ(図2)。
俯瞰図のコア技術に掲載されていない「記憶(知識化)」や「処理(アクセラレーター)」もAI技術の1つと考えられる。図2を参考にしていただきつつ、7つの分野を概観していこう。