人工知能はビジネスをどう変えるか
「ヒト・モノ・カネ」から「ヒト・データ・キカイ」へ
急速に実用化が進み出した人工知能。今後、人の仕事が機械に奪われるかのような議論も多いが、そもそも「知的作業」とは何か。そして人が得意な作業と機械が得意な作業を分類して考えないと、議論は錯綜したままである。一方で、ビッグデータの登場と情報処理技術の急速な発展により、人工知能が今後のビジネス環境に歴史的な変曲点をもたらすのは間違いない。人がやるべき仕事が決定的に変わる世界では、価値の概念も変わる。人工知能がもたらすビジネスへの影響を、脳科学とデータ分析に造詣が深い筆者が語る。『DIAMOND ハーバード・ビジネス・レビュー』11月号より、抜粋してお届けする。
歴史的変曲点をもたらす3つの変化
2015年5月28日、深層学習(ディープラーニング)を搭載した、世界で初めて大規模で展開するサービスGoogleフォトがリリースされた。このアプリは、スマートフォンなどに保存された写真データを、自動で分類し、合成写真まで作成する。これはユーザーのデバイス上の画像データをクラウドで管理する仕組みだが、世界の億単位の人が数千枚、数万枚の写真、つまり兆単位の写真を一気に上げ始めた。
その写真の仕分け、連続写真の合成のスピードは驚くほど的確かつ速い。1000人で取りかかっても7、8年はかかると思われる処理を、このサービスは1日でやってのける。人間の200万倍以上のスピードだ(注1)。このサービスに使われている深層学習は、現在最も注目されているAI(人工知能)の要素技術の一つであり、その可能性はたしかに計り知れない。しかし、深層学習だけを取り出していま起きつつある変化の本質を理解することはできない。
これから起きる変化の本質は、深層学習、分析手法など情報科学的な技法の革新だけでなく、学習データの質と量、これを実装するコンピュータの情報処理力の3つの変化がセットで起きることにある。
(1)情報科学
これまでの人工知能研究の中心にあるのは、機械学習とデータマイニングだが、大半の産業分野での利用はこれからだ(注2)。これらが幅広く広まることに加え、深層学習の実用化が進むことが相乗的に質的な変化をもたらす。
機械学習(マシンラーニング)とは、コンピュータが経験からルールや知識を学習し、賢くなる技術である。
ここで「賢くなる」と言っているのは何らかのタスクのパフォーマンスが上がることだ。言わば、処理スピードやテストの点数が上がるなどだ。データマイニングとは、知られていなかった意味のある情報をデータから抽出する技術のことをいう。
機械学習とデータマイニングは独立の概念ではあるが、相互に関係性が深く、ここから先、便宜的に機械学習と統一して表現する。
これらを活かし、「数十億種類のキーワードに対する検索」「100万単位の商品アイテム(SKU)別の購買時のレコメンデーション」といった、つい20年前から見ればほぼ奇跡か魔法といえることがインターネット上で可能になっていることを見ても、そのインパクトの大きさがわかるだろう。
なお「深層学習」は、情報抽出を多階層にわたって行うことで、高い抽象化(メタ化)を実現する機械学習の一つだ(注3)。深層学習によって、これまで人間の指示なしで扱えなかった抽象的な概念を教え込まなくともコンピュータがみずから把握できるようになることが増える。結果、抽象概念の学習、取り扱いが一気に容易になる。
また、これまで人間が教え込む必要があった「分析の軸」(特徴量)も深層学習は自力で把握する。これまでの機械学習では、「特徴量」を設定するには、対象領域に対する知識や、人手による試行錯誤が要求されたが、深層学習はこれを不要にする。
いま現在、深層学習が確実に機能することがわかっている応用範囲は、画像認識、音声認識、薬物活性予測、ゲームプレーなどに限られているが、その実用化は、多くの分析的な活動にかつてないタイプの変化をもたらす可能性がある。
(2)データ
どれほど機械学習、深層学習などの技術が発達しても、それらを正しく機能するように機械が学習するには大量のデータが必要だ。これを実現するのが、従来型の多様性が低く、リアルタイム性が少なくサンプルの一部しかカバーしないデータだけではなく、多様性とリアルタイム性の高い全量データ、つまり「ビッグデータ」の出現だ。
その背景には、従来のコンピュータ利用データだけでなく、ソーシャルメディアやセンサーから爆発的にデータが生まれ利用可能になっていることがある。
たとえば、スマホからは、GPS、磁気、加速度など搭載された多様なセンサーから大量のデータが発生する。これらのデータがたとえば人の歩き方、活動量、活動場所などの情報となり、それをベースに人間の関係性、お店や街の混雑状況、健康状態などの学習が可能になる。
ただし汚れたデータ、解析不可能なデータばかりではどうしようもない。どれほど大量のデータと優れた分析体制があったとしても、学習に使えるレベルのデータがなければAIは機能しない。十分に質の高いインプットがないとAIは機能しないのだ。
ビッグデータと機械学習は相互に入れ子の構造である。ビッグデータの活用には多くの場合、機械学習が必要であり、機械学習を磨くためにはビッグデータが有効だ。
(3)情報処理力
以上の機械学習、深層学習の利活用の前提になっているのは、膨大なデータからのリアルタイムに近い学習能力の実現、すなわち、高い情報処理力だ。特に深層学習は情報の特徴抽出を多階層にわたって行うため、強い計算能力を有することが不可欠だ。
これまでバッチ処理でしか取り扱いが困難であった機械学習、深層学習をリアルタイムに近い形で処理していくことの効果は大きい。解析に一時間半かかっていたものが、1分(約100倍)、10秒(約500倍)で返ってくることで、データの持つ力を即座に利用できるようになるからだ。数時間前はこうでしたという話と、いまこれが起きています、という話の違いだ。
この変化は、個々の半導体チップの性能向上だけでなく、画像処理に本来特化したチップであるGPUの計算能力までも活用するようなアーキテクチャーの発達、利用可能なCPU/GPUの数が爆発的に増えること、加えて、Hadoop、Sparkといった分散処理技術、オンライン処理技術が広まることによって実現する。
以上に見てきた通り、ビッグデータが生まれ、情報処理力が爆増する一方で、情報の抽象化技術において深層学習という革新が起きている。
AIは機械、ソフトウェアによる知覚と知性の実現だ。もっとも初歩的には、自力で判断するものはすべてAIといえなくはない。サーモスタットや部屋の温度に合わせて活動を変えるエアコンもこの意味ではAIだが、本稿では、この情報科学、データ、情報処理力の3つを掛け合わせたもの、すなわち機械学習、自然言語処理など必要な情報科学を実装したマシンに十分な学習を行ったものをAIとして議論したい(図表1「AIにまつわる誤解」を参照)。
冒頭に掲げたGoogleフォトはまさにこの典型的な例だ。深層学習のアルゴリズムを実装した大きな並列処理のシステムに、グーグルがこれまで集めてきた膨大な量の写真を使って教育した仕組み(AI)を使い、情報処理を進めているのだ。
そもそも知性とは「さまざまな事柄を正しく理解し、経験から学び、分析的に考え、課題を解決する」力といえるが、「さまざまな事柄を正しく理解する」こと一つ取っても、抽象化して知覚する力が高くないと、たとえば腕時計とは何かさえ理解できない。
これまではコンピュータが対象物や言葉の意味を把握することまで人間は期待してこなかったが、ついにAIがそのベースになる特徴を自力で把握する(=助力なしに区別する)ことが可能になってきた。機械が何らかの共通項をもとに概念をグルーピングし(=気づきを得)、さらにそのグループ同士の共通項を抽出する力が跳ね上がっている。
しかも近い将来、この進化が止まる理由は計算力の限界以外にないように見える。人間にも見えていない特徴(共通項)を機械が発見し、それが活用される日はそれほど遠くないだろう。
深層学習を含めたAIが広まることによって、人間の知覚能力、認知的な仕事が劇的に機械にサポートされるようになる。
我々は歴史的な変曲点に立っている可能性が高い。
サービス立ち上げ当初、仮に1人につき、1日1000枚、同時に1000万人しか利用者がなかったとしても、毎日100億枚、当初上がっていたことにな る。このランダムに上がる写真の仕分けや合成を人手でやれば、1人1日せいぜい5000枚程度ぐらいしかできないことを考えると、200万人日必要。すな わち1000人でやったとしても労働ベースで2000日かかるわけだが、これが毎日平然と処理される。
AIの実現に必要な基礎技術には機械学習、データマイニングの他にも、人間が普通に使っている言葉をコンピュータに処理できるようにする「自然言語処理技 術」、画像をコンピュータに処理できるようにするための「コンピュータビジョン」、手や身体の機能の実現を図る「ロボティックス」などがある。
学習によってつながりの強度が変わる神経系の接合部分(シナプス)を模したニューラルネットワークの一種。脳神経系のように多層の情報処理を行う。大量のデータとハードウェアの性能向上によって花開いた。
- 人工知能はビジネスをどう変えるか「ヒト・モノ・カネ」から「ヒト・データ・キカイ」へ (2015.10.20)
- 機械は我々を幸福にするのか「グレート・デカップリング」という現実 (2015.10.13)