ビジネス+IT

文字サイズ: 大; 中

ビジネス課題別で探す

ITジャンル別で探す

今さら聞けないディープラーニングの基本、機械学習とは何が違うのか

第三次人工知能（AI）ブームが、メディアなどでクローズアップされ始めたのは2011年頃から。その中心にあったのが、IBMのワトソンとディープラーニング（深層学習）と呼ばれる新技術だ。ワトソンは人工知能が商用で利用できることを世間に広め、一部機能が日本語化された。一方、ディープラーニングは、画像分野で精度を上げ、その応用としてグーグルの「AlphaGo」が囲碁の世界王者にも勝ち、大きな話題を振りまいた。人工知能とは一体何なのか。その基本とビジネス活用事例、最新動向、今後の展望について、野村総合研究所上席研究員の古明地正俊氏が解説する。

第三次人工知能ブームの立役者は「ディープラーニング」

　かつて1980年代に人工知能ブームが起きたとき、日本では第五世代コンピュータのプロジェクトが展開され、主としてルールベースの人工知能が研究された。これは、プログラムでいうところの「if～then～eles」のように、専門家の知識をルールで記述して専門家と同様のことを行えるようにするという設計思想だった。しかし、専門家の知識を抽出するのは難しく、何よりもメンテナンスが大変だったため、実用には至らなかった。

（クリックで拡大）

第三次AIブームの到来

（出典：野村総合研究所）

関連記事

▲ 閉じる ▼ すべて表示

　一方、今回のブームのコアになる「機械学習」は、人がルールを記述することはない。たとえば、猫の画像認識では、猫というタグを画像に付け、機械学習アルゴリズムに流し込むと、自動的に猫を判断して分類してくれる。野村総合研究所上席研究員の古明地正俊氏はその背景には大きく2つのポイントがあったと指摘する。

「１つめの背景がビッグデータ技術の進展だ。機械学習をさせるには、多くの学習データを用意しなければならない。これらを容易に入手できるようになった。もう1つの背景は、計算機の性能が飛躍的に上がったことがある。さらに“ディープラーニング（深層学習）”という新技術が登場した点も大きい」（古明地氏）

　ではディープラーニングと機械学習は何が違うのか。ディープラーニングは機械学習の一種とみなされるが、大きな違いもある。たとえば、従来型の機械学習で色を認識するには、「色情報」を特徴にして識別させていた。この特徴は、人間が定義する必要があった。

　一方、ディープラーニングでは、学習データからマシン側が自動的に特徴を抽出する点が大きく違う。つまり何に着目すればよいかを教える必要がなく、どんな特徴を利用すれば識別できるのかを自動的に学ぶ。

（クリックで拡大）

従来の機械学習とディープラーニングの違い

（出典：野村総合研究所）

「複雑な画像識別では、特徴を抽出していくことが難しくなる。実際に人が、猫とライオンの子供を識別する特徴を知ることは難しい。ディープラーニングでは、非常に細かい部分まで特徴を抽出できるため、画像認識や音声認識の分野で幅広く活用されるようになった。ただし言語処理分野に関しては、まだ十分に使いこなされていないのが実情だ」（古明地氏）

（クリックで拡大）

ディープラーニングが適用できる領域

（出典：野村総合研究所）

実用段階に入ったディープラーニング、ECサイトなどの具体的な事例

　では、ディープラーニングは現在、どのような分野で活用されているのか。その1つが、米国のスタートアップ、Sentient Technologiesの取り組みだ。ディープラーニングを商品検索に活用している。

（クリックで拡大）

ディープラーニングを商品検索に活用した事例

（出典：野村総合研究所）

「ECサイトで商品を選ぶ際に、自分のイメージを伝えたいことがある。その際に、商品画像を自動的に分類し、ユーザーの好みにマッチするサンプル画像を提示し、選択しやすくしてくれる。特に服や靴の好みなど、言語による表現が難しいものに対して、非常に効果が高い」（古明地氏）

　画像処理と言語処理という2種類のディープラーニングを組み合わせた事例もある。これは、画像認識に良く利用されるニューラルネットの「CNN」（Convolutional Neural Network）で認識したあと、フィードバック経路を有するニューラルネットの「RNN」（Recurrent Neural Network）により、写真の説明文を自動生成するユニークな事例だ。特にRNNは、機械翻訳など自然言語処理の分野への適用が拡大している。

「この技術は、ソーシャルメディア系のサービスを提供する場合にとても便利だ。ユーザーの画像を自動的にタグ付けできるため、あとから言葉で検索が行えるようになる。サービス側の企業にとっても、画像から言語化された多くの情報を抽出することで、ユーザーに対する理解が深められるというメリットがある。たとえば、たびたびラーメンの画像をアップする人の情報を言語として抽出できれば、この人がラーメン好きだということが分かるだろう」（古明地氏）