海外コメンタリー

IBM「Watson」関連研究チームが取り組む文書の自動要約システム--品質は人レベルにも

Nick Heath (TechRepublic) 翻訳校正: 編集部 2016年03月09日 06時30分

  • このエントリーをはてなブックマークに追加

 IBMの自然言語処理および機械学習エンジンを担当するチームが、人間に匹敵する文書要約能力を備えたディープラーニング(深層学習)ベースのシステムを開発した。

 IBMの「Watson」の質問応答能力はヘルスケアから金融まで幅広い分野で活用されている

 Watsonの自然言語処理および機械学習エンジンは、IBMが提供する言語認識やコンピュータビジョン、データアナリティクスのサービスを支えている。そして、研究チームは舞台裏でこのスマートなシステムの能力を高め続けている。

 Watsonの質問応答アルゴリズム担当チームによる最新の画期的成果は、文書の要約を自動的に作成する「最先端」システムの開発だ。

 同チームは、過去に機械翻訳や動画への自動キャプション追加に使用されたディープラーニングのアプローチを採用して、何百万もの英語ニュース記事の短い要約を作成した。

 IBM USの研究者であるRamesh Nallapati氏とBing Xiang氏、Bowen Zhou氏は論文の中で、「この研究で、われわれはテキストを要約する作業に注力している。もちろん、これはソース文書の言葉の入力シーケンスを要約という言葉のターゲットシーケンスにマッピングする作業と考えることも可能だ」と述べている。

 彼らが使用した、ディープラーニングをベースとするシーケンスツーシーケンスアプローチは、機械翻訳に使われることの方が多い。同チームによると、要約は通常、文字数が少なく、文書の長さにそれほど依存しないので、要約の作成は機械翻訳と大きく異なるという。また、機械翻訳と異なり、ソース資料の重要な概念以外のすべてを省略することも許容されるという。

 こうした違いがあるにもかかわらず、認識リカレントニューラルネットワーク(エンコーダとデコーダ)を使用してテキストの要約を作成するこのアプローチは、Facebookが要約作成に使用する新しい最先端モデルを「大幅に上回るパフォーマンス」を発揮する。

 IBMのチームは、「それらの要約は驚くほど高品質で、ほとんどの場合、人間が作成した要約として簡単に通用するだろう」と述べている。

 「われわれの研究成果は、シーケンスツーシーケンスモデルが要約に関して極めて大きな可能性を秘めていることを力強く証明するものだ」(同チーム)

 同チームが今後重点的に取り組む研究テーマは、要約の中で珍しい単語を効果的に生成する方法を調べることだ。それが「既存モデルの著しい欠点であるようだ」と同チームは述べている。

 人間のように言語を理解できる能力をコンピュータに持たせたいのなら、テキストの核心的な意味をとらえる要約を作成可能なマシンの開発が重要になる。テクノロジが高品質な文章を出力できる段階まで進歩する中で、要約作成の自動化やコンピュータによるレポート作成に対する需要も拡大している。自動レポート執筆サービス「Quill」を提供するNarrative Scienceが先頃述べたところによると、同社の売上高は毎年倍増しているという。

 IBMは従来の事業分野の低迷への対処を進める中で、Watsonサービス群を開発者に提供してサードパーティーアプリを構築してもらうだけでなく、「『Watson Health』や『Watson Internet of Things』といった新たな機会への投資も積極的に行っている」と最高経営責任者(CEO)のGinni Rometty氏は先頃述べた。

 Credit SuisseのアナリストであるKulbinder Garcha氏によると、IBMはクラウドコンピューティングへの段階的に移行し、縮小傾向にあるハードウェアやOS、従来のサービス事業による利益への依存を減らそうと努力しており、Watsonなどの新しいテクノロジへの注力は「複数年にわたる、痛みを伴う方向転換」の一環だという。

IBM「Watson」関連チームが取り組む自動要約システム
IBMのWatsonシステム 提供:IBM

この記事は海外CBS Interactive発の記事を朝日インタラクティブが日本向けに編集したものです。

  • このエントリーをはてなブックマークに追加

SpecialPR

連載

CIO
内山悟志「IT部門はどこに向かうのか」
データドリブンな経営
情報通信技術の新しい使い方
米ZDNet編集長Larryの独り言
谷川耕一「エンプラITならこれは知っとけ」
田中克己「2020年のIT企業」
大木豊成「Apple法人ユースの取説」
林雅之「スマートマシン時代」
デジタルバリューシフト
モノのインターネットの衝撃
松岡功「一言もの申す」
三国大洋のスクラップブック
大河原克行のエンプラ徒然
今週の明言
アナリストの視点
コミュニケーション
情報系システム最適化
モバイル
モバイルファーストは不可逆
通信のゆくえを追う
スマートデバイス戦略
セキュリティ
ベネッセ情報漏えい
ネットワークセキュリティ
セキュリティの論点
OS
XP後のコンピュータ
スペシャル
より賢く活用するためのOSS最新動向
HPE Discover
Oracle OpenWorld
AWS re:Invent 2015 Report
「Windows 10」法人導入の手引き
北川裕康「データアナリティクスの勘所」
Windows Server 2003サポート終了へ秒読み
米株式動向
マーケティングオートメーション
AWS re:Invent 2014
Teradata 2014 PARTNERS
Dreamforce 2014
Windows Server 2003サポート終了
実践ビッグデータ
VMworld 2014
中国ビジネス四方山話
日本株展望
ベトナムでビジネス
アジアのIT
10の事情
エンタープライズトレンド
クラウドと仮想化
NSAデータ収集問題