情報システムのトピックス-PR-

News ＆ Trend

日経コンピュータ

画像の内容を解読する人工知能を実現、米大手ベンダーや有力大学が火花

2014/12/04
中田敦＝日経コンピュータ（筆者執筆記事一覧）

記事一覧へ >>

　画像をコンピュータに読み込ませると、「この画像にはフリスビーで遊んでいる若者のグループが写っています」といった具合に、画像の内容を文章で説明してくれる――。

　2014年11月、画像のキャプション（説明文）を自動生成する人工知能を、米グーグルや米マイクロソフト、米スタンフォード大学の研究者らが相次ぎ論文発表した。いずれも人間の脳を模倣した機械学習技術である「ディープラーニング（深層学習）」を採用し、仕組みが酷似している。グーグルが11月17日に公表した論文などを基に、その詳細を説明しよう。

　グーグルの人工知能は、画像の被写体を認識する「画像認識エンジン」と、「Google翻訳」などで使う統計的機械翻訳技術をベースにした「文章生成エンジン」の二つで構成する（図）

図●グーグルが開発した、画像の内容を解読する人工知能

画像の意味をテキストで分析可能に。

[画像のクリックで拡大表示]

　同システムはまず、画像認識エンジンが画像の被写体や被写体同士の関係性を英単語に変換する。この画像認識エンジンは同社のサービスで実稼働しているもので、「Deep ConvolutionalNeural Network」というディープラーニング技術を使っている。

機械翻訳の技術を転用

　続いて文章生成エンジンが、画像認識エンジンが生成した単語を組み合わせて文章を作り出す。この文章生成エンジンは、「統計的機械翻訳」の仕組みを転用している。

統計的機械翻訳では、ある言語の文章とそれを別言語...

1 2 次ページ>>

ツイート

連載新着記事一覧へ >>

「ドメイン名ハイジャック」攻撃に残るリスク、企業はどう対処する？（2014/12/03）
社内に埋もれたデータ活用でアピール、企業オープンデータに広がりも（2014/12/02）
クルマにJavaを搭載した“Java Car”公開、IoTを機に攻勢に出るオラクル（2014/12/02）
米CapyがアバターCAPTCHA提供開始、複雑なパズルでリスト型攻撃を抑止（2014/12/01）

今週のトピックス-PR-

Twitter Facebook

この記事に対するつぶやき（自分もつぶやく）

@nikkeibpITpro

この記事に対するfacebookコメント

nikkeibpITpro

コメント機能について

▲ ページトップ

ITpro NOW

Dockerが牽引する“アプリ主導のインフラ”

情報システムの最新記事>>一覧

いま読まれている記事

Twitterもチェック

@nikkeibpITproをフォローする

PC Online いま読まれている記事

ITpro Active 昨日読まれた記事

Focus

ITproまとめ

記事カテゴリ

イベントINFO -PR-

特番/イベント

最新号

注目のセミナー

申込受付中！

IT営業のための
トップアプローチ＆提案書作成講座

決済権者の信頼を得るために必要なスキルやテクニックを徹底指導！【早割実施中】

｜ITproについて｜会員登録・変更｜メルマガ登録｜アクセス履歴の利用について｜ITproへのお問い合わせ・ご意見｜広告について｜サイトマップ｜日経BP書店｜
｜著作権・リンクについて｜個人情報保護方針/ネットにおける情報収集/個人情報の共同利用について｜利用規約｜スマートフォン版について｜ID統合について｜

Copyright © 1995-2014 Nikkei Business Publications, Inc. All rights reserved.
このページに掲載されている記事・写真・図表などの無断転載を禁じます。著作権は日経BP社、またはその情報提供者に帰属します。
掲載している情報は、記事執筆時点のものです。