マイクロソフトの音声認識技術、聞き取り能力が「人間と同等」にまで向上

Luke Lancaster (CNET News) 翻訳校正: 水書健司 長谷睦 (ガリレオ) 2016年10月20日 11時58分

  • このエントリーをはてなブックマークに追加

 Microsoftの人工知能(AI)研究部門、Microsoft AI and Research Groupが、会話で使われる言葉をほとんどの人間と同程度の正確性で聞き取れる音声認識システムを作り上げた。

 この画期的な技術は、研究チームが「ヒューマンパリティ」(人間と同等であること)と呼ぶ基準を達成した。つまり、完璧ではないものの、誤りの数が人間のプロの筆記者と同等か、それよりも少ないということだ。このシステムの単語誤り率は、2016年9月に報告されたばかりの6.3%から、さらに5.9%まで減少している。

 これは話を聞いて受ける印象以上に、目覚ましい進歩と言える。人間でも、書き起こしの際に「have」と「is」、あるいは「a」と「the」を聞き違えるのはよくあることだ。これが実質的に意味するのは、コンピュータが史上初めて、会話の中で使われる言葉を人間と同等の正確さで認識可能になったということだ。

 このシステムは、ニューラルネットワークを用いて膨大な量のデータを処理し、より多くの情報に触れることで、パターン認識を学んでいくという。

この記事は海外CBS Interactive発の記事を朝日インタラクティブが日本向けに編集したものです。

  • このエントリーをはてなブックマークに追加

関連ホワイトペーパー

SpecialPR

連載

CIO
藤本恭史「もっと気楽にFinTech」
Fintechの正体
内山悟志「IT部門はどこに向かうのか」
情報通信技術の新しい使い方
米ZDNet編集長Larryの独り言
谷川耕一「エンプラITならこれは知っとけ」
田中克己「2020年のIT企業」
大木豊成「Apple法人ユースの取説」
デジタル未来からの手紙
モノのインターネットの衝撃
松岡功「一言もの申す」
三国大洋のスクラップブック
大河原克行のエンプラ徒然
今週の明言
アナリストの視点
コミュニケーション
情報系システム最適化
モバイル
通信のゆくえを追う
スマートデバイス戦略
セキュリティ
ネットワークセキュリティ
セキュリティの論点
スペシャル
de:code
Sapphire Now
VMworld
HPE Discover
Oracle OpenWorld
Dell World
AWS re:Invent
PTC LiveWorx
デプロイ王子のテクノロジ解説!
古賀政純「Dockerがもたらすビジネス変革」
誰もが開発者になる時代 ~業務システム開発の現場を行く~
さとうなおきの「週刊Azureなう」
より賢く活用するためのOSS最新動向
「Windows 10」法人導入の手引き
北川裕康「データアナリティクスの勘所」
Windows Server 2003サポート終了へ秒読み
米株式動向
Windows Server 2003サポート終了
実践ビッグデータ
中国ビジネス四方山話
日本株展望
ベトナムでビジネス
アジアのIT
10の事情
エンタープライズトレンド
クラウドと仮想化