IBM、音声認識の誤り率でMSの記録更新--「人と同等」レベルには未達と判断

Liam Tung （ZDNet.com）翻訳校正：編集部 2017年03月14日 14時06分

印刷

メール

ダウンロード

クリップ

　IBMが、最新の音声認識テストでMicrosoftを僅差で抑え、単語誤り率5.5％を記録している。

提供：IBM

　この誤り率は、人間が会話中に聞き落とす20単語につき1単語というおおよその率に匹敵する。Microsoftは2016年10月、IBMが2016年に発表していた最高記録である6.9％を破る5.9％という記録を出したが、今回IBMが再び上回った格好だ。

　だがIBMは、会話を理解するという点で機械が人間を上回るのはもう少し先になる可能性があると強調している。Microsoftは単語誤り率が5.9％を記録した際に、「ヒューマンパリティ（人間と同程度であること）」に到達したとしていたが、最新の調査によりMicrosoftを祝福するのはまだ早いことがわかったとIBMは述べている。

　「われわれはまだシャンパンを開けて祝う段階にはない」とIBMの首席リサーチサイエンティストGeorge Saon氏は記している。Saon氏によると、今回のマイルストーンを達成する過程で、実際にはヒューマンパリティはもっと低く、誰も到達していない5.1％であると判断したという。

　単語誤り率5.5％に到達するために、IBMは長期短期記憶（LSTM）とWaveNet言語モデルを組み合わせた。見知らぬ人同士のフォーマルな電話の会話を含む「Switchboard」コーパスを使ってこれらのモデルをテストしたという。さらにIBMは、よりカジュアルな家族間の会話を含む「CallHome」でもテストした。会話の話題はさまざまで事前の設定はない。このテストでのIBMシステムの単語誤り率は10.3％だった。人間の場合は6.8％だ。

　IBMが公開している研究論文によると、Switchboardテストにはいくつかの問題があるという。「40のテストスピーカーのうち36人がトレーニングデータに登場している。8種類もの会話に登場しているものもあった。われわれの音響モデルは、トレーニング中に出てきた音声パターンを記憶するのに長けている」。

　CallHomeのテストで生じた大きな差異は、その音響および言語モデルがテストスピーカーのデータを経験していなかったことによるものだ。

　IBMは、同社の音声認識における成果を使って、「Watson Speech to Text」サービスに新しい機能を加えていると述べている。

この記事は海外CBS Interactive発の記事を朝日インタラクティブが日本向けに編集したものです。

ZDNet Japan トップへ

関連企業： IBM , Microsoft , 日本マイクロソフト

SpecialPR

デジタル変革か？ゲームセットか？

デジタルを駆使する破壊的なプレーヤーの出現、既存のビジネスモデルで競争力を持つ
プレイヤーはデジタル活用による変革が迫られている。これを読めばデジタル変革の全体像がわかる！
【3/31まで早期割引受付中！】「IBM Watson Summit 2017」開催

日本IBMが主催する最大の国内総合イベント。テクノロジー・リーダーの疑問を紐解く「企業IT、セキュリティー、モバイル、データ解析などの進化を探る」詳細はこちらから！

連載

CIO: 研究現場から見たAI; ITは「ひみつ道具」の夢を見る; 内製化とユーザー体験の関係; 米ZDNet編集長Larryの独り言; 今週の明言; 「プロジェクトマネジメント」の解き方; 田中克己「2020年のIT企業」; 松岡功「一言もの申す」; 林雅之「デジタル未来からの手紙」; 谷川耕一「エンプラITならこれは知っとけ」; Fintechの正体; 内山悟志「IT部門はどこに向かうのか」; 情報通信技術の新しい使い方; 三国大洋のスクラップブック; 大河原克行のエンプラ徒然
コミュニケーション: 情報系システム最適化
モバイル: 通信のゆくえを追う
セキュリティ: セキュリティの論点; ネットワークセキュリティ
スペシャル: 座談会＠ZDNet; Dr.津田のクラウドトップガン対談; CSIRT座談会--バンダイナムコや大成建設、DeNAに聞く; 創造的破壊を--次世代SIer座談会; 企業決算を追う; 「SD-WAN」の現在; 展望2017; IBM World of Watson; de:code; Sapphire Now; VMworld; Microsoft WPC; HPE Discover; Oracle OpenWorld; Dell EMC World; AWS re:Invent; PTC LiveWorx; 古賀政純「Dockerがもたらすビジネス変革」; さとうなおきの「週刊Azureなう」; 誰もが開発者になる時代～業務システム開発の現場を行く～; 中国ビジネス四方山話; より賢く活用するためのOSS最新動向; 「Windows 10」法人導入の手引き; Windows Server 2003サポート終了へ秒読み; 米株式動向; 実践ビッグデータ; 日本株展望; ベトナムでビジネス; アジアのIT; 10の事情; エンタープライズトレンド; クラウドと仮想化

IBM、音声認識の誤り率でMSの記録更新--「人と同等」レベルには未達と判断

関連記事

日本オラクル、モバイル端末の音声認識を使ったBIツールを提供

Watsonの音声認識技術と質問応答システムを連携--IBMがコールセンター向けに

マイクロソフト、音声認識の単語誤り率で新記録--Microsoft Research報告

グーグル、自然言語処理APIと音声認識APIをオープンベータに

アドバンスト・メディア、音声認識でインカム通話を「見える化」

関連ホワイトペーパー

SpecialPR

デジタル変革か？ゲームセットか？

【3/31まで早期割引受付中！】「IBM Watson Summit 2017」開催

連載

CNET Japanトップストーリー

ホワイトペーパーランキング

ZDNet Japanクイックポール

カテゴリーランキング

IBM、音声認識の誤り率でMSの記録更新--「人と同等」レベルには未達と判断

関連記事

関連ホワイトペーパー

SpecialPR

連載

ホワイトペーパーランキング

ZDNet Japanクイックポール

カテゴリーランキング

ZDNet Japan Headline