マイクロソフトは、Microsoft TranslatorとSkypeにおいて、ニューラルネットワーク(AI)を活用した日本語の音声リアルタイム翻訳の提供を本日(4月7日)開始しました。
マイクロソフトは、これまでの機械翻訳に、統計的な手法を用いていました。しかし「2〜3年で、このテクノロジーの限界がわかってきた。改善してもわずかな改善しかできない」(オリヴィエ氏)といい、AIベースの機械翻訳への移行を決定したといいます。
本日(4月7日)より、Microsoft Translatorアプリ(Android / iOS / Windows / WEB)がAIベースに刷新。翻訳精度が大きく向上しました。
そして新たに日本語の音声リアルタイム翻訳「ライブ機能」の提供も開始。これは、スマートフォンやタブレット、PCなどのマルチデバイスから、最大100人まで同じトークルームで同時翻訳しながら会話できる機能。各参加者の発言を、参加者それぞれの母国語にリアルタイム翻訳してくれます。日本語や中国語、英語、フランス語など、同じ会話に3つ以上の言語の話者が混在していても問題ありません。
さらに、Edgeブラウザ、Microsoft Office(Excel、PowerPoint、Outlook)統合の機械翻訳も、本日からAIベースに刷新。APIも提供し、さまざまなサービスでAI機械翻訳を活用できます。
AI翻訳は継続的に改善する
ライブ翻訳を実際に試したところ、発話中ではなく、発話を終えた1秒後に翻訳された音声が流れます。これを「リアルタイム」といえるかどうかは微妙ですが、翻訳スピードはかなり高速でストレスを感じませんでした。
また、Microsoft Translatorは、最大100人までがマルチデバイスで同じ会話に参加できる点も魅力。アプリでQRコードを読み取ることで、複数人が1つのトークルームに簡単に入れます。また、WEBブラウザから参加することも可能です。さらに、翻訳したデータは(誰が発言したという情報も含め)テキスト化されるため、簡易的な議事録の作成にも便利だなと感じました。
肝心の翻訳精度ですが、機械翻訳特有の粗さはあり、通訳者を置き換えるというレベルには到底達していません。これは「ニューラルベースの機械翻訳がまだ発展途上にある」(担当者)ため。
「ニューラル機械翻訳は継続して改善するのが特徴です。マイクロソフトの全ての製品に搭載されたわけですから、ユーザーが沢山使うことで、どんどん翻訳精度が向上していきます。ガソリンから電気エンジンに変わるクルマと一緒で、まだ黎明期なんですが、3年後、5年後が本当にワクワクします」
とはいえ、サッと意味を汲み取りたい用途には十分な翻訳精度だと感じます。
マイクロソフト AIリサーチ グループディレクターのオリヴィエ フォンタナ氏
1つの会話に最大100人まで参加でき、3つ以上の言語も同時翻訳する。翻訳結果はテキストで出力でき、簡単な議事録作成にも便利