難解な日本語もすらすら翻訳
取材に向かったのは東京・小金井市にある国立研究開発法人「情報通信研究機構」です。開発中の多言語音声翻訳システムのデモンストレーションでまず驚かされたのはその精度の高さです。
「腎機能と糖尿病の検査をしていただけますか」
スマートフォンのマイクに向かってこう話しかけると、コンピューターが翻訳して英語ですらすらとしゃべります。日本語の音声データがインターネットを通じてサーバーに送られ、コンピューターがそれを翻訳して英語の音声データを瞬時に送り返す仕組みです。
苦節30年の研究
「ここまで来るのに30年かかりました」
情報通信研究機構の先進的音声翻訳研究開発推進センター長を務める木俵(きだわ ら)豊さんは、しみじみ語りました。研究機構で自動翻訳の研究開発が始まったのは1986年です。実用化には程遠い状況が長らく続きましたが、5、6年前に大きな変化が起きたといいます。
スマートフォンの性能が一気に高まって多くの人たちが翻訳アプリを使える環境が整ったこと。さらにインターネット上から翻訳に不可欠な膨大なデータを取得できるようになり、AI=人工知能の技術が飛躍的に進化したこと。こうしたことから自動翻訳は実用化の段階に入りました。
31か国の言語に対応
情報通信研究機構は、開発中のシステムを使った翻訳アプリを実証実験の一環として無料で公開しています。英語、中国語といった主要言語はもちろん、ミャンマー語やウルドゥ-語(パキスタンや北インドの言語)など世界31の言語に幅広く対応しています(ことし8月現在)。
自動翻訳を行うために、旅行先や病院など特定の場面で交わされる膨大な会話のデータをあらかじめコンピューターに覚え込ませているということです。研究機構は、全国の大学や企業と連携してこの翻訳アプリを2020年の東京オリンピック・パラリンピックまでに実用化することを目指しています。
木俵センター長は「翻訳アプリは病院の医師や観光客、それにタクシー運転手まで幅広い層に利用されていて期待の高さを感じる。産学官の日本の頭脳を結集することで2020年には『言語の壁』をなくすという国の目標をなんとしても実現したい」と話していました。
TOEIC 700点へ
さらに、情報通信研究機構が中心となる国家プロジェクトに参画している企業を取材しました。こちらは、音声ではなく文書の自動翻訳技術です。
NTTドコモとベンチャー企業2社がおととし設立した翻訳会社「みらい翻訳」は、法律や特許関連の業務で使う企業の文書の翻訳システムを手がけています。
翻訳システムの技術レベルは、今の段階でTOEIC(日常生活やグローバルビジネスでの英語の力を測定する世界共通のテスト)のスコアで655点と同等の水準。仕事上の簡単なメモであれば読んで理解できるレベルです。
技術はどんどん進化しており、来年3月までには、一般的な企業で国際部門の社員に求められる700点以上に到達することを目指しています。栄藤(えとう)稔社長は2年後の2018年には実用化レベルになり、2020年には普及が拡大すると見ています。栄藤社長に自動翻訳の現状と可能性について聞きました。
ーーーライバルはどういった企業ですか。
栄藤社長:もちろん、グーグルやマイクロソフトです。彼らは世界中の人たちが使うグーグル翻訳など膨大なデータを持っています。人工知能の技術も世界最高レベルです。その彼らとどう戦っていくか。私たちは“チューニングの世界”で勝負できると考えています。
ーーーチューニングの世界で勝負とはどういうことでしょうか。
栄藤社長:グーグルは大量のデータを使って世界的にオールマイティーな翻訳サービスを出しています。私たちの戦略は違います。例えばある地域だけで通じる独特の会話、ある企業や業界だけで通じる会話、それぞれのニーズに合わせていく翻訳です。いわば、既製服とオートクチュールとの勝負です。オートクチュールの勝負なら負けることはないと思っています。
外国語学習は不要となるのか?
ーーー自動翻訳の今後に夢が広がります。
栄藤社長:電子メールで使われる英語に限定すれば、今の時点でもTOEIC900点と同等の水準まで技術は進化しています。ただ、これは電子メールで使われる表現は定型のものが多いからです。今後、実用化されていくのも、企業が作成する文書のほか旅行先や診察室、それぞれの状況に特化した分野となります。
ーーー外国語学習は不要となる時代も将来到来しますか。
栄藤社長:特に日本語からの翻訳は難しいんです。「あれはどうなった?」のように表現があいまいだったり、主語が全くなかったりするからです。それに雑談や日常会話、文脈から判断する力、要約する能力をコンピューターが持つのはまだ先だと思います。もし可能になったら、”人間を一人つくる”みたいなものですからね。グローバル社会ではやっぱり英語は必要ですよ。
取材を終えて
日本が30年にわたって地道に研究を続けてきた自動翻訳がいよいよ実用化の段階に入ったことに大きな期待を感じます。その一方で、圧倒的な量のデータを武器にグーグルなどアメリカのIT企業がわずかな期間であっさり追い上げてしまう時代の変化も実感します。
「みらい翻訳」の栄藤さんは、グーグルの翻訳を”既製服”、みずからの特化した翻訳を“オートクチュール”と表現していました。“オートクチュール”でどの分野で勝負をしていくのか、2020年の東京オリンピック・パラリンピックを契機に日本の翻訳サービスを世界にアピールできるかが注目です。
ただ、食べればあらゆる言語を自動翻訳してくれるドラえもんの”ほんやくコンニャク”のような、ひみつ道具の域に達するのはまだまだ先になりそうです。語学をしっかりと学び直そうと決意を新たにした取材になりました。
- 経済部
- 小田島 拓也 記者