
「Otter.ai」をご存じでしょうか。話し言葉をテキストにするクラウド型の自動文字起こしツールです。
現時点では英語にしか対応していないものの、その精度や実用性の高さから、海外展示会の取材で必携のツールとして、テクノロジー系の記者・ライターで小さなブームとなりました(詳しくは旅人ライター中山智氏の紹介記事をご覧ください)。
このOtterが1月22日、日本市場向けに展開することを発表しました。NTTドコモが子会社ドコモ・ベンチャーズを通じてOtter.aiの運営企業AISenseに出資し、日本の企業向けの導入支援サービスを展開します(なお、日本からのアプリの利用は記事公開時点でも可能です)。
ドコモが23日〜24日に展開する「DOCOMO Open House 2020」では、Otter.aiとドコモ子会社みらい翻訳の翻訳エンジンを連携させて、「英語のスピーチをリアルタイムで日本語に翻訳する」というデモンストレーションを展示しています。

22日、このイベントの内覧に訪れたOtter.aiのSam Liang CEOは、日本向けの展開について語りました。Otter.aiは英語のみをサポートしていますが、多言語での文字起こしサービスの展開も視野に入れています。Liang氏は「日本語はスペイン語や中国語と並んで重要な言語の1つで、いち早く対応するべきだと考えている。2020年後半の日本語のサポートを目指して、可能性を検討していきたい」と語りました。
もっとも、Otter.ai公式には日本語文字起こしへの対応は発表しておらず、Liang CEOの発言は努力目標と捉えるべきものと言えます。
もちろん、日本語の自動文字起こしを実現するには日本語の音声認識アルゴリズムを構築する必要があり、実現にはそれなりにハードルがあります。一方でドコモのグループ会社に当たるNTTコミュニケーションズは日本語向けの音声認識エンジンを法人向けに提供している実績があります。ドコモとOtter.aiの提携が効果的に作用した場合、日本語対応もより早く実現するかもしれません。