「年間1000円で働いてくれるAIアナウンサー」。エフエム和歌山のコミュニティーFM「Banana FM」が2017年7月に始めたラジオ放送は、大きな反響を呼んだ。米Amazon Web Services(AWS)のテキスト読み上げサービス「Amazon Polly」を使い、ニュースや天気予報を自動で読み上げるというもので、年間でのコストは1000円程度とも言われている。
あらかじめ新聞社などからニュース原稿を受け取り、エフエム和歌山が開発したプログラムを使い、合成音声で読み上げやすいようにルビや句読点の位置などを自動修正。原稿をエフエム和歌山のサーバに保存しておき、放送直前にAmazon Pollyが音声に変換して、自動的に読み上げる。
予算が限られがちな、小規模なコミュニティー放送局において、深夜や早朝といったアナウンサーが確保しにくい時間帯の運用を楽にしつつ、コストも削減できる。最近では、選曲も含め、音楽番組も自動で放送しているという。スタッフが1人いれば放送でき、たとえ無人でも、同じプログラムを流し続けられる。
このシステムを作ったのは、同社クロスメディア局長の山口誠二さん。米国の大学を中退後、東京で3年ほどWeb系企業に勤め、その後、エフエム和歌山でラジオ業務を約10年行っているという。PHPやJavaScriptを10年以上触れ続けていたが、社内システムの面倒を見ることが多く、クラウドを使う必要性を感じていなかったという。
山口さんは自身を「AWS初心者」だと言うが、Amazon Pollyについては、ノンプログラミングで簡単に使うことができる点で、「他のAWSサービスとは違う」と話す。山口さんが、自動放送システムを作ろうと考えたのは約1年前。クラウドで使える音声合成サービス3つを比較したところ、価格はほとんど変わらないものの、日本語における音質には差が大きな出た。
「イントネーションの問題などは、機械学習の発展でいずれ改善されると考えていた一方で、音質は劇的に変わることはないと思いました。Amazon Pollyは日本語発話の品質が高く、ユーザーコミュニティーがあるので、問題が起きても解決しやすいのもポイントでした」(山口さん)
実際に、漢字や英語の読み間違いなどはどんどん改善してきており、数カ月前と今でも大きな差があるという。ただし、そんなAmazon Pollyにも「弱点」があると山口さんは話す。
Copyright © ITmedia, Inc. All Rights Reserved.
Office 365を導入したものの、利用者にアプリの動作やネットワークが“重い”と苦情を言われたら、あなたならどうしますか――原因はどこにある? とるべき対策は?
あなたにオススメの記事
- PR -