Android Policeは9日(現地時間)、米グーグルのバーチャルアシスタント「Google Assistant」に同社傘下の米DeepMindによって開発された最新の音声生成アルゴリズム「WaveNet」が採用されていることが、公式に発表されたことを伝えています。
WaveNet自体は既に昨年発表されていましたが、DeepMindによると、この1年間をかけて改良を重ねた結果、音声生成処理を実に1000倍も高速化することに成功し、発表時点では0.02秒分の音声を生成するのに1秒かかっていたところを、1秒で20秒分の音声を生成することが可能になったとのことです。
また、WaveNetが採用する機械学習による音声生成技術は処理速度のみならず、精度の面においても進化を遂げており、非常に自然な抑揚とイントネーションを実現しています。公開されているサンプル音源を聞けば、その差は一目瞭然です。
「WaveNet」導入前(上)と導入後(下)
一聴してWaveNetが導入されたバージョンのGoogle Assistantの方が、より実際の人間に近い発音を実現していることが分かります。また、
なお、現時点でWaveNetは、米語(アメリカ英語)および日本語の2ヶ国語のみの対応となっていますが、今後対応言語は追加されていく見通しです。
[DeepMind via Android Police]
ソーシャルシェア
著者