2010年02月17日 (水)名古屋工業大学「人としゃべるコンピューター 徳田・李研究室」
〔2月14日の放送〕
今回は名古屋工業大学で、コンピューターが人の言葉を聞いて認識したり、人の言葉を話したりする技術を研究している情報工学科の徳田・李研究室をご紹介しました。
まず、はまじゅんを迎えてくれたのは、校舎の1階の通路にある、こちらのキャンパス情報案内端末。
はまじゅん 「ごあいさつをお願いします。」
情報案内端末 「渋マガZをお聴きのみなさま、はじめまして。私は名古屋工業大学のキャンパス情報を案内しています。『めいちゃん』と呼んでください。」
はまじゅん 「徳田先生の場所はどこですか?」
めいちゃん 「徳田恵一先生の居室は406Aです。」
はまじゅん 「ありがとう。」
めいちゃん 「どういたしまして、今後ともごひいきにしてください。」
名前は名工大の「めいちゃん」といいます。
研究室の学生の皆さんが、質問のキーワードと応答文をプログラムに入力したり、めいちゃんのメンテナンスをしたりしています。
はまじゅんも上手に質問に答えてくれる名工大のアイドル・めいちゃんをすぐに好きになってしまいました。
研究室でも、徳田恵一教授にさまざまな音声合成・認識の研究について聞かせていただきました。従来の音声合成、言葉をしゃべる技術は、録音した音声そのものを単語ごとにつぎはぎするような方式が主流でしたが、それだと音声のつながり、つなぎ目が不自然なことがよくあります。
名古屋工業大学で開発している方式は、文章の文字原稿とそれをある人が読んだ音声データをペアでコンピューターにインプットします。コンピューターはそこから、その人の声質や文章に応じた話し方の特徴を学習します。そして新しい文章を与えられた時に、その文章を読むのに最適な抑揚などの話し方を計算し、それに合わせて音声を作ります。そうしてコンピューターは自然な話し方ができるようになるんです。
研究室では、しゃべりのテンションを変える/怒りなどの感情を込める/歌を歌わせる/海外の大学と協力し、日本語だけでなく、英語や中国語でコンピューターにしゃべらせる/ある言語でしゃべった言葉を他の言語に自動翻訳してしゃべらせる、といった研究にも取り組んでいます。
コンピューターの音声認識・合成の最先端を行く研究には驚くばかりでした。今後の研究にますます期待が高まります。
投稿者:番組スタッフ | 投稿時間:22:03