パソコンにしゃべらせてみましょう。(音声合成について)

《遠い地平線が消えて、ふかぶかと夜の闇に心を休める時、・・・・・
   で始まる「JAL提供FM番組」ジェットストリーム のナレーションはさらにつづき
・・・・この音楽が美しく、あなたの夢に、溶け込んでいきますように
     で終わります。さらに各曲にも雰囲気を盛り上げる 「語り」 が入ります。
     このナレーションは 当時 城 達也 が担当しました。

このようなナレーションを My CD に取り込めたらと思い、いろいろと試してみました。
本来なら自分の声で語り録音すればよいのですが、自分の声に自信がないので、音声合成という技術を使ってみることにしました。

音声合成というのは、コンピュータ上で、書かれた文章を自動的に読み上げ、声を生成する技術です。
この "音声合成" は "テキスト読み上げ" ともいわれます。
この音声合成技術を、Microsoft では 
「Text-to-Speech」 略して TTS と呼んでいます。
そして音声合成技術の基本部分である 「Text-to-Speech ENGINE」 を 「フリー」 で提供しています。

私はMicrosoftではなくて当初IBM「Voice Type」IBM「Via Voice GOLD」にグレードアップして使っていました。
IBM「Via Voice GOLD」MicrosoftENGINEを併用し、日本語はもちろん、英語、米語、ドイツ語、イタリア語、スペイン語、
フランス語、ロシア語、オランダ語、ポルトガル語・・・・・など、ほとんどの言語を発声することができていたのが、「Via Voice 
GOLD」
 がさらにバージョンアップして、「Via Voice V.8」 になったあたりから、 日本語しか発声することができなくなりました。
それでやむを得ず、古いバージョンの「Via Voice GOLD」を使っていました。

ところが最近になって調べてみると、日本で制作され、しかもフリーソフトで使いやすいものがいくつか見受けられるようになりました。

例えば、
国内フリーソフトでは
 おしゃべりテキスト  FUTAMURA Masashi(二村眞司)転載自由      日本語/多国語
 楽SpeechS       Free's            フリーソフト    日本語/多国語
 
reporter       村田組            フリーソフト    日本語/英語(Ms Agent必要)
 
バイハート      Tokunaga Yoshito (kobo)   転載禁止      日本語/多国語(Ms Agent必要)
 
Text-to-Speech Controller   まろ        公開終了      日本語/英語など
 
proEdit        Tea & Eyes          フリーソフト    日本語のみ(ProTALKER必要)
 
読み上げTool     西村誠一           フリーソフト    英語のみ?(WindowsXP?)
       
注  Ms Agent については別項参照

外国フリーソフト
では
 
ReadPlease      ReadPlease Corporation              多国語(日本語不可)

体験版
では、
  
SMARTTALK         沖電気                   日本語読み上げと、歌も歌うことのできる、面白いソフト
  
ドキュメントトーカー      クリエートシステム開発          同上
            
注   SMARTTALK 歌うサンプル   故郷 (女性) 桃太郎  浦島太郎 (男性) 

有償ソフトでは
  ProTALKER 97      IBM
  SMARTTALK テキスト音声変換エンジン   沖電気               販売終了

有償ソフトで、もともと音声認識ソフトですが、音声合成もできるもの

  VIA VOICE           IBM
  LaLa Voice          東芝
 
などがあります。

外国語については、は日本語で書いた文章を、オンライン翻訳サイトなどで翻訳させ、翻訳された文章を貼り付け
ればネイティヴな外国語をしゃべるようになります。

ここで、外国語をどのようにしゃべるか、サンプルをお聞きください。
下のアンダーラインのところをクリックすると聞くことができます。

       英語  (男性)
       英語
  (女性)
       英語  
(ささやくこともできます)
       ドイツ語     (男性)

       フランス語   (女性)
       イタリア語    (男性)
       スペイン語
   (男性)
       ロシア語     (男性)
       中国語      (男性)
       ロボット がしゃべります。

各国語は "
My PC can speak XXXXX fluently like this." という英文を翻訳サイトでオンライン翻訳
させた結果で、正しいかどうかは保証のかぎりではありません。
また、こんなこともできます。

       英語      
(機長アナウンス)
       ドイツ語   (Johan Wolfgang von Goethe 1749-1833) の詩 「野ばら」 を朗読します)

このほかの外国語も対応した各外国語の ENGINE をインストールすれば、ロシア語、ポルトガル語、中国語、韓国語
などもしゃべるようになります。


*****************************************************************************************************************************
音声合成のソフトはそれぞれに特徴があって用途により適切なものを選択すればよいでしょう。
なかでもお勧めは 【おしゃべりテキスト】 と 【ReadPlease】 です。
ここでは、もっとも使いやすく、機能も多いと思われる 【おしゃべりテキスト」
 を取り上げてみ
ました。
*****************************************************************************************************************************

【おしゃべりテキスト】 のセットアップと使い方について説明いたします。

(1) このソフトではマイクロソフトからフリーソフトとしてリリースされている「Text-to-Speech Engine」を利用します
   ので、あらかじめこれをインターネットからダウンロードして、インストールする必要があります。
   さらに「SAPI4」というソフトもインストールする必要があります。
   インターネット上で

       http://www.microsoft.com/msagent/downloads/user.aspx

    
にアクセスすると、表示されるページのなかに下の図のような [Text-tospeech engines:]という項目があります。
   図に示したように、
【Select a text-to-speech(TTS) engine】 の右端にある▼矢印をクリックすると
   リストが表示されます。
   その中から 【Lernout & Hauspie(p):TTS3000 TTS engine - Japanese(3MB exe】の項目を選択します。

  



(2) 【Download selected engine】をクリックするとダウンロードできます。



(3) ダウンロードされたファイル ( lhttsjpj.exe ) をダブルクリックして、実行させます。自動的にインストールされる
    途中で許諾を求められたら 「はい」 を選択します。インストール画面が消えるまで待ちます。
    なお、MS Agent などで利用することもあるので、
       「Lernout & Hauspie(R) TrueVoice TTS - American English engine (1MB exe)」
    も同じようにダウンロードし(ファイル名は 
tv_enua.exe )、ダブルクリックしてインストールしておいてください。

(4) 次につぎに「SAPI4」をインストールします。
      前述と同じページのなかに
下記のような [SAPI 4.0 runtime support:] という項目があります。

   
【Download the Microsoft SAPI 4.0a runtime binaries (824KB exe)】をクリックするとダウンロードが始まりま
      す。
 



(5) ダウンロードされたファイル (spchapi.exe) をダブルクリックして、実行させると自動的にインストールされます。

(6) 次に
Vector
から 「おしゃべりテキスト」osyatx20.lzh というファイルをダウンロードします。

(7) このファイルを解凍すると 
osyatx20 というフォルダーができます。このフォルダーを適当な位置におきます。

(8) このフォルダーの中にある
 osyaberiText.exe を起動させると下図のように表示されます。

             

(9) ここで[設定]⇒[音声の選択」をクリックます。

             

10)下図のような 「声選択」 の窓で使用したい音声を選択します。
    
上記(1)の手順で Lernout & Hauspie(p):TTS3000 TTS engine - Japanese(3MB exe のみインストール
     した
ときは、 Adult Male #1 Japanese (L&H)  Adult Female #1 Japanese (L&H)
 の2項目しかリスト
     に表示されません。

    
各国語のText-to-Speech engine のインストールすれば、各国語に対応した男声、女声などが選択できます。

                    


 (11) 読み上げさせたいテキストを メニューの「ファイル」⇒「開く」か、あるいはメモ帳などで開いたテキストをコピーし、
     テキスト領域に貼り付ける。 テキスト領域では、メモ帳のように自由に編集できます。

 (12) メニューの「再生」⇒「再生」か、F5キー、または 「コントロールパネル」の右向き矢印をクリックすると、読み上げ
     が始まります。

 (13) さらに、声の音程を上げたり、下げたり、読み上げる速度をかえることもできます。
     そのようなときはメニューの「設定」⇒「一般設定」を選択すると、下図のような[汎用パラメータコントロール]窓が
     表示されますので、「ボイス特性」リストの中から「ユーザー定義」を選択すると、[ピッチ]で声の音程が変更でき
     ます。
     また[レート]で読み上げ速度を変更することができます。
     また、[テスト]欄にテスト用のテキストを書き込むか貼り付け「発声」をクリックすると設定された条件で発声テスト
     をおこなうことができます。
     よければ「適用」をクリックすると、設定が有効となります。
     この[汎用パラメータコントロール]の内容は選択した各言語engine によって違いますが、基本的には同じです。

     

以上、《おしゃべりテキスト》 のインストールと使い方を簡単にご紹介しました。
あとは付属のヘルプ・ファイルを参考に、音声合成の面白さをお楽しみください。

そのほかのアプリケーションもソフト名をクリックすればそれぞれのホームページにアクセス
できますから、ダウンロードしてトライしてみてください。

 〔参考〕

  (A) 読み上げるときの抑揚など不自然なところがありますが句読点やスペースを適当に入れると直ることがあります。

  (B) 日本語の発声はアクセントなど不自然なところがありますが外国語はかなり
NATIVEな発音だとされています。

  (C) テキストをテキスト領域に書き込んだとき、WindowsXPでは正常に表示されないようです。たとえばドイツ語の
     "ウムラウト"など。しかし発声は正常なようです。
     この問題はWindows98上では発生しないようで、文字も正常に表示され、発声も正常です。

  (D) 日本語では、Microsoft のフリーの日本語engine や、ドキュメントト-カーよりも、ProTALKER engine のほうが
     音質はよいと思われます。なかでもSMARTTALKの音質が一番いいようです。

  (E) Text-to-Speech Engine は一旦インストールすると、通常の方法では削除(アンインストール)できません。
     「システムの復元」 しか元に戻すことことができないと説明されています。

  (F) 読み上げソフトのなかには reporter などは、
「クリップボード読み上げ機能」 を持っているものがあります。
     
「クリップボード読み上げ機能」 というのは、読み上げソフトを立ち上げておけば、Internet Explorerや、
     Outlook Express や、メモ帳のテキストの一部を(ドラッグ反転、右クリック、コピーで)クリップボードにコピー
     しただけで読み上げてくれる機能です。