ゆっくり実況といえば、動画サイトでもすでにいちカテゴリとして確立した立場を持つようになったのではないかと思います。しかし、それも編集動画前提のお話。
テキストを打ち込んでゆっくりにしゃべらせた音声ファイルを、あらかじめ録画しておいた動画に重ねて編集しなければいけないので、ライブ配信でゆっくりを使うのって現実的ではなかったですよね。
でも、先日このブログ※でちょっと触れた、音声認識機能を使えば…
(※【フリー】無料で使える音声認識テキスト入力ソフト2選→http://mono-tone.blog.jp/archives/1066338166.htmlのことです)
音声認識でテキスト入力→それをゆっくり読み上げ
という連携で、マイクに吹き込んだ言葉をゆっくりにしゃべらせることが可能なのではないか!?と考えました。一番手っ取り早いのは、棒読みちゃんやsoftalkのクリップボード監視を使って、テキストを渡す方法です。
早速、入力枠を常に監視し続け、なにかテキストが入ればそれをクリップボードに送り、枠の内容はクリアするだけのソフトをササッと作って試してみました。
実況のための読み上げ配信用ソフトを自作していたがすでに存在していた件
先日ご紹介したとおり、Google音声認識は無料で使うのであればchromeブラウザ上でなければいけません。自分で作ったソフトの入力枠に音声認識によるテキスト入力を行うには、windows標準の音声認識機能を使うことになります。こちらは学習次第でそこそこの精度で読み取るようにはなりますが、いかんせんお堅い。日本語として文法が正しくなければなかなか認識してくれなかったりします。
ライターとして美しい日本語を使った記事を書くには良いのですが、配信サイトでライブ実況を行うのなら言葉はどうしても口語になります。単語登録を使って少しずつ教育していくこともできますが、気の遠くなるお話でした。
そのてん、Google音声認識はややネットスラングに偏ってしまう感はありますが、口語にも強く、実況向きの性能を誇ります。Windows音声認識がいすのきしみや咳払いも拾って「で」「て」といった出力をしてしまうのに対し、Google音声認識はそういったノイズを排除する機能も搭載しているようです。
余談はさておき、私はしばらく自分で作ったソフトの微調整をしたり、思い付きでオマケ機能を搭載したりしながら、少しずつ音声認識読み上げ実況の環境を整えていきました。そして先日、また思いついた機能を搭載するために調べものをしていて、偶然発見したのです。
私がやりたかった、音声認識を読み上げるソフトはすでに有志の手によって開発され、発表されていた…!
発見できたのは以下の2本のソフトです。
音声認識した結果を結月ゆかりさんに喋ってもらうアプリ
サイト→http://okayulu.moe/
音声認識でゆっくりとVOICEROIDに喋らせる! NAMAROID
サイト→http://ch.nicovideo.jp/StackGamesEmpire/blomaga/ar944599
ゆかりねっとの方はGoogle音声認識を使っていて、とても快適。ゆかりさんのイラストもかわいらしいので、配信視聴者さんのウケも良いのではないかと思います。
NAMAROIDのほうは聞き取り精度がゆかりねっとよりも低く(体感)、準備段階としてインストールしておかなければいけないものが大きいので、「ちょっと試してみたい」程度であればゆかりねっとをオススメします。ただし、前述したノイズ自動排除機能が災いしてか、先日ゲーム実況配信でちょっとしたミスをしたときに「ああぁぁああぁあぁ」という嘆きの声はノイズとして処理されたようで、一切拾ってもらえませんでした。