Sinsyの音響モデルってユーザーが作れるものなんですか?
-
-
-
まだ作れるかどうかわかりませんが、Linux用のソースコードや、デフォルト音響モデル謡子の元データ(軽量版)など配布されています。中身を差し替えれば作れると思って勉強中です。また、OpenTalkの音響モデルは作成した方がいます。
-
え!?謡子さんの元データ公開されてるんですか!?
-
はい。web版が70曲程度のところ、31曲分のrawと、それを学習させるコードがセットで配布されてます。探せば見つかると思いますよ!ただ情報は少なく、喋るものの作成法などを参考にしていくしかありません。何かわかったら情報共有したいですね。
-
楽譜データとかはセットになってないんですか
-
楽譜をラベルデータの形式に変換したものと、発音タイミングのラベルデータが同梱されていますから、多分とりあえずそれだけで生成できます。自作モデルの場合ラベルも自作しなければいけませんね。そこから先はまだ知識不足でわかりません。プログラミングもできませんし英語も苦手です><
-
喋る方の音響モデルのラベル生成参考にすればいける気がするんですが・・・・。楽譜となるとまた違うのでしょうか
-
楽譜の形式がオープンソースのMusicXMLらしく、その読み書きをするソフトも存在しますね。しかし知識がなくどのように応用すれば良いかわからない状態ですw 今はJuliusを使おうとしてエラーに悩まされています・・・
- 3 more replies
New conversation -
Loading seems to be taking a while.
Twitter may be over capacity or experiencing a momentary hiccup. Try again or visit Twitter Status for more information.