ヒホ(ヒロシバ)@hiho_karuta·2018年11月6日(音声合成に明るい皆様・・・今あなたたちの脳に直接呼びかけています・・・言語特徴量の大元?の「フルコンテキストラベル」を手に入れる一番ナウい方法を教えてください・・・何卒・・・何卒・・・)2715
Daisuke Saito@dsk_saito·2018年11月6日日本語だとすると、手っ取り早いのはOpenJTalk をトレースオプション付きで実行して、ログの部分を使うことでしょうかね。実際はmecab + naist-jdic の形態素解析とアクセント処理がOpenJTalk のフロント部分のライブラリと使われているので、そこを切り出して使えないこともないのですかね。211
xiuちゃん@xightcane1·2020年9月23日横から失礼します。 ログファイルのフルコンテキストラベルに関してなのですが、画像のA:B:C:D:E:Fとその後ろのパラメータ?はぞれぞれ何を示しているのか教えて頂けると嬉しいです。2
Daisuke Saito@dsk_saito返信先: @xightcane1さん, @hiho_karutaさん探し出すのは結構大変なのですが、 * OpenJTalk がベースにしているHTS というツールの日本語用のデモスクリプト: http://hts.sp.nitech.ac.jp/archives/2.3/HTS-demo_NIT-ATR503-M001.tar.bz2… の data/lab_format.pdf に記載があります。音声が同梱されている関係で128MB ありますので、DMでpdf のみご連絡した方がよいかもです。午前2:36 · 2020年9月24日·Twitter Web App1 件のいいね
Daisuke Saito@dsk_saito·2020年9月24日返信先: @dsk_saitoさん, @hiho_karutaさんざっくり A: 当該モーラ(ひらがな1文字だと思ってください)のアクセントに関する情報、B-D: 前後と当該単語の形態素に関する情報、E-G: 前後と当該のアクセント句のアクセントの情報、H-J: 文節レベルの区間での情報(前後と当該)、K: 文全体情報(文節数、アクセント句数、モーラ数)です。12