ツイート

会話

(音声合成に明るい皆様・・・今あなたたちの脳に直接呼びかけています・・・言語特徴量の大元?の「フルコンテキストラベル」を手に入れる一番ナウい方法を教えてください・・・何卒・・・何卒・・・)
2
7
15
日本語だとすると、手っ取り早いのはOpenJTalk をトレースオプション付きで実行して、ログの部分を使うことでしょうかね。実際はmecab + naist-jdic の形態素解析とアクセント処理がOpenJTalk のフロント部分のライブラリと使われているので、そこを切り出して使えないこともないのですかね。
2
1
1
横から失礼します。 ログファイルのフルコンテキストラベルに関してなのですが、画像のA:B:C:D:E:Fとその後ろのパラメータ?はぞれぞれ何を示しているのか教えて頂けると嬉しいです。
画像
2
返信先: さん, さん
探し出すのは結構大変なのですが、 * OpenJTalk がベースにしているHTS というツールの日本語用のデモスクリプト: hts.sp.nitech.ac.jp/archives/2.3/H の data/lab_format.pdf に記載があります。音声が同梱されている関係で128MB ありますので、DMでpdf のみご連絡した方がよいかもです。
返信先: さん, さん
ざっくり A: 当該モーラ(ひらがな1文字だと思ってください)のアクセントに関する情報、B-D: 前後と当該単語の形態素に関する情報、E-G: 前後と当該のアクセント句のアクセントの情報、H-J: 文節レベルの区間での情報(前後と当該)、K: 文全体情報(文節数、アクセント句数、モーラ数)です。
1
2
返信を表示

Twitterを使ってみよう

今すぐ登録して、タイムラインをカスタマイズしましょう。
By signing up, you agree to the Terms of Service and Privacy Policy, including Cookie Use.

トレンド

いまどうしてる?

国際ニュース
ライブ
更新:ロシア大統領報道官 CNNの質問に「ロシア存亡の脅威あれば核兵器使用ありえる」
ニュース
ライブ
ゼレンスキー大統領のオンライン国会演説
トレンドトピック: ゼレンスキー大統領国会中継
ニュース · トレンド
日本の領土侵略
ロイター通信によると、衆院外務委員会で林外相は23日、ロシアのウクライナ侵攻を受け日米防衛の抑止力について質問されたことに対し、日本の領土が侵略された場合は日米同盟に基づき米国が日本を防衛すると繰り返し表明していると述べました。
7,874件のツイート
日本のトレンド
多重交際
トレンドトピック: ホテル密会SNSナンパ
ニュース
3 時間前
岸田首相がベルギー訪問 G7首脳会議出席へ