会話

ヒホ（ヒロシバ）

@hiho_karuta

2018年11月6日

（音声合成に明るい皆様・・・今あなたたちの脳に直接呼びかけています・・・言語特徴量の大元？の「フルコンテキストラベル」を手に入れる一番ナウい方法を教えてください・・・何卒・・・何卒・・・）

Daisuke Saito

@dsk_saito

2018年11月6日

日本語だとすると、手っ取り早いのはOpenJTalk をトレースオプション付きで実行して、ログの部分を使うことでしょうかね。実際はmecab + naist-jdic の形態素解析とアクセント処理がOpenJTalk のフロント部分のライブラリと使われているので、そこを切り出して使えないこともないのですかね。

xiuちゃん

@xightcane1

2020年9月23日

横から失礼します。ログファイルのフルコンテキストラベルに関してなのですが、画像のA:B:C:D:E:Fとその後ろのパラメータ？はぞれぞれ何を示しているのか教えて頂けると嬉しいです。

返信先:

さん,

さん

探し出すのは結構大変なのですが、 * OpenJTalk がベースにしているHTS というツールの日本語用のデモスクリプト: hts.sp.nitech.ac.jp/archives/2.3/H の data/lab_format.pdf に記載があります。音声が同梱されている関係で128MB ありますので、DMでpdf のみご連絡した方がよいかもです。

午前2:36 · 2020年9月24日Twitter Web App

返信先:

さん,

さん

ざっくり A: 当該モーラ（ひらがな1文字だと思ってください）のアクセントに関する情報、B-D: 前後と当該単語の形態素に関する情報、E-G: 前後と当該のアクセント句のアクセントの情報、H-J: 文節レベルの区間での情報（前後と当該）、K: 文全体情報（文節数、アクセント句数、モーラ数）です。

返信を表示

Twitterを使ってみよう

今すぐ登録して、タイムラインをカスタマイズしましょう。

Appleのアカウントで登録

電話番号またはメールアドレスで登録

By signing up, you agree to the Terms of Service and Privacy Policy, including Cookie Use.

関連性の高いアカウント

Daisuke Saito

@dsk_saito

フォロー

研究者＠東大。博士（工学）。大学院工学系研究科電気系工学専攻准教授／EEIC UTokyo 。音声を中心とするマルチメディア情報処理に関わっています。認識や知覚を含めた音声研究全般、各種メディア情報処理、機械学習、脳機能画像処理など、興味は多数。どうでもいいことをつぶやきますが生暖かく見守ってください。