製品紹介
組み込み向け音声合成
当社では、組み込みシステム向けの音声合成エンジンを開発しています。 明瞭な合成音声であることはもちろん、小型・軽量、組み込みが容易であることにこだわって開発しています。
昨今、サーバーで音声を合成して通信回線で送るクラウド型のシステムが流行っていますが、 次のようなクラウドが使えないシステムでの音声合成にお使いください。
- インターネット接続が断続的
- LPWAなどの低速通信回線
- 災害などの非常時でも頑健なシステム
- スタンドアロン
言語処理部と規則音声合成部に分かれています
当社の音声合成エンジンは、漢字を含むテキストを、かな表記の音声記号列に変換する言語処理部 AqKanji2Koeと、音声記号列を音声に変換する規則音声合成部 AquesTalkの2つのモジュールに分かれています。
漢字仮名混じりテキストからの音声合成の場合には、2つのモジュールを組み合わせて使用します。
動的に漢字を読む必要がない場合は、規則音声合成部だけを用い、よりコンパクトに実装できます。
文中の単語を置き換えるなど、プログラムで動的に音声記号を置換・生成したり、 数値の桁読みなどのAquesTalkの独自機能を使うことで、 規則音声合成部だけでも数多くのアプリケーションに対応できます。
AqKanji2KoeとAquesTalkは完全に独立しており、それぞれ異なる環境、例えば言語処理はLinuxサーバーで、規則音声合成はマイコンで動かすといった柔軟なシステム構成も可能です。
現在、AqKanji2Koeは2種類、AqKanji2Koeは4種類のエンジンがあり、任意の組み合わせが可能です。システムに適した組み合わせも提案いたしますので、お気軽にご相談ください。
また、小型IoT機器向けに、言語処理と規則音声合成を組み合わせた AquesTalk-KMもリリースしました。
- AqKanji2Koe 言語処理エンジン
- AquesTalk 規則音声合成エンジン
- AquesTalk-KM 言語処理+規則音声合成エンジン
パッケージとカスタムの2つの製品種類があります
当社の音声合成エンジンはソフトウェアライブラリとして提供します。お客様はこれを製品やシステムに組み込んでお使いいただきます。
パッケージ製品は、あらかじめ主要なプラットフォーム(OS)向けにビルドしたライブラリで、すぐに検証や開発が行えます。評価版も用意されています。
カスタム製品は、特殊なOSやOSを持たない組み込みシステム向けに、お使いの環境(CPU種類など)に合わせてビルドして提供します。 ライブラリのインターフェースや機能のカスタマイズなど、様々なニーズにも対応できます。例えば、音声出力しながら他の処理も可能なフレーム単位の音声出力、声の種類の差し替えや調整、文字コード、入出力フォーマットやサンプリング周波数の変更などにも柔軟に対応いたします。
その他の製品
- AquesTalk Pico LSI
- AquesTalk picoエンジンを組み込んだ1チップの音声合成LSIです。
- AquesTalk ESP32
- Espressif Systems製のマイクロコントローラ ESP32用の音声合成ライブラリです。AqKanji2Koe-MとAquesTalk picoエンジンが移植されており、漢字を含むテキストからの音声合成ができます。
- AquesTalk Pi
- Raspberry Pi 上で音声合成を可能にするアプリケーションプログラムです。AqKanji2Koe-AとAquesTalk(1)エンジンが使われており、少ない処理量で高速に音声合成できます。
- AquesTalk TTS
- Android TTS API準拠のテキスト音声合成エンジン アプリです(ライブラリではありません)。 AqKanji2Koe-AとAquesTalk(1)エンジンが使用されています。AquesTalk10エンジンを採用し、機能も拡張した 「AquesTalk TTS Pro」もあります。
- Labs
- β版、実験、その他の公開場所です。
オプションモジュール
「人名モジュール」AqJinmei
カナ表記の人名を入力とし、適切なアクセントを付与した音声記号列を生成する、AquesTalkエンジンのフロントエンドモジュールです。これを使用すれば、よみがなの情報から適切なアクセントで名前を読み上げることができるようになります。 辞書を持たずに内部ルールでアクセントを付与するアルゴリズムにより、8kbyte程度のコンパクトな実装サイズとなっています。アクセント正解率 姓:95% 名:98% (当社コーパスによる調査)
「地名モジュール」AqDress
地名の音声記号列を生成する、AquesTalkエンジンのフロントエンドモジュールです。郵便番号または全国地方公共団体コードを入力すると、市区町村までの地名の音声記号列を生成します。本モジュールにより、住所を音声で確認するシステムが簡単に構築できます。漢字からの読み上げで問題となる同一表記で読みが異なる地名(例えば、愛知郡: あいちぐん[愛知県]/えちぐん[滋賀県])でも、正しい読みと適切なアクセントで読みあげることができます。プログラムサイズ(データ含む)は、地方公共団体コードからは26KB、郵便番号からは41KB程度と小さく、小型端末にもお使いいただけます。
「周波数変換モジュール」AqResample
組み込みシステム向けのサンプリング周波数変換ライブラリです。 オーディオ等の一次元信号を任意のサンプリング周波数に変換(リサンプリング)します。AquesTalkの出力だけでなく、他のアプリでもお使いいただけます。
製品についてご不明な点がございましたら、お気軽にお問い合わせください。