「各ファイルから新規生成」では新しいモデル UUID・話者 UUID が自動的に作成されますが、
「既存の .aivm/.aivmx ファイルのメタデータを編集」では元の UUID がそのまま保持されます。
AivisSpeech や AivisHub でも、メタデータ編集・モデルデータ差し替えを行う前と同一の音声合成モデルとして認識されます。
複数のテキストを入力して、音声合成モデル内のすべての話者・スタイルのボイスサンプルを一度に生成できます。
利用するには、あらかじめこの PC で AivisSpeech を起動しておく必要があります。 今までボイスサンプルを作るのが面倒でメタデータに設定していなかったという方も、ぜひ一度お試しください!
WAV → M4A への変換により、生成後のモデルサイズが最大 10MB 以上削減されています!
ボイスサンプルが自動的に WAV から M4A (AAC) 形式に変換されるようになりました!
モデルサイズを簡単に削減できますので、以前音声合成モデルを制作された方もぜひ一度お試しください!🙏
このサイトでは、AivisSpeech や Aivis Cloud API で使える AI 音声合成モデルファイル (AIVM / AIVMX) を、簡単に作成・編集できます。
AIVM (Aivis Voice Model) / AIVMX (Aivis Voice Model for ONNX) は、学習済みモデル・ハイパーパラメータ・スタイルベクトル・話者メタデータ
この AIVM Generator では、ブラウザ上の GUI で AIVM / AIVMX ファイルを生成・編集できます。
もちろん、既存の AIVM / AIVMX ファイル内の AIVM メタデータの確認・編集にも対応しています。
すべての処理はブラウザ上で行われます。入力情報がサーバーにアップロードされることはありません。
aivmlib / aivmlib-web では、AIVM / AIVMX ファイル内のメタデータを読み書きするための Python / JavaScript (Web) 向け
ファイル選択フォームへのドラッグ&ドロップ、またはクリックでファイルを選択できます。
現時点では、Style-Bert-VITS2 で作成した音声合成モデルにのみ対応しています。
AIVM / AIVMX ファイルのメタデータの整合性を保つため、両方のファイルを同時に生成・編集する仕様となっています。
Style-Bert-VITS2 で作成した Safetensors モデルはあるが、ONNX モデルをお持ちでない場合、下のフォームからかんたんに変換できます。
「変換開始」ボタンを押すと、モデルファイルが変換サーバーに送信され、変換処理が始まります。変換には数分程度かかります。
変換が完了すると、ONNX モデルが自動的にダウンロードされます。変換後にサーバー上のファイルは直ちに削除されますので、ご安心ください。
※現在開発中につきまだ動作しません(2025年8月中に実装予定)。今すぐ Style-Bert-VITS2 で作成したモデルを ONNX に変換したい方は最新の dev ブランチに切り替えた上で こちらの ONNX 変換スクリプト をご利用ください(デベロッパー向け)。
ここで設定したメタデータは、AIVM / AIVMX ファイル内に埋め込まれる AIVM マニフェスト に反映されます。
AivisSpeech での音声合成には AIVMX (.aivmx) 形式を、モデルミックスや開発には AIVM (.aivm) 形式をご利用ください。
- AIVM (.aivm): モデルミックスによる新しい声質の作成やファインチューニングが可能な形式です。
- おもに NVIDIA GPU での利用に特化しています。(PyTorch + Safetensors モデル)
- GPU で高速に音声合成を行うため、Aivis Cloud API の内部では AIVM ファイルを使用しています。
- AIVMX (.aivmx): より多くの環境で音声合成を実行できる形式です。
- CPU だけでも快適に音声合成を実行できます。やろうと思えば Web ブラウザでも動かせます。(ONNX モデル)
- Windows では AMD Radeon / Intel Arc GPU でも高速に動作します。
- AivisSpeech はインストールサイズを削減するため、AIVMX ファイルにのみ対応しています。