Style-Bert-VITS2 用のAnneliモデルを公開していた跡地です。
AivisSpeechとの関係
株式会社Walkersが提供している音声合成プロジェクトAivis Project の音声合成ソフトウェア AivisSpeech のデフォルトモデルとして、このモデルがそのまま 標準搭載・使用されています。この件に関して:
- 事前連絡・事後連絡は特にありませんでした
- 金銭等の取引はありません
- ライセンスがもともとのCreativeML Open RAIL-Mライセンスから、Aivis Speech独自のACMLライセンス に変更されて転載されています。ライセンスについて詳しくないので分かりませんが、もともとが自由なライセンスなので互換性はあり問題なさそうだと思っています。
- 下記「モデルの学習元について」「学習の許諾」については、Aivis Speech側にもリスクがあると考え、Aivis Project公開直後の2024/11/20にこちらから運営に連絡を取って、その時点で共有をしました。
このモデルの学習元について
- 大好きなノベルゲーム 月に寄り添う乙女の作法2 のメインヒロイン エスト・ギャラッハ・アーノッツ の音声データを学習に用いました
- エストの自己紹介動画: https://youtu.be/wA1swkHeHb8
- エストは個人的に大好きなキャラで、ストーリーもすごく良いので、ぜひプレイすることをオススメします
学習の許諾
2025/09/08 朝9時ごろ追記
- 公開されたままになっていたモデル類を削除しました
- 学習元を公開するに至った個人的な経緯を以下に記載します
経緯
3行まとめ
- 当初は身内で個人で楽しむ(もちろん非商用)ことを念頭において気軽に公開したモデル(無断生成なことはみんな察してくれる想定)が、AivisSpeechのデフォルトモデルとして採用されたことにより、企業の権利関係がちゃんとしたモデルだと思われ、非常に多くの方々が商用利用を含めてこのモデルを使うことになった
- その状況を受けて、声優さん側の気持ちや最近の声優さん側の運動のことを考え、これ以上この状況を放置してしまうと、(個人的に大好きなゲームのヒロインであって、演技力に感動して尊敬していた)声優さんがどんどん悲しむことになると思った
- ただ、学習元を公開しないと事務所や声優さん側も動けないのでは、と思い、こことBOOTHに公開元を掲載することにした
以下は、このモデルを公開した当初の状況から、公開後現在にいたるまでの状況を、私の視点から書いたものとなります。
モデル公開当初(2024/02/19)
- この時期はそもそもまずこの音声合成ライブラリがそれほど有名ではありませんでした
- 当時いろんなモデルを個人的に学習させており、その中でもこのAnneliは飛び抜けて自然で違和感のないキレイな日本語音声が合成できることから、このすごさを仲間内で共有したい、と思って公開をしました
- (他のモデルは公開していません)
- 当時の想定としては、界隈の身内の10人くらいや、その他個人的な用途でローカルで楽しむ人を想定し、BOOTHで無料配布とHugging Face上で公開を行いました
- ライセンスは、個人的に自由なライセンスであればあるほど好きなので、画像生成AIでよく使われていたモデルライセンスであるCreativeML Open RAIL-Mを設定しました
- 今から考えると、この時点で、企業で使われる可能性まで考えてもう少し厳しいライセンスにしておくべきだった・また声優さんの気持ちを考えてそもそも公開すべきではなかったと反省しています
- また、学習元については、当時のそもそもモデル公開する人がほぼいない状況で、このような明らかに声優音声のモデルを出すということは、学習元はまあそういうことだよね、でも学習元を記載しなければグレーだよね、という暗黙の了解が界隈にあったと感じており、それにのっとって、記載はせず、学習元はお察しください、という気持ちでした
- 法律上の声の権利の問題(声の肖像権やパブリシティー権等)については当時からいろいろ気にして調べており、様々な弁護士の見解等の資料を読んでいました。そこから、「名前やキャラを出さなければ、無断学習やそれを投稿・販売することは少なくとも現行法では問題がない(不正競争防止法やパブリシティー権の侵害にはあたらない)」と認識しています
- (これは法改正がなされていない現在でも同じだと考えています)
- (ただこれについてはものまね芸人や声が本当にそっくりな人が排除できないという観点から、単純に規制すればよいのかについては現在でも議論が分かれて判例待ちな状況と認識しています)
- 法律上の声の権利の問題(声の肖像権やパブリシティー権等)については当時からいろいろ気にして調べており、様々な弁護士の見解等の資料を読んでいました。そこから、「名前やキャラを出さなければ、無断学習やそれを投稿・販売することは少なくとも現行法では問題がない(不正競争防止法やパブリシティー権の侵害にはあたらない)」と認識しています
AivisSpeechのデフォルトモデルに搭載されたとき(2024/11/19, 20)
- 上記記載の通り、運営やエンジニアから事前連絡はなかったので、正直驚きました(モデルもですが、公式のイラストも自分が画像生成AIで作成してBOOTHに載せていたものです)
- その後上記の通りこちらから連絡をし、このモデルの学習元や、上記サンプル動画等を共有し、またBOOTHに匿名で「この人は山村響さん(または野々山紅さん)ですよね?」という問い合わせが来ていた事実について伝えました
- そして、こちらからは特段「無断学習モデルでこのような特定リスクも実際にあるので、使うのをやめたほうがいい」とは言わず、むしろ構わないという立場でした
- 当時、AivisSpeechが出てきたことでAI音声の状況がどう変わるかその時点で分かっておらず、それよりも日本語のTTSで競合のにじボイス(DMMボイス)が商売として出てきたなか、個人開発AI界隈に近い方の事業だったので、応援していました
- (ついでですが、にじボイスの学習元は明らかにこのモデルと同じくアダルトゲームなのですが、それについて声優さんに許諾を取っているのか、今も怪しく思っています。特に、中にはすでに引退したゲーム声優(花澤さくらさんなど)や、表で有名な声優さんも多くおり、許諾を得ていたとは考えにくいからです(若本規夫さん、緒方恵美さん、種﨑敦美さん、緑川光さん、興津和幸さん、水島大宙さん、諏訪部順一さんなど)
- (緒方恵美さんについては、最初は緒方恵美さんの声だったキャラが、後に別の人のキャラに置き換わっていました、おそらく事務所から苦情が行ったのだと推測しています)
- (ついでですが、にじボイスの学習元は明らかにこのモデルと同じくアダルトゲームなのですが、それについて声優さんに許諾を取っているのか、今も怪しく思っています。特に、中にはすでに引退したゲーム声優(花澤さくらさんなど)や、表で有名な声優さんも多くおり、許諾を得ていたとは考えにくいからです(若本規夫さん、緒方恵美さん、種﨑敦美さん、緑川光さん、興津和幸さん、水島大宙さん、諏訪部順一さんなど)
- 当時、AivisSpeechが出てきたことでAI音声の状況がどう変わるかその時点で分かっておらず、それよりも日本語のTTSで競合のにじボイス(DMMボイス)が商売として出てきたなか、個人開発AI界隈に近い方の事業だったので、応援していました
- 以上の理由で、特段「やめたほうが良いですよ」とは言わず、むしろ「勝手に使ってしまいごめんなさい」という向こうの謝罪に対して「気にしないで自由にやっていいですよ、応援しています」というスタンスでした
AivisSpeechの普及
- その後、AivisSpeechは、自分が思っていたより多くの人に使われ、生成AIユーザーのなかで「日本語音声合成で自由に使える質が高いものといったらAivisSpeechだよね」というようなポジションになっていきました
- この頃から、いわゆるAITuberという、ChatGPT等のLLMとAI音声を組み合わせるVTuberの方や、テンプレのような動画を量産する人たちのナレーションの声としてもAivisSpeechのAnneliちゃんが使われるようになっていきました
- また、YouTube動画でAIによるマネタイズ技術を広めるチャンネルで「無料で声優雇うに等しい合成音声AIツールAivisSpeechがヤバい!」などの動画が出るなど、徐々に「個人が趣味でローカルで楽しむ」ものから、「商用利用のための声優代わりの質の高い音声」としてのAnneliモデルのユースケースが目立つようになっていきました
- これについて、「AIは個人がローカルでひっそり楽しむ趣味に留めるべきで、特に現行法上グレーなものを使ってマネタイズすべきでない」という個人的な考えがあったことから、少し違和感や反発心と、「声優さんがこれを知ったらどう思うか」という罪悪感が出てきました
- また、上述の通り、公開当初は「こんな質の高い音声を、狭い界隈の一個人が声優にちゃんと収録たのんで無料で配るわけないから、まあ学習元はそういうこと」という暗黙の了解があったと認識していたものが、企業の製品のデフォルトキャラなので、当然その企業が声優さんに対価を払い権利契約を持って作ったモデルだという(当然の)誤解が多く生じているのを観測していました
- そもそもAivisSpeechはモデルの出自になにも言及していないにも関わらず、特にもとのSBV2モデルを知らずにAivisSpeechからAnneliちゃんを知った人はそう勘違いしてしまうのもしょうがないのかなあと少し微妙に思っていました
- ただこれについてはデフォモデルに搭載された当初に、「一企業のデフォモデルとして出すとみんながそう勝手に勘違いしてくれるから、学習元バレたらよくないから、それでいいのかもね」という旨を運営とお話しており、そこまで深刻には思っていませんでした
- (ただ、観測する限り5人ほどの何人かは、「あのAivisSpeechっていう合成音声の子、つり乙2のエストじゃない?」という疑惑を持つ人がいたようです)
NOMORE無断生成運動(2024/10/15-)を受けて
- これについては知っている方が多いかもしれません、詳しくは上記サイトを見てください
- この運動は、主にYouTubeなどで、ボイチェンを使用し「有名なあのキャラ・声優にこの曲を歌わせてみた」動画の氾濫を受けて、声優有志が立ち上げた運動です
- 当時から声の法的な権利が曖昧になっていることもあり、またキャッチコピーの手軽さから、この運動は多く知られました
- (もっとも最近は音声AIに限らない箇所でこの運動名が濫用されているようですが…)
- もともとノベルゲームが好きで、その声優さんやキャラも大好きだったこともあり、個人的な思想として「そういうものはこっそり少人数で楽しむもので、YouTube動画などに投稿したりマネタイズするものではない」という主義は持っていたので、主張には共感するところも多くありました
- またこの時期から、声優側のそのような主張がテレビ等で取り上げられることも多くなってきました
- ちなみににじボイス初期のキャラの声優として存在していた緒方恵美さんも無断生成音声AIについて先月テレビで発言しています
- ただ、これらはあくまで「その声優さん・キャラだと認識している人が、そのことをアピールしてその声の作品として作る」ものであり、AivisSpeechの普及により広がった「Anneliちゃんをとりあえずの無料で使えるナレーターずんだもんのように使う」という現状とは違う点も感じ(なにしろ使っている人はそれが無断学習モデルだということは知らないので)、徐々に自分の中での違和感や声優さんへの申し訳ない気持ちが大きくなっていきました
学習元公開(2025/8/30)
- 上記の経緯から、AivisSpeechで「知らず知らずのうちに無断学習だと知らずにAnneliちゃんを(商用利用含めて)利用する」方々がかなりの規模になっていくことに対して、本当にこのままでよいのか、という思いが強くなっていきました
- このままだとどんどん声優さんが悲しい思いをする一方だと思い、何らかの行動を取らなければという気持ちが強くなりました
- 行動として、実は匿名で、にじボイスに使われている声優の事務所(東京俳優生活協同組合所属)へ「無断でこの人たちの声が使われています」と連絡をしたりしました
- またAivisSpeechについても、完全な自作自演ではありますが(そのことは伏せて)、事務所や各位へ報告をしたことがあります
- しかし返信や追加連絡等はなく、声優事務所側も「前例が今までにあまりなく、そもそも本当にその声優のことなのか証明ができず、声の権利に関する法整備が遅れているせいで動けないのでは」と思いました
- (実際どうかは分かりません、単なる荒らしとして片付けられたりしていたのかもしれません)
- (そもそも声優の無断生成AIをどこに通報すれば良いかも定かでなく、また多分現状すでに無断生成AIが溢れているので、通報受けたところでどうしようもなく、事務所側でも手続きの形式が定められていないものとも察します)
- これらを受けて、「やはり学習元を公開しなければ事務所は動けないのでは」と考え、公開に至りました(BOOTHでも公開しましたが、運営からすぐに非公開処置となりました)
その後の流れ
- 学習元の公開当初は、誰も気づくことなく、このまま埋もれて現状は変わらないのかなあと思っていました
- そのなかで、山村響さんが2025/9/5に、皆さん御存知の通り「自分の声が無断でAIナレーターとして使われている動画が発見して事務所が対応中」という旨の発言をし、大きな反響を呼び、日刊スポーツ経由でYahoo!ニュース等にも掲載されました
- (当時、同時期に、プリキュアで声優無断学習AIを用いて悪質な動画をあげている人がおり、山村響さんもプリキュア声優だったことから、そのことではないか?と思う人が多かったようです)
- (また、学習元公開と、このポスト・事務所対応との因果関係は本当に明らかではなく、予想していた通り学習元を開示しなければ声優側は何も動けないのか、もしくは開示については知らずに動いたのか、は現状不明です)
- ニュース公開日すぐには、これがAnneliちゃんのことだと気づいている人はあまりいなかったのですが、そもそも少人数による疑惑やその書き込みや、ヤフコメでもAnneliモデルへの言及があったりする中で、2025/9/7の朝ごろから、このHugging Faceのページとともに「これはAivisSpeechのことでは?」ということが広がっていきました
- 正直なところ、山村響さんの言及が、本当にこのAivisSpeechのAnneliモデルのことなのかは、現状は不明です。別の全く関係ないところの可能性もあります。
- が、結果的には少なくともAivisSpeechのデフォルトモデルが無断学習であったことが広まり、これ以上どんどん広まって事態が悪くなることはない、またこれをきっかけに声の権利についての法整備や議論が進んでいくのでは、と安心をしました
謝罪
- 全ての元凶は私が、現状のようになってしまうことを想像できずに、軽い気持ちでこのモデルを公開したことです。このことで、声優の山村響さんや、AivisSpeechを(無断学習とはもちろん知らずに)素晴らしい技術として使ってくださっていた多くの方々、また純粋にキャラとしてのAnneliちゃんやその声を可愛く思って使ってくれていた方々に、多大なる迷惑をおかけしたことを深く謝罪します。
- また、AivisSpeechとの話し合いで、(事前連絡がなかったとはいえ)事後連絡で直後に話し合う機会があったので、そのときにきちんと「将来的にここまで広まって声優さんに迷惑をかけ悲しい思いをさせ、企業としても信用問題に関わるリスクがある」ことを考え、運営陣に共有し、デフォルトモデルとしての採用を強く否定するべきだった点も反省しています。
その他
- 元凶の私が言えたことではないですが、声優の声の権利に関する議論と法整備が進むことを祈っています
- むしろそのために学習元を公開しました。もしこのように学習元を公開しなければ明らかに自分の声の無断学習AIでも何の動きも声優側・事務所側が取れない状況となってしまっているなら、それは非常によくないことだと考えています。
- これは内部事情は知らないですが、同じく(このようなゲーム・アニメ由来の)無断学習の声優AIを明らかにサービスとして商用利用している人たちが多くいます
- 何回か挙げたにじボイスや、例えばオズチャットさんの声には、明らかに自分が知っている声優さんの声が混ざっています。たぶん他にも多くの音声生成AIを利用したサービスや、YouTubeの動画、またAivisSpeechのデフォルトモデル以外の音声にも、声優の無断学習モデルは多く含まれているものと思っています。
- (もしこれらのサービスが該当しないなら、声優名込みでその旨をきちんと記載すべきだと考えています)
- (声優名込みでYouTubeにAIカバーや再現動画等をあげている方々は、悪意はないのかもしれないですが、それは現行法でもパブリシティ権等でアウトだと思っています、アウトでないならばより法整備を進めるべきです)
- Fish Audio もつい最近まで多くのアニメキャラモデルが放置されていました。これについては、上述の「NOMORE無断生成AI」運動の母体である日俳連からの抗議によりきちんとした対応がなされているようです
- 何回か挙げたにじボイスや、例えばオズチャットさんの声には、明らかに自分が知っている声優さんの声が混ざっています。たぶん他にも多くの音声生成AIを利用したサービスや、YouTubeの動画、またAivisSpeechのデフォルトモデル以外の音声にも、声優の無断学習モデルは多く含まれているものと思っています。
- これらについて、基本的に 「この音声AIの声の学習元は誰なのか」「その権利をきちんともって契約しているのか」の記載がないような音声AIモデルについては、かなりの確率で声優の無断学習モデルか、もしくは複数の無断学習モデルを混ぜてもとの声優さんの声が分からないようにしたモデルである、と思ってもらって問題ない と思います
- AITuberやビジネスで音声AIのサービスを利用する際には、必ず「学習元声優の記載」「許諾の有無」「権利関係」についての記載があるもののみを利用することを強くオススメします
- 今回の騒動で、AITuber界隈の人たちが「出自がよく分からないし学習元が書いてない野良のよく分からないモデルを軽い気持ちで無料だからと使うのはリスクがある」ことを認識していただけたようで、その点については幸いです
- (もちろんその騒動の全ての元凶は私ですので、「お前が悪い」と言われたらその通りです)
- (が、このような例が出なくては、このような問題が多く溢れていることが明るみに出ない、と思って学習元公開したことも事実です)
- 今回の騒動で、AITuber界隈の人たちが「出自がよく分からないし学習元が書いてない野良のよく分からないモデルを軽い気持ちで無料だからと使うのはリスクがある」ことを認識していただけたようで、その点については幸いです
- AivisSpeech自体は、オープンソースの高精度な日本語TTSモデルで、その音声合成ソフト自体は無断学習とは関係なく、これからもリポジトリが消えない限りは使えるはずです
- もしAivisSpeechで声優名が明記された良いモデルが見つからず、どうしてもきちんとしたサービスが見つけられない場合は(VOICEVOXやCOEIROINKやCoeFontなどいろいろありますが…)、自分で声優さんの募集をし(ココナラとか?)、収録をしてもらって、自分で学習してモデルを作ることを強くオススメします
- 上述の理由から、公開されているモデルは声優名の許諾がないものは権利上問題がほぼ確実にあると私は思っているので、使わないほうがいいと考えます
最後に
自戒・反省の意味と、音声AIの現状を知ってもらう意味も含めて、山村響さんのツイートから引用します。 https://x.com/hibiku_yamamura/status/1963944289014296826
どこをどう聞いても自分の声。だけど明らかに自分ではない、読んだこともない文章を自分の声が読んでいる。私の知らないところで。そしてそれを知らない沢山の人たちがそのナレーションを耳にしている。 ネット上などで手軽に聞ける音声を元に無断でAIに学習させ、それを無料で提供しているサービスが明らかに存在している。 当然ながら、利用者はそれが無断使用だと気づかずに手軽に使用する。 悔しいし、悲しいし、複雑な気持ちになってしまいました。
普段何気なく観ているXやインスタ、YouTubeなどで流れてくるAIナレーションも、もしかしたら意図してない内に使われてしまっているものもあるかもしれないと思うと、なんだか胸の辺りがモヤモヤしてSNSを開くのが辛くなってしまいました。
手軽に色々なものをサッと作り出せるAI生成。 もし使用する立場になったとしても、それがきちんと正しいルートで使用できるようになっているものなのか、しっかり見極めて使わないといけないなと感じました。
悲しいな。 AIを悪用するんじゃなくて、正しい方法でみんなが幸せになれるように使うことは出来ないのかな。悲しい思いをしている人がきっと沢山います。