Symphoneme 立ち上げ前夜


Symphonemeが立ち上がった時実はよくわかっていなかったのでなんとなくわくわくしていたがだんだん他社員の人から情報を聞くにつれて疑念を抱くようになった。(実装もされていない機能を特許にしようとしているなど)



開発者が打ち合わせに出してもらえないという出来事は初期のkokkuri氏(※氏はデモ曲の作詞・作曲を手掛けている)との打ち合わせからあった。



開発者は、某芸能人(以下T氏)の人の打ち合わせには出席する許可を得ることができたが、発言をさせないなどということが起き、開発者の前で上司が一人でありもしない(現状で未実装であり、かつ技術的に将来的にも実装の道筋がない)ことをさも可能であるような話しぶりで話していた。



今のSymphonemeのビジネスモデルはT氏からユーザーがつかない、ビジネスモデルを考え直せなど散々ないわれようだったが改善する気はさらさらなかったようで、実際に現在のような公開の仕方になった(通常であればデモが先に来るはずだが何故解説動画が先に上がったのかがよくわからないし、解説動画に虚偽の内容が含まれていることが後にSymphoneme-Sを使ってみたというユーザーによって明らかにされた)。



また、K社との打ち合わせではクラファンの際に声優の顔写真を使い、宣伝に用いたいなどと上司が発言しステマだと注意されていた。



T氏との打ち合わせの時点で目が覚め絶望していました。

Symphoneme が抱えてきた問題:
プロジェクトの見積もりの甘さ
 

 

まず、見積もりが甘すぎます。見積もりがあまりにも甘すぎるため誰もやりたがらず声優さんからも断られていたのです。会社で友達(数々の有名ボカロPの動画を制作してきた方です)に動画制作を依頼しようとした際、炎上案件である、相場を理解しておらず適切な値段設定ができていないとして切り捨てられていました。



当時から規約の面などで自作曲の曲以外楽譜が使えないことについて前B社社員

(この方は僕と一緒に退職済み)によって問題視されていました。



ビジネスモデルも目的が明確でなく、なぜやろうと思ったのか理由の説明ができていませんでした。



S氏と交流を持ち始めたのはクラファンの相談がきっかけのようですが、あのビジネスモデルではクラファンをやっても集まらないという話しがS氏との話しの前に既にありました。



元開発者としての想い
開発者は今退職していますが、1年近く進歩がない(品質が変わっていない)のを見受けると「いったい何をやっていたのか」という気持ちです。



やはり改修やバグ取りは無理だったのでしょうか。



以前、「歌声に加工をゴリゴリする」とか言ってて、「それは歌声の個性が消えるのでやめてください」と言ったことがあります。



しかし、未だにあのツイートをするということはやはり何も成長しないんだなと感じました。



tano氏は、AIについての知識を持っている人物ではありません。あくまでもプロデューサーです。(もしかしたら自称プロデューサーでプロデューサーでは本当はないのかもしれませんが)技術について詳しく知らないのにも拘らず、Twitterで「AIのネットワーク組み換えはもちろんですが、特にインプット用のWAV音源加工。例えばコンプとリミッターをゴリゴリにかけたらどうなるかとか、色々試してみたいことがたくさん。」 などとつぶやいていました。このtano氏のTwitterの投稿で「原音にコンプとリミッターをゴリゴリにかけてAIで学習するということ」や、「研究は遊びではないのだから、AIのネットワーク組み換えなど無意味なことをしても精度は上がらない」といった指摘がありました。



例えばコンプとリミッターをゴリゴリにかけたらどうなるかはMix師やユーザー視点からも違和感を覚えたとの報告があります。これは、開発者としても同じ意見であり、譲れないところです。しかし、以前ユーザーと同じようなことを指摘し続けていたにもかかわらずこの意見がSymphonemeのプロジェクトチームに通じることはなかったようです。それは開発に関わった者として、研究者としてとても悔しくただただ呆れるばかりです。



僕が最初にもらった無加工のデータで驚いたのはアカペラであるはずなのに何故か後ろでずんちゃずんちゃ聞こえ丸々バックトラックが入っていたことです。



できる限りよい収録環境(ノイズがないなど)、自然な音声データを用いるべきではないか、ましてやリミッター、コンプは音質の劣化を招き波形の形そのものが変わるため学習するには不向きなデータです。音楽業界からすればあり得ないことです。僕は何度もそのことを伝え、「無加工で出してください」と言ったにもかかわらず、最後まで誰もそれに耳を傾けることはありませんでした。

また、AIの研究とはおおよそ言えないただ活性化関数の組み合わせを試すだけの作業が半年以上続いた時もありました。



また、Symphonemeの名前の由来も変更になっていて驚きました(元々はSymphony + phonemeでした)。



解説動画であった由来「Sythesize + multiple + phoneme」にした理由はやはり開発者がいなくなったからでしょうか。



規約に関しても、この会社を退職済みの元社員から聞きましたが以下の条項の問題も指摘されていました。



       2-1.著作権が許諾されていないファイルのアップロードまたは音声合成。→これについてはT氏との打ち合わせの際指摘されていましたが何も変えなかったということですね



   1-2.フィギュア、グッズ、立体物については、ハンドメイド品(量産を想定しない、小規模での製造)のみ、かつ1種につき3点までを製造可とします。→なぜ3点までなのか説明がない

3-3.当社は、事前の予告なく、いつでも本サービスの内容を変更し、または本サービスの提供を終了することができるものとします。→予告なくサービスの終了をされては困る(通常有償無償を問わず事前予告をサービス終了の少なくとも1か月前に告知しなければならない)
2-4.複製または改変された本コンテンツに関する一切の権利は当社に帰属します。→改変されたコンテンツ(二次創作)権利はユーザーにあるので会社に帰属するのはおかしいのでは
3-1.無償、有償問わず、本コンテンツのデジタル3Dモデル本体の配布や頒布。(.blend、.fbx、.ma等)→1-3.3Dモデルについては作成および、その3Dモデルを撮影した動画投稿は許諾します。と明らかに矛盾している




この声明を公開する意味
Symphonemeというサービスの基盤にある研究は遊びでは断じてない。その点が軽視されている現状は、例え退職した後としても看過できません。これは、元社員だからではなく、研究者としての訴えです。