【反AI】歌詞はそのままAIモデルに存在するか?
このような疑問、批判があります。
(以下x.comのポストより引用)
こちらをうけて、少し話題の毛色が変わります。
皆さんは音楽を聴く時、難解なフレーズの曲を好むでしょうか?それとも平易な表現のものが好まれるでしょうか?
私は聴くにしても歌うにしても、割と平易なものの方が助かると思ってます。大体歌うのもこういった……
歌い出し(ノーヒント)
「ズィジダエッセウンビージデイェーガー!」
!!!!Revo陛下の何処が平易なんだよ!!!!
それはさておき、今回は歌詞の生成AIにおいて「歌詞の依拠性」や「類似性が見られやすい」訳を考察します。
ドイツ語はわからないので日本語で考える
サンホラを17年ほど嗜んでいるのにドイツ語がわからない。
なので日本語の歌詞について中心に考えさせてください。
母音と曲のイメージ相関
「あ」「い」「え」はポジティブなイメージを喚起する母音として、「う」「お」はネガティヴなイメージを喚起する母音としてそれぞれ音楽界では取り扱われてきました。
これは発する音声の周波数によるもの、なんて研究があると昔聞いた気がします。
今もそうだと思いますが、明るさを演出する場面には母音でいえば「あいえ」、静けさには「うお」が使われやすいとされています。
内容のかぶりやすさ
いとしさとせつなさとこころづよさと。
日本人であればおよそ特定のメロディが脳内再生余裕だと思います。
しかしこの3フレーズは歌詞を考える上で使われがちなものです。
特にこのフレーズたちはとてつもないことに
・起(曲の雰囲気をつたえる)
・落(昇の為に一度勢いを落とす)
・昇(一気に盛り上がりをみせる)
の、楽曲進行における味の素のような「基本要素」を僅か10秒足らずで完成させてしまっています。やはり小室哲哉is神。
相当に奇天烈な曲を作らない限りは、使われるフレーズ、タイミング、進行には大きな差は生まれません。
逆にいうと気持ちよく脳に届く楽曲ほど作法がしっかりしていると言えます。でなければ聴力を失ったベートーヴェンが論理的に曲を書き続け、それらが人々に親しまれることはなかったのですから。
王道を重んじるが故に
どれほど奇抜な楽曲であれ、人間が理解できるサウンドやボイスに収まれば作品になります。
いかにパンクであろうともそれは所謂「パンクたらしめる要素」が用いられるし、どれだけ変調を特徴とした楽曲であっても「人間の理解力」に寄り添った作品にならなければゴミ同然なワケですね。
先の「起・落・昇」は確かに一例に過ぎません。
これは恋愛の進行にも似ているといわれ、人間の感情を昂らせるための王道を示した調査結果でもあります。
こういうものは生成AIに教え込めばかなり上手に楽曲を作り出せるようになるでしょう。
小室哲哉がAI使ったら誰も勝てないぞ???
生成AIは歌詞をコピーしているのか?
という話になると、これは部分的に正解です。
そもそも論、訓練する曲たちがみな似たようなフレーズを用いる傾向があった場合は各学習元の楽曲に依拠したというより「歌詞そのものが似通いやすい」と言えるワケです。
実際、歌詞とは超短編小説のようなものですから、伝えたいことや表現したいことを決めてしまったらあとは組み合わせになってしまいます。
あまりにも暗喩や奇抜な表現が組み込まれると、スッと頭に入ってこず一種のノイズにもなりますよね。
となると、たとえ数百万の歌詞を元に構築されたモデルであったとしても、結果的に依拠性を避けるということにはならなかった……とすれば、結果論としてコピーになったと理解することは可能です。
ただし基本的なAIの理解のもとに限る
これは断言できることですが、知識のある者が到達する理解とそうでない者の理解とは似て異なるものです。
知識があれば「このケースではどういう事が原因で結果そうなったか」を理解し、様々なケースに対応することもできるし間違った理解を広めることもありません。
知識がなければ「この結果があるのだから全体に適用できるのだ」と十把一絡げに考えてしまいます。これでは間違った認識を広めてしまいかねませんね。
反AIに傾倒するあまり自身のイデオロギーにフィルタリングされた出来事しか認識できなくなるのも反AIの恐ろしい所です。
1人でも脱反AIが叶うのを祈るばかりです。
ご拝読いただき誠にありがとうございました。


りんごさん、小学生ですか? この文は、酷い。
短い文章で扱うには話題が大き過ぎましたね…