反AI主義者が流した代表的なデマ 20240113

「生成AIは無断学習で作られたデータを使っているので存在自体が違法である」

 

 著作権法第30条の4の規定により、学習は無断が原則かつ無断でも合法なので、法的にはそもそも「無断学習」という概念自体が存在しない。そのようにして作られた学習データが「違法な存在」という事もない。

 画像生成AIに対して凄まじい攻撃性を見せる反AIが、同じ構造の機械翻訳を平然と使っている事からもそれが分かる。

 もちろん「違法な存在になって欲しいと思っている人」はいる。

 

「画像生成AIの学習データは収集した画像を圧縮したものであり、Promptに応じてそれらを復元・合成する一種の検索エンジンである」

 

 そのような稚拙な設計では生成AIを完成させる事ができないので、今の形になったのである。

 

「無断学習が合法なのは法整備が追いついていないだけで、今後違法になる」

 

 現実は逆で、「各陣営が自分にとって都合のいい法解釈を乱立させて開発者が足を引っ張られる事が目に見えていたため、先手を打って2019年に30条の4を作り、機械学習を合法化しておいた」のである。

 これは、インターネット黎明期に、レコード会社や出版社の顔色を伺って規制だらけにした結果、国内で配信サービスが全く育たず、AppleGoogleに国単位で敗北したという過去の反省を踏まえている。

 もちろん「法整備が追いついていない事にしたい」と思っている人はいる。

 

「AIで生成した画像には著作権がないので転載・二次利用し放題」

 

 2023/6/19に文化庁が「創作意図と創作的寄与があればAI生成物にも著作権は認められる」と公式に発表し、この主張を否定している。

 デマの発生源は、2023/3/17にアメリカ合衆国著作権局が出した見解で、これはその後裁判沙汰になり、8/18に判決が出ている。この見解をもって「AI生成物には著作権がない」と主張するには以下の5つの問題がある。

 

 ①米国著作権局が独自に出した見解であり、米国内でもその判断が妥当かどうか(裁判していないので)不明。もちろん米国以外には全く関係がない。

 ②日本においては、著作権は作品を作った瞬間に自動的に発生するが、米国においては、著作権は作品を著作権局に登録した際に始めて発生する。そのため米国では、ある作品に著作権を与えるかどうかを、一行政機関が独断で決められる。制度に根本的な違いがある。

 ③Stephen ThalerのCreativity Machine裁判は、一般的にイメージされるような「生成AIを制御した人間が作品を登録しようとして拒否された」という事例ではなく、「生成AIというシステムそのものを著作権者として登録しようとして拒否された」という特殊な事例である。

 ④出力後の人的修正が一切無い、いわゆる「ポン出し」の話をしている。現実にはポン出しのデータがそのまま作品として公開される事はまず考えられない。

 ⑤ControlNetすら存在しない時代に発生した事件であり、技術的にあまりにも古い。

 

「AIはAIが生成したデータを再学習すると段々壊れていく」

 

 映画のシナリオとしてはよくありそうな話ではある。

 デマの発生源は、2023/6/12頃に掲載された「AIは誤ったデータを再学習する事で誤りが強化されていく」という記事。どちらかというと画像生成AIではなくLLMの話であり、そもそも原文からして「AIはAIが生成したデータを再学習すると壊れる」とは言っていない。「ゴミデータを学習すると学習モデル全体の質が下がっていく」と言っているだけである。それは当たり前の事で、改めて言及するような事でもない。

 これは「全員がデマを信じるとそのコミュニティではそれが事実になる」というデマのメカニズムに似ている。ゴミデータを学習して壊れるのはAIだけではない。人間も壊れる。

 

https://venturebeat.com/ai/the-ai-feedback-loop-researchers-warn-of-model-collapse-as-ai-trains-on-ai-generated-content/