ノイズ付与された画像を学習する意義について
基本的に「学習に用いないでくださいね」という意思表示たるウォーターマークや学習阻害ノイズがあっても、少なくとも現段階において、その学習は認められるものである。
「AIに聞いたら権利侵害で訴訟リスクあるって言ったもん!」などという発言を見てしまったのだが、この権利侵害とは何についてのことなのだろうか。基本的に著作権法とカテゴライズされる法律群は感情ではなく勘定による判断を重視し、ここで言うところの権利侵害とは、即ち結果としての「減収」などに当たる。
で、だ。AIの学習、それも自律的な学習まで考えると「ノイズの学習」や「ウォーターマークの学習」はやるべきことだ。このロジックを説明する。
一見矛盾した学習だが…?
無作為なスクレイピングによる学習、それ自体は合法である。
一部の認知の歪んだ方は、ここで「合法だったらやってもいいっていうのか!」だとか「それは法整備が追いついていないからだ!」等と言い出しがちだろう。人の話はちゃんと最後まで聞いたほうがいい。
で、この学習とはなんのためにあるべきか?という話に入っていこうと思う。
画像をAIに学ばせるというのは、何しもその成果物が「画像」や「動画」といった視覚情報が必要な分野ばかりではない。逆の「画像からテキスト」という形でも利用される。
つまりだ。「学習拒否」を画像から意思表示として正しく読み取ることが可能であれば、スクレイピングした中からその画像を弾いてデータセットを作ることができる。このためには「学習拒否」を学ぶ必要がある。
この学習拒否がプラットフォーム内で明確にスクレイピングを弾くなどの設定が効けばいいが、そうもいかない。これはフォーマットの統一が必要である。
もし「学習阻害ノイズとしてこれを設定しているなら弾く」というマーカーが定められたのなら、それはメタタグでもウォーターマークでも何でもいいんだが、まぁメタタグはSNSなどへのアップロードで削除されがちなのでウォーターマークが無難だろう。つまり特定のウォーターマークをフラグとして立てられるのなら、イラストレーターなりの意思表示は、機械的に尊重されるようになる。
あとは意味付けの問題だ。これが正しく行われていたなら、今のようなことにはなっていなかっただろう。
技術の用途まで人は考えない
ぼくもいち技術者なので「うせやろ?」と感じてしまうのだが、基本的に人というのは技術をどう利用するかというところに思いを馳せることは少ないようだ。
同時に、抽象的概念の言語化、それ以前に意識することも難しいという人も多いらしい。ここだろうな、と思う。
AI学習というものを十把一絡げにしてしまうと、防衛のため、安全策のため、権利保護のために必要な学習が阻害されてしまう。
多くの無知によって、価値のある技術の発展に必要なものが制限されてしまう。これは非常に問題である。
技術の発展、経緯、結果、善悪
技術の発展そのものと、そこで何が使われているのか、どのような使われ方が想定できるか、その善悪といったものについては、分解して考える必要がある。
今で言えばもはや初歩と言えるような医学の発展の歴史は、直視できるもののほうが少ないのではないだろうか。
あなたが今使っているであろうデバイスについても、恐らく戦争による技術発展の応用結果によるものだろう。
アインシュタインやファインマンを憎むかどうかといったところだろうか。彼らは「人間がここまでアホとは思わんかった」となっているかもしれない。ぼくは彼らに非常に親近感を覚えます。希代の天才に対して烏滸がましいが。
結局の所、どこまで行っても終着点は「倫理」の話なのです。
人の行いとしてそれはどうなのかという。
法整備とは未来を決める行為である
法律というものの拘束力は絶大です。だから、それを定める時はあらゆることを考えなければならない。価値観においても技術においても、急進的な変化を起こし続ける時代において、その未来を定めるべき法を、一部の人間の一時の不安によって定めるべきではない。
だから、そこに求めるよりもまずは今できることを確実に行いましょう。
っていう倫理を説いても、届かない層には届かないから「こう」なんだけどね!



コメント
8要するに作品の直接的データに存在しない作品の魂を機械に理解させる為、メタタグ付けるって話ですかねこれ
技術発展と思想発展って反比例するんだと思います、思想的後進性の根本的原因の過去から学ばない定期を直したい所…
メタタグはSNSアップ時に削除されるので概ね無意味です。
そのままの意味です。
1. AIがスクレイピングを行う
2. 画像を解析し、ウォーターマークがあれば「これは学習拒否なので使わない」と選別する
3. 残りのデータのみを用いて学習を行う
そのための「学習禁止とはどういった形で表明されるのか」をAIが学ぶ。そういう話です。
なるほど…生成AIはデータを真理としがちなのでそりゃ学習拒否と画像データになければガン無視しますよね、書かないといけないの面倒過ぎる(これは開発者側の尊重姿勢が足りないのが原因だと思います)
そうですね。その意思表明がでかでかとしたウォーターマークになってしまうのは創作表現として非常によろしくないです。
なので、次の記事で書いたマーカーと組み合わせることで、画像にはほぼ影響のない形で意思表明を可能にし、それを自動的に弾くというシステムが出来上がれば世界はマシになるなぁという希望的観測、つまりは現時点で戯言でございます。