なぜサンプリングや引用はよくてAIイラストは駄目なのか 記号化の欲望について
なぜか絵師だけAIを受け入れないという話
なぜ音楽家はサンプリングの一種、小説家は引用の一種としてAIを受け入れることがあるのに、絵描きは強い忌避感を示すのか。
絵師たちのこの拒絶は単なる感情的なものではなく、理論的に説明して正当化できます。
〈記号化〉というキーワードを使って考えるだけで、サンプリングや引用だけでなく、二次創作が許される理由も説明できるのです。
アートは各ジャンルによって、扱う情報の記号化の度合いが違います。例えば、音楽や小説はすでにある程度記号化された表象を使います。
音階は離散的で、それを象徴するのが楽譜です。音楽のすべては記号化されていません。たとえば、声の生成が批判されるのは記号化の外にあるからです。
世界は言語によって分節されると言うように、小説も言語という記号を使います。小説は構成素としてはほぼ記号のみで成り立っており、情報を文脈に外注します。
しかし絵は違います。それは非記号的なアートの一種です。すべてを記号化し、記号体系に取り込もうとする働きの外にあります。
記号と人類史
記号の起源について考えます。
記号はそもそもシェアされて引用されるために生まれました。文字が代表例です。文字は複製が容易になるような進化を遂げました。その発生過程を遡ると、象形文字は未だ絵との中間段階にありますが、人の手でのコピー可能です。しかし、絵画まで遡るとコピーが難しくなります。そして芸術的絵画となると、むしろ拡散を拒むために複雑化しています。画家はシェアされないために、記号化の流れを逆行させたのです。
しかし文字も絵画も、起源においては単純な絵だったことは注目すべきです。数字も例外ではありません。表現される対象と意味が乖離し、その結びつきが恣意的になっていったのが文字であり、むしろ対象に接近しようとするのが絵でした。対象の再現以上のことを試みました。いわば、逆記号化とでも呼ぶべき、記号化の拒絶、複雑さへの逆行です。これは暗号に近い働きをします。
ここで生成AIには、わざわざ進化してまで絵画が拒絶している記号化を強制する暴力性を感じると思います。それは記号への退行です。
聖堂の宗教画は教会の権威のために、肖像画は貴族の権威のために、それ以降の絵画は個人の自由のために、(あるいは資本主義・SNS下においては評価を集めるために)それぞれ精緻化=逆記号化していきました。その権利の発生源には常に人間がいて、通貨のように模造不可能でした。これが機械的に模造可能だったら、成り立たないことでした。
よくAIの登場は、写真や印刷のそれと同じだと言われますが、科学の発展によってすべてが機械的に複製・捏造可能になっていくわけではありません。例えば、通貨は今でも機械的に複製不可能とされるものであることを思い出してください。たとえ可能でも、禁止されています。カメラや印刷機では捏造できないものという意味では、アートは通貨に近い性質を持っていました。
だからどちらかといえば生成AIアートは、量子コンピュータなどの登場で懸念される、暗号やセキュリティの解析・無意味化に近いのです。
絵描きの感じる不快感は、お札の透かしが解析され、新しいお札が存在しなかった組み合わせの記番号(シリアルナンバー)で発行され、市場に流通しているようなものに非常に近いです。だから、AIアートのクオリティが高ければ偽札の束ということであり、低いからといって偽造が許されるものではありません。使用する分には構わないというのは鑑賞者側で閉じた視点です。
なぜそれが駄目なのか、出来ないことが出来るようになった、解析できなかったことが解析できるようになったことが、なぜ法規制されなければならないのか。(もちろん、印刷機の登場が間接的には著作権法を要請したように、新技術には法規制が続きます)
それは利害の話になってしまいますが、もっと原理的な話を掘り進めることはできないでしょうか。そもそも、完全に解析できているのか。
引用・サンプリング・二次創作は、なぜ許されるのか
記号についての議論を踏まえて、引用やサンプリングとは何かについて説明します。
小説において、あなたはほとんどが引用で成り立つ、引用の網目のような小説を書くことができます。表層的な構造を見ると、ほとんど既存のものしかありません。しかしその背後を見なければなりません。それは単語や文という記号的なパーツをまとった、不可視のネットワークです。しかしその網目の位相的形状、言語外の文脈に対する結びつき方はあなたの創作であり、記号化できません。むしろ、この配列はそのままで単語だけを置き換えたほうが盗作的です。
サンプリング音楽において、部分的な要素を切り取ってコピーしてもよいし、サンプリングの集積のような音楽を作ることができます。でもその配列の位置関係が成す位相的形状はコピーできません。(音楽とかDTMに詳しくないから例を出せない)
これらは要するに言語において単語や言い回しはその言語の話者が皆丸々コピーするが、その配列によって独自性を出すということを言っているに過ぎません。同じ単語リストを使っても、論文の配列と、無意味な戯言の配列があります。しかしそこには単なるマルコフ過程的な一次元的配列ではなく、表現された論理構造が背後にあります。その構造が非記号的な要素です。LLMはその構造に無関心です。LLMは物理法則を原理的に理解しないので、緻密なハードSFが書けません。
だから、音楽や小説も絵のように非記号的な要素を持っているということです。
小説家が心配していないのはもちろん、文脈を理解しないだろうという安心感と、出版社に守られているのが理由だと思いますが。最悪どこから引用したのかは検索すれば出てくるかもしれない。
(ところで、二次創作が許されるのはキャラクターの特徴が記号的だからです。データベース消費とかそういう用語で語られました。記号はシェアされるためにあります。これは音楽におけるカバー曲や歌ってみたと同じで、音階や歌詞などは離散的な記号であるのでコピー可能ですが、声や歌い方など非記号的な部分に創作要素があり、そこは無許可で解析してはならないということです。とはいえ、キャラの服や髪型が完全に記号かというと、立体物であるので、誰にでもコピーできるとは言えません。要素に分節化できるということが、言語的なところです。たとえばあるキャラの帽子を被ってあるキャラの服を着た人物は容易に想像できますが、絵師二人の絵柄の混合はそのあり方が自明ではありません)
引用元が明記されていればいいというものではない
再度、引用とサンプリングの話に戻ります。
引用元の明記や、リスペクトがあればよいのか、といった話題にはあまり触れませんでした。画像生成AIにおいては意図的に来歴が消されているので、問題外なのですが。もし明記されていてすべての引用元をたどることができたらいいのか?数十億枚の画像のうち、パターン抽出にどれがどの程度寄与したかがわかればいいのか?
自分が前から想像していたのは、生成AIが機械である以上入出力の因果関係は決定論的なので、生成された一枚の絵から、学習元データセットの数十億枚の絵に対して枝分かれしながら伸びていく遡行する線のようなイメージです。その手がかりは破棄されているのか、原理的に不可能なのかわかりませんが、できるようにしてからモデルを再構築したらどうなるのか。
それでもやはり、呼び出すためのクエリとしてアノテーションが必須である以上、問題があります。danbooruなどで雑に人力でラベルを貼られて、分類されていることが意図しない記号化です。キャプションやタイトルも作品の一部であること、雑な言語化を嫌って無題にする画家などがいることを思うと、学習の前段階に行われるアノテーション自体がすでに同一性を損なっています。
(ちなみに繰り返しになりますが、トム・ヨークやカズオ・イシグロらが署名した声明は生成ではなく学習段階への創作物の利用の禁止を求めています)(追記:この記事は小説・音楽系の人に向けたものですが、いわゆるAIユーザー界隈に先に届いているようなので紹介しますが、前述の声明は〝Statement on AI training〟と呼ばれるもので、openAIから抜けた人がちょっと著名すぎるクリエイターと著作権団体の署名を集めて、創作物の学習自体が許されないと宣言したものです。学習段階への大規模な批判です)
もしアノテーションによる言語化を一切利用しない画像生成AIなんかがあったら、それこそ面白いのではないかと・・・。たとえば、ソラリスの海、あるいは他のSF作品では、すべてを分解してたまに再生する灰洋、そういう人間の言語化を知らない異質な知性による人間活動の模倣みたいなものが感じ取れるのは、そういうものではないかと。現行モデルのように、人間がしっかり「これは女の子」「これはハイクオリティ」と評価まで含めて教えてしまっているのは、もう「商品価値のある部分を抽出してね(そして誰かの著作物であることを示す情報は廃棄してね)」と言ってるに等しいので、そういうものを一切知らないAIが自分で発見していくならいいですけど。でもそれでは、言語で呼び出すことが出来ないので、使えませんけど。(このモデルでi2iしたらどうなるのだろう?)
記号化への欲望
記号化は、言語優位の人たちの欲望だと思っています。万物を記号化して理解し、操作・制御したいという欲望です。欲望という言葉が強すぎるなら、傾向でもいいです。記号化があらゆる科学の基礎で、そもそも言語がそうでした。画像生成AIとは、その欲望の最新バージョンにすぎません。
しかし、絵描きはそれに永久に抗うと思います。そもそも目的が違うからです。絵描きは非記号的なものを非記号的なまま扱うことを目的としています。情報を単純化して削減させることがあっても、ラベリングで代替させることがありません。絵はもはや解析によって数値化されてしまいますが、本来その潜在空間を表す膨大な数列を扱う能力は人間にはありませんから、結局は言語でラベリングする必要があります。その制御と支配の試みには言語が使われます。
記号化の欲望を持った人類にとって、記号的なものは自分の記号システム内に置いたということであり、非記号的なものは理解不能な他者です。
すべてを言語化したバベルの図書館、共通言語の象徴であるバベルの塔、普遍言語、これらは言語の完全性への期待です。(バベルの図書館というワードはこの話題に関してカクヨムで頂いたコメントを参考にしました。自分では思いつきませんでした)言語にはチョムスキーが言うように無限要素があるので、なんとかなりそうではあります。でもそのシステムの外とどう接地しているのか不明です。このへんはゲーデルがどうこう、言語ゲームがどうこう、カントールの対角線論法がどうこうでなんとかしてください。難しいのでよくわかりません。とにかく記号体系の外部との対応関係が結局万能ではないかもです。
自分の思考を言語化すれば完全に絵にしてくれるマシン、完全な意思疎通を可能とする万能の言語、これらはすべて記号化による他者の同化の欲望であり、最終的には拒絶されます。人類補完計画みたいなものです。解析されて共有され、勝手に他者と混ぜ合わせられるべきではないものについて話しています。
虐殺文法、メデューサの呪文(短編小説)、言壺――それらの言語SFは大抵、単一の言語で全人類の行動が支配されてしまうものです。でも脳にはそんなコードを受け付ける入力がないし、各人の脳には翻訳不能な違いがあります。バベルの図書館を読み取るリーダー部分に違いがあります。
「プログラミングでも変数とか関数とかに名前をつけるが、名前をつけられないモノは、人類の手に負えない」という感じのツイートがバズっていたことがあります。名状できないままにしたほうがいいものもあると思います。絵描きは名前をつけないまま操作します。つけるとむしろそれに縛られることがあります。作業を言語化することで効率化できることもありますが。(コードが完全に記号的で、それゆえにIT界隈では情報と知見のシェアが当たり前の文化であること、それが絵師と相容れないことはよく指摘されます)(合法ならいいという態度も、法律という記号体系がその外部によって決められたことに無関心だからです)
歌や演技なども、言語化されないまま人間同士の間で伝承されていくと思います。これは身体という非記号的なシステム全体が他のシステムに同調しようとする試みのような感じで、入力データの統計的分析ではないです。
なんだか、「言語化」というものを批判している感じになりましたが、「本来共有されるべきではない非記号的なものを、機械的な解析を介して記号化し、それを用いて記号のように共有化すること」が批判の対象だと思います。
よくある、利益・職が奪われる・感情・リスペクト・温かみとかの言葉を使わずに、記号というキーワードを使って、AIアートはそもそも絵というものが存在し始めた意味に反していると主張するのがこのAIイラスト批判の内容です。(美術手帖「AIと創造性」にあるように、数万枚の学習データを作者自身で描いたAIは存在します。それは批判の対象ではないです。)
こういうのは記号論とか表象文化論とかに詳しい人がやるべきですが、誰もやらない(人間のアートを守ろうとしない)ので素人の自分がやろうと試みました。誰かちゃんとやってください。疲れたので終わります。


コメント