見出し画像

画像生成AIに関する主張に反応した4つの考察


はじめに

X(旧Twitter)が2024年11月15日以降のAI学習方針について利用規約を更新したため、ここ数日Xを中心とした各SNSが騒然としています。

これを受けてXのユーザーの中には、今後のX上での投稿運用見直しや、他SNSへの移動を検討する人や企業が認められます。

その渦中、たっくんさんという方が以下の記事を公開されました。

上掲の記事は端的に言えば、たっくんさんの「誤った情報が流布され、それを訂正できないことへの苛立ち」の表明です。

記事を拝読し、私も思うところがあったので、氏の主張を検討しつつ本稿を書いています。

上掲の記事中で何が主張されているか

たっくんさんの記事では、ご自身でも整理されているように、大意としては以下の主張が認められます。

  1. 生成AIについて誤った情報が広まっている

  2. 画像生成AI対策は効力が薄く絵が汚れるだけ

  3. 絵描き界隈における反AI的な思想が陰謀論化しており危険

  4. 正しい知識を受け入れられる人と反AI陰謀論者とは"制作"に関する考え方が異なるため理解しあえない

提出されたこれらの主張について、私も本稿において考察を加え、検討してみたいと思います。

本稿の筆者について

私は「塀」という名義で商業漫画家・イラストレーターをしており、現在は秋田書店様「チャンピオンクロス」誌上にて漫画連載をしています。

今年の9月から専業作家ですが、15年近く兼業作家(工学系の大学院生、SIerやSaaSベンダー勤務のソフトウェア開発者)として活動していました。

画像生成AIに対する私のスタンスについては、以下の記事をご高覧いただけますと幸いです。

私が「反AI」(私の苦手な言葉です)なのか「AI推進派」なのかを気にする読者の方もいらっしゃると思いますが、私は特定の属性を標榜していません。
私の属性云々よりも、主張に関心をお寄せいただき、ぜひ批評的にお読みいただければ幸いです。

考察1. 生成AIについて誤った情報が広まっている

これは真だと思います。

  • そもそも客観的に確認できる(反証可能な)事実に反した解釈が流通し、これを信じている人がいる

これは生成AIに限らず、SNS上では任意のトピックにおいて日々起きています。その内容や普及度と独立に、常に誤解や誤読が起きている。
免責を求めるわけではないですが、私自身も、日々多くの誤解や誤読しており、時にはその認識を前提して主張をしているはずです。

ゆえに、私たちは自分の認識や主張に関する誤りを発見し、これを訂正しながら対話を深めていくべきだと思います。
(思想家の東浩紀さんが「訂正する力」として、このような態度の重要性を説かれています)

生成AIに関する情報は溢れており、かつ専門的な内容が多いため、情報の取捨選択がそもそも難しいという課題があると思います。

具体的な主張を整理する

さて、たっくんさんの具体的な指摘を確認しましょう。
私なりに整理すると、以下のようになります。

  • インターネット上のあらゆる場所で、既に生成AI学習目的のデータ(画像)収集は行われているため、今さら(Xの利用規約改訂を契機に)焦って対策に走る意義は薄い。

主張について考える

2024年現在のインターネットでは、あらゆる場所で生成AI学習目的のデータ収集が行われていることが知られています。
(Xも2023年9月29日更新の利用規約において、すでに「収集した情報や一般公開された情報を、機械学習または人工知能モデルのトレーニングに使用する」可能性があることを明文化していました)

では、「生成AIに私の投稿した画像を学習されたくない」と考える人が、今日から任意の対策を検討し講じることは、「今さら」であり「無意味」なのでしょうか?

帰宅時に「外出中水道を出しっぱなしにしていた」ことに気づいた人は、とりあえず水道の蛇口を閉めるはずです。
一般的に、「もういっぱい水を垂れ流しちゃったし、今更閉めても遅い」とは考えないでしょう(怪しい比喩ですが、動機のニュアンスは通じるかと思います)。

生成AI対策を行う企業や人々は、この蛇口的な視座から検討・行動していると私は考えています。
そのような目的(What)のもとに選択された手法(How)の内容や意義と独立に、「学習されたくない」という動機から発した行動は尊重されてしかるべきだと私は考えています。

考察2.画像生成AI対策は効力が薄く絵が汚れるだけ

たっくんさんは、昨今の画像生成AI対策としてポピュラーな画像加工(AI学習阻害ツールやウォーターマークなど)の意義は低く、絵の価値を損ねると主張しています。

具体的な主張を整理する

  • ITの専門家(IT屋)であるたっくんさんの見識から言えば、Glazeは生成AI対策としてほぼ無意味であり、対策用ウォーターマークは誰も幸せにならない。

  • ゆえに、Xユーザーは無駄なことをせず、今まで通り無加工画像を公開すべき。

主張について考える

Glazeとは、シカゴ大学SAND Labが中心となって開発している画像生成AI学習の阻害ツールです。
AI学習阻害ツールは、ほかにもNightshadeやemamoriなど様々な思想・目的のもと開発されています。

また、ウォーターマークとは、いわゆる”透かし”のことです。

たっくんさんは、これらの手法(How)が、「学習されたくない」という目的(What)を満たすために不適当であると指摘しています。
(このような対策無意味論はたっくんさん特有の主張でない点に注意してください)

「誰も幸せにならない」という主張は、「画像加工によって上記のWhatが満たせない以上、画像加工はクリエイターにとっても鑑賞者にとっても功利的に損である」ことを意味すると、私は解釈しました。

しかし、上記対策の広まりは「損」であり無意味なものなのでしょうか。

私は以下のように考えます。

2024年冬現在、AI学習対策である画像加工はそれ自体が「学習されたくない」という意思表明であり、社会活動的な意味や意義を擁しています。
重要なのは、これがコンテンツの権利者にとって紛れもない表明行動であり、主張行為であると認識されている点です。

仮に私が任意のXユーザーが投稿する任意の加工画像に対し、「それ、技術的に無意味だよ」と情報工学的観点から難点を指摘したとします。
しかし、このXユーザーの「学習されたくない」という意思表明は依然強度を保つはずです。
(この主張の意義を、「思考を読まれたくないのでアルミホイルを頭に巻きたい」的な主張と同一視されてしまうと弱るのですが、そのような同一視的主張もあることは認識しています)

一連の対策活動は、情報工学的な対策面での実利のみならず、社会的意義においても問われる必要があると私は考えます。

考察3.絵描き界隈における反AI的な思想が陰謀論化しており危険

たっくんさんは、"(氏の認識における)絵描き界隈”において、「コロナワクチンにマイクロチップが……」的な陰謀論が蔓延していると指摘します。

具体的な主張を整理する

  • 生成AIに関して誤った知識が流布されており、「反AI」の主張は陰謀論的である。

    • 集団ヒステリーが起きている。

    • 絵を楽しませてもらっている立場として"汚い絵"を見るのは嫌だから、誤った認識を訂正する助言をしてあげているのに、一部のXユーザーは受け入れてくれない。

      • 助言を「生成AIの味方による攻撃」だと捉えるXユーザーがいる。

  • 人間が描いた絵と画像生成AI製の絵は「嗅覚」が鋭ければ峻別できる。

    • 手描きの絵を上回る「熱量と感情が載った絵」はAIに出力できないため、絵描きには自信を持って投稿し続けてほしい。

陰謀論はあるか

考察1に示したように、事実の誤解はあらゆる場所で起きていると私は考えています。
たとえば、Xの利用規約内容を誤読したり、Stable Diffusionのアルゴリズムを誤って理解している事例がこれに該当します。

しかし、AI規制論やAI対策論が「陰謀論」的であるかどうかについては、無論独立に検討が必要でしょう。
たっくんさんは、「技術的指摘を拒否する人」の陰謀論者的態度について、以下のように書いています。

アドバイスをしている人は技術的に正しい理解を広めようとしているだけであり、かつ"汚い絵"を見るのは嫌だから教えているだけなのにも関わらず、攻撃されたかのような反応をされるそうです。
もう完全に陰謀論の域になってます。

『この数週間の生成AIを発端としたTwitter上の絵師の方々の話に関して思うこと』

整理しましょう。

 助言者は「技術的に正しい理解を広めたい」かつ「汚い絵を見るのは嫌」 という動機から、<技術的に正しい>助言(訂正)をしています。

純粋に情報工学的な知識は反証可能な客観的事実であり、認識誤りがあれば訂正されるべきです。これは間違いない。

他方、助言者の「(加工されて)汚い絵を見るのは嫌」という動機は、つまるところ画像投稿者の「学習されたくない」という意思表明の否定です。
その意図が助言者にないとしても、助言者の振る舞いがそれを体現します。

たっくんさんもご承知かと思いますが、本来的に画像投稿者は投稿画像に生成AI対策加工をしたいはずが(美的、手間的観点からも)ないでしょう。

それでも「学習されたくない」という思いのために”あえて”行った行為を否定されれば、被否定者は「攻撃された」ないしは「志を異にする」と考えることもあると思います。
繰り返しますが、学習対策は情報工学的実利のみならず、社会的機能として連帯や意思表明としても意味を持ち始めている点に注意しましょう
(そんな機能は存在せず本稿筆者の妄想だ、という反駁は予期していますが、現状私はそう考えません)

集団ヒステリーについて

たっくさんのご指摘のとおり、集団ヒステリー(パニック)的な動きは、Xユーザー間でしばしば起きているように思います。

私見では、多くのユーザーが「情報の妥当性や価値」を判断する尺度を持たず、発言影響力のある人物や組織、(自称含む)専門家の意見に翻弄されています。

そのような不安定的状況の渦中で、豊川信用金庫事件的な、集団熱狂の因子は散りばめられている。

私たちはなによりもパニックに注意すべきです。
この点において、たっくんさんの「今さら」という指摘は、むしろ生成AI対策において重要だと私は考えます。

生成AI問題対策は今後短期間で収束するものでなく、私たち一人ひとりが長期的に付き合い、議論し、訂正し、積み上げていくものです。

状況は何年も前から進行しており(「今さら」「今なお」)、予断を許さない緊張感もある。
しかし、「自分がパニックに陥っている」と感じたら、その時は情報の奔流から距離を取り、落ち着く努力が肝要だと思います。

(ともあれ、他SNS利用の集団的検討は有意義だと感じています。こういうタイミングで、他のSNSの可能性が大衆に評価されると思うので)

「嗅覚」は実在するか

で、現時点の生成AI製画像に対する嗅覚が通用する人間として思うのは、人が描いたものは人にしか出せない、ということです。

『この数週間の生成AIを発端としたTwitter上の絵師の方々の話に関して思うこと』

たっくんさんは、ご自身に「人間が描いた絵か生成製の絵か、正直見ればわかる」能力があり、それを「嗅覚」と呼称されています。
本稿では私もこれにならい、上記で定義された能力を「嗅覚」と呼びます。

これは人間の認知機能に対する経験的な見識です。
たっくんさん以外にも、「なんとなく」AI製の絵とそれ以外を区別できるという人は多くいるでしょうし、その精度は個人差が認められると思います。

そういう意味で、「嗅覚」は認知科学的に定義できると私は考えます。

しかし、これは2024年現在での話です。

つまり、今後「嗅覚」が効かなくなるようなアウトプットを、能力向上した生成AIが出力する可能性は否定できません。
「嗅覚」がなんなのかを分析するということは、裏を返せば「嗅覚が効かないような成果物を作る」分析にもなります。
この分析は生成AIを商用利用したい人や組織からすれば、ビジネス機会上重要であり、産学連帯で研究が進む可能性もある。

絵を描いていない立場なので勝手に言っていますが、「学習されたとしてもその絵を上回る熱量と感情が載った絵は出ないんだから、自信を持って投稿し続けてほしい」と思いますね。

『この数週間の生成AIを発端としたTwitter上の絵師の方々の話に関して思うこと』

上記引用では、「手描きの絵には生成AIが生み出せない熱量と感情が載っている」という反証不可能な主観論が述べられています。

手描きの絵に、生成AIが生み出せない熱量と感情が載っているかどうかを知っているのは、本質的にはその絵を描いた当人だけです。
鑑賞者(が実作者を兼ねるとしても)の「嗅覚」はそれを峻別しているわけではないと私は考えます。

「嗅覚」は単なるパターン認識であり、認知科学の問題です。
(無論、鑑賞者は作品から「熱量」や「感情」を感じます。しかし、それはあくまで鑑賞者の内部で起きている情動の産物であり、客観視はできません。生成AIの成果物に強い「感情」を感じる鑑賞者も当然いるはずです)

「手描きの絵には熱量と感情が載っている」ことは、他者に言われるまでもなく実作者は十分理解している。
その上で、「その作品を無許可で生成AI学習に利用しないで欲しい」と単純な主張をしているわけです。

「手描きイラストと生成AI製のイラストが市場競合するのではないか」という競合論的議論と独立に、「<この私>が熱量と感情を乗せた絵を、そもそも生成AIに利用しないでほしいという権利」に一層の関心が照射されることを期待します。

考察4.正しい知識を受け入れられる人と反AI陰謀論者とは"制作"に関する考え方が異なるため理解しあえない

たっくんさんの嘆息を生む原因は、技術的に誤った知識の流通と同程度に、この相互理解障害に主たる要因があるようです。

具体的な主張を整理する

  • プログラマーにとって生成AIはアシストツールであり、(プログラマーの)代替ではない

    • 一方、現在の芸術領域では生成AIが創作のアシストでなく創作者と競合しており、ゆえに創作者は生成AIを"敵"とみなしている

  • ソフトウェア開発者は怠惰であることが美徳

    • しかし、芸術は努力の結晶であり、考え方が異なる人々なのでわかり合えない

生成AIと人間の主従関係

私のTLではときどき、ソフトウェア開発者が生成AI規制的な主張をする絵描きについて、(ときに冷笑的に)批判する投稿が目につきます。

たとえば、

  • ソフトウェア開発現場においては生成AIと開発者が自然に共生を模索できているが、絵描きは拒否反応を示している

  • ソフトウェアライセンスのような、成果物の利用に関する考え方がイラスト界隈にもあるべきではないか

みたいな感じです。

私個人としては、ソフトウェア開発とイラスト制作はそもそも単純比較可能な対象ではないと考え、他のユーザーとSNS上で議論を深めてきました。

たっくんさんがご指摘の通り、GitHub CopilotのようなAIエージェント機能はプログラマーの実装支援ツールとして広く利用されています。
主従の主はあくまでプログラマー側にあるように思えますが、無論ソフトウェア開発の現場でも「ツールに使われる」危険性が指摘されています。
つまり、「自分がAIに生成させたコードの意味が理解できないけど、なんか動く」状態です。

これをソフトウェア開発の民主化と呼ぶかは別の議論に譲りますが、主従関係の転倒は画像生成AIの専売特許ではない点に注意すべきです。

(あるいは、ここでラディカルな「人間が主である必要は必ずしもないのではないか」という指摘を受ける可能性をも私は予期しますが、こちらも哲学的領域に踏み込んだ難題だと考えており、ここでは触れません)

なぜわかり合えないか

たっくんさんは、ソフトウェア開発者とイラストレーターに着目し、前者の視座に立脚しつつ、両者がわかり合えない要因を以下に求めています。

  • ソフトウェア開発

    • (怠惰が美徳であり)コミュニティにおける効率や再利用が推奨される

    • 一例として、付与された公共性のあるソフトウェアライセンスの誓約範囲内で、成果物の自由な利用が許されている

  • イラスト製作

    • 努力の結晶であり、制作者(権利者)以外による加工利用は厳禁

補足が必要でしょう。
かつて、プログラマーのLarry Wallさんが、プログラマーの三大美徳として「怠惰・短気・傲慢」を提唱しました。
ここでの怠惰とは、換言すれば「工学的な効率性と再利用性の追求」と言えます。あくまでHigh Outputを主眼としたものである点に注意してください。

つまり、成果物の二次利用を許容する文化の有無が、わかりあえなさの源泉ではないか、という指摘です。

しかし私は、上述のとおりソフトウェア開発をイラスト製作と対置可能なもとして扱うことに疑義を呈しています。

まず、成果物としての<イラスト自体>と、ソフトウェアのソースコードを同じ粒度で扱えると私は考えませんが、強引に等価対置の比喩を考えてみましょう。

たとえば、生成AIがAppleストア等に公開されているソフトを片っ端から学習し、AIユーザーが様々な類似ソフトを大量に公開する。
あるいは、私たちが起業し、時間と費用をかけて作ったSaaSをリリース後にAIで学習され、コピーしたようなSaaSが大量にリリースされる。

そんな世界を想像してみてください。

イラストレーターに現在見えている世界は、そのようなものだと私は思います。

余談ですが、漫画制作の現場においては、作画の素材が『CLIP STUDIO PAINT』上で公開・共有されており、これはたっくんさんの仰る「効率性・再利用性」のためのコミュニティワークだと私は理解しています。

私はソフトウェア開発とイラスト制作それぞれにおける業務や文化が相互浸透しておらず、両者のプレイヤー間でしばしば言葉尻を掴んだ空中戦に発展していることを残念に思います。
辛抱強い相互対話によって、この垣根が超えられていくことを期待します。

終わりに

長い文章をお読みいただきありがとうございます。
このような思考機会をくださった、たっくんさんの記事に感謝します。

私自身の無理解や不勉強によって、誤った事実が含まれているかもしれません。
ご寛恕をお願いするとともに、お気づきの点について、ぜひご指摘いただければ幸いです。

余談ですが、私はSNS上で種々の議論が散逸することをもったいなく感じています。
まとまったテクストが書かれ、批判や感想に耐え、あらたな議論に発展していくこと。テクストが常に参照可能であること。
それを祈念し、まず自ら筆を執った次第です。

この記事が気に入ったらサポートをしてみませんか?

コメント

ログイン または 会員登録 するとコメントできます。
画像生成AIに関する主張に反応した4つの考察|塀
word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word

mmMwWLliI0fiflO&1
mmMwWLliI0fiflO&1
mmMwWLliI0fiflO&1
mmMwWLliI0fiflO&1
mmMwWLliI0fiflO&1
mmMwWLliI0fiflO&1
mmMwWLliI0fiflO&1