本文へ移動
芸術は漠然だ!~斉と公平太のムダに考えすぎ~

アンドロイドはターボ式着火ライターの夢を見るか?

2022年8月22日

400

「DALL・E」が生成した画像


OpenAI「DALL・E2」について6月3日のコラムに書きました。そして今、Midjourney(ミッドジャーニー)の登場で機械学習による画像生成の話題がSNS上で盛り上がってきてます。

で、このMidjourneyがSNSで話題になる数日前、7月26日のことなんですが、自然科学研究機構,基礎生物学研究所,准教授の渡辺英治さんからDMが来まして、機械学習による画像生成についての所感をやりとりしました。

ちなみに渡辺英治さんは、こんな研究もやってます!
『深層学習によって「蛇の回転錯視」の知覚再現に成功』
http://www.nibb.ac.jp/press/2018/03/20-2.html

今回は渡辺先生の許可をもらって、そのやりとりをほぼそのまま掲載します。(決して手抜きではないです!)

______________
W:渡辺英治> <S:斉と公平太>

W:「お疲れ様です。プロのご意見が聞きたいです。
以下はAIが作った絵画ですが、どれくらいのレベルにあるとおもいますか。
ちなみに作品のテーマは『生物の進化を題材にした芸術作品』です。」
(注:テーマは英語で指示)

DALL・Eが生成した画像


DALL・Eが生成した画像


S:「メッセージありがとうございます。これ答えるのが、いろいろな側面があるのですが、DALL-E2やGoogle Imagenの画像生成と比べると、少し見劣る気がします。
(注:この時点で僕はDALL-Eで生成された画像とは知らない)
普通にこれが人間が描いたとすると東京芸大は不合格ですが、地方の私立美術大学なら合格するかものレベルかもです。(注:東京芸大、地方の私立美術というのはあくまでも僕が個人的に感じた印象からの、比喩、例えです。本当に合格するかどうかという意味ではありません、ちなみに私は地方私立美術大学出身です)
ただ、純粋に美術としての判断はまた別なので難しいですが、例えばDALL·E mini(現在DALL·E miniからcraiyonに名前が変更)は再現度は低いですがトータルの美術としてのレベルは高いと感じてます。」

W:「『東京芸大は不合格ですが、地方の私立美術大学なら合格するかものレベル』という判断が聞きたかったです。なるほど!です。上の画像群はDALL-Eです。」

S:「下の画像はDALL·E miniに『生物の進化を題材にした芸術作品』と日本語入力したものと、『A work of art on the evolution of living things』(google翻訳で「生物の進化を題材にした芸術作品」を翻訳したもの)と入力したもの)です。」

DALL·E miniに『生物の進化を題材にした芸術作品』と日本語入力して出た画像


(注:日本語で入力すると西洋からみた日本的なものが出てしまう傾向にあるようです、あとでよく見直したら、細かく見るとパッと見ではわかりにくいですが「生物の進化を題材にした」が反映されています。)

DALL·E miniに『A work of art on the evolution of living things』と入力したもの


W:「DALL·E miniとDALL·E と比べると芸術性としてはどう思われますか?
『A work of art on the evolution of living things』とDALL·Eに入力したものは以下です。」
(注:わざわざ僕がDALL·E miniに入力した言葉と同じものをDALL·E入力してくれました)

DALL·Eに『A work of art on the evolution of living things』と入力したもの


W:「素人目からすると、DALL·E miniのほうが芸術的な表現力が高く、DALL·Eは立体感など描写の巧みさが目立っているような気がします」

S:「DALL·Eの画像だったんですか。DALL·Eの方が言葉の意味に忠実ですね。SNSで言葉の入力によっていろいろ調整できるようなことが書いてありました、皆いろいろやってるようで、例えばヨーロッパの風景、と入力せず、ゲームの風景、と入力した方が良い結果が、期待したヨーロッパの風景をだせるとか、書いてあったような気がします。正確ではないですが。
DALL·E minとDALL·EとDALL·E 2ですが、DALL·E miniの方が芸術的表現力が高いと思うのは、もしかしたら再現性が低い方が意味のレンジが広いと解釈できるからかもしれません。以前俳句の番組を見ていたら応募作の添削の方向性として、言葉の意味の解釈を広げれる言葉に修正していたので、そのせいかもしれません。あと、DALL·EとDALL·E 2の違いが気になります。」

W:「『言葉の意味の解釈を広げれる言葉に修正』は完全に同意です。おそらく言葉を知り尽くした結果、言葉に縛られたような印象です。
DALL·E2はより微妙な言葉に反応する、長文にも反応するということです。今度は突き抜けて言葉次第では、俳句のような絵画をかけるようになっているかもしれません。
いずれにしてもプロである斉藤さんが『DALL·E miniのほうが』というのが興味深いです」

S:「DALL·E miniすごいですよ、人間には描けないようなヘタウマが描けるし、著作権もない。SNSでいろいろみんな実験してますね」 (注;著作権に関してはまだわからないので僕は言葉を入力した人に確認を取れないものはここではアップしません)

W:「たしかに商用利用可で、著作権がないというのは驚愕ですね」

S:「僕も、いろいろ試したいけど、まだ試してないです。友人は支離滅裂な言葉を入れて試してます。僕は、ターボ式着火ライターのパッケージに、『墓参りとアウトドア』と書いてあったので、そのような言葉でターボ式着火ライターの画像がでるか試したいです。」

ターボ式着火ライター


「アウトドア」と「墓参り」の文字

ターボ式着火ライターのパッケージアップ


W:「斉藤さん、ドンピシャですよ『Cemetery visits and outdoor activities』
これは怖すぎる(笑)」
(DALL·Eに『Cemetery visits and outdoor activities』と入力して生成されたのが下の画像)

DALL·Eに『Cemetery visits and outdoor activities』と入力したもの


S:「『ターボ式着火ライター』はでませんね、あと日本語で入力すると日本ぽいものがでますね」
(注:この時点で渡辺先生の言っている「ドンピシャ」の意味に気がついてない。)

W「英語で入力したのに日本ぽくなったので、なんだろうとなりました。」

S:「それは、少しターボ式着火ライターが反映されてますね!!」
(注:ここでやっと私はドンピシャの意味を理解します、墓の形が日本の墓の形なのです。)

DALL·Eに『Cemetery visits and outdoor activities』と入力したもののアップ


W:「そうそう そこです」

S:「すげえ!」

W:「そこに怖くなる要素(すげえ)がありました(笑)」

S:「これはきっとDALL·Eはターボ式着火ライターのことわかってますね」

___
この後も、渡辺先生とのやりとりを続けたのですが、この『Cemetery visits and outdoor activities』と入れて日本風の墓石の画像が出たことが、個人的に結構衝撃だったので今回コラムで紹介することにしました。

英語圏でも墓参りにロウソクや線香に火をつけるのかもしれないよ!とか日本風の墓石に似たものあるかもしれないよ!ということもあるかもしれませんが、たぶんDALL·Eは日本の墓参りをわかっているかも、という部分に関心があります。

念の為、Googleで「Cemetery visits and outdoor activities」で画像検索してもこの形の墓石は上位にランクしませんでした。日本語で「墓参り アウトドア」と画像検索すると「ターボ式着火ライター」に似た商品が上位に出てきます。

このやりとりの後、8月1日にMidjourneyに「Artwork on the theme of biological evolution」という言葉を入れて生成された画像を渡辺先生が送ってきてくれました。再考させる機能があり1回だけ再考させましたとのことです。

Midjourneyに「Artwork on the theme of biological evolution」と入力して生成した画像


これはこれですごい上手な絵、すごい画像だと思います。

しかし、僕は、この機械学習の画像生成が上手い絵を描くことには興味がなくはないですが、それよりも興味があるのが、どういう思考回路で画像を生成しているのか?という部分に興味があります。それは結局、人間はどうやって画像を生成しているのか?人間とは何か?ということが知りたいということです。

アラン・チューリングが提案した「チューリングテスト」というものがありますが、私、この度「チャッカマンテスト」というものを提案したいと思っておりましたが、「チャッカマン」が商標登録されていたので諦めました。どのみち、このまま進歩すれば「墓参り、アウトドア」と入力して「墓参りでターボ式着火ライターを使用している」画像が出てくるようにもなるでしょう。

(おしまい)
____

補足:あらためて渡辺先生とのやりとりをコラムに書き起こすとき、読み直したのですが、それぞれDALL·E、DALL·E2、DALL·E mini craiyon、Midjourneyに対する僕の評価ですが、もっと色々使って見ないとわからないかも、というのが正直なところで、あまり本気にしないでください!僕個人が「DALL·E mini craiyon」が良いと思うのは、単に個人的な好みの問題かもしれません。Midjourneyよりも個人的に「DALL·E mini craiyon」の画風が好きです。「プロの意見を、、」という言葉に気持ちよくなって調子こいてしまいました。すみません。

文中に書きましたが、現在DALL·E miniはcraiyonに名前が変更されてるらしいです、名前はDALL·E miniですが、DALL·E、DALL·E2とも関係ないようです。やりとりは、そのまま「DALL·E mini」と表記しています。

また、「ターボ式着火ライター」も、やりとりでは「チャッカマン」と書いていたのですが、「チャッカマン」という商品名は、株式会社東海に商標登録されており、今回紹介した画像の柄の長い使いきりの多目的ライターは、チャッカマンではないのでパッケージに書いてある「ターボ式着火ライター」に修正しました。

「AI」「機械学習」「画像の自動生成」等の言葉に関しては、厳密な意味、専門的にみて使用に間違いがあるかもしれませんが、一般的な意味で使用しているのでご了承ください。
___

参考にしたHPのリンク

OpenAI 「DALL-E」「DALL-E 2」
https://openai.com/dall-e-2/
                       
「craiyon」
https://www.craiyon.com/

Google Imagen
https://imagen.research.google/?fbclid=IwAR3fpPq9mJxHd7C7ovNyg_4cuXCxyp7i3R7as3IKYaKg8d_CSBli-s0axe4

マイクロソフト NUWA-infinity
https://nuwa-infinity.microsoft.com/#/




おすすめ情報