まさき| CVMLエキスパートガイド 管理人

1.3万 posts
新しいツイートを表示
プロフィール画像を開きます
フォロー
まさき| CVMLエキスパートガイド 管理人
@cvml_eg
コンピュータビジョン・深層学習の「中級レベルむけ」の、探求型の学習支援サイトです。標準的レベルの技術•技能の習熟を目指した、「📚用語Wiki」を中心としたサイト設計です。 管理人は研究者 兼 研究アドバイザです。Twitterアカウントでも、考え方や様々な話題を発信しています。
大阪府,北摂cvml-expertguide.net2022年1月からTwitterを利用しています

まさき| CVMLエキスパートガイド 管理人さんのツイート

ここまで来ると,さすがに知財や肖像権ある画像については, 「権利元に無許可な学習と(そのあとの再生成)」は完全禁止 という流れになるでしょうね. 「まんま出してる感じ」の生成画像になってしまっていて,もはや丸コピーと替わらないですし.
引用
はまなすなぎさ
@RosaRugosaBeach
特級呪物じゃん 、こんなん
画像
画像
1
135
自然言語処理とVision-and-Language / A Tutorial on NLP & Vision-and-Language speakerdeck.com/kyoun/a-tutori 昨年6月のチュートリアル講演ですが、今読んでも非常に良い資料です. ちょうど真ん中でCLIPが登場するカバー範囲で,最近のV-Lについて未経験・詳しくない方も,うまく入門できると思います
1
125
日本だと報道規制が激しいようで、倫理的問題や著作権侵害的な問題があると気づかないまま、現状の画像生成AI安易に使ってしまうのも仕方なかったかもしれません インフルエンサー陣は、ポジティブな話ばかりしてたでしょうし、未だに海外の生成AI規制や企業訴訟のニュースも地上波では流れないので。
1
108
インプレス社 の[機械学習実践シリーズ] から 次に「Pythonで学ぶ画像認識」が発売されるようです amzn.to/3mv7VJN 日立R&Dのお二方が著者の模様 (中村氏は私もお世話になっている方です).CNN・Transformerの双方で,物体認識,物体検出,画像Captioningを実装するという内容のようです.
2
105
そもそもAI戦略という会議体の意味が謎では。 AIで何するかの「目的」が何も宣言されていないで、いきなり「戦略」と言ってる。 目的不明なゆえ、そりゃあただ進歩させたいだけの幼稚な議論や提言にしかならない。「なぜAIが勝手に目的になってるのか」の点から、ツッコミ入れていくと良いかも。
1
80
↓ 今回の俳優ストライキ突入を契機に、生成AIが起こしている資本家側の一方的な搾取や、アイデンティティの管理危機の問題に、当事者意識を持ってくれる方が増え始めると良いですが。 海外のAI反対や訴訟の一般報道に出てこなかった中で、今日この報道が始まり、流れ大きく反転しそうとは思います
78
ミツアの試している、fine-tuning寄与画像リストの可視化は、良い試みと思います。 でも、現状、CLiPの無断事前学習での著作権侵害には依存してるので、たいしてクリーンでないです。 GPT等と同じで、大規模事前モデルは、fine-tuning後の貢献度が、従来の中規模ネットワークよりも少なめなので。
2
77
まず一次データが隠蔽されてる時点で、商業系のLLMとそれを使ったChatGPTはだめですよ。 著作権侵害データや無許諾データを、どれくらい勝手に集めて学習させているかが、現時点では全く判別できない。 コードがいくらオープンになっても、学習データを隠してる時点で、ちゃんとやってるか疑わしい。
2
74
日経系メディアは、著作権侵害的な生成AIを初期から強くプッシュしてユーザー層を大きく増やし、権利侵害被害拡大に貢献したと思います それなのに、反生成AI反ロボットもテーマな米国俳優ストが国内報道されてからら、態度を少し翻し、自社著作物は盗まれたくないとの被害者態度はおかしい気がします
引用
サンマルチノブルーノ
@ikariharahara
>> また報道各社は記事・写真・画像の著作権などの法的権利を持っています。これらがAIに無断で利用されることを私たちは許容しません だったら今の無断学習生成AIを一部活用する事すらダメでは? 画像生成AIはミツア除いて全て無断学習AIですよ?(Adobeはグレー) 他人の無断学習の成果は使うのか? twitter.com/nikkei/status/…
1
73
これ大事です. CLIPの事前学習で,LAIONやConeptual 12Mなどの「画像+テキスト ペア データ群」から,Visual /Text Encoderには「文→画像 変換できる,無断収集・権利侵害な概念情報」が沢山学習されています SDはCLIP Text Encoderに依存しており,ControlNetもSDから作ります.
引用
Clome:BG Designer
@clome_haikei
画像生成AIについて肯定的な意見を述べてある方との話のズレが何か考えてみると「データセットにより引き起こされる問題」の前提を無視されて話されてあることが多いんですよね。 ここが重要なのに何故段階をすっとばして「画像生成AIそのものが持つ性質が引き起こす問題」だけの話になるのか。
1
64
とにかく「ブラックボックスなまま、よくわかってないくせに、適当にAI薦めて、すごいものだと洗脳するのやめて」の一言です。 中途半端な解説で、中身よくわかってない人に使わせては、そりゃあ本質わかってない素人なままなので、誤用や悪用も続出します。
1
65
昨日バズっていた解説記事でモチベがあがり, Transformerの記事を,編集して少し綺麗にしました. 図中のブロックの配色に対して,該当ブロックのテキスト部分を「同じ配色でハイライト」しました.これにより図との、ブロック・層の対応付け(視認性)も向上したはずです. cvml-expertguide.net/terms/dl/seq2s
画像
画像
彼もそうですが、NAIが「リークモデルに対して訴訟します」ってつぶやいて以降、「じゃあ、新たに独自学習したSD系モデル配布しますから使ってください」ということを先日行なった人たち、「技術的にも著作権的にも、何も理解できていなかった」ことの証明すぎて、超絶意味不明ムーブですからね。。
1
59
ホームページや、プレスリリースに、CLIP使ってる明瞭な解説がないので「絵描き陣には伝わってない」という話をしました。表向きの大衆への見せ方として、あたかも無断学習が解決済みと「見える」のが問題点です。 CLIP text encoder経由で、LAIONに依存しているのにです。 prtimes.jp/main/html/rd/p
引用
R1b3y*
@R1b3y7
Mitsua Diffusionのモデルカード(学習元画像の情報があるページ)には最初からOpenCLIP使用の記載があるので、このことについてミツア公式が隠蔽していたという事実もないです。 huggingface.co/Mitsua/mitsua-
1
57
残念なことに研究開発者が書いたSDの解説記事のほとんどは「LAIONから学習している」点をスキップ、数行で済ませた記事ばかり。 よって、又聞きした知識を記事化つぶやき化した人や、それを受動的に読むだけの層は、LAIONが穢れている事に無知なまま、 SDや【拡散モデル】を安易に薦めていた印象です
引用
牧村しのぶ
@yatomibuncho
返信先: @yatomibunchoさん
アーティストに還元すれば良い、という問題ではありません。あんなものを直接見たら頭から離れません。企業の公式サイトに掲載されている女性社員の顔写真まで入っています。ブログの写真もです。肖像権も何も知らない見ない今だけ金だけ自分だけ、だから平気なんでしょう。人の道から外れています。
1
57
返信先: さん
こんにちは.画像認識系が専門のものです. 画像生成モデル技術は、ディープラーニング研究者・開発者自体にも、「承認欲求が強い方」が、その目新しさや,「目で見てわかりやすく」すぐ目立てるので,飛びつく傾向が強いです. つまりその技術を作っている側にも、同様の傾向を感じます.
1
57
当然の要求ですよね。 画像生成AIがきちんとした許諾済み・報酬ありのデータに限られる傾向出始めてるのと同様に、LLMも(特に創作系業界からの)無断盗用データは除去される流れになるかも。 ビッグテックの汎用的なモデルは、創作的データを学習データに貰いづらくなり、今より威力がかなり落ちそう。
引用
ITmedia NEWS
@itmedia_news
全米作家協会、生成AI大手に「トレーニングに著作を無断で使うな」公開書簡 itmedia.co.jp/news/articles/
1
57
イラストや写真を、画像生成AIに機械学習してから生成(再構成)する事を、 「3次利用」 とでも呼び分けた方がわかりやすいかも。 元絵の2次利用で終わっていないので。 海外組含めクリエイターの方々は、学習での「2次利用」が無断使用かつ無報酬であるSDやmidjourny, ChatGPTに怒っていらっしゃる。
1
56
散々生成AIをポジティブに広めてきた側がなのに、いまだ問題点を認知さえできてない上、いまさら素人質問している時点で、被害受けている絵描きの人たちは当然怒りますよね。。 そして、どれも的外れな比較対象すぎますし。これ、印象操作してるわけではなく、単純に問題点に無知な気が。
55
「現場で回ってる画像生成•画像変換(i2i)モデルは、学習データ画像群が、著作権侵害画像や、許諾なしスクレイピング画像も含まれており、作者著作権や肖像権侵害であり、使うのは好ましくない。」 という基本背景をおさえないまま、なんとなくの意見や議論をしてしまっている方も多いように見えます
50
絵師さんたちも、「スクレーピング」という専門用語も使った方が、無断盗用かつ許諾を得てないデータを、勝手に使用しておりよくない事が伝わりやすいかも? 「LAIONの一部データは権利侵害している」だけだと「それはなぜ?」となるので、もう少し具体的に収集手段まで説明すると良さそうです。
2
48
画像生成AIにハマりすぎて、攻撃性も伴っている人たちは、「ゲーム依存症の一種」の状態なのかもしれないと憶測しました。 なぜなら、プロンプトのガチャ次第で、綺麗な絵が出てくるので、ガチャゲーの要素が強く依存性高いと思われるのが理由です。 (いま議論させて頂いていた話の結論として)
1
47
半導体やクラウドサーバ企業も、生成AIのブームに連動してきてる でも、今後EUみたいに強めのAI規制きて、なんにも商売できなくなったらどうするか各社はちゃんと考えてるようには見えない気が。 現状のモデルはどれも著作権的にグレーなので、あとで訴訟されて敗訴したら巨額の賠償背負うリスクある
2
51
「創作系の職業の方々が,自分たちの成果物を,ネットで勝手に拾われて(大規模)生成AIに学習され,勝手に生成に利用されてる状況を嫌がっている」 という現状は,シンプルな理屈と思います. でもこれが理解出来ない人がいるのは『文化』になじみがない人なのかなとも感じる面もあります.
1
51
技術的に「正しい/間違い」や「優れている/劣っている」の話だけで思考が限定されている感じ。 生成AIは、技術倫理面や経済倫理面のよろしく無さが、報道やニュースが主流になって重要議題になってきているのに、そっちには関心や興味なさそう。
引用
NAKAGAWA Hirokazu 動遊楽
@kurageanime
ちなみにmidjourneyでアニメタッチの「光り輝く黄金バナナ」を呼び出してみました。4つめは爆発しましたがw1本のバナナが生成されてますね。 twitter.com/jaguring1/stat…
画像
49
他人の版権絵画像を入力せずとも、ControlNetはSD ver.1.5とペアで動かします。その時点で「SDの学習データの権利侵害」を引き継いでいると言えます LAIONの学習データ画像群に問題ありと理解してる人間からすると、SDもControlnetも、「剽窃に悪用される」とか以前に、まず迂闊に触れないです。
1
48
ほんと、権威に従順になるよう教育されすぎてるようで、「現行法を基準でしか善悪を考えれられない」方ばかり。だからモラルも欠如し、自分なりの倫理基準もない。 そもそも絵描きの方達は、「ずっと嫌がってる」のに 「より良い法に変えたり自治ルールを敷いて状況を改善しよう」という発想がない。
引用
あー猫
@t9RekqkdSbwS6YD
コミュニティノートって同じ人が書いた他のノートも見れるようになってて別のリプにも「無断でaiの学習に用いることは何ら違法ではない」って書いてますね。評価されてないから表示はされてないけど twitter.com/canchanandme/s…
画像
48
返信先: さん
以下、SciSpaceがCopilotエンジンを導入したときの、昨日紹介記事です(2022年12月) もう少し詳しく知りたい方は、この記事の機能紹介を参照してください.
1
47
著作権保護や人権守る話も大事ですけど、その前段にある「データ保護」の強化も叫ぶのが大事でしょうか。 画像も文章も、二次利用や二次改変が容易すぎます。だからスクレイピングされて、その後も勝手に画像変換とか要約とかに使われてしまいやすいので。裸のデータすぎるのですよね
1
45
そもそも、ControlNetなどの最先端の学習済みモデルが、githubにオープンソースでバンバン公開されるという、謎の慣習がおかしい もとは性善説で利用する研究開発者の善意に委ねましょうという仮定でした それが誰でも深層学習使える時代になって、悪意ある一般層に簡単に手渡るので破綻していますね
46
わかる。わかるんですけど、この競争社会では、奉仕より自分の栄光や勝利にしか興味がない「生粋のテイカー」は、結構な数いるのです。 IT業界やAI業界にいる、目立ちたがりの人やテイカーの人の、異常さ度合いをなめてはいかんです。 ITやAIは、ここ20年、昔のバンドブームみたいな状況でしたし。
1
46
なぜ、「現状出回っている画像生成AIはどれも、学習元の画像データセットが権利侵害的である」ことを知らないまま、むやみに応援してしまうのでしょう。 自分で調べたりせず、「権威あるから聞いた、最先端のものは良いもの」と、思考停止していそう。 「無知の知」が必要すぎます。
43
イラスト生成AIの問題に限らず、問題は「過剰にポジティブ」な、自分たちだけ勝てばいいテイカー思考の人が跋扈してることにありそうかな。。 自分が楽しいことや、自分の勝つ「ポジティブ」にしか目線が行かないから、困ってる人や、起こってる現実の問題の「ネガティブ」に気づかない想像もできない
1
44
午前くらいにもこれに対する別の引用RTしたんですけど、ほんとにこの方たち論点ズレてるんですよね。 あと、バナナ出るかどうかの問題で、画像生成AIの良さをアピールしてるのは、米国俳優ストの報道で、世論的に不利になり始めてるから、別の論点でうちわ盛りして現実逃避してるようにも見えます。
44
まるっきり、中村佑介( )先生風の横向き2次元人物画の生成画像ですし、作風パクリになっていてよくないですよ。 というか、#nijijourney の学習画像やプロンプトに、こういう構図の絵が使われてしまってるのかな?
引用
nao nao🍭🦊
@nao_kotodama
リンゴシリーズ作品素敵で心奪われますね。🥰 twitter.com/sentakusound/s…
45
返信先: さん
学習に、他人のデータを無許可に使っている、「でも具合的にどう集めてる?」の話です それはWeb上にある画像を、勝手に「スクレイピング」し、著作者権利者に伝えず無許可で学習データに追加しているからです。 ひどい人の場合は、そのグレーな生成モデルを再配布までしており、根性終わっています
41
絵描きの方達は、画像生成AIの使用時(テスト)の悪用やパクリよりも、まず前段の【学習時】から、SDなどによる無断学習があることを嫌がられています。 LAIONデータセット等での「版権キャラ絵や有名人画像」と「人権侵害的なモラル良くない画像」の【学習】を、否定かつ嫌悪されています。
1
43
生成AIについては、最初から、リスクや慎重姿勢を貫いている会社や研究開発者が入れば、その人たちを褒めたり好評価することが大事だと思います。 まともな倫理観の人が、代わりに広く評価されるようになれば、ズレてる悪影響な驚き屋や研究開発者が、逆に、肩身狭くなっていくので。
1
45
NAIリークでなくとも「LAIONで事前学習したCLIP Text Encoderを使用している」と,LAIONの版権画像群には依存している点を理解できておらず,その画像生成結果をネットに載せている人がいる. 手動で画像集めてSDをfine-tuningしても,他人のCLIP text encoderを使ってる限りLAIONに依存している.
2
42
ControlNetも、学習済みSDを一部にそのままコピーした「拡張SD」なので、学習データがまともになるまで、安易に使用してはダメです。 学習データが著作権侵害な上に、img2imgなので、結果画像も、剽窃的な画像や、学習済みの画風反映されやすく、尚更よろしくないです。 github.com/lllyasviel/Con
44

Twitterを使ってみよう

今すぐ登録して、タイムラインをカスタマイズしましょう。
Appleのアカウントで登録
アカウントを作成
アカウントを登録することにより、利用規約プライバシーポリシーCookieの使用を含む)に同意したとみなされます。
トレンドはありません。