まさき| CVMLエキスパートガイド管理人

自然言語処理とVision-and-Language / A Tutorial on NLP & Vision-and-Language speakerdeck.com/kyoun/a-tutori 昨年6月のチュートリアル講演ですが、今読んでも非常に良い資料です．ちょうど真ん中でCLIPが登場するカバー範囲で，最近のV-Lについて未経験・詳しくない方も，うまく入門できると思います

speakerdeck.com

自然言語処理とVision-and-Language / A Tutorial on NLP & Vision-and-Language

2022年度人工知能学会全国大会（第36回）チュートリアル講演資料

125

1万

まさき| CVMLエキスパートガイド管理人

@cvml_eg

6月24日

未だにmidjournyの新verを気軽に紹介してるインフルエンサーとか，倫理がぶっとびすぎていて，もはや理解不能． Wiki冒頭説明でも「無許諾に画像を学習していて倫理・法的にも問題があり，集団訴訟も起きてる」と書いてある．それでも広く薦めるとか，犯罪幇助者に近しい．

ja.wikipedia.org

Midjourney - Wikipedia

119

8,935

まさき| CVMLエキスパートガイド管理人

@cvml_eg

7月25日

日本だと報道規制が激しいようで、倫理的問題や著作権侵害的な問題があると気づかないまま、現状の画像生成AI安易に使ってしまうのも仕方なかったかもしれませんインフルエンサー陣は、ポジティブな話ばかりしてたでしょうし、未だに海外の生成AI規制や企業訴訟のニュースも地上波では流れないので。

108

4,777

まさき| CVMLエキスパートガイド管理人

@cvml_eg

3月7日

インプレス社の[機械学習実践シリーズ] から次に「Pythonで学ぶ画像認識」が発売されるようです amzn.to/3mv7VJN 日立R&Dのお二方が著者の模様 (中村氏は私もお世話になっている方です)．CNN・Transformerの双方で，物体認識，物体検出，画像Captioningを実装するという内容のようです．

amazon.co.jp

Pythonで学ぶ画像認識機械学習実践シリーズ

105

2万

まさき| CVMLエキスパートガイド管理人

@cvml_eg

4月30日

返信先:

@sino6

さん

以下の記事では、「全能感」をキーワードに、生成AI使用者（同じく使用者層である驚き屋•追加モデル開発者も含む）が、暴走してエスカレートしてしまいがちな事に対して、鋭い洞察がなされています。先生にもとても参考になると思いましたので、紹介しておきます:

note.com

AI慣れによる精神的なリスク／全能感の復活と反抗期｜まさまさZ

この２，３か月はテクノロジー系、ビジネス系、クリエイティブ系の話題の中心はAIで、TWITTERでもAIに触れた人達の反応を様々な形で多く見ました。その中で感じた事を所感的に書いていきます。 ■全能感と反抗期全般的に感じるのは僕自身も使用してみて、AIによって出来る事の拡張性はとてつもなく広く深くなったと感じます。先月のマイクロソフトのビルゲイツのAIに関するブログでも全体感として下記の様...

3.8万

まさき| CVMLエキスパートガイド管理人

@cvml_eg

2022年12月26日

物体・画像認識と時系列データ処理入門 [第2版] NumPy/TensorFlow2(Keras)/PyTorchによる実装ディープラーニング amzn.to/3xUpS7m 今年から私が推選している「実装で学ぶ入門本」ですこの本は「上巻：基礎編」で，初歩理論とその実装を，最も効率良く学ぶことができ，超オススメです (続く)

amazon.co.jp

物体・画像認識と時系列データ処理入門 [TensorFlow2/PyTorch対応第2版] NumPy/TensorFlow2(Keras)/PyTorchによる実装ディープラーニング

Amazonでチーム・カルポの物体・画像認識と時系列データ処理入門 [TensorFlow2/PyTorch対応第2版] NumPy/TensorFlow2(Keras)/PyTorchによる実装ディープラーニング。アマゾンならポイント還元本が多数。一度購入いただいた電子書籍は、KindleおよびFire端末、スマートフォンやタブレットなど、様々な端末でもお楽しみいただけます。

9,288

まさき| CVMLエキスパートガイド管理人

@cvml_eg

7月7日

そもそもAI戦略という会議体の意味が謎では。 AIで何するかの「目的」が何も宣言されていないで、いきなり「戦略」と言ってる。目的不明なゆえ、そりゃあただ進歩させたいだけの幼稚な議論や提言にしかならない。「なぜAIが勝手に目的になってるのか」の点から、ツッコミ入れていくと良いかも。

2,913

まさき| CVMLエキスパートガイド管理人

@cvml_eg

7月14日

↓ 今回の俳優ストライキ突入を契機に、生成AIが起こしている資本家側の一方的な搾取や、アイデンティティの管理危機の問題に、当事者意識を持ってくれる方が増え始めると良いですが。海外のAI反対や訴訟の一般報道に出てこなかった中で、今日この報道が始まり、流れ大きく反転しそうとは思います

2,934

まさき| CVMLエキスパートガイド管理人

@cvml_eg

4月12日

写実AI画像生成アカウントが，AIボイス変換の悪用危険性のことを他人事のようにコメントしているのは，さすがに理解に苦しむ…

3,633

まさき| CVMLエキスパートガイド管理人

@cvml_eg

7月27日

ミツアの試している、fine-tuning寄与画像リストの可視化は、良い試みと思います。でも、現状、CLiPの無断事前学習での著作権侵害には依存してるので、たいしてクリーンでないです。 GPT等と同じで、大規模事前モデルは、fine-tuning後の貢献度が、従来の中規模ネットワークよりも少なめなので。

4,255

まさき| CVMLエキスパートガイド管理人

@cvml_eg

7月19日

まず一次データが隠蔽されてる時点で、商業系のLLMとそれを使ったChatGPTはだめですよ。著作権侵害データや無許諾データを、どれくらい勝手に集めて学習させているかが、現時点では全く判別できない。コードがいくらオープンになっても、学習データを隠してる時点で、ちゃんとやってるか疑わしい。

3,766

まさき| CVMLエキスパートガイド管理人

@cvml_eg

7月27日

日経系メディアは、著作権侵害的な生成AIを初期から強くプッシュしてユーザー層を大きく増やし、権利侵害被害拡大に貢献したと思いますそれなのに、反生成AI反ロボットもテーマな米国俳優ストが国内報道されてからら、態度を少し翻し、自社著作物は盗まれたくないとの被害者態度はおかしい気がします

引用

サンマルチノブルーノ

@ikariharahara

7月26日

>> また報道各社は記事・写真・画像の著作権などの法的権利を持っています。これらがAIに無断で利用されることを私たちは許容しませんだったら今の無断学習生成AIを一部活用する事すらダメでは？画像生成AIはミツア除いて全て無断学習AIですよ？(Adobeはグレー) 他人の無断学習の成果は使うのか？ twitter.com/nikkei/status/…

4,220

まさき| CVMLエキスパートガイド管理人

@cvml_eg

5月24日

これ大事です． CLIPの事前学習で，LAIONやConeptual 12Mなどの「画像+テキストペアデータ群」から，Visual /Text Encoderには「文→画像変換できる，無断収集・権利侵害な概念情報」が沢山学習されています SDはCLIP Text Encoderに依存しており，ControlNetもSDから作ります．

引用

Clome:BG Designer

@clome_haikei

5月23日

画像生成AIについて肯定的な意見を述べてある方との話のズレが何か考えてみると「データセットにより引き起こされる問題」の前提を無視されて話されてあることが多いんですよね。ここが重要なのに何故段階をすっとばして「画像生成AIそのものが持つ性質が引き起こす問題」だけの話になるのか。

8,865

まさき| CVMLエキスパートガイド管理人

@cvml_eg

7月26日

とにかく「ブラックボックスなまま、よくわかってないくせに、適当にAI薦めて、すごいものだと洗脳するのやめて」の一言です。中途半端な解説で、中身よくわかってない人に使わせては、そりゃあ本質わかってない素人なままなので、誤用や悪用も続出します。

3,032

まさき| CVMLエキスパートガイド管理人

@cvml_eg

2月16日

昨日バズっていた解説記事でモチベがあがり， Transformerの記事を，編集して少し綺麗にしました．図中のブロックの配色に対して，該当ブロックのテキスト部分を「同じ配色でハイライト」しました．これにより図との、ブロック・層の対応付け(視認性)も向上したはずです． cvml-expertguide.net/terms/dl/seq2s

6,815

まさき| CVMLエキスパートガイド管理人

@cvml_eg

7月5日

彼もそうですが、NAIが「リークモデルに対して訴訟します」ってつぶやいて以降、「じゃあ、新たに独自学習したSD系モデル配布しますから使ってください」ということを先日行なった人たち、「技術的にも著作権的にも、何も理解できていなかった」ことの証明すぎて、超絶意味不明ムーブですからね。。

2,704

まさき| CVMLエキスパートガイド管理人

@cvml_eg

6月27日

ここ最近、著作権侵害的な画像生成AIを用いたアプリ公開の、多発化になってきていて、流石にカオスすぎます。

5,309

まさき| CVMLエキスパートガイド管理人

@cvml_eg

7月30日

ホームページや、プレスリリースに、CLIP使ってる明瞭な解説がないので「絵描き陣には伝わってない」という話をしました。表向きの大衆への見せ方として、あたかも無断学習が解決済みと「見える」のが問題点です。 CLIP text encoder経由で、LAIONに依存しているのにです。 prtimes.jp/main/html/rd/p

引用

R1b3y*

@R1b3y7

7月30日

Mitsua Diffusionのモデルカード（学習元画像の情報があるページ）には最初からOpenCLIP使用の記載があるので、このことについてミツア公式が隠蔽していたという事実もないです。 huggingface.co/Mitsua/mitsua-

4,646

まさき| CVMLエキスパートガイド管理人

@cvml_eg

7月19日

残念なことに研究開発者が書いたSDの解説記事のほとんどは「LAIONから学習している」点をスキップ、数行で済ませた記事ばかり。よって、又聞きした知識を記事化つぶやき化した人や、それを受動的に読むだけの層は、LAIONが穢れている事に無知なまま、 SDや【拡散モデル】を安易に薦めていた印象です

引用

牧村しのぶ

@yatomibuncho

7月18日

返信先: @yatomibunchoさん

アーティストに還元すれば良い、という問題ではありません。あんなものを直接見たら頭から離れません。企業の公式サイトに掲載されている女性社員の顔写真まで入っています。ブログの写真もです。肖像権も何も知らない見ない今だけ金だけ自分だけ、だから平気なんでしょう。人の道から外れています。

3,750

まさき| CVMLエキスパートガイド管理人

@cvml_eg

2月16日

返信先:

@you629

さん

こんにちは．画像認識系が専門のものです．画像生成モデル技術は、ディープラーニング研究者・開発者自体にも、「承認欲求が強い方」が、その目新しさや，「目で見てわかりやすく」すぐ目立てるので，飛びつく傾向が強いです．つまりその技術を作っている側にも、同様の傾向を感じます．

1.3万

まさき| CVMLエキスパートガイド管理人

@cvml_eg

7月19日

当然の要求ですよね。画像生成AIがきちんとした許諾済み・報酬ありのデータに限られる傾向出始めてるのと同様に、LLMも(特に創作系業界からの)無断盗用データは除去される流れになるかも。ビッグテックの汎用的なモデルは、創作的データを学習データに貰いづらくなり、今より威力がかなり落ちそう。

引用

ITmedia NEWS

@itmedia_news

7月19日

全米作家協会、生成AI大手に「トレーニングに著作を無断で使うな」公開書簡 itmedia.co.jp/news/articles/

3,086

まさき| CVMLエキスパートガイド管理人

@cvml_eg

7月9日

3,564

まさき| CVMLエキスパートガイド管理人

@cvml_eg

8月7日

散々生成AIをポジティブに広めてきた側がなのに、いまだ問題点を認知さえできてない上、いまさら素人質問している時点で、被害受けている絵描きの人たちは当然怒りますよね。。そして、どれも的外れな比較対象すぎますし。これ、印象操作してるわけではなく、単純に問題点に無知な気が。

2,815

まさき| CVMLエキスパートガイド管理人

@cvml_eg

5月10日

「現場で回ってる画像生成•画像変換（i2i)モデルは、学習データ画像群が、著作権侵害画像や、許諾なしスクレイピング画像も含まれており、作者著作権や肖像権侵害であり、使うのは好ましくない。」という基本背景をおさえないまま、なんとなくの意見や議論をしてしまっている方も多いように見えます

4,266

まさき| CVMLエキスパートガイド管理人

@cvml_eg

1月23日

Simon Prince先生の新テキスト「Understanding Deep Leraning」のドラフトです．各モデルのわかりやすい解説と「CNN構造の良い図解」が素晴らしいです(ResNet, 正規化フローの章が素敵) udlbook.github.io/udlbook/ 私のサイトも図解にこだわっているので，似た志向性の本が出てきて自信を深めています

7,038

まさき| CVMLエキスパートガイド管理人

@cvml_eg

4月21日

絵師さんたちも、「スクレーピング」という専門用語も使った方が、無断盗用かつ許諾を得てないデータを、勝手に使用しておりよくない事が伝わりやすいかも？「LAIONの一部データは権利侵害している」だけだと「それはなぜ？」となるので、もう少し具体的に収集手段まで説明すると良さそうです。

4,776

まさき| CVMLエキスパートガイド管理人

@cvml_eg

4月28日

画像生成AIにハマりすぎて、攻撃性も伴っている人たちは、「ゲーム依存症の一種」の状態なのかもしれないと憶測しました。なぜなら、プロンプトのガチャ次第で、綺麗な絵が出てくるので、ガチャゲーの要素が強く依存性高いと思われるのが理由です。（いま議論させて頂いていた話の結論として）

3,392

まさき| CVMLエキスパートガイド管理人

@cvml_eg

6月16日

半導体やクラウドサーバ企業も、生成AIのブームに連動してきてるでも、今後EUみたいに強めのAI規制きて、なんにも商売できなくなったらどうするか各社はちゃんと考えてるようには見えない気が。現状のモデルはどれも著作権的にグレーなので、あとで訴訟されて敗訴したら巨額の賠償背負うリスクある

2,866

まさき| CVMLエキスパートガイド管理人

@cvml_eg

6月27日

自分が著作権侵害的モデルを使ってることわかっていない人が多すぎて、ちょっと頭クラクラしそう。

2,504

まさき| CVMLエキスパートガイド管理人

@cvml_eg

7月25日

「創作系の職業の方々が，自分たちの成果物を，ネットで勝手に拾われて(大規模)生成AIに学習され，勝手に生成に利用されてる状況を嫌がっている」という現状は，シンプルな理屈と思います．でもこれが理解出来ない人がいるのは『文化』になじみがない人なのかなとも感じる面もあります．

2,141

まさき| CVMLエキスパートガイド管理人

@cvml_eg

6月30日

この界隈の人たち、こぞって「魔法」とか言い出す。あと「呪文」とか。黒魔術洗脳されてる感が非常に強いし、それを洗脳されてない子供に布教するの勘弁してほしい。

1,795

まさき| CVMLエキスパートガイド管理人

@cvml_eg

7月21日

教育委員会なのにモラル崩壊していて笑えませんね。。

1,443

まさき| CVMLエキスパートガイド管理人

@cvml_eg

7月17日

技術的に「正しい/間違い」や「優れている/劣っている」の話だけで思考が限定されている感じ。生成AIは、技術倫理面や経済倫理面のよろしく無さが、報道やニュースが主流になって重要議題になってきているのに、そっちには関心や興味なさそう。

引用

NAKAGAWA Hirokazu 動遊楽

@kurageanime

7月16日

ちなみにmidjourneyでアニメタッチの「光り輝く黄金バナナ」を呼び出してみました。4つめは爆発しましたがｗ1本のバナナが生成されてますね。 twitter.com/jaguring1/stat…

2,702

まさき| CVMLエキスパートガイド管理人

@cvml_eg

5月16日

他人の版権絵画像を入力せずとも、ControlNetはSD ver.1.5とペアで動かします。その時点で「SDの学習データの権利侵害」を引き継いでいると言えます LAIONの学習データ画像群に問題ありと理解してる人間からすると、SDもControlnetも、「剽窃に悪用される」とか以前に、まず迂闊に触れないです。

3,180

まさき| CVMLエキスパートガイド管理人

@cvml_eg

7月12日

ほんと、権威に従順になるよう教育されすぎてるようで、「現行法を基準でしか善悪を考えれられない」方ばかり。だからモラルも欠如し、自分なりの倫理基準もない。そもそも絵描きの方達は、「ずっと嫌がってる」のに「より良い法に変えたり自治ルールを敷いて状況を改善しよう」という発想がない。

引用

あー猫

@t9RekqkdSbwS6YD

7月11日

コミュニティノートって同じ人が書いた他のノートも見れるようになってて別のリプにも「無断でaiの学習に用いることは何ら違法ではない」って書いてますね。評価されてないから表示はされてないけど twitter.com/canchanandme/s…

2,403

まさき| CVMLエキスパートガイド管理人

@cvml_eg

2月6日

返信先:

@cvml_eg

さん

以下、SciSpaceがCopilotエンジンを導入したときの、昨日紹介記事です(2022年12月) もう少し詳しく知りたい方は、この記事の機能紹介を参照してください．

typeset.io

AI that explains papers: Copilot for scientific research

Learn all about SciSpace Copilot. Find out how it can help you better understand research papers by providing you with explanations, summaries, and answers on the go.

6,769

まさき| CVMLエキスパートガイド管理人

@cvml_eg

4月23日

著作権保護や人権守る話も大事ですけど、その前段にある「データ保護」の強化も叫ぶのが大事でしょうか。画像も文章も、二次利用や二次改変が容易すぎます。だからスクレイピングされて、その後も勝手に画像変換とか要約とかに使われてしまいやすいので。裸のデータすぎるのですよね

2,543

まさき| CVMLエキスパートガイド管理人

@cvml_eg

3月28日

そもそも、ControlNetなどの最先端の学習済みモデルが、githubにオープンソースでバンバン公開されるという、謎の慣習がおかしいもとは性善説で利用する研究開発者の善意に委ねましょうという仮定でしたそれが誰でも深層学習使える時代になって、悪意ある一般層に簡単に手渡るので破綻していますね

4,213

まさき| CVMLエキスパートガイド管理人

@cvml_eg

7月27日

わかる。わかるんですけど、この競争社会では、奉仕より自分の栄光や勝利にしか興味がない「生粋のテイカー」は、結構な数いるのです。 IT業界やAI業界にいる、目立ちたがりの人やテイカーの人の、異常さ度合いをなめてはいかんです。 ITやAIは、ここ20年、昔のバンドブームみたいな状況でしたし。

3,172

まさき| CVMLエキスパートガイド管理人

@cvml_eg

4月25日

なぜ、「現状出回っている画像生成AIはどれも、学習元の画像データセットが権利侵害的である」ことを知らないまま、むやみに応援してしまうのでしょう。自分で調べたりせず、「権威あるから聞いた、最先端のものは良いもの」と、思考停止していそう。「無知の知」が必要すぎます。

2,484

まさき| CVMLエキスパートガイド管理人

@cvml_eg

6月23日

イラスト生成AIの問題に限らず、問題は「過剰にポジティブ」な、自分たちだけ勝てばいいテイカー思考の人が跋扈してることにありそうかな。。自分が楽しいことや、自分の勝つ「ポジティブ」にしか目線が行かないから、困ってる人や、起こってる現実の問題の「ネガティブ」に気づかない想像もできない

2,751

まさき| CVMLエキスパートガイド管理人

@cvml_eg

7月17日

午前くらいにもこれに対する別の引用RTしたんですけど、ほんとにこの方たち論点ズレてるんですよね。あと、バナナ出るかどうかの問題で、画像生成AIの良さをアピールしてるのは、米国俳優ストの報道で、世論的に不利になり始めてるから、別の論点でうちわ盛りして現実逃避してるようにも見えます。

2,854

まさき| CVMLエキスパートガイド管理人

@cvml_eg

7月11日

まるっきり、中村佑介（

@kazekissa

）先生風の横向き2次元人物画の生成画像ですし、作風パクリになっていてよくないですよ。というか、#nijijourney の学習画像やプロンプトに、こういう構図の絵が使われてしまってるのかな？

引用

nao nao

@nao_kotodama

7月6日

リンゴシリーズ作品素敵で心奪われますね。

twitter.com/sentakusound/s…

7.8万

まさき| CVMLエキスパートガイド管理人

@cvml_eg

4月21日

返信先:

@cvml_eg

さん

学習に、他人のデータを無許可に使っている、「でも具合的にどう集めてる？」の話ですそれはWeb上にある画像を、勝手に「スクレイピング」し、著作者権利者に伝えず無許可で学習データに追加しているからです。ひどい人の場合は、そのグレーな生成モデルを再配布までしており、根性終わっています

5,093

まさき| CVMLエキスパートガイド管理人

@cvml_eg

5月15日

絵描きの方達は、画像生成AIの使用時（テスト）の悪用やパクリよりも、まず前段の【学習時】から、SDなどによる無断学習があることを嫌がられています。 LAIONデータセット等での「版権キャラ絵や有名人画像」と「人権侵害的なモラル良くない画像」の【学習】を、否定かつ嫌悪されています。

3,726

まさき| CVMLエキスパートガイド管理人

@cvml_eg

7月17日

生成AIについては、最初から、リスクや慎重姿勢を貫いている会社や研究開発者が入れば、その人たちを褒めたり好評価することが大事だと思います。まともな倫理観の人が、代わりに広く評価されるようになれば、ズレてる悪影響な驚き屋や研究開発者が、逆に、肩身狭くなっていくので。

2,171

まさき| CVMLエキスパートガイド管理人

@cvml_eg

6月29日

NAIリークでなくとも「LAIONで事前学習したCLIP Text Encoderを使用している」と，LAIONの版権画像群には依存している点を理解できておらず，その画像生成結果をネットに載せている人がいる．手動で画像集めてSDをfine-tuningしても，他人のCLIP text encoderを使ってる限りLAIONに依存している．

4,072

まさき| CVMLエキスパートガイド管理人

@cvml_eg

7月11日

ControlNetも、学習済みSDを一部にそのままコピーした「拡張SD」なので、学習データがまともになるまで、安易に使用してはダメです。学習データが著作権侵害な上に、img2imgなので、結果画像も、剽窃的な画像や、学習済みの画風反映されやすく、尚更よろしくないです。 github.com/lllyasviel/Con

2,167

Twitterを使ってみよう

今すぐ登録して、タイムラインをカスタマイズしましょう。

Appleのアカウントで登録

アカウントを作成

アカウントを登録することにより、利用規約とプライバシーポリシー（Cookieの使用を含む）に同意したとみなされます。

トレンドはありません。

まさき| CVMLエキスパートガイド 管理人

まさき| CVMLエキスパートガイド 管理人さんのツイート

Twitterを使ってみよう

まさき| CVMLエキスパートガイド管理人

まさき| CVMLエキスパートガイド管理人さんのツイート