凄いですね、こんなデマに食いついていいねを押す反AIが600近くも居るなんて。それだけ事実を理解出来ない人間が沢山居る事に驚きです。 x.com/Kokukitumohu1/…
2024-06-20 19:19:34これこそデマやろwww 学習元のデータは入ってません???? はぁ??????wwwwww データ無しでどうやって生成してんだよwww x.com/crystal_14n/st…
2024-06-20 00:53:41ここでいう「学習元のデータ」とは「元画像そのもの」の話をしてるんだから、そんなものは当然無い。 人間の絵師だって全部のイラストをローカルに保存してるわけじゃ無いでしょうに x.com/Kokukitumohu1/…
2024-06-20 13:01:46未だに切り貼りしてると思ってるからなあ。 x.com/ym404/status/1…
2024-06-20 11:21:23いや、学習元のデータ(画像などのメディアデータ)は生成モデル内には一切含まれてないですよ。「学習用のデータセット」と「生成モデル」の区別、ついてます? x.com/kokukitumohu1/…
2024-06-20 01:45:30いや、学習元のデータ(画像などのメディアデータ)は生成モデル内には一切含まれてないですよ。「学習用のデータセット」と「生成モデル」の区別、ついてます? x.com/kokukitumohu1/…
2024-06-20 01:45:30これこそデマやろwww 学習元のデータは入ってません???? はぁ??????wwwwww データ無しでどうやって生成してんだよwww x.com/crystal_14n/st…
2024-06-20 00:53:41@Viktor_ChernovR @ikeaniphil 上記はデマです。生成AIの中に学習元のデータは入っていません。 また、学習元に許諾や対価の支払いがないことは事実ですが、法的にそれらは不要と明示されていますし、ChatGPTもXのGrokもみんな同様の条件で制作・運用されています。
2024-06-19 21:37:37@Kokukitumohu1 データ無しでどうやって生成するかというと、確率密度分布を表すためのパラメータを使って生成しています。 例えばデータが正規分布に従うなら、生成AIに保存するパラメータは平均と標準偏差です。 学習時にはこのパラメータを求めています。
2024-06-20 10:38:53@Kokukitumohu1 「このグラフから男性の身長を生成しない」と言われたら、平均,標準偏差を元に174cm,169cmみたいなそれっぽい適当な値を何個でも出力できます。 このグラフを作る元になった一人一人の身長データは知りません。 しかし、私が今言った数値が実際に日本の誰かの身長と一致する可能性もあるでしょう。 pic.twitter.com/Rob8Kv8xel
2024-06-20 10:40:28
拡大@Kokukitumohu1 例えばSDの学習データセットは56億枚学習させて10GB。 一枚辺り2Bってそれもう色の一つすら示せねえよ。
2024-06-20 21:50:132同じような二人目
いくつかコメントです。 >生成AIに元画像は入ってない説よく見るけど、圧縮した形で入ってるんだよね 生成AIが持っているデータ(重み)とは、画像を別の画像に変換するルールであり、画像表現そのものではありません。 つまり、「jpegのように画像が保存されている」という暗黙の前提が誤りです。 x.com/niranegiX/stat…
2024-06-21 02:15:46生成AIに元画像は入ってない説よく見るけど、圧縮した形で入ってるんだよね 画像生成AIの説明でよく潜在空間って言葉があるけど、あれは「学習画像とその補間のみを表現して、補間外のものは表現しない」という空間 だから潜在空間内に入ってるし、対応する座標をいれれば出てくるよ
2024-06-20 17:14:19>潜在空間って言葉があるけど、あれは「(中略)」という空間 潜在空間とは、潜在変数が属する空間のことです。それ以上でも以下でもありません。
2024-06-21 02:16:24>「学習画像とその補間のみを表現して、補間外のものは表現しない」という空間 生成AIに関しては、「ある種の確率分布にサンプルが従うように設計された空間」という説明がより適切です。 これは学習データの補間に限ったものではないですし、補間外のものも表現可能です。
2024-06-21 02:16:53>だから潜在空間内に入ってるし、対応する座標をいれれば出てくるよ 不正確なことを承知で説明すると、以下のとおりです: - 学習データが潜在空間に入っている確率はゼロではないけれど、それは他の任意のデータにも言えることである (続く)
2024-06-21 02:19:19- 同様に、学習データと同一のデータが出る確率もゼロではないけれど、(適切に訓練されたモデルならば)天文学的な確率である - 対応する座標は存在するものの、それを知る手段が基本的にない
2024-06-21 02:19:53>それが画像生成AIで使われてるVAEの動作原理で、だから以前から工場での異常検知に使われてた 画像生成と異常検知ではVAEの構造が異なっているので、適切な比較ではないです。 異常検知ではエンコーダーとデコーダーを組み合わせますが、画像生成においては一般にデコーダーだけを使います。(続く)
2024-06-21 02:21:08また、近年の画像生成AIで用いられるVAEは次元圧縮が主目的であって、生成の本体機能は拡散モデルやGANが担っています。 なので「画像生成AIで使われているVAE」は少し主語が大きすぎるように思えます。
2024-06-21 02:21:47>強度0のi2iで確認できるよ いわゆるi2iモデルで確認することは一般的にできません。 VAEは入力と出力が等しくなるように学習する手法なので再構成が可能です。 しかし、一般的なi2iは入力を何かしら変化させるように学習しているため、VAEと同じような処理を実現できません。
2024-06-21 02:22:39>U-netもCLIPも学習素材の合成で出来てる U-NetはアーキテクチャでCLIPは学習方法なので、対等に並べることはできません。 まず、後者は基本的に識別的な処理のみ含まれるので、通常「合成」とみなされることはありません。 前者は、そもそもアーキテクチャ自体が合成というのは意味が通らないです。
2024-06-21 02:23:42>ただVAEが分かりやすいだけ 最も重要なエンコーダーとデコーダーの解説が含まれていないので不適当です。 画像生成AIにおけるVAEでは、少なくとも - デコーダーを直接生成に利用する - 次元圧縮手法として他の生成AIに組み込む - 拡散モデルを階層型VAEとみなす といった用途の区別が必要です。
2024-06-21 02:26:16>コレに元画像が入ってないって言うのは「jpegには元のbitmapは入ってない」って言ってるようなもの 上述のようにjpegで類推可能という前提に誤りがあるので、その主張はナンセンスです。
2024-06-21 02:26:40>変換されたものが圧縮状態で入ってるのよ 繰り返しになりますが、画像表現そのものではなく、画像から画像へと変換するためのルールが入っています。
2024-06-21 02:27:03ハァ? 50億枚以上を?5ギガバイトちょいのモデルの中に? 単純計算で一枚何バイトか考えてみ?無理だっつーの なんで多少プログラミングかじっただけでも十分に不可能とわかるような事を平気で言えるんだ 「座標いじれば〜」とか自慢げにデタラメ言いふらしてんじゃねえよ x.com/niranegiX/stat…
2024-06-20 22:33:54
キャバ嬢を美人化するアプリに、下手くそな絵を補正させたらどうなるのか。
教師データを低次元に特徴ベクトル化した行列データを学習元のデータっていうなら正しいんじゃなの 学習元の痕跡すら残っていないけど