@masamune_sakaki ありがとうございます。 つまり、 >明確な技術的事実に基づいたものであり、強くファクト(事実)です。 という主張は誤りだということで良いですよね? x.com/masamune_sakak…
2025-03-27 14:06:46「拡散モデルは生成過程が段階的であるため検知しやすく、自己回帰型は中間段階がないため検知しにくい」という話は、 明確な技術的事実に基づいたものであり、強くファクト(事実)です。 x.com/v_ajw63600/sta…
2025-03-27 07:13:40@v_ajw63600 では、技術的な事実には基づいてるが、OpenAIの真意や非公開技術については不明と修正致します。
2025-03-27 14:08:17@masamune_sakaki すみません、「技術的な事実に基づいてる」とは何を指していますでしょうか? 少なくとも、GPT-4oの画像生成アルゴリズムについては、客観的かつ明確な情報は登場していなかったと思うのですが。 現状では、確実に憶測が混入すると思われます。
2025-03-27 14:12:21@v_ajw63600 note.com/megamarsun/n/n…
こちらを読んでみてください。議論するよりいろいろ分かると思います。
@masamune_sakaki 「技術的な事実」はどの部分に該当しますでしょうか?該当箇所を示すなり抜き出すなりしてください。それが引用の基本です。 (自己引用の件に関しては、今回は目を瞑っておきます)
2025-03-27 14:19:49記事の中身すら確認しない根拠厨
まず、なぜ正確に文字が書けるのかという解説として、拡散モデルではなく文脈理解を持つTransformerによる推論であるとされています。私は調べる前は、Transformerだけで絵を描けるとは思わず、拡散モデルを併用しているのではないかと予想していました。しかし、これは誤りであり、実際は完全な自己回帰型モデルであることが判明しました。 その後、私はOpenAIが何らかのビジネス的理由で倫理基準を緩和したという仮説を立てて調査しましたが、そのような事実は見つかりませんでした。さらに調査を進めるうちに、自己回帰型モデルにおいては生成ステップが存在しない仕組みがあることを確認しました。この自己回帰型モデルは、かなり以前に開発されていたものの、公開されていなかったそうです。 現状ではオープンソースの実装がまだ少なく、ローカルで動作するものも存在しません。そのため外部から動作確認を行った結果、確かに左上から右下に向かってピクセル単位で描画されていることが確認でき、技術資料との整合性が取れていることを確認しました。
2025-03-27 14:29:13@masamune_sakaki 長文ありがとうございます。 ですが、私の質問(引用箇所を示してほしい)の回答にはなっていませんね。 LLM から良い回答を引き出すためには、良いプロンプトを入力することが重要ですよ。
2025-03-27 14:46:10根拠厨は長文を読めない
@v_ajw63600 調査の引用は多岐に及ぶためここで書くのは難しいですが、全てソースのある複合的な調査です。
2025-03-27 14:53:22@masamune_sakaki そうなんですね! では、要約や整理等は一切不要なので、ソースを共有していただけますか? 私自身で内容のファクトチェックを実施したいと考えていおりますので。
2025-03-27 14:56:23相手にする価値なし
@masamune_sakaki 自己回帰モデルの「技術的な事実」について、ソースの共有をお待ちしています。 どうか遠慮せずご連絡くださいね。 x.com/masamune_sakak…
2025-03-27 19:45:51「技術的な事実」の根拠となるソースの共有、お待ちしております。 有効なソースを一つでも提示できましたら、あなたが私の主張を無根拠で否定した事実を覆せますよ。 x.com/masamune_sakak…
2025-03-27 23:07:46@masamune_sakaki 「技術的な事実」の根拠となるソースの共有、よろしくお願いいたします。 あなたがお持ちの文献リストをそのまま張り付けるだけですので、そう難しい作業ではないと存じます。 私としては、無根拠な批判をされたことは承服しかねます。
2025-03-28 08:43:12ついに根拠が登場
解説記事の投稿
なぜ新しいGPT‑4o image generationは文字が描けるのか解説した記事です。 x.com/masamune_sakak…
2025-03-28 11:03:15こんにちは、榊正宗です。 AIが文字入り画像を完璧に描ける時代が、ついに来ました。 最新のChatGPT-4oが、日本語の看板やポスター、メニューまで驚くほどリアルに描けるようになっています。 どうしてAIが急にこんなに進化したのか、他の画像生成AIとの違いは何なのか、気になる方も多いですよね。 今回は、そんな疑問に優しいAI『チャッピー』と一緒にじっくり迫ってみました。 AIが創り出す新しいクリエイティブの可能性を、ぜひ楽しんでみてくださいね。 本文記事はリプ欄にリンクがあります!
2025-03-26 16:55:15@v_ajw63600 note.com/megamarsun/n/n… リプ欄にはとても書けないのでnoteにまとめました。
2025-03-28 12:45:11結論として、拡散モデルは「見せる前に止める」ことに強く、自己回帰型モデルは「生成中に検知して止める」柔軟性はあるが、視認リスクを伴うという違いがあります。どちらが安全かは、使う目的や場面によって判断する必要があります。 これ、わたしは「見せる前に止める」こと出来ないという話をしていたので、そこに齟齬があったかもしれませんね。途中で(ある程度見せて)止めることは可能です。
2025-03-28 12:47:31自己回帰型モデルと拡散モデルの違い|榊正宗@AI規制派 @masamune_sakaki #note note.com/megamarsun/n/n…
2025-03-28 12:48:03ネチネチ難癖
@masamune_sakaki 記事執筆ご苦労様です。 その記事はあなたが書いたものなので、技術的な根拠としては利用できませんね。根拠は一次情報を利用することが原則であり、常識となります。 ですが、折角ですので、拝読させていただきますね。
2025-03-28 13:02:06
https://x.com/nijijourney/status/1799183026729193810 ニジシャーニーはもう1年近く前から日本語出せるよ
内容ほとんど読んでないけど「SNSで議論なんかしようとするとかあほだなあ」としか。