サクサク読めて、アプリ限定の機能も多数!
業界標準で使われているある程度考えられた質問セットがある中で「僕が考えた残酷な質問」できゃっきゃしてるのダサすぎる
ssssschang のブックマーク 2025/08/12 14:42
このブックマークにはスターがありません。 最初のスターをつけてみよう!
note.com/maha05252025/08/12
いきなり結論まとめGPT-5とGPT-4oに同じ問題を100回ずつ投げ、4oのほうが正答率が高いという結果が出た(4o:98%、5:71%)。 つまりGPT-5はGPT-4oの上位互換ではない。劣化している部分は間違いなく存在する。 読...
92 人がブックマーク・40 件のコメント
\ コメントが サクサク読める アプリです /
業界標準で使われているある程度考えられた質問セットがある中で「僕が考えた残酷な質問」できゃっきゃしてるのダサすぎる
- Normal Star 14
のスターを獲得しています!このブックマークにはスターがありません。
最初のスターをつけてみよう!
GPT-5が4oよりナーフされてることを証明してみた|まはー
いきなり結論まとめGPT-5とGPT-4oに同じ問題を100回ずつ投げ、4oのほうが正答率が高いという結果が出た(4o:98%、5:71%)。 つまりGPT-5はGPT-4oの上位互換ではない。劣化している部分は間違いなく存在する。 読...
92 人がブックマーク・40 件のコメント
\ コメントが サクサク読める アプリです /