業界標準で使われているある程度考えられた質問セットがある中で「僕が考えた残酷な質問」できゃっきゃしてるのダサすぎる

ssssschangssssschang のブックマーク 2025/08/12 14:42

その他
このブックマークは合計
  • Normal Star 14
のスターを獲得しています!
  • eryaeryaさん がスターを付けました。
  • beejagabeejagaさん がスターを付けました。
  • uchuchさん がスターを付けました。
  • yumenoayumenoaさん がスターを付けました。
  • KKaaZZKKaaZZさん がスターを付けました。
  • littleswampmanlittleswampmanさん がスターを付けました。
  • neko_8_8kunneko_8_8kunさん がスターを付けました。
  • h_funorih_funoriさん がスターを付けました。
  • ugo_uozumiugo_uozumiさん がスターを付けました。
  • tzttztさん がスターを付けました。
  • fishmafishmaさん がスターを付けました。
  • fishmafishmaさん がスターを付けました。
  • fishmafishmaさん がスターを付けました。
  • myrmyrさん がスターを付けました。

GPT-5が4oよりナーフされてることを証明してみた|まはー

    いきなり結論まとめGPT-5とGPT-4oに同じ問題を100回ずつ投げ、4oのほうが正答率が高いという結果が出た(4o:98%、5:71%)。 つまりGPT-5はGPT-4oの上位互換ではない。劣化している部分は間違いなく存在する。 読...

    \ コメントが サクサク読める アプリです /

    • App Storeからダウンロード
    • Google Playで手に入れよう