Post

Conversation

大学入試共通テストを各社AIに単純にPDFでアップして解かせてみてるけど、圧倒的にGeminiが強い。 課金なし同士で比較しても、Geminiだけ圧倒的に速く回答し、ChatGPTに至っては共通テストのPDFすら読み込めずスタートすら出来ない。 Grokは本当にGeminiの100倍以上時間かかってGeminiより低い回答を返す。 GPQAスコアとかHumanity's Last ExamとかのAI向け試験で何点とったかも大事だが、何秒で回答したのかも各社はベンチマークとして公表すべきだとおもう。 共通テストに至っては Gemini>>>>(時間100倍の壁)>>>Grok>>(0点の壁)>ChatGPT