大学入試共通テストを各社AIに単純にPDFでアップして解かせてみてるけど、圧倒的にGeminiが強い。
課金なし同士で比較しても、Geminiだけ圧倒的に速く回答し、ChatGPTに至っては共通テストのPDFすら読み込めずスタートすら出来ない。
Grokは本当にGeminiの100倍以上時間かかってGeminiより低い回答を返す。
GPQAスコアとかHumanity's Last ExamとかのAI向け試験で何点とったかも大事だが、何秒で回答したのかも各社はベンチマークとして公表すべきだとおもう。
共通テストに至っては
Gemini>>>>(時間100倍の壁)>>>Grok>>(0点の壁)>ChatGPT