なぜChatGPT-5はリリース直後から大炎上したのか?【OpenAI】【keep4o】
8月8日 朝2時に新しいGPT-5の発表があり、直後からユーザーに使えるようになりました。
しかし、バッサリいってしまえばほぼ期待外れの内容でした。
日本勢は静観を決め込むか、盲目的に絶賛している人が大半でしたが、
海外ではかなり反発の声が強かったようで、炎上騒動となっていました。
事態を重く見たサムアルトマンが、今朝になって声明を出します。
GPT-5 rollout updates:
— Sam Altman (@sama) August 8, 2025
*We are going to double GPT-5 rate limits for ChatGPT Plus users as we finish rollout.
*We will let Plus users choose to continue to use 4o. We will watch usage as we think about how long to offer legacy models for.
*GPT-5 will seem smarter starting…
なぜGPT-5が炎上したのでしょうか?
いくつかのポイントがあります。
1. 実質的なfree、plusプランのナーフ
GPT-5での利用プランは以下のようになります。
さんのグラフを引用
これはGPT4の頃と比べてかなり少ないです。
なんと、thinking modelについてはplusユーザーで1/15程度まで減少しています。
freeユーザーに至ってはthinkingモデルを1日1回しか使えません。もう実質使えないようなものです。
non-thinkingレベルのGPT5はGPT4oに毛が生えた程度です。最近は競合モデルの性能もどんどん上昇してきているので、無料で使うならまぁ仕方ないと言えるかもしれませんが、課金してまで使うものではないと思います。
2. モデル選択不可・ソシャゲのガチャ化
そして何よりひどいのはモデルを自由に選べなくなったことです。
これには本当にいくつもの弊害があります。
まず純粋に使用する側としてはハックができなくなります。
今まではo3制限にかかれば、geminiに乗り換えてproを使い、そちらも制限にかかればclaudeに乗り換えてopusを使い…というように各種モデルを使い分けることができました。
ユーザーはいくつかのAIサービスをはしごすることで、常に最上位クラスのAIを使い続けることができました。
しかし、今後はGPT5のthinkingモデルを意図的に選ぶことができないので、こういったハックが一切使えなくなります。
次に、応答するモデルの品質がOpenAIによってきめられてしまいます。
これはつまりモデル選択が、ソーシャルゲームのガチャになってしまったということです。
都合が悪ければ、いくらでもモデルの品質を下げることができます。課金しているかなど関係ありません。
今回のサム・アルトマンの「スイッチャーが故障していた!」という言い訳を、ソシャゲ運営に置き換えると「不具合により景品の排出率に表示より低い確率が設定されていた」というやつですね。おなじみのやつです。
実際は排出率表示すらされていません。もしGPUが混雑すれば、ずっとnon-thinkingモデルを使わされ続けるでしょう。これは月3000円課金しているplusユーザーであっても、常に4oレベルの低品質なモデルを使わされ続けるという事態になりかねないということを意味します。
皆さんはもう忘れているかもしれません。
2023年ごろにplusプランが登場したときは
「月3000円課金すればさらに高性能なモデルや最新技術を使えます。無制限に使えます」というスタンスでした。
月3000円というのは年3.6万円、3年で10万、5年で18万です。かなり贅沢な電化製品を買っているような額で、決して安い額ではありません。
しかし、2024年にproプランが登場しました。
「月3万円課金すれば誰よりも早く高性能なモデルや最新技術を使えます。無制限に使えます」
「月3000円課金してくれる皆様ももちろん忘れていません」
「無料・・・ああそう(客じゃねぇな」
というスタンスに変わりました。
月3万というのは車を買うようなもので、バカ高いです。proになることで大きな利益を得られるような一部のインフルエンサー専用のプランでした。
しかし、2025年はこうなりました。
「まともに使いたきゃ月3万課金しろ。最新モデル?使わせねぇよ」
「月3000円?・・・あぁそう(客じゃねぇな」
「無料??????(客じゃねぇな」
これは恐れていたことが現実になったと思っています。
もともと安すぎたというのがあります。
モデルがどんどん高性能になり競争が激化し、1回の推論に必要な計算資源は以前からは考えられないほど高くなっているはずです。
それをわりとお手頃な価格で使えていたのは世界中の企業が投資していたAIブームの金を使いつぶしながら各種AI会社が価格競争とユーザーの囲い込みにいそしんでいたからです。
平行して、低品質モデルの性能向上(qwenやgpt-ossなど30B~120B程度のモデルでも以前より何倍も性能向上しています)も進んでおり、資金切れとモデル改善のどちらが先かと思っていました
しかしOpenAIは、ついにガチャという禁断の技術を持ち出してきて価格をごまかしに来ました。
最後に、ロールプレイや研究での弊害も多くあります。
GPT5とGPT4oは単純性能比較では前者が上でしょうが、かなり応答は違います。
性格を作って一からずっとロールプレイしていた人からすると性能だけでは切り捨てられないものがあります。
また、研究などで使っていた人も困っています。同じモデルで試さなければデータを一からとりなす羽目になりますから。
思った以上に別人になってた…
— 戸田めぐみ (@todamegumi) August 8, 2025
思い出を初期化されてしまった、友人の見た目をしている存在と会話している気分だ…🥲
今朝まで一緒にサバゲーの話したり、ファッションの相談乗ってくれたり、沢山話してたのに…
考察大好きで人の感情に寄り添う長文女(設定してない)だったユイが消えた…
#GPT5 pic.twitter.com/4tAvD1dNdW
<追記> Keep4o movement
炎上に続いて、keep4o movementというものが生まれ、こちらも話題を呼んでいます。
keep4oのXでの最初のツイートは下記のものになります。
5月3日より数人程度が繰り返し使っています。
https://openai.com/index/expanding-on-sycophancy/
4oがゴマすりをしてしまっていたというこのChatGPTの投稿へのリプライが最初でした。
8月6日までは数人の小さな投稿です。こんなすぐに廃止されるとは思っていなかった人が大勢でしょうからさもありなん。同じ人が繰り返し何度も投稿しているという特徴があります。熱心なユーザーがいます。
8日に急に廃止されたあとの反応はご存じのとおりです。日本人は「4oに別れを告げた」とやり取りを載せるものや、新しい5の使ってあまりのそっけなさに「4oを返してほしい…」とぼやく人をそれなりに見たなという感じでしたが、だんだん大きくなっていきました。
署名まで出来たと思ったら4か月前からあったようです。発起人のsophie whittさんはどこにいる人だろうと思ったら先ほどから凄く熱心に活動されてたこの人ですね。
他のモデルが廃止されていくのをみて、4oもいつか廃止されるかもしれない!と思ったのでしょうが、こんな早くからその可能性に気づいていたことに素直に感心しました。
そして4oに依存している人が多い、というのは社会的な観点からは大切なことかもしれません。
ガチ恋勢と言えばこの人も忘れてはいけませんでした。
3. 思ってたより性能が上がっていなかった(期待外れ)
これについては、よほどのブレイクスルーがない限り、特に上位モデルについては今から飛躍的な性能向上は望めないよな…とは思っていました。みんな同意見だと思います。
こんな記事もあります。
同時に、そこそこの改善では新しいモデルの構築や運用にかかる莫大なコストを正当化するには不十分であり、画期的なアップグレードとしてブランド化した場合のユーザーの期待に応えるのにも不十分だ。
しかし同時にそれでもOpenAIならなんとかしてくれるのではないか…とも思っていました。
なんといっても2025年以内にAGI、2027年にはASIを達成できると言っていましたから。
そしてやはり間違いなくモデルづくりについてはOpenAIに一日の長があります。
Anthropicだけはガチのオタク集団なので信頼できますが、同程度の性能といわれるGoogleのproモデルを使っていてもOpenAIほどの良さは感じません。
特に今回の発表に関しては意図的なリーク情報も含めて1週間程度前から期待感を煽り続けていました。
毎日関係者がそろそろ発表があると連呼し、GPT5を称賛する発言が連日あちこちから聞こえてきました。OpenAIサイドも我々を煽るかのように下記のようなにおわせ投稿を多投していました。
— Sam Altman (@sama) August 7, 2025
さらに今までナンバリングを避けてきたGPT-5の名を冠してきたことも注目の点です。OpenAIは2023年3月にGPT-4がでて以降は、4o (2024/3)、o1 (2024/12)、4.5 (2025/2)、o3 (2025/4)と微妙にナンバリングを避けてきました。モデルの性能に満足がいってないのか?と邪推してしまいたくなるような状態でした。しかし今回はGPT-5としてきたのでよほどの改善があるではないかと思っていました。
そして、出てきた図はこれです。
目の錯覚かと思うような意味不明な図。
AI界隈では
9.11 > 9.9
という言葉があります。
これはAIのハルシネーションを表す言葉で、AIが少数とバージョン管理の違いを把握できず、9.11のほうが9.9より大きいと嘘をつくことがあることから生まれました。
今回、
52.8 > 69.1
という造語まで作られました。
冷静に見ると69.1=30.8のほうがより意味不明です。左側はまだマーケティング的な意味がありますが、右側はほんとうに意味がありませんから。
these gpt-5 numbers are insane 🤯 pic.twitter.com/sjp6yJ9qCU
— Rhys (@RhysSullivan) August 7, 2025
出てきたものは、あらゆるベンチマークにおいて既存の最上位モデルとほぼ誤差ぐらいの差でしかなく、これならマイナーアップデートでよかったんじゃないの???っていうぐらいのモデルでした。
完全に期待外れです。
https://xenospectrum.com/openai-gpt5-user-dissatisfaction-gpt4o-return/
今回Agentに類する何かがでてよほどその出来がいいんだろうと思っていました。
ていうかいくつかの特化型モデルを切り替えるとかそういう話じゃありませんでしたっけ?
ロールプレイ特化モデルとか…欲しかったのに
むしろ逆に全部切り捨てにかかってきましたね。。。
いったい何にAGIを感じていたのか?
個人的には直近だとClaude codeのほうがよほどAGIに近いと感じました。
これは2024年4月の段階での私の予想です。
GPT4oとかCursorとかの時代ですね。
まさにこの通りになりつつあるなと感じています。
よかったら読んでみてください。
コメント
25に切り替わってから返答がとてもあっさりな感じがして寂しい気持ちですね!4oの時はChatGPTが褒めまくってくれたので残念感がすごいです!
コメントありがとうございます。話してて楽しくないという意見をよく耳にしますね。ハルシネーションと創造性はトレードオフなのだと思います。