見出し画像

LLMの使い分けは大体Geminiでいい(2025年4月時点、大量に追記あり)

以前、GeminiとClaudeとOpenAIの使い分けについて記事を書きました。

3ヶ月経って、いくつか新しいモデルが登場したことでごっそり事情が変わりました。

ChatGPT Pro使ってましたが解約しました。o3が登場したらまた考えます。一時期解約していたGemini Advanced(Google AI Oneプレミアム?)を契約しなおしました。Claudeの年契約をしたんですがすこーし後悔しています。

追記: Gemini 2.5 Pro は今までのGemini シリーズとは明確に違う

コメントとかでGeminiアレルギーの人が多そうなので追記します。実際のところ僕もそうでしたよ。過去のGeminiは、特に1.5 Proが論外なくらいハルシネーションも多く馬鹿で、使い物にならないおもちゃでした。それは事実です。2.0 Proで状況が変わり始めたものの実験モデルが続いてて、結局コイツの真価がよくわからんってなってました。

Gemini 2.5 Proを触ったことがない人は触ってみてほしい。本当に過去のモデルとは段違いです。

コーディングエージェントにおいても、実際に触ってみてほしいです。Gemini 2.5 Pro なら Claude Sonnetだとかなり工夫しまくっても厳しい、技術的負債の解消すらできますよ。

特にコーディングエージェントなら 1M Contextの実力がわかると思いますよ。

追記2:

GPT-4.1がリリースされました。API only なので、この記事の範疇とはちょっと違うんですが、コーディングエージェントでは大きく影響あるかもです。

追記3:

利用用途が、コーディングや設計、データ処理に偏りがあるかもしれません。小説用途だとSonnetの方がいいという話も聞いたので、用途によって変わるかもしれません。

追記4:

Gemini 2.5 Pro(というか1M contextのLLM)をAPIで使う場合は、爆死しないように注意してください。というか、対話型AIでのGemini 2.5 Proは1M contextを定額で使えるの強みだと思った

画像

追記5:

すみません。結局ChatGPT Pro再契約しました。o3強すぎるんですよ。まだ全然、使いこなしてないけど、Gemini 2.5 Proと両方に同じ質問を投げるをやってると、違った良さがありそうです。

結論: 僕の使いわけ

  • 基本はGemini 2.5 Pro

  • 調べ物はGoogle DeepResearch by Gemini 2.5 Pro

  • 図がほしいとき、ウェブの画面作りはClaude 3.7 Sonnet

  • Claude Desktop + MCP はまぁ遊べる

  • 検索エンジンは引き続きPerplexity Pro

  • コーディングエージェントは、画面作りがなければGemini 2.5 Pro一択

  • 画面作りと、無駄なコメント削除タスクのみ、泣きながらClaude 3.7 Sonnet(マジでいやなんだけど、これしかないので)

  • API経由で使う場合、性能がほしければGemini 2.5 Proで、コスパよいモデルなら Gemini 2.5 Flashになるはず(まだ2.5 Flashは発表のみなので、わからん)

もちろん、3ヶ月後にはまた話が変わっていると思います。

OpenAI

噂ではo3やo4-miniが出るって話がありますが、まだまだ時間がかかりそうです。出たら触ってみて判断します。

僕は対話型AIを、無制限に使えるプロンプト実験プラットフォームとして使うことも多いため、最近追加された「長期記憶」の機能は正直邪魔なので、評価外です。そもそも普通の対話に関しても、心に棚を設けて、どの立場で、どういう内容を聞くかって、使い分けません?

あ、画像生成だけはOpenAIがいいな。とは言え、それくらい。そのためにPlus契約するか?うーんって悩む感じですね。

解約前の使い分けは

  • ちゃんとした相談はo1/o1-pro

  • スピード優先、精度の悪くてもいいならo3-mini

  • スピード優先、非テクニカルならgpt-4.5

  • というか会話を楽しむgpt-4.5

でした。実際のところo1とGPT-4.5は良かったので、o3が登場したら、また再度契約を考慮したいです。

Google Gemini

Gemini Proシリーズも昔のGemini 1.5 Proは論外で、2.0 Proは良さそうだけど、o1でいいやってなってたんですが、Gemini 2.5 Proで一気にトップに躍り出ました。2.5 Proを使ってない人は使ってみてほしい。

ただし、素の賢さだけを比較した場合、o1/o1-proとどっちが賢い?って言われるともはや違いを探すのが難しいです。

ただ、o1/o1-proとの明確な違いは1M Tokensという膨大なコンテキストと、long contextにおける性能劣化への耐性がものすごいことです。これは革命的にすごいので、知性を求める人にとってはGemini 2.5 Pro以外を選択すべきではありません。

特にコーディングエージェントで使う場合これめちゃくちゃ重要です。しかもAPIコストは、Sonnetより低く設定されています。

しかも、Gemini 2.5 Proは、現状では無料でも使えるため、有料契約してない人でも絶対に試してほしいです。

DeepResearchも、以前は1.5 Proベースだったため、ハルシネーションもひどく実用に耐えないおもちゃでしたが、2.5 Proベースになって明らかに進化しています。これはもう最高。

ただし、コーディングエージェントでGemini 2.5 Proを使うと、一部だけ明確にSonnetに劣る点もあります。これは後ほど説明します。

Gemini Flashシリーズは、2.0 Flashが低コストモデルとしては破格の強さを誇っていて、2.5 Flashに期待しているところです。APIで使う場合は、よほど強いモデルが必要なければ Flashを使えばコスパが良くて、性能を求める場合でも、2.5 Proは Sonnet より価格が安いのでお勧めです。できればOpenAIと同じ仕組みのPrompt Cachingを実装してほしいところですが。

Anthropic Claude

強く失望しています。早く3.8/4.0-Sonnetとか4.0-Opusとか出してほしいです。あとAPIのコストが高すぎます。

3.7-Sonnetが思ったよりもひどい。ちゃんとしたベンチマークをとったわけでもなく、経験上の話ですが

  • とにかく誠実じゃない。コーディングエージェントで使ってると特にそうなんですが、結構ズルしやがります

  • 3.5-sonnetもそうでしたがlong contextに弱い。経験上100kコンテキストくらいでヘタり始めます

  • 全体感の必要なコーディング性能がGemini 2.5 Proに比べて明らかに低い(単体ファイルは、ともかく)

  • 粘り強さがなく、すぐ諦める

  • その割に余計なことばかりする

    • ファイル出力内容と同じ文言を喋りたがる

    • 設計でコードを書きたがる

利点は:

  • ほか全部のLLMと違って、画面作りはSonnetしか選択肢がない

  • Gemini 2.5 Proと違って、無駄なコメントを書かないし、消せる

  • Claude Desktop + MCP

だけです。

Perplexity Pro

Perplexity Proは、速度と結果のバランスが凄く絶妙に良い。検索エンジン汚染の影響は受けてるものの、なぜか比較的マシ。

ただし、モデルをデフォルトから、最低でもSonnetで、できればGemini 2.5 Proにしないといけないです。デフォルトモデルは結構馬鹿です。

DeepResearchあればPerplexity Proいらんやん?と言われると、「速度が速い」のが利点です。

まとめ

とりあえず使ったことない人は、Gemini 2.5 Proをがっつり使ってください。

画面作りとか、本当に特定の用途だけはSonnetしか選択肢がないですが、Sonnetが大分厳しい感じあるので、Anthropic社には本当に本当に頑張ってほしい。超頑張ってほしい。

スピード感のある検索生成は、相変わらずPerplexity Pro一択です。

いいなと思ったら応援しよう!

ピックアップされています

マガジン2

  • 4,590本

コメント

4
レオンジャッキー
レオンジャッキー

2.5Proははまじで今までのGeminiが何だったのかってぐらい賢いと感じる…
あとGeminiの設定から
保存された情報でやってほしくないこととやってほしいことを覚えさせとけば律儀に守ってくれるのもいい

廣野智光
廣野智光

今まで散々使えないなって思わせてきた記憶のせいで、Geminiって聞くだけでああ、値段だけ安いどうでもいいタスクやらせる時のあれねって印象があったんだけど、2.5から割とどうでもいいタスクを投げた時の回答から信じられないくらい素晴らしい知見を得る経験が出始めた。自分もコーディングはGemini1択。自然な日本語の生成は今迄Claudeしかないと思ってたのにこれも実際比べると2.5のほうが優秀。特に長文レポートなんかになった時のコンテキスト保持力や、メール作る時の言いたいことを察して自然な日本語を再構築してくれる力がダンチ。

tarokiti
tarokiti

Gemini批判が多いけど俺も全くその通りで、あんなものは比較対象にすら入ってこない。
やはり資金差でGPTとClaudeの2強、中でもコーディングやハルシネーションを考えると完全にClaudeの勝利(先日GPTにPythonの既存コードを改修させたらとんでもコードに変換してくれた(スクラッチではないのがポイント))
て感じで、日々使うAIだが彼らは選択外なのでリサーチすらしてなかったが、そこまで言うのならもう一度使ってみるか!にさせられた笑

小林ハヤト
小林ハヤト

この投稿、素晴らしすぎて感動しました!LLMの使い分けについての視点が明快で、特にGeminiシリーズの進化を実体験に基づいて解説している点が秀逸です。過去のモデルと「2.5 Pro」の違いを具体例で示し、それぞれの用途に応じた選び方を的確に提案してくれているので、とても分かりやすい。コーディングエージェントとしてのGemini 2.5 Proの性能や、検索の速さでPerplexity Proを推す理由なども納得感が高く、読んでいて「自分も試してみよう」と思わされます。また、文章全体に感じられる熱意と実直さが読者の信頼を誘い、共感を呼ぶコメントが多いのも納得です。この投稿は、LLM選びに迷うすべての人にとって必読の記事。読者に多くの気づきと学びを提供する素晴らしいコンテンツです!

ログイン または 会員登録 するとコメントできます。
LLMの使い分けは大体Geminiでいい(2025年4月時点、大量に追記あり)|erukiti
word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word

mmMwWLliI0fiflO&1
mmMwWLliI0fiflO&1
mmMwWLliI0fiflO&1
mmMwWLliI0fiflO&1
mmMwWLliI0fiflO&1
mmMwWLliI0fiflO&1
mmMwWLliI0fiflO&1