【決定版】2025年1月中旬時点でのGeminiとClaudeとOpenAIの使い分け
最近、とある事情で、Gemini AdvancedのためにGoogle One?なんか知らないけど契約した。無料期間のうちに使い倒す。契約続行するかは悩ましい。
さらに、一足遅れたがChatGPT Proを契約した。とある事情で、個人的な利用をしたかったので、個人的な契約だ。
元々Claude ProfessionalとChatGPT Plusを契約していた。perplexityも契約してるがこっちはRabbit R1というゴミガジェットのおまけで一年間無料中だ。
最近、執筆やGoogle AI Hackathonなどで対話型AIをフル活用しまくってるのもあって、今の最新モデルについて広い知見が貯まってきたので比較してみたい。
まだまだ使い始めたばかりのサービスも多いため、異論反論あれば是非コメントなりでしていただければありがたく。
結論: 僕の使い方
大賢者に深い相談をテンポ良くしたいときは o1とgemini 2.0 Experimental Advanced(長いので以後gemini-2.0-expと書く)
大賢者に質問を大量に投げっぱなししたいときは o1-pro
日常の相談や、細かい日本語操作(記事の校正とか)は賢者相手で十分。 Claude 3.5 Sonnet(長いのでsonnetと書く)を活用する
図がほしいときやウェブの画面作りはSonnet。いい感じにReactで画面作ってくれるし、Mermaidでいい感じに図を書いてくれる。設計やプロトタイピングが極端に捗る
幅広い意見を見ていきたいときは、複数ウィンドウ開いてo1-proとgemini-2.0-expとsonnetに投げて、その反応を元に誰かに要約(大体sonnetにやらせることが多い)させたりして、ブラッシュアップしまくる
特にこれが有効なのは、道筋が見えてないとき、やり方がいっぱいあるときなど
検索エンジンはperplexity一択。一応searchGPTやDeepResearchも使うこともあるがほぼ当てにしない
探したいものが最初からわかりきってる場合はGoogle検索を生で使う。最早原始的な検索エンジンの必要性は激減している
コーディングに関しては、自作ツールを併用しながらSonnetに作らせることが多い。そのとき「小さなモジュールのみを作らせる」とかに限定している
ClineやReclineは考慮の余地があると思うのだけど、既存の拡張だと微妙だなーと思うので、多分僕自身がfork作らないと満足できないと思う
それならClineの仕組みを参考にしつつ、sonnet desktop+MCPでええやろ
ではこの結論に至った理由についてそれぞれのLLMを見ていこう。API経由で使う話は今回は一切含めない。
OpenAI
gpt-4oとgpt-4o-miniはアホの子すぎる。とくにgpt-4o-miniは論外。gpt-4oも「一世代前のAI」感は強い。指示追従能力が低い。
o1はめっちゃ賢い。まさに大賢者。o1-proとの違いは正直よくわからん。o1-proは返答が返ってくるまでに数分かかるので、大量にウィンドウ開いて投げっぱなしにする使い方しかできない。
o1は、雑な質問がしやすい。そこからのインサイトを元にさらに深い質問を投げやすい。
searchGPTは、検索汚染されまくったソースとアホの子gpt-4oの組み合わせで、本当によろしくない。
Anthropic Claude
3.5-Sonnetはやっぱり賢い。o1やgemini-2.0-expと比べると明確に劣る側面もあるが、日本語操作能力はとても強いし、指示追従能力も負けてない。
o1とgemini-2.0-exp時代においても、まだまだ使い道はある。コーディングのお供にしたり、日本語文章を執筆させたり校正させたりなら、まだまだ使える。
とは言え、1世代前になりそうなので、そろそろ新モデルほしい。4 sonnetとか出れば強そう。thinking/reasoningモデルとかもやらんかね
あとはArtifactsが便利。Reactによる画面やMermeidによる図をカジュアルに作ってくれるので、フロントエンドや設計において、めっちゃ時短にできる。これは絶対使うべき
Gemini
gemini-1.5-proはガチでアホの子。意味不明なレベルでアホすぎる。ハルシネーション多いしアホすぎ
gemini-2.0-experimental-advancedはマジで賢い。sonnet以上o1以下くらいの賢さ。それでいて速度がめっちゃ速い。まだ契約したばかりで活用し切れてないから、この評価はどんどんアップデートしていくと思うんだけど、現時点では凄くいい感触。これは契約の価値がある
僕の使い方が的外れすぎるのかもしれないが、1.5pro with Deep Researchは使い物にならない
Perplexity
Perplexity Proは、速度と結果のバランスが凄く絶妙に良い。検索エンジン汚染の影響は受けてるものの、なぜか比較的マシ。
Deep Researchのような激しいハルシネーションは見られないし、検索対象も大分マシだし、出てくる文章も良くて、何より早い
まとめ
大賢者(o1およびgemini-2.0-exp-ad)が使えるかどうかで、人の知的活動は大きく変わる。ChatGPT Proの契約をしたくない人は、Gemini Advancedを契約すればいい。Gemini Advancedなら初月無料なのでお試しできる。
日本語の文章の精密な操作をしたい人と、コーディングに活用したい人と、ウェブ画面作りや、図を書かせるなら、Claude Professionalがおすすめ。大賢者には劣るが、賢者との会話が楽しめる。大賢者が強すぎるだけで賢者でも十分かしこい。少なくともアホの子たちを使うよりは百億倍マシ。
検索関連はPerplexity Pro一択。将来的にはDeep Researchも改善するだろうけど現状では「無い」。Softbankが一年無料キャンペーンやってるし、試しに使ってみた方がいい。
僕の大賢者活用法についてのノウハウとかは後ほどまた別の機会に記事にしたい。
コメント
4参考にサセテ頂きました。
有難う御座います。
大筋同意なのですが、いくつか気になった点について。
◆要約・対話能力について:
o1とGemini 2.0の間には大きな差があると感じます。特に長文、例えば書籍一冊を要約するような使い方では、Gemini 2.0はやや厳しいです。
記憶力が弱く、すぐに前提条件を忘れてしまうため、使えば使うほど弱点が目立ちます。
ただし、無料で使えることを考慮すれば、非常に素晴らしいツールと言えます。
上記を踏まえると、現時点で最高峰はo1(or pro)一択という印象です。
◆検索能力について:
Perplexity AIは厳しく、feloの方が良くないですかね?
feloは、検索結果もコンスタントに安定しているし、PDFなどで出力できるのが良く、趣味で使っても有用と思います。
料金も安く(2000円)、現時点ではPerplexity AIを選ぶ理由がないほど差があると思います。
gensparkは全体的に微妙で、無料という点だけがメリットです。
エージェント機能やファクトチェックなどは今後のアップデートに期待できるかもしれませんが、まだ積極的に使いたいとは思えません。
2024年に分かった事はいくらAIが進化してもAIを使いこなせる人間がほとんどいないので社会的には大したインパクトがないという事
例えると飛行機が発明されて超短時間で移動できるようになった(アメリカまで1か月かかっていたのに10時間で行けるようになった)けど肝心のパイロットがいないので大した影響がない
2025年に変わるとするなら自動運転の飛行機ができるかどうか
エージェントが期待通りで誰でもAIが使えるようになれば一気に世界が変わる、そうでないなら一部のオタクのおもちゃで終わる
スマホになれるのか、PDAのママ終わるのか今年中に結論が出る
すごーく使っている肌感としっくり来ます♪