回答(10件)
マスコミの報道と、解説が変に盛り上がっているから。 わかっている解説はほとんどないんじゃないかなぁ。 以下は私の理解と意見。反論を求めます。 以下は全部嘘 DeepSeek はNvidaのGPUを使わないでいい。=>大嘘 DeepSeekは型落ちのGPUで計算した。=> H800は最新。 DeepSeekが使ったGPUはNvidaが中国向けに性能を落としたもので、H100の半分くらいの性能。 => H800の演算性能はH100と大差ない。 AIデータセンターがいらなくなる => 真逆(後述) DeepSeekの「開発費」は550万ドル => 訓練コストの仮計算だけ。 これに相当するChatGPTのコストは、たぶん同程度 DeepSeekは画期的な発明だ => MoEと呼ばれる手法も、訓練データを整備すれば計算時間が減ることも専門家なら知ってる。先例もある。 本当で、意義深いのは ほぼ同じ土俵で、ChatGPTを上回る(かもしれない)AI性能を実現した。 =>(マラソンで新記録を出した、というのと同じ) ただし、セキュリティホールがすぐに見つかっているなど、 サービスとしての完成度が低いままサービスインしたのはまずい。 オープンソースで公開したこと => 4751サイバーリンクがサービスを始めるように、DeepSeekを転用してChatGPTのようなサービスが可能になる。 DeepSeekが公開していない部分も補う動きも始まっている https://gigazine.net/news/20250129-deepseek-r1-open-hugging-face/ 有償サービスで稼ごうと思っていたところは不意を打たれた。 だから DeepSeekを咎めることは間違い、讃えていい。 そういうサービスがたくさん始まると予想される。 今日・明日を境に、たくさんのプロジェクトがスタートするから、 GPUに対する需要が、一時的に爆発するかもしれない。 AIデータセンターも、需要が高まりそう。 これには悪い面も。特に電力需要。一社か数社がやれば良い計算をたくさんの会社がやると、トータルな電力需要は膨大になる。
この回答はいかがでしたか? リアクションしてみよう