(cache)我來試試看條列式給業外，但有興趣了解的人看，能不能幫助大家新年不要再吵 DeepSeek 了。其實 DeepSeek 指的是以下兩件事，它們不該互相混淆： 1. 模型：一個建立於前人的開源方法，再加上一些聰明的工程，性能直逼 o1 ，但訓練成本低很多的 AI ，而該團隊也給出文獻和相關模型。在這之前，真正能挑戰 OpenAI o1 的模型不多，何況是開源的。以上是業界最讚賞的部份，也幫助開源界挑戰 OpenAI 很大的力量。 2. DeepSeek 網站 / app ：他們免費開放讓一般人測試、使用這個模型。無論你喜不喜歡，事實是只要他們還想要營運，就會有中國特色的監管和資安疑慮。我是覺得很好用，但我完全理解，基於各種理由不想使用它。

我來試試看條列式給業外，但有興趣了解的人看，能不能幫助大家新年不要再吵 DeepSeek 了。其實 DeepSeek 指的是以下兩件事，它們不該互相混淆： 1. 模型：一個建立於前人的開源方法，再加上一些聰明的工程，性能直逼 o1 ，但訓練成本低很多的 AI ，而該團隊也給出文獻和相關模型。在這之前，真正能挑戰 OpenAI o1 的模型不多，何況是開源的。以上是業界最讚賞的部份，也幫助開源界挑戰 OpenAI 很大的力量。2. DeepSeek 網站 / app ：他們免費開放讓一般人測試、使用這個模型。無論你喜不喜歡，事實是只要他們還想要營運，就會有中國特色的監管和資安疑慮。我是覺得很好用，但我完全理解，基於各種理由不想使用它。

Translate

Related threads

ai.libai

about an hour ago

被DeepSeek-R1刺激到了嗎？ChatGPT也推出了o3-mini與o3-mini-high兩顆擅長推理的模型來回應了！

Translate

ljiekai

7 hours ago

寫了一篇認真討論怎麼樣學術分析deepseek v3帶來的爭議。從模型GPU利用率（MFU）來討論，詳細計算後發現deepseek v3並沒有離群，在過去有大量模型宣稱過比他更高的利用率。更重要的是企業也可以依此判斷到底2025要不要搞LLM，預期投入要多少…等axk51013.medium.com/deeps…

Translate