Create
Notifications
Profile
Pin
More
More
Back
cosmowayback's profile picture
我來試試看條列式給業外,但有興趣了解的人看,能不能幫助大家新年不要再吵 DeepSeek 了。其實 DeepSeek 指的是以下兩件事,它們不該互相混淆: 1. 模型:一個建立於前人的開源方法,再加上一些聰明的工程,性能直逼 o1 ,但訓練成本低很多的 AI ,而該團隊也給出文獻和相關模型。在這之前,真正能挑戰 OpenAI o1 的模型不多,何況是開源的。以上是業界最讚賞的部份,也幫助開源界挑戰 OpenAI 很大的力量。2. DeepSeek 網站 / app :他們免費開放讓一般人測試、使用這個模型。無論你喜不喜歡,事實是只要他們還想要營運,就會有中國特色的監管和資安疑慮。我是覺得很好用,但我完全理解,基於各種理由不想使用它。  
Translate
Like
12
Comment
Repost
Share
Related threads
ai.libai's profile picture
被DeepSeek-R1刺激到了嗎?ChatGPT也推出了o3-mini與o3-mini-high兩顆擅長推理的模型來回應了!  
Translate
Like
13
Comment
Repost
Share
ljiekai's profile picture
寫了一篇認真討論怎麼樣學術分析deepseek v3帶來的爭議。從模型GPU利用率(MFU)來討論,詳細計算後發現deepseek v3並沒有離群,在過去有大量模型宣稱過比他更高的利用率。更重要的是企業也可以依此判斷到底2025要不要搞LLM,預期投入要多少…等axk51013.medium.com/deeps…  
Translate
Like
11
Comment
Repost
Share
akiraxtwo's profile picture
「Humanity's Last Exam」是由人工智慧安全中心(Center for AI Safety)主導的專案,旨在建立一個多領域的高難度基準測試,評估大型語言模型(LLM)的能力。該專案集結了來自全球近千位專家,涵蓋超過五百個機構,收集了三千道涵蓋百餘個學科的挑戰性問題。  
Translate
Like
8
Comment
1
Repost
2
Share
sw.chao's profile picture
容許自己的不完美、容許他人的不完美、都是很重要的生命功課。  
Translate
Like
2
Comment
Repost
Share