Home
Search
Create
Notifications
Profile
Pin
More
More
Log in
Back
Thread
cosmowayback
1d
a day ago
More
我來試試看條列式給業外,但有興趣了解的人看,能不能幫助大家新年不要再吵 DeepSeek 了。
其實 DeepSeek 指的是以下兩件事,它們不該互相混淆: 1. 模型:一個建立於前人的開源方法,再加上一些聰明的工程,性能直逼 o1 ,但訓練成本低很多的 AI ,而該團隊也給出文獻和相關模型。在這之前,真正能挑戰 OpenAI o1 的模型不多,何況是開源的。
以上是業界最讚賞的部份,也幫助開源界挑戰 OpenAI 很大的力量。
2. DeepSeek 網站 / app :他們免費開放讓一般人測試、使用這個模型。無論你喜不喜歡,事實是只要他們還想要營運,就會有中國特色的監管和資安疑慮。我是覺得很好用,但我完全理解,基於各種理由不想使用它。
Translate
Like
12
Comment
Repost
Share
Related threads
ai.libai
1h
about an hour ago
More
被DeepSeek-R1刺激到了嗎?ChatGPT也推出了o3-mini與o3-mini-high兩顆擅長推理的模型來回應了!
Translate
Like
13
Comment
Repost
Share
ljiekai
7h
7 hours ago
More
寫了一篇認真討論怎麼樣學術分析deepseek v3帶來的爭議。
從模型GPU利用率(MFU)來討論,詳細計算後發現deepseek v3並沒有離群,在過去有大量模型宣稱過比他更高的利用率。
更重要的是企業也可以依此判斷到底2025要不要搞LLM,預期投入要多少…等
axk51013.medium.com/deeps…
Translate
axk51013.medium.com
【LLM 專欄】Deepseek v3 的訓練時間到底合不合理?淺談 LLM Training efficiency
Like
11
Comment
Repost
Share
ciaochiaociao
7h
7 hours ago
More
今天發現這個從材料系轉CS的CMU強者 畢業後還到meta工作 最近轉GenAI! 脆真的都推給我跨領域的勵志人士!身為硬轉的過來人真是觸爛🤷
Translate
d.w.820
1d
a day ago
去年底換組到
@meta
Gen AI org 從完全不知道post-training 在衝啥 到現在大概略知一二 (再除二) 整體而言的感覺就像剛入職的時候 好多新的東西要學 雖然綜觀我一樣只是一個小小螺絲釘 但感覺整個產業正在定義著下個decade的世界 好期待
Translate
Like
134
Comment
3
Repost
1
Share
4
akiraxtwo
24m
24 minutes ago
More
「Humanity's Last Exam」是由人工智慧安全中心(Center for AI Safety)主導的專案,旨在建立一個多領域的高難度基準測試,評估大型語言模型(LLM)的能力。
該專案集結了來自全球近千位專家,涵蓋超過五百個機構,收集了三千道涵蓋百餘個學科的挑戰性問題。
Translate
Like
8
Comment
1
Repost
2
Share
sw.chao
49m
49 minutes ago
More
容許自己的不完美、容許他人的不完美、
都是很重要的生命功課。
Translate
Like
2
Comment
Repost
Share