來談一下最近沸沸洋洋的 Deepseek 吧我剛好有一個北京的學長在 Deepseek 雖然我不太知道詳細的細節也沒仔細問但只能說中國的 AI 發展本來就很強算力也不會輸 2022 在北京商湯實習的時候人手16張 A100 那時候我就在復刻 GPT-3 的 LLM了所以要說算力 Deepseek 一定夠不只2000 張但「實際訓練」有沒有可能只用兩千張 GPU 呢？很有可能其實我們公司九個月前就做了類似的事當時 Mosaic 用 MoE 訓練兩個月做出 DBRX 已經大幅度減低成本也能追上 GPT-3.5 當然不得不說 Deepseek 使用 RL 創新降低成本也提升 benchmark 是真的很厲害那麼這會影響 NVDA, TSM 這麼嚴重嗎? 我認為不會, AI 需求還是在, 且更多公司能加入（當然我們也會有更多用戶 ✌️ 今天公司年會聽完了大老闆講話真的很有遠見也很慶幸自己能加入 DB 吃到這塊 AI 的大餅未來也要繼續加油 💪

串文

2025-01-28 23:16

讚

280

回覆

轉發

作者

Martin Chou
choumartin12

粉絲

3,737

串文

344+

讚

回覆

轉發

24小時粉絲增長

發文前

3,613

發文後24小時

3,730

變化

+117 (3.24%)

互動率

(讚 + 回覆 + 轉發) / 粉絲數

8.64%

回覆 (BETA)

最先回覆的內容
發文後	用戶	內容
2 小時內	Lin Mark marklin0731	看到這張圖，想起馬斯克當初要做電動車被說不可能，因爲電池成本太高。後來他把成本降低，開啟了電動車產業的發展。
2 小時內	MichaelChao SG mychao777	Deepshit
2 小時內	吳子青 wtzuching	Deepseek開發出來明明就是好事, 我們這裡的算法組都很興奮, 可預期之後更多基於GRPO或其他策略發展出來更好訓練的LLM. 明明就是中美雙贏的局面
4 小時內	Jeff Lin starkjegan4	今天外媒分析有一個有趣的數字,輝達銷售的晶片金額,新加坡買了77億美金,但是市場上有人評估新加坡在AI運算與發展的公司與平台根本無法與77億美金相比,那晶片去哪裡了？？？？我絕對不會懷疑中國發展AI的實力,但是這種發展成本的宣傳數字是否是真的？有待市場去驗證, 很多成本可能都沒算進去
4 小時內	Sammy Kao kaobei123789	你討論的參雜了技術面的訊息，對綠腦來說，聽不懂，就算懂也假裝聽不懂。就是一群鴕鳥，希望這是偽造，但是又不敢去驗證，就怕是真的，這樣信仰會受到打擊。現在看到綠腦主要的說法都是，「他們就是作假，等時間驗證你們就知道了，反正你們就是親共，就是看不得台灣好」
5 小時內	iSam isamsaysaysong	Deepseek 很讚，可以檢驗小草政治審查模組也可以破解，應該推廣給更多中國牆內使用，青鳥支持
6 小時內	Adam Lee 孟霈 pei0718	要確捏在這邊幫DeepSeek講話是會被業外LLM專家糾正的
6 小時內	朱静 hoowood1983	从经济学维度看这个事其实也没那么玄乎。就是一个最基本的经济学原理：边际效用递减嘛
8 小時內	tcagugua	你怎麼沒遇到網軍說Deepseek 爛
19 小時內	Ben Lu hsueh.pin.tw	內行人好險你寫的很專業他們根本聽不懂不知道如何反駁你