2025-01-28 23:16
來談一下最近沸沸洋洋的 Deepseek 吧 我剛好有一個北京的學長在 Deepseek 雖然我不太知道詳細的細節也沒仔細問 但只能說 中國的 AI 發展本來就很強 算力也不會輸 2022 在北京商湯實習的時候人手16張 A100 那時候我就在復刻 GPT-3 的 LLM了 所以要說算力 Deepseek 一定夠 不只2000 張 但 「實際訓練」有沒有可能只用兩千張 GPU 呢? 很有可能 其實我們公司九個月前就做了類似的事 當時 Mosaic 用 MoE 訓練兩個月做出 DBRX 已經大幅度減低成本 也能追上 GPT-3.5 當然不得不說 Deepseek 使用 RL 創新 降低成本也提升 benchmark 是真的很厲害 那麼這會影響 NVDA, TSM 這麼嚴重嗎? 我認為不會, AI 需求還是在, 且更多公司能加入 (當然 我們也會有更多用戶 ✌️ 今天公司年會 聽完了大老闆講話 真的很有遠見 也很慶幸自己能加入 DB 吃到這塊 AI 的大餅 未來也要繼續加油 💪
280
回覆
27
轉發
16

作者

Martin Chou
choumartin12
profile
粉絲
3,737
串文
344+

回覆

轉發

24小時粉絲增長

發文前

3,613

發文後24小時

3,730

變化

+117 (3.24%)

互動率

(讚 + 回覆 + 轉發) / 粉絲數
8.64%

回覆 (BETA)

最先回覆的內容
發文後用戶內容
2 小時內
profile
Lin Mark
marklin0731
看到這張圖,想起馬斯克當初要做電動車被說不可能,因爲電池成本太高。後來他把成本降低,開啟了電動車產業的發展。
2 小時內
profile
MichaelChao SG
mychao777
Deepshit
2 小時內
profile
吳子青
wtzuching
Deepseek開發出來明明就是好事, 我們這裡的算法組都很興奮, 可預期之後更多基於GRPO或其他策略發展出來更好訓練的LLM. 明明就是中美雙贏的局面
4 小時內
profile
Jeff Lin
starkjegan4
今天外媒分析有一個有趣的數字,輝達銷售的晶片金額,新加坡買了77億美金,但是市場上有人評估新加坡在AI運算與發展的公司與平台根本無法與77億美金相比,那晶片去哪裡了????我絕對不會懷疑中國發展AI的實力,但是這種發展成本的宣傳數字是否是真的?有待市場去驗證, 很多成本可能都沒算進去
4 小時內
profile
Sammy Kao
kaobei123789
你討論的參雜了技術面的訊息,對綠腦來說,聽不懂,就算懂也假裝聽不懂。就是一群鴕鳥,希望這是偽造,但是又不敢去驗證,就怕是真的,這樣信仰會受到打擊。 現在看到綠腦主要的說法都是,「他們就是作假,等時間驗證你們就知道了,反正你們就是親共,就是看不得台灣好」
5 小時內
profile
iSam
isamsaysaysong
Deepseek 很讚,可以檢驗小草 政治審查模組也可以破解,應該推廣給更多中國牆內使用,青鳥支持
6 小時內
profile
Adam Lee 孟霈
pei0718
要確捏 在這邊幫DeepSeek講話是會被業外LLM專家糾正的
6 小時內
profile
朱静
hoowood1983
从经济学维度看这个事其实也没那么玄乎。就是一个最基本的经济学原理:边际效用递减嘛
8 小時內
profile
tcagugua
你怎麼沒遇到網軍說Deepseek 爛
19 小時內
profile
Ben Lu
hsueh.pin.tw
內行人 好險你寫的很專業 他們根本聽不懂不知道如何反駁你

© 2025 Threadser.net. 版權所有。

Threadser.net 與 Meta Platforms, Inc. 無關,未經其認可、贊助或特別批准。

Threadser.net 也不與 Meta 的"Threads" 產品存在任何關聯。