2025-01-25 13:07
還沒研究完 Deepseek-R1 的東西,但先來丟一些快速想法: 1. 那些說「中國的AI會做言論審查沒屁用」的人真的搞錯重點。模型是開源的,大家都能下載下來自己調,或是拿模型的output去蒸餾自己的模型(論文中非常強調這部分,因為表現很好) 2. 模型很強,差不多是o1等級,目前大家都有共識了(Lmsys、第三方獨立benchmark都一樣結果) 3. 模型的cost reduction不是一個「還不錯,但沒什麼大不了」的feature。這種程度的cost reduction是一個game changer,對開源社群跟美國frontier labs的人都有極大影響
1,217
回覆
67
轉發
89

作者

哈利說
harryspeaks_
profile
粉絲
85,769
串文
126+

回覆

轉發

24小時粉絲增長

發文前

85,265

發文後24小時

85,769

變化

+504 (0.59%)

互動率

(讚 + 回覆 + 轉發) / 粉絲數
1.60%

回覆 (BETA)

最先回覆的內容
發文後用戶內容
16 分鐘內
三口子
pepperbear886
嗯....好,那接下來要攻擊的是[中國製的會自動放木馬開你後門]
17 分鐘內
profile
蘇家興
qqzake
今天聽古癌說也在說你這一些論點
一小時內
profile
Billy Lee
billyeebilleey
如果這cost reduction 是一個game changer, 好奇美國巨頭還要支付高昂費用購買Nvidia 最先進的晶片嗎?
一小時內
profile
zhang3
idzhang3
感覺一堆人思維方式上很中國文化,看什麼都是立場先行,圍繞立場再亂說一通當做證據。國際上完全沒人這樣。 這幾乎就是革命性的,好奇以後怎樣發展,美國如果不是大轉彎,接下來怎麼弄
2 小時內
虎翼(호의)
wu.winny
請問一下,要跑deepseek的模型很高階的電腦嗎? Mac Mini跑的動嗎?
3 小時內
profile
CChin Kian
cchinkian
R1 完整的呈现想法过程真的好棒棒。
3 小時內
profile
Thomas liu
shin7965977
當你那這些論點反駁他們對方卻無法回答的時候,他們就會說:我們有台積電他們有嗎?台灣沒有加蓋,舔共就滾去中國
4 小時內
profile
Steve Lo
steveyy0421
中國ai講白了先抄襲 在來說。 我說要繁體中文對話一直亂跳簡中文 在說二次訓練要先避開所有台灣相關的事情就很難 他常常只會回答中國的事或觀念 建議要用可以不要用線上付費的 根本就是被拿來訓練用
7 小時內
profile
Wei-Jen Cheng
williamgrot
好啦好啦 反正在意言論審查的又不會讀那些論文,更不會下載人家的開源模型回家train成言論自由的形狀
8 小時內
profile
moshi_mosh_ai
cost 問題真的影響很大,我們團隊也因此在考慮要不要接deepseek來測看看了

© 2025 Threadser.net. 版權所有。

Threadser.net 與 Meta Platforms, Inc. 無關,未經其認可、贊助或特別批准。

Threadser.net 也不與 Meta 的"Threads" 產品存在任何關聯。