2025-01-25 13:07
還沒研究完 Deepseek-R1 的東西,但先來丟一些快速想法:
1. 那些說「中國的AI會做言論審查沒屁用」的人真的搞錯重點。模型是開源的,大家都能下載下來自己調,或是拿模型的output去蒸餾自己的模型(論文中非常強調這部分,因為表現很好)
2. 模型很強,差不多是o1等級,目前大家都有共識了(Lmsys、第三方獨立benchmark都一樣結果)
3. 模型的cost reduction不是一個「還不錯,但沒什麼大不了」的feature。這種程度的cost reduction是一個game changer,對開源社群跟美國frontier labs的人都有極大影響