2025-01-28 10:33
讓Nvdia 重挫17%的Deepseek 到底什麼來頭?
讓人跌破眼鏡的訓練費用557萬美金,是GPT4o的5%
Deepseek 是中國的量化私募基金幻方全資開發,業內AI訓練模型1萬張A100是基礎,幻方2019開始買卡,創始人本來就是做大模型的後來看到Ai的普及化前景好就選了這個方向。
其他家都是上億幾十億上百億不等的訓練成本,它才花了五百五十七萬美金,大大降低了入局成本,價格上也是降維打擊的程度,API的價格更是Gpt4的七十分之一
數學推理和多任務處理也是名列前茅!訓練大模型降低成本方式有兩個大方向1.降低工作量2.減少閒置,Deepseek 做到了順暢沒人閒著的高效能。
我自己是Gpt 的付費用戶Deepseek 實際運用下來就是個理科高材生的感覺,文字理解能力跟GPT比差滿多的
DeepSeek