2025-01-27 11:23
今日最夯話題,什麼是 DeepSeek?
DeepSeek 是一家來自中國的 AI 新創公司,近期因其 AI 模型 DeepSeek-R1 而備受矚目。該模型以低成本、高效能著稱,其訓練成本僅約 600 萬美元,使用 2,048 組 Nvidia H800 晶片,在短短兩個月內成功開發,展現了驚人的運算效率。與之相比,Meta 訓練 Llama 3 模型耗費更強大的 H100 晶片,訓練成本高達數億美元。DeepSeek 以開源方式推廣,並在基準測試中表現出色,與 OpenAI O1、Meta Llama 3.1 等業界巨頭的產品不相上下。這一突破顛覆了市場對 AI 模型發展的認知,並引發對 AI 領域成本效益與技術壁壘的廣泛討論。
DeepSeek 對 AI 產業的影響?
DeepSeek 的成功動搖了市場對於 AI 產業「高成本等於高效能」的既有認知。它證明了即使不依賴頂級 AI 晶片,仍能開發出媲美國際巨頭的模型,這可能改變現有的 AI 產業格局。許多分析師認為,DeepSeek 的低成本策略可能對 Nvidia、Meta、Google 等投入鉅資的科技巨擘構成挑戰。