2025-01-28 01:40
一堆小白在說Deepseek有政治風險不用之類的
真的是無力吐槽
第一Deepseek最有價值的點在於他提出了一個很省資源的的預訓練方法,足以加速產業的發展,而不是模型本身。如果目前檯面上的大公司例如ChatGPT都能重複這些方法,那多模態模型的成本就足以下降到一般人都能使用的程度,而不是一個月2000美元的價格
第二就算以模型本身來說,只要你顯卡的VRAM夠大,就可以直接下載模型本體在自己的電腦跑,不會遇到線上版本的任何審查問題
最後這種學習資料被prune過的模型當然表現不會完全比原始的大模型好,要精細的生產力還是用Claude吧
他可以做的跟現階段那些meta開源模型llama一樣,就是把模型下載下來到自己電腦,不花訂閱費用就可以跑了~