2025-01-30 14:43
DeepSeek-R1: "Kẻ thách thức" OpenAI o1 xuất hiện Điểm nổi bật: • Sử dụng thuật toán Group Relative Policy Optimization (GRPO) thay vì PPO, giúp giảm chi phí tính toán. • Mô hình tự học các chiến lược suy luận phức tạp như tự suy ngẫm và quay lui. • Các mô hình nhỏ hơn được "chưng cất" từ DeepSeek-R1 cho hiệu suất đáng kinh ngạc, thậm chí vượt trội hơn cả o1-mini. • Chi phí sử dụng DeepSeek-R1 rẻ hơn đáng kể so với o1 (2.19/1M token so với 60/1M token)
4
回覆
0
轉發

回覆

轉發

24小時粉絲增長

無資料

互動率

(讚 + 回覆 + 轉發) / 粉絲數
0.64%

回覆 (BETA)

最先回覆的內容
發文後用戶內容

© 2025 Threadser.net. 版權所有。

Threadser.net 與 Meta Platforms, Inc. 無關,未經其認可、贊助或特別批准。

Threadser.net 也不與 Meta 的"Threads" 產品存在任何關聯。