2025-02-01 09:11
o3-mini 在Humanity's Last Exam上的表現。 DeepSeek-R1 的校準誤差為 81.8%,顯示在模型預測的置信度與實際結果之間的差距最小。 說真話的總是被針對😂?
52
回覆
7
轉發
1

回覆

轉發

24小時粉絲增長

發文前

18,743

發文後24小時

18,763

變化

+20 (0.11%)

互動率

(讚 + 回覆 + 轉發) / 粉絲數
0.32%

回覆 (BETA)

最先回覆的內容
發文後用戶內容
一小時內
profile
無聊就學AI Lab | Boring Traveler
akiraxtwo
表格出處

© 2025 Threadser.net. 版權所有。

Threadser.net 與 Meta Platforms, Inc. 無關,未經其認可、贊助或特別批准。

Threadser.net 也不與 Meta 的"Threads" 產品存在任何關聯。