Threadser.net
數據
關鍵字
Threads
Login
串文
串文鏈結
2025-02-01 09:11
o3-mini 在Humanity's Last Exam上的表現。 DeepSeek-R1 的校準誤差為 81.8%,顯示在模型預測的置信度與實際結果之間的差距最小。 說真話的總是被針對😂?
讚
52
回覆
7
轉發
1
作者
無聊就學AI Lab | Boring Traveler
akiraxtwo
粉絲
18,773
串文
2,079+
讚
回覆
轉發
24小時粉絲增長
發文前
18,743
發文後24小時
18,763
變化
+20 (0.11%)
互動率
(讚 + 回覆 + 轉發) / 粉絲數
0.32%
回覆 (BETA)
最先回覆的內容
發文後
用戶
內容
一小時內
無聊就學AI Lab | Boring Traveler
akiraxtwo
表格出處