o3-mini 在Humanity's Last Exam上的表現。 DeepSeek-R1 的校準誤差為 81.8%，顯示在模型預測的置信度與實際結果之間的差距最小。說真話的總是被針對😂？

串文

2025-02-01 09:11

o3-mini 在Humanity's Last Exam上的表現。 DeepSeek-R1 的校準誤差為 81.8%，顯示在模型預測的置信度與實際結果之間的差距最小。說真話的總是被針對😂？

讚

52

回覆

7

轉發

1

作者

無聊就學AI Lab | Boring Traveler
akiraxtwo

粉絲

18,773

串文

2,079+

讚

回覆

轉發

24小時粉絲增長

發文前

18,743

發文後24小時

18,763

變化

+20 (0.11%)

互動率

(讚 + 回覆 + 轉發) / 粉絲數

0.32%

回覆 (BETA)

最先回覆的內容
發文後	用戶	內容
一小時內	無聊就學AI Lab \| Boring Traveler akiraxtwo	表格出處