2025-02-28 23:06
AGI 現在agi的benchmark有絕對性的錯誤,完全唔準確。 真正的benchmark應該是一個,任何model都沒有任何記憶的問題。 最近在用spring ai寫program,因為太新,有很多很多的問題。張github個repository連上claude,因為claude不能連網,不斷生成新嘅content,然後不斷重複🥱,就出現怎樣也做不好的問題。 這才是應該benchmark的地方,要從他們懂得自己不懂得而著手,不是在記憶問題而返回答案
3
回覆
1
轉發

作者

楊聰
_wingyeung_
profile
粉絲
95
串文
307+

回覆

轉發

24小時粉絲增長

發文前

95

發文後24小時

95

變化

0 (0.00%)

互動率

(讚 + 回覆 + 轉發) / 粉絲數
4.21%

回覆 (BETA)

最先回覆的內容
發文後用戶內容

© 2025 Threadser.net. 版權所有。

Threadser.net 與 Meta Platforms, Inc. 無關,未經其認可、贊助或特別批准。

Threadser.net 也不與 Meta 的"Threads" 產品存在任何關聯。