Threadser.net
數據
關鍵字
功能建議
Blog
Following
Threads
Change language
登入
串文
串文鏈結
2025-02-28 23:06
AGI 現在agi的benchmark有絕對性的錯誤,完全唔準確。 真正的benchmark應該是一個,任何model都沒有任何記憶的問題。 最近在用spring ai寫program,因為太新,有很多很多的問題。張github個repository連上claude,因為claude不能連網,不斷生成新嘅content,然後不斷重複🥱,就出現怎樣也做不好的問題。 這才是應該benchmark的地方,要從他們懂得自己不懂得而著手,不是在記憶問題而返回答案
讚
3
回覆
1
轉發
作者
楊聰
_wingyeung_
粉絲
95
串文
307+
讚
回覆
轉發
24小時粉絲增長
發文前
95
發文後24小時
95
變化
0 (0.00%)
互動率
(讚 + 回覆 + 轉發) / 粉絲數
4.21%
回覆 (BETA)
最先回覆的內容
發文後
用戶
內容