AGI 現在agi的benchmark有絕對性的錯誤，完全唔準確。真正的benchmark應該是一個，任何model都沒有任何記憶的問題。最近在用spring ai寫program，因為太新，有很多很多的問題。張github個repository連上claude，因為claude不能連網，不斷生成新嘅content，然後不斷重複🥱，就出現怎樣也做不好的問題。這才是應該benchmark的地方，要從他們懂得自己不懂得而著手，不是在記憶問題而返回答案

串文

2025-02-28 23:06

讚

回覆

轉發

作者

楊聰
_wingyeung_

粉絲

串文

307+

讚

回覆

轉發

24小時粉絲增長

發文前

發文後24小時

變化

0 (0.00%)

互動率

(讚 + 回覆 + 轉發) / 粉絲數

4.21%

回覆 (BETA)

最先回覆的內容
發文後	用戶	內容