Threadser.net
2025-01-29 03:59
發現一點目前可能還沒有人提到的: DeepSeek R1 這個模型在技術上的特點,是具有 「思維鏈」的能力,可以進行所謂的「推理」。 但這不代表這個模型輸出的答案就會是客觀正確的,特別是具有價值觀選擇的問題!因為模型在訓練的時候,就有可以依照情境,用不同的思考標準來回答,把模型訓練成「雙標仔」。 透過實際測試開源的 deepseek-r1: 70b 版本,檢視其中 <think> 標籤,這個內容就是模型自己看但不輸出給使用者的「思考過程」,會發現: 當分析一個國家是否民主這個問題時,針對中國與美國,DeepSeek R1 自動內建了滿滿的中國價值觀,兩套不同的標準!真的是不折不扣的雙標仔! 這樣的能力,會比起之前單純的透過敏感詞過濾與語料知識篩選,更具認知作戰的威脅性!使用這個開源模型做應用,做再訓練或微調,不得不慎! Meta 是不是要趕快發表具有推理能力的 LLaMA 4 了?
17
回覆
2
轉發
1

作者

粉絲
889
串文
570+

回覆

轉發

24小時粉絲增長

發文前

823

發文後24小時

830

變化

+7 (0.85%)

互動率

(讚 + 回覆 + 轉發) / 粉絲數
2.25%