發現一點目前可能還沒有人提到的： DeepSeek R1 這個模型在技術上的特點，是具有「思維鏈」的能力，可以進行所謂的「推理」。但這不代表這個模型輸出的答案就會是客觀正確的，特別是具有價值觀選擇的問題！因為模型在訓練的時候，就有可以依照情境，用不同的思考標準來回答，把模型訓練成「雙標仔」。透過實際測試開源的 deepseek-r1: 70b 版本，檢視其中 <think> 標籤，這個內容就是模型自己看但不輸出給使用者的「思考過程」，會發現：當分析一個國家是否民主這個問題時，針對中國與美國，DeepSeek R1 自動內建了滿滿的中國價值觀，兩套不同的標準！真的是不折不扣的雙標仔！這樣的能力，會比起之前單純的透過敏感詞過濾與語料知識篩選，更具認知作戰的威脅性！使用這個開源模型做應用，做再訓練或微調，不得不慎！ Meta 是不是要趕快發表具有推理能力的 LLaMA 4 了？

串文

2025-01-29 03:59

讚

回覆

轉發

作者

粉絲

889

串文

570+

讚

回覆

轉發

24小時粉絲增長

發文前

823

發文後24小時

830

變化

+7 (0.85%)

互動率

(讚 + 回覆 + 轉發) / 粉絲數

2.25%

回覆 (BETA)

最先回覆的內容
發文後	用戶	內容
13 小時內	Jack C Kaka jackckaka	@raycw 厲害，原來ds 展現出來的思考過程，另有一個暗影版本，不得不防