2025-01-30 08:52
最近討論到「每個線上的 AI 工具都會搜集資料,有需要特別針對 DeepSeek 嗎?」順便把討論過程記下:
無論如何,大原則永遠是不要真的相信雲端服務能夠保護好使用者的關鍵隱私資料,尤其是那些從資料榨取更多價值的企業。例如 chatGPT 3.5 時期就在聊天介面被汲取出訓練資料(包含真實企業的資訊),現在的免費方案使用者輸入的內容,也還是會被拿去訓練使用。我因此從來只給它寫程式碼範例、整理網路上到處都有的資料(例如附圖的服務條款比較),避免將研究資料集交給它處理。
再細究 openai 與 deepseek 的差異,雖然科技公司都會榨取使用者的隱私挪作他用,但資料託管的伺服器地理位置有別,終究會因為數位主權的強弱有再一步外洩出去的差異。例如中國企業對於政府索資的抵抗能力遠低於美國企業,甚至要主動協助「维护网络清朗」(也因此中國更可能出現全網封殺的情況),所以百度比 Google 更不能信任。
開源與否不過是工具能架設在哪裡的差別,只是影響安全性的其中一個因素。科技公司的掠奪秉性與周遭制度是更關鍵的兩個變項,沒辦法依據前者或後者就下結論,得從自身對資料的掌控與威脅建模去綜合評估