2025-01-29 01:18
雖然昨晚有個迷因笑稱日本對於 DeepSeek 的話題毫不關心。
但其實日本 CyberAgent 集團(迷錯,就是 GBF & 馬娘的母集團),在昨天公開了使用日文數據進行增量訓練,基於 DeepSeek-R1-Distill-Qwen-14B/32B 架構的 LLM 模型。
它們表示未來也將持續透過開源與產學合作來為日本國內的技術進行貢獻。
而這幾天日本網路社群的反應大致上是這樣:
DeepSeek 登場
↓
它竟然說尖閣諸島(釣魚台)是中國的!
↓
CyberAgent 公開 DeepSeek R1 蒸餾版模型
↓
擔心 CyberAgent 版的回答會與中國立場接近
↓
在沒有 Injection 的狀態下問 DeepSeek R1 關於台灣國家定位問題
↓
不但願意回答,而且比 Copilot 的回覆要來得更仔細 ←現在到這