DeepSeek如果是偷用OpenAI训练好的data来进行training,那就彻底解释了为何短时间内就有高质量model。因为这是弯道超车,犹如比赛跑步时偷偷减少了几个环。因为training on real data是很多很多noise 的,要如何筛选则要很反复地不停optimise,如果你拿了筛选好的data,那肯定你的模型很快就掌握了好的答案。
但是话说回来,如果proton买了日本mitsubishi 的旧款引擎,很短时间内就有了国产车,其实我们是买了人家mitsubishi 花了很多年才能做到的成果,但不影响我们跃升世界第十一个独立汽车自主研发设计和出产国。
你说万一DeepSeek 是给钱subscribe了ChatGPT的服务,那就算不光彩,也是合法的呀。