DeepSeek-R1 真的能写代码？它和 OpenAI 相比，哪个更实用？

2025-10-20 09:10:38 作者：Vali编辑部

今天要给大家带来一个重磅消息，DeepSeek-R1正式上线并同步开源模型权重。这款模型采用MIT许可证，用户可以直接利用它训练出新的模型，甚至还能通过蒸馏技术打造更轻量化的版本。我们特别开放了API接口，只要在调用时设置model='deepseek-reasoner'参数，就能获得完整的思维链输出。官网和App的更新版本也已经同步上线，方便用户随时体验。

这款模型在后训练阶段大规模使用了强化学习技术，仅用极少标注数据就显著提升了推理能力。在数学、代码和自然语言推理等任务中，表现已经能和OpenAI o1正式版媲美。特别值得一提的是，我们还公开了全部训练技术，希望推动技术社区的交流与创新。

在模型架构方面，我们同步推出了DeepSeek-R1-Zero和DeepSeek-R1两个660B参数版本。更令人惊喜的是，通过R1的输出，我们还蒸馏出了6个更小的模型，其中32B和70B版本在多项能力上已经能对标OpenAI o1-mini的表现。这些模型的开源无疑会为开发者提供更多选择。

为了让技术更易传播，我们对开源协议进行了优化。所有模型权重都采用标准化的MIT许可证，完全开源且不限制商用。用户协议也明确支持模型蒸馏，这意味着开发者可以自由利用模型输出训练其他模型。这种开放的授权方式让技术传播更加顺畅。

在实际使用场景中，登录官网或App后，打开"深度思考"模式就能调用最新版DeepSeek-R1完成各类推理任务。对于需要频繁调用的用户，API服务提供了灵活的定价方案：每百万输入tokens收费1元（缓存命中）或4元（缓存未命中），输出tokens则按16元/百万计费。详细的调用指南可以参考官方文档。

我们特意进行了实测，用之前体验Claude3.7的prompt测试效果。这个任务要求用HTML、CSS和基础JavaScript实现带动画效果的天气卡片，同时要动态更新时间和天气信息。结果显示，DeepSeek-R1在十几秒内就完成了生成，效果明显优于之前版本。设计细节和交互动画都表现得非常在线。

这次更新很可能已经应用了3月发布的DeepSeek-V3-0324模型，这个新版本参数达到685B，编程能力有明显提升。从测试结果看，R1的编程能力确实有了显著增强，甚至可能和刚发布的Claude 4不相上下。这种进步对于需要处理复杂代码任务的用户来说是个好消息。

DeepSeek-R1的推出不仅展示了模型性能的突破，更重要的是为开发者提供了更多选择。从开源协议到API定价，从模型架构到实际应用，每个环节都经过精心设计。这种开放共享的态度，让技术进步能够更快地惠及更多用户。相信随着更多开发者加入，这个生态会不断壮大，带来更多创新可能。

对于需要AI鞋履或AI服装工具的用户来说，DeepSeek-R1的这些特性也值得关注。无论是处理复杂的设计需求，还是进行快速的原型推演，这款模型都能提供有力支持。特别是在需要结合多种技术手段完成任务时，其强大的推理能力和灵活的调用方式会带来显著优势。

总的来说，DeepSeek-R1的发布标志着AI技术又向前迈进了一步。从模型性能到开源生态，从实际应用到未来潜力，每个方面都展现出强大的竞争力。相信随着更多开发者和用户的加入，这个平台会不断成长，为AI工具市场带来更多可能性。