Kimi K2里藏着DeepSeek V3？这暗示了什么？AI工具的未来会怎样改变？

2025-10-16 09:25:11 作者：Vali编辑部

Kimi新模型K2的热度持续攀升，不仅在多个基准测试中取得优异成绩，实际使用体验也获得广泛认可。这款模型在工具调用方面表现出色，被认为是自Claude 3.5 Sonnet发布以来，能够胜任生产力级别任务的优秀模型。与此同时，原本计划本周上线的OpenAI开源模型却因安全考量推迟，引发业界关注。不少用户猜测，这是否与K2的出现有关？

在持续发酵的讨论声中，Kimi工程师透露了更多关于模型的细节。不仅涉及技术层面，还回应了多项猜测。例如，开源确实有提升知名度的考量，但并不恨DeepSeek，只是这条路线不是自己验证的。从年初开始，Kimi已停止投流。值得一提的是，有用户发现K2背后采用的是DeepSeek V3架构。这些细节引发人们对K2开源背后考量的深入思考。

K2选择开源路线，背后有三大原因。首先，这是为了提升口碑。如果K2只是闭源服务，现在不会有如此多的关注和讨论。前车之鉴如Grok 4，能力越强，人们的预期越高，负面评价可能更多。其次，开源能借助社区力量完善技术生态。K2开源不到24小时，社区就出现了MLX实现、4bit量化等成果。要知道，K2开源的模型版本有两个：Kimi-K2-Base适合科研与自定义场景，Kimi-K2-Instruct在多数问答与Agent任务中表现优异。仅凭Kimi内部难以快速实现这些成果。

最重要的是，开源能倒逼模型进步。当开源要求不能走捷径时，反而更有利于做出更好的模型和产品。因为开源后，效果必须"可复现"，不能再靠各种技巧遮掩。只有当任何人拿到相同权重都能轻松复现结果，才算真正站得住脚。与此同时，工程师回应了关于Kimi"擅长营销投流"的传言。实际上，从今年年初开始，Kimi已停止投流。国内应用商店搜索Kimi甚至第一页都看不见，苹果App Store和国内搜索平台搜Kimi会推荐友商。即使在如此恶劣的互联网环境下，Kimi也没有恢复投流。

因为年初DeepSeek-R1的爆火证明，硬实力就是最好的推广。只要模型做得好，就会获得市场认可。工程师还透露了一个细节：年初反思会上，他提出了一些激进建议，没想到CEO杨植麟的行动比他想象的还要激进，如不再更新K1系列模型，集中资源搞基础算法和K2。这说明Kimi是少数仍在坚持投入基础模型研发的创业公司。即使在Agent爆火后，面对"Kimi不应该卷大模型，应该去做Agent产品"的质疑，Kimi仍在坚持这一方向。

工程师表示，绝大多数Agent产品，离了Claude以后什么都不是。2025年，智能的上限仍然完全由模型决定。作为以AGI为目标的公司，如果不去追求智能的上限，他一天也不会多呆下去。除了这些，工程师还提到Kimi团队在产品设计与底层能力构建上的深层思考。例如，在"写前端"功能上，AI写前端已达到"可用"水平。但传统聊天机器人输出Markdown，难以满足"排版成一页A4纸"的具体需求。因此，像上个月推出的Kimi Researcher功能，让AI能生成更丰富的网页内容。

在实测中，K2的表现令人印象深刻。用一句话提示"创建一个简单的breakout游戏作为单个html页面"，K2输出的代码比基础版本多出2.6倍，画面和玩法更丰富。生成贪吃蛇游戏时，虽然第一次输出难度较大，但通过调整参数后，游戏在速度和难度上都有明显改进。工具调用功能也表现出色，能生成包含车票、食宿安排的河北旅游攻略，并附上购票链接。创意写作功能同样亮眼，30分钟内就完成了一封"给宇宙和自己最后的告别信"。

关于K2背后采用DeepSeek V3架构的说法，工程师表示这是合理借鉴。虽然目前没有详细技术报告，但K2本身已用实际行动证明其技术实力。至于OpenAI推迟开源模型的传闻，CEO奥特曼称需要更多时间进行安全检测和审查高风险区域。但网友并不买账，最高赞评论直接指出，OpenAI的开源模型参数比K2小很多，但性能"超级强大"，只是因某些原因才在发布前发现问题。

K2的推出不仅展现了Kimi在AI领域的技术实力，更反映出当前AI行业竞争的激烈程度。从开源策略到实测表现，K2都展现了其独特的价值。随着更多用户和开发者参与，这款模型有望在未来的AI生态中扮演重要角色。