Kimi K2里藏着DeepSeek V3?这暗示了什么?AI工具的未来会怎样改变?

2025-10-16 09:25:11 作者:Vali编辑部

Kimi新模型K2的热度持续攀升,不仅在多个基准测试中取得优异成绩,实际使用体验也获得广泛认可。这款模型在工具调用方面表现出色,被认为是自Claude 3.5 Sonnet发布以来,能够胜任生产力级别任务的优秀模型。与此同时,原本计划本周上线的OpenAI开源模型却因安全考量推迟,引发业界关注。不少用户猜测,这是否与K2的出现有关?

在持续发酵的讨论声中,Kimi工程师透露了更多关于模型的细节。不仅涉及技术层面,还回应了多项猜测。例如,开源确实有提升知名度的考量,但并不恨DeepSeek,只是这条路线不是自己验证的。从年初开始,Kimi已停止投流。值得一提的是,有用户发现K2背后采用的是DeepSeek V3架构。这些细节引发人们对K2开源背后考量的深入思考。

K2选择开源路线,背后有三大原因。首先,这是为了提升口碑。如果K2只是闭源服务,现在不会有如此多的关注和讨论。前车之鉴如Grok 4,能力越强,人们的预期越高,负面评价可能更多。其次,开源能借助社区力量完善技术生态。K2开源不到24小时,社区就出现了MLX实现、4bit量化等成果。要知道,K2开源的模型版本有两个:Kimi-K2-Base适合科研与自定义场景,Kimi-K2-Instruct在多数问答与Agent任务中表现优异。仅凭Kimi内部难以快速实现这些成果。

最重要的是,开源能倒逼模型进步。当开源要求不能走捷径时,反而更有利于做出更好的模型和产品。因为开源后,效果必须"可复现",不能再靠各种技巧遮掩。只有当任何人拿到相同权重都能轻松复现结果,才算真正站得住脚。与此同时,工程师回应了关于Kimi"擅长营销投流"的传言。实际上,从今年年初开始,Kimi已停止投流。国内应用商店搜索Kimi甚至第一页都看不见,苹果App Store和国内搜索平台搜Kimi会推荐友商。即使在如此恶劣的互联网环境下,Kimi也没有恢复投流。

因为年初DeepSeek-R1的爆火证明,硬实力就是最好的推广。只要模型做得好,就会获得市场认可。工程师还透露了一个细节:年初反思会上,他提出了一些激进建议,没想到CEO杨植麟的行动比他想象的还要激进,如不再更新K1系列模型,集中资源搞基础算法和K2。这说明Kimi是少数仍在坚持投入基础模型研发的创业公司。即使在Agent爆火后,面对"Kimi不应该卷大模型,应该去做Agent产品"的质疑,Kimi仍在坚持这一方向。

工程师表示,绝大多数Agent产品,离了Claude以后什么都不是。2025年,智能的上限仍然完全由模型决定。作为以AGI为目标的公司,如果不去追求智能的上限,他一天也不会多呆下去。除了这些,工程师还提到Kimi团队在产品设计与底层能力构建上的深层思考。例如,在"写前端"功能上,AI写前端已达到"可用"水平。但传统聊天机器人输出Markdown,难以满足"排版成一页A4纸"的具体需求。因此,像上个月推出的Kimi Researcher功能,让AI能生成更丰富的网页内容。

在实测中,K2的表现令人印象深刻。用一句话提示"创建一个简单的breakout游戏作为单个html页面",K2输出的代码比基础版本多出2.6倍,画面和玩法更丰富。生成贪吃蛇游戏时,虽然第一次输出难度较大,但通过调整参数后,游戏在速度和难度上都有明显改进。工具调用功能也表现出色,能生成包含车票、食宿安排的河北旅游攻略,并附上购票链接。创意写作功能同样亮眼,30分钟内就完成了一封"给宇宙和自己最后的告别信"。

关于K2背后采用DeepSeek V3架构的说法,工程师表示这是合理借鉴。虽然目前没有详细技术报告,但K2本身已用实际行动证明其技术实力。至于OpenAI推迟开源模型的传闻,CEO奥特曼称需要更多时间进行安全检测和审查高风险区域。但网友并不买账,最高赞评论直接指出,OpenAI的开源模型参数比K2小很多,但性能"超级强大",只是因某些原因才在发布前发现问题。

K2的推出不仅展现了Kimi在AI领域的技术实力,更反映出当前AI行业竞争的激烈程度。从开源策略到实测表现,K2都展现了其独特的价值。随着更多用户和开发者参与,这款模型有望在未来的AI生态中扮演重要角色。