这两位设计师的灵感，究竟从何而来？他们的作品，为何如此相似？

2025-10-22 08:35:34 作者：Vali编辑部

在大模型技术不断突破的背景下，梁文锋与杨植麟这对创业搭档再次在技术赛道上展开较量。4月30日，DeepSeek推出的Prover-V2模型在数学推理领域引发关注，其参数量达到671B，较前代版本提升近百倍。这个专门用于证明数学定理的模型在miniF2F测试中通过率达88.9%，成功解决PutnamBench测试的49道题目。

与此同时，月之暗面的Kimina-Prover也同步推出，该模型在miniF2F测试中通过率80.7%，PutnamBench测试成绩为10道题。对比来看，DeepSeek-Prover-V2在两项关键指标上均优于对手。两家公司都在技术报告中提及强化学习技术，DeepSeek的论文聚焦于子目标分解的强化学习方法，而月之暗面则强调基于强化学习的推理模型。

从技术演进路径看，DeepSeek的Prover系列模型自2024年3月开始更新，目前已迭代至V2版本。与之同步的代码模型Coder系列也在持续升级，从2024年4月至今已完成三次重大版本迭代。通用推理大模型R1的发布标志着DeepSeek在基础能力上的突破，其性能已接近OpenAI o1正式版水平。

在模型开发过程中，DeepSeek团队采用分阶段训练策略。Prover-V2-671B模型以DeepSeek-V3为基础进行微调，通过将复杂问题分解为子目标，结合逐步推理形成思维链，为强化学习提供初始冷启动。这种技术路线在数学推理领域展现出明显优势，算法工程师认为这为模型能力的验证提供了客观标准。

市场对DeepSeek的新模型充满期待，但挑战同样明显。阿里巴巴的开源模型正在快速追赶，其新发布的Qwen3模型参数量仅为DeepSeek-R1的三分之一，性能却全面超越。蔡崇信曾评价DeepSeek展现出开源价值，但行业观察人士指出，当前大模型领域需要更多竞争者推动技术进步。

在商业层面，Kimi面临来自豆包和腾讯元宝的激烈竞争。QuestMobile数据显示，Kimi月活在2024年11月突破2000万，但随后被豆包超越。腾讯元宝通过微信引流和大量广告投放，在短时间内实现用户增长，成为排名第三的AI产品。这反映出大模型产品的市场表现不仅取决于技术，更与运营策略密切相关。

百度作为另一重要玩家，其文心4.5 Turbo和深度思考模型X1 Turbo在性能和成本方面表现出色。李彦宏在发布会上指出，DeepSeek虽然在数学推理领域表现突出，但存在处理多模态内容能力不足、幻觉率较高等问题。这种技术对比凸显出大模型在不同应用场景中的差异化优势。

从产业格局看，开源已成为大模型竞争的重要抓手。阿里巴巴的通义大模型已开源200余个模型，全球下载量超3亿次，衍生模型超过10万个。这种开源策略不仅提升了技术影响力，也加速了技术普及。多位创业者认为，大模型领域需要多个领先产品共同推动行业发展。

在技术演进的道路上，DeepSeek和Kimi的较量仍在继续。无论是数学推理的深度探索，还是多模态能力的拓展，这些竞争者都在为AGI的实现铺路。随着更多玩家加入开源竞赛，大模型技术标准的制定将进入关键阶段。这场持续的技术博弈，最终将决定人工智能发展的未来方向。

这两位设计师的灵感，究竟从何而来？ 他们的作品，为何如此相似？

这两位设计师的灵感，究竟从何而来？他们的作品，为何如此相似？