这两位设计师的灵感,究竟从何而来? 他们的作品,为何如此相似?

2025-10-22 08:35:34 作者:Vali编辑部

在大模型技术不断突破的背景下,梁文锋与杨植麟这对创业搭档再次在技术赛道上展开较量。4月30日,DeepSeek推出的Prover-V2模型在数学推理领域引发关注,其参数量达到671B,较前代版本提升近百倍。这个专门用于证明数学定理的模型在miniF2F测试中通过率达88.9%,成功解决PutnamBench测试的49道题目。

与此同时,月之暗面的Kimina-Prover也同步推出,该模型在miniF2F测试中通过率80.7%,PutnamBench测试成绩为10道题。对比来看,DeepSeek-Prover-V2在两项关键指标上均优于对手。两家公司都在技术报告中提及强化学习技术,DeepSeek的论文聚焦于子目标分解的强化学习方法,而月之暗面则强调基于强化学习的推理模型。

从技术演进路径看,DeepSeek的Prover系列模型自2024年3月开始更新,目前已迭代至V2版本。与之同步的代码模型Coder系列也在持续升级,从2024年4月至今已完成三次重大版本迭代。通用推理大模型R1的发布标志着DeepSeek在基础能力上的突破,其性能已接近OpenAI o1正式版水平。

在模型开发过程中,DeepSeek团队采用分阶段训练策略。Prover-V2-671B模型以DeepSeek-V3为基础进行微调,通过将复杂问题分解为子目标,结合逐步推理形成思维链,为强化学习提供初始冷启动。这种技术路线在数学推理领域展现出明显优势,算法工程师认为这为模型能力的验证提供了客观标准。

市场对DeepSeek的新模型充满期待,但挑战同样明显。阿里巴巴的开源模型正在快速追赶,其新发布的Qwen3模型参数量仅为DeepSeek-R1的三分之一,性能却全面超越。蔡崇信曾评价DeepSeek展现出开源价值,但行业观察人士指出,当前大模型领域需要更多竞争者推动技术进步。

在商业层面,Kimi面临来自豆包和腾讯元宝的激烈竞争。QuestMobile数据显示,Kimi月活在2024年11月突破2000万,但随后被豆包超越。腾讯元宝通过微信引流和大量广告投放,在短时间内实现用户增长,成为排名第三的AI产品。这反映出大模型产品的市场表现不仅取决于技术,更与运营策略密切相关。

百度作为另一重要玩家,其文心4.5 Turbo和深度思考模型X1 Turbo在性能和成本方面表现出色。李彦宏在发布会上指出,DeepSeek虽然在数学推理领域表现突出,但存在处理多模态内容能力不足、幻觉率较高等问题。这种技术对比凸显出大模型在不同应用场景中的差异化优势。

从产业格局看,开源已成为大模型竞争的重要抓手。阿里巴巴的通义大模型已开源200余个模型,全球下载量超3亿次,衍生模型超过10万个。这种开源策略不仅提升了技术影响力,也加速了技术普及。多位创业者认为,大模型领域需要多个领先产品共同推动行业发展。

在技术演进的道路上,DeepSeek和Kimi的较量仍在继续。无论是数学推理的深度探索,还是多模态能力的拓展,这些竞争者都在为AGI的实现铺路。随着更多玩家加入开源竞赛,大模型技术标准的制定将进入关键阶段。这场持续的技术博弈,最终将决定人工智能发展的未来方向。