梁文锋到底有什么特别？他的动态值得持续关注吗？

2025-10-22 09:20:59 作者：Vali编辑部

五月将至，全球AI领域迎来新一轮技术博弈。中美科技巨头在四月中旬动作频频，OpenAI接连发布GPT-4.1系列模型，谷歌推出Gemini 2.5混合推理模型，豆包在杭州巡展中展示1.5深度思考模型。与此同时，阿里团队也在紧锣密鼓准备下一代大模型Qwen3。这场无声的科技竞赛中，DeepSeek团队动作频频，其最新动态引发业内广泛关注。

近期，全球最大AI开源社区Hugging Face CEO Clément Delangue在社交平台发布一条耐人寻味的动态。这条由三个眼睛表情符号组成的简短信息，附带DeepSeek团队在Hugging Face平台的官方资源库入口，迅速在科技圈掀起热议。业内普遍认为，这暗示DeepSeek R2模型已进入发布倒计时。

近半个月来，关于DeepSeek R2模型的消息持续发酵。除HuggingFace CEO的动态外，玩家@deedydas在社交平台披露了所谓R2大模型的技术参数：1.2万亿参数规模，780亿活跃参数采用混合MoE架构，训练成本较GPT-4o降低97.3%，5.2PB训练数据支撑，在C-Eval2.0测试中取得89.7%得分，视觉能力在COCO测试集达到92.4%。这些数据引发行业高度关注。

凤凰网科技就相关消息向DeepSeek求证，对方暂未回应。有接近DeepSeek的知情人士透露，目前网传消息真实性有待验证。但结合其产品迭代规律和产业链动态，五月发布新品的传闻并非空穴来风。据《中国企业家》报道，DeepSeek团队自2024年9月推出V2.5版本，12月发布V3基础架构，次年3月升级至V3-0324版本，形成每季度重大更新的开发节奏。

这种紧跟行业节奏的研发策略，使得业界普遍预测其下一代主力模型R2或将延续"五一档"发布传统。路透社披露的研发动向印证了这一猜测：DeepSeek正在加速R1模型后续产品R2的研发进程，原计划5月初发布，现希望尽早推出。更值得关注的是技术演进方向，业内人士推测R2在代码生成和多语种推理能力方面将有显著提升。

这一预期并非无中生有。今年三月发布的V3-0324版本已展现惊人实力，根据Artificial Analysis Intelligence Index最新评测，该模型成为得分最高的非推理模型，在基准测试中力压Google Gemini 2.0 Pro、Anthropic Claude 3.7 Sonnet及Meta Llama 3.3 70B等顶尖模型。这种技术积淀与迭代速度，使得R2尚未发布便已承载全球AI界的较高期待。

无论前述传闻最终是否成真，可以预见的是，当这款新模型正式亮相时，或将改写新一轮全球算法与算力生态格局。在国产AI大模型赛道暗流涌动的当下，DeepSeek创始人梁文锋的每一步都走得很稳。他曾说过："中国也要逐步成为创新贡献者，而不是一直搭便车。"

尽管近期DeepSeek在公众视野中保持低调，但梁文锋始终朝着核心使命努力，那就是探索通用人工智能的本质。多位接触过DeepSeek团队的人士认为，梁文锋的志向不在服务好用户和做好产品，而是直指终极AGI。

这让他在早年间试探性接触资方时，优先排除了有退出顾虑的机构，主要依托自有资金。一位早期接触过DeepSeek的机构对凤凰网科技表示，梁文锋很早就发现Chatbot产品的可替代性很强，"现在的产品都没有黏性，所以只要技术强随时可以把用户抢过来"。DeepSeek R1的发布也的确证实了这一观点。

DeepSeek的最后一次模型更新发布是在今年3月，推出V3-0324版本，被视为R2的基础模型。该版本针对性能、用户体验和实用性进行了优化，通过6850亿参数的MoE架构升级，代码能力显著增强，再次深度影响全球市场。因此5月或将发布的旗舰模型R2，也被视为影响全球AI格局的关键落子。

特别需要说明的是，这一技术攻坚的窗口期，恰逢国产芯片产业剧变。美国对英伟达H20芯片的出口禁令，直接斩断中国AI企业获取高端GPU的主渠道，倒逼华为昇腾910C、寒武纪MLUarch04等国产芯片加速填补市场空白。

清程极智的CEO汤雄超曾对凤凰网科技表示，作为当前开源市场所能用到的最好模型，DeepSeek和最难获取的芯片一度是深度捆绑的。此前DeepSeek开源周所呈现的，其推出了一系列针对英伟达H卡的算力优化方案。

这让梁文锋在早年间曾表达："我们真正的挑战从来不是资金，而是高端芯片的出口禁令。"但禁令也从未真正束缚其技术野心，"英伟达的GPU没有什么神秘之处，但要赶上他们，就必须重建团队、付出时间和成本，追赶下一代技术——这才是真正的护城河。"梁文锋表示。

多位国产算力产业从业人士也对凤凰网科技表示，当前国产生态已在加速迭代中。本次DeepSeek新一代旗舰模型发布，也或将存在另一变量，即在推理侧深度适配国产算力。

当前，千行百业都展现出了旺盛的大模型部署需求，但正如李彦宏所言，DeepSeek最大的问题就是又慢又不稳定。如何才能获取到稳定的、便宜的满血版DeepSeek，这不仅仅是行业需要解决的问题，更需要DeepSeek官方加入其中。

值得一提的是，凤凰网科技从行业人士处了解到，DeepSeek已经正在和一些国产芯片合作，"国产芯片中有些头部的，实际上已经在和DeepSeek合作了"。但对于合作的进展，以及R2可能满足的情况，目前尚不能得知更多细节。