AI模型训练,数据够用吗? 算力成本,老板能接受吗?
AI人才争夺战已经演变成一场技术与人才的双重较量。当各大科技公司开始从各自阵营中抽调核心力量时,这场竞争的激烈程度远超想象。从基础研究到商业落地,从算法创新到工程实践,每一个环节都成为争夺焦点。
去年开始,科技巨头们纷纷调整战略,把人才招揽提上日程。腾讯推出"青云计划",用业界顶尖薪资和无职级限制的晋升通道吸引人才,同时新增2.8万实习岗位储备力量;字节跳动启动"Top Seed计划",专门为大模型、多模态等前沿领域开放博士岗位。相比这些新生力量,经验丰富的核心骨干成了各方争夺的重中之重。
在这一波人才争夺中,阿里巴巴通义实验室的变动尤为引人注目。最近应用视觉团队负责人薄列峰离职的消息传出后,引发业内热议。这已是继2月语音团队负责人鄢志杰、2024年8月大模型技术负责人周畅之后,阿里AI核心部门第三次失去关键人物。这些带着阿里技术基因的核心人才,或投奔其他大厂,或另立门户,成为行业暗战中的新变量。
通义实验室,一个被实战验证过的人才库
在通义之前,业界公认的AI"黄埔军校"是微软亚洲研究院(MSRA)。两者在培养顶尖人才摇篮的路径上,的确有不少相似之处。自1998年成立以来,MSRA为中国乃至全球AI领域输送了诸多关键人物,李开复、沈向洋、张宏江、陆奇、王坚等都出自这里。MSRA是初代由强大科技公司支持并投身于长期技术研究的组织。
而通义之所以能成为新的人才输出"富矿",根基也在于强大的母体支持与长期的战略布局。2017年10月马云在云栖大会宣布成立达摩院时,就为这个机构注入了千亿资金,立志打造"致力于探索科技未知,以人类愿景为驱动力的研究院"。在时任院长张建锋(花名:行癫)负责之下,机器智能、数据计算等五大实验室迅速铺开。这一举措的背后,是互联网大厂试图复制新一代"微软亚研院"的时代雄心。
相较于其他大厂的AI团队,由达摩院孵化而来的通义实验室,在顶尖人才密度、前沿技术探索和研究体系的系统性上,从一开始就建立了优势。相较字节跳动般从内部抽调并辅以外部引援组建独立的Seed大模型团队,腾讯在既有AI Lab基础上修补增益的路径,客观来看通义实验室的布局的确更早,带来了更丰富的积累。
达摩院当初也成为国内最早嗅到并全力投入大模型浪潮的团队之一。在OpenAI的GPT系列引爆全球之前,达摩院内部已启动大模型研究,并推出了M6等早期探索性模型。这种"跟进早、持续投入"的战略路径,使得通义在后续的大模型竞赛中,能够更快拿出具备竞争力的产品来跟进。
之后Qwen的演进更是验证了通义更早的积累的重要性。它今天不仅在多个权威Benchmark上取得了与国际顶尖模型(如GPT-4、LLaMA系列)相媲美甚至超越的成绩,更关键的是,在达摩院时期阿里就已经开始把开源作为重要的技术竞争策略,甚至做了诸多基于开源的商业化尝试,这让后来阿里把Qwen系列中的多个版本(从1.8B到72B,乃至更大参数的闭源版本)进行开源的决策更加顺畅。
许多开发者反馈,Qwen在代码生成、长文本理解、多轮对话等方面的表现令人印象深刻。这种来自一线开发者的"用脚投票",从侧面印证了通义团队在模型架构设计、训练数据构建、以及优化调优等方面的积累。
在模型性能之外,通义团队的一大特点,还在于研究方向覆盖面广,几乎涵盖了AI技术的各个关键维度——从自然语言处理到计算机视觉,从语音识别到多模态融合,在各个细分赛道都积累了技术人才。这些更早发生,且与阿里其他真实业务场景结合更紧密的技术研发积累,让通义成为了一个被实战验证过的人才库。当ChatGPT突然闯出后,这些真正有过丰富经验的人才就成了香饽饽。
大厂间挖角,人才流动是否会带来格局变动?
与MSRA诞生时,中国AI产业尚处萌芽,更侧重基础研究与人才启蒙的时代背景不同,通义成长于AI产业化竞争已趋白热化的阶段。这决定了通义的模型研发从一开始就更紧密地围绕市场需求与商业化落地展开。因此,从通义流出的技术人才,往往具备"即插即用"的实战能力和丰富的工程经验,一旦加入核心竞争对手阵营或另立门户,无疑会成为撬动行业现有格局的潜在变量。
比如周畅作为通义千问大模型的技术负责人之一,深度参与了Qwen系列模型从架构设计到训练优化的核心环节。他当时的出走,给接收方带来了战术上的优势。鄢志杰的离职也引发业内对通义人才储备的担忧。这些核心人物的流动,直接影响着技术路线的延续性。
对于试图通过"挖角"核心人才来快速弥补自身短板、甚至复制一个"小通义"的大厂或创业公司而言,只是挖人并非一条坦途。通义基于"研究院"土壤成长起来的独特AI研究氛围,以及阿里集团提供的海量真实业务场景、强大的算力支持和长期战略投入,是其成功的关键因素。
这让竞争变得更加复杂,阿里云 CTO 兼阿里通义实验室负责人周靖人曾强调:"现在模型研发不仅是模型、算法层的创新,而是个长期系统工程,要有坚定投入的耐心,今天做、明天停,对团队影响很大。阿里在通义千问上的投入是非常坚定的。" 这基本也说明仅靠挖人难以构建起真正的核心竞争力,它背后要做的是一个复杂庞大的系统工程。
对手人才流出可能在短期内为接收方带来战术上的优势,但长期来看,行业格局的变动更多取决于各玩家自身战略的清晰度、执行的彻底性、以及构建可持续创新体系的能力。对各家公司而言,真正的考验并非如何单纯"留人"与"抢人",而是在持续的技术创新与开放生态中,如何巩固并提升自己的独特文化和竞争力。这盘棋,远比"抢人大战"复杂得多。