英伟达新科学家是谁? 95后清华毕业,未来会怎样?
老黄的「抢人」动作再次引发行业震动。这位英伟达创始人近日现身加州圣克拉拉总部园区,与两位华人AI大神Banghua Zhu和Jiantao Jiao合影曝光。两位专家的加入,不仅让NVIDIA的星河计划(Star Nemotron)团队阵容更加壮大,也标志着英伟达在企业级智能体领域的布局进入新阶段。
从照片背景来看,两人很可能在NVIDIA的Voyager大楼工作。老黄这次没有穿标志性的皮衣,而是以更低调的姿态将两位重量级人才纳入麾下。这两位专家曾共同创办Nexusflow,这家企业专注于为企业级应用场景提供智能体解决方案。他们的背景堪称硬核——Banghua Zhu是华盛顿大学电子与计算机工程系助理教授,Jiantao Jiao则是加州大学伯克利分校电子工程与计算机科学系助理教授,同时担任伯克利CLIMB联合主任。
从技术角度看,这两位专家的加入对英伟达来说意义重大。Banghua Zhu曾带领团队开发出Starling-7B、Athene系列等多款模型,其中Athene-70B在Chatbot Arena上的Elo评分提升30多分,显示出强大的多语言处理能力。Jiantao Jiao则深耕生成式AI与基础模型领域,涵盖从数据策管到模型安全护栏的全链条技术。他们的加入,无疑为NVIDIA的智能体研发注入了新的活力。
在模型训练领域,Banghua Zhu的团队开发了Nectar数据集和创新性奖励模型训练算法。Starling-7B在Mistral系列7B模型中排名靠前,显示出其在对话理解方面的优势。Athene-V2-72B-Chat在多个基准测试中与GPT-4o直接对标,尤其在复杂函数调用任务中表现突出。这些成果为英伟达构建企业级智能体提供了坚实的理论基础。
Jiantao Jiao的研究方向同样值得关注。他主导的RLHF技术优化方案,提出了更优样本复杂度的奖励模型训练算法,这在模型训练效率方面具有重要意义。同时,他在大语言模型水印技术上的突破,为模型版权保护提供了新思路。这些技术积累,正是英伟达打造端到端智能体解决方案的关键。
从行业趋势来看,英伟达的这一动作并非偶然。NVIDIA此前推出的Nemotron系列,已经展现出多模态推理和工具接口能力。通过细分Nano/Super/Ultra三档算力梯度,为开发者和企业提供「业务级」Agent底座。两位专家的加入,正好补足了企业级智能体研发所需的理论和技术双重支撑。
值得注意的是,老黄对华人人才的重视程度。他在多个场合表示,中国研究人员是「世界级」的,美国公司正在大量引进这类人才。这次招聘动作,或许正是为了防止人才外流。结合何恺明入职谷歌、Meta挖走OpenAI苏黎世团队等事件,这场AI人才争夺战才刚刚拉开序幕。
在模型评估方面,Banghua Zhu团队开发的Arena-Hard-Auto系统,采用「大语言模型即裁判」模式,大幅提升了评估效率。这种自动化评估方式,为英伟达构建统一的智能体性能评价体系提供了可能。同时,基于代理模型的偏好评估系统,其结果与强化学习最终性能高度相关,为模型优化提供了重要参考。
Jiantao Jiao在模型服务领域的贡献同样显著。他提出的模型路由与缓存算法,显著提升了推理效率。S-Lora框架能够同时服务数千个LoRA适配器,这种高并发处理能力,为大规模智能体部署提供了技术保障。这些创新成果,正是英伟达打造智能体生态系统的基石。
从战略角度看,英伟达的这一系列动作预示着其在智能体领域的野心。通过整合学术界与产业界的顶尖人才,构建从基础研究到应用落地的完整生态。这种「软硬通吃」的布局,不仅能满足企业级智能体的多样化需求,也为开发者提供了更强大的工具支持。
在AI人才争夺战中,英伟达的表现令人期待。两位专家的加入,既是对Nexusflow技术成果的认可,也是对英伟达企业级智能体战略的有力支撑。随着技术的不断突破,这场由老黄发起的「抢人大战」,或许将重塑整个AI产业的竞争格局。