智能服装鞋履,未来趋势在哪?这些大厂,究竟图什么?

2025-10-12 10:40:17 作者:Vali编辑部

AI具身智能:谁在领跑这场未来之战?

撰文 | 程书书编辑 | 李信题图 | 豆包 AI

2023年5月,英伟达创始人黄仁勋在ITF World半导体大会上断言:"AI的下一个浪潮是具身智能。" 这个判断迅速被产业趋势验证,从春晚舞台上扭秧歌的机器人,到机器人大会上跳舞打拳的机械臂,具身智能正以惊人的速度走进公众生活。

图源:春晚视频截图

这个关乎未来的赛道,腾讯、阿里、字节、京东、美团等互联网巨头悉数入场,它们不再满足于云端的算法竞争,而是希望将AI"装进身体"。投资、自研、生态共建……一场AI时代的"抢滩登陆战"已经打响。

一、具身智能到底是什么?

具身智能的概念最早可追溯至1950年,根据全国科学技术名词审定委员会定义,具身智能(Embodied Artificial Intelligence, EAI)是指一种基于物理实体进行感知和行动的智能系统。这类系统通过智能体与环境的交互获取信息、理解问题、作出决策并执行行动,从而展现出智能行为和适应性。

与传统人工智能存在明显差异,后者主要存在于计算机程序、云端服务器中,依赖抽象的符号计算和数据处理。而具身智能更注重通过物理实体的感知、运动以及与外部环境的交互实现认知,形成"感知-思考-行动"的闭环。

现在很多人将具身智能等同于人形机器人,实际上,具身智能系统的实现形式并不局限于人形结构。比如具备环境感知能力的智能扫地机器人、用于高空作业的无人机、已进入路测阶段的自动驾驶汽车等,都是具身智能的具体应用载体。

2022年12月,谷歌发布机器人大模型RT-1,"大模型+机器人"概念兴起。随后,微软于2023年2月发表论文,公布ChatGPT应用于机器人的研究成果,展示了大模型提升机器人人机交互能力的潜力。

同年7月,基于RT-1研究成果,Google融合了视觉语言模型(VLM)和RT-1中收集的大量机器人真实动作数据,提出了视觉语言动作(VLA)模型RT-2。这个模型可以从网络和机器人数据中学习到大量知识,并将这些知识转化为机器人控制的通用指令。使得机器人也能像ChatGPT一样理解自然语言,并根据自然语言做出一系列动作,能数学推理、能辨认人物、也能泛化到各种新环境、新任务。

RT-2展现出的各项能力,刷新了大众对传统机器人模型的认知,也让市场看到了通过堆叠人工智能(AI)算力,可以实现人机多轮交互的高度智能化。不仅能完成文本、图片甚至视频生成,还能应用到硬件尤其是具有运动能力的硬件上——即所谓的"具身智能",其中最直观的产品就是人形机器人。

不久前的2025世界机器人大会发布了《人形机器人十大潜力应用场景》,描绘了人形机器人应用于各行各业的未来图景,包括工业通用操作、汽车制造、3C制造、船舶制造、石油化工、电力生产、安全应急、商业服务等。

图源:2025世界机器人大会

随着技术不断成熟和应用场景持续拓展,具身智能有望成为继移动互联网之后的下一个重要技术平台。对大厂们来说,如何平衡投资成本与回报周期,还有实现技术突破与商业落地的有效结合,将成为决定其战略成败的关键。

二、谁在领跑这场未来之战?

如果说美团是"早布局",那京东则以"快节奏、高密度"著称。曾一日(7月21日)内宣布领投逐际动力、众擎机器人、千寻智能三家具身智能企业,两个月内领投5家。

京东的投资聚焦"硬件+大脑"与"量产能力",核心目标明确:服务于自身的零售与物流体系。例如,逐际动力推出的LimX VGM技术,可通过人类操作视频实现机器人行为学习,无需真机样本即可泛化部署,其TRON 1双足机器人已在巡检、安防、配送等场景开展规模化应用。众擎机器人则已完成产品量产,正加速推进规模化交付,计划将生产团队能力提升五倍。

不仅如此,京东还同步推进自研布局:2025年3月成立具身智能专项部门,并挖来商汤科技副总裁沈徽担任负责人;7月推出"JoyInside平台",旨在将京东大模型能力嵌入各类机器人硬件,构建"硬件+软件+服务"的生态闭环。

图源:京东官方

相较京东与美团的高调出击,腾讯与阿里则采取更为克制和平台化的策略。

腾讯明确"不做硬件,只做伙伴"的定位。马化腾曾表示:"腾讯希望成为所有机器人厂商的合作伙伴。" 2025年世界人工智能大会上,腾讯推出具身智能开放平台 Tairos(钛螺丝),提供从基础模型、数据采集、训练仿真到真机部署的全栈式模块化能力,赋能行业开发者。其投资路径也印证了这一理念——参与宇树科技、智元机器人等明星项目的中后期融资,重在生态协同而非控制权。

阿里巴巴和蚂蚁集团则展现出"投资+自研+生态共建"的立体化布局。蚂蚁集团不仅投资了宇树科技、星海图、灵心巧手等产业链关键环节企业,更成立了全资子公司蚂蚁灵波科技,专注于人形机器人研发。该公司已在浦东建设人形机器人开放训练场,联合大模型、传感器、灵巧手等上下游企业,构建覆盖感知、决策、操控、安全的技术闭环,并向家庭服务、养老护理、医疗辅助等场景延伸。

字节跳动虽未以公司主体直接出手,但其关联基金锦秋基金已投资宇树科技、乐享智能、因克斯等企业。与此同时,字节正悄然推进自研机器人项目。据披露,其机器人研发团队已从2023年的约50人扩展至15比,自主研发的机器人产量累计超千台,显示出其"以投促研、以研带产"的长期意图。

三、未来格局由谁主导?

互联网大厂们在具身智能领域,选择了不同的战略布局和发展路径,这些差异化的战略,既反映了各自的核心优势和业务需求,也塑造着中国具身智能产业的未来格局。

随着技术不断成熟和应用场景持续拓展,具身智能有望成为继移动互联网之后的下一个重要技术平台。对大厂们来说,如何平衡投资成本与回报周期,还有实现技术突破与商业落地的有效结合,将成为决定其战略成败的关键。

图源:京东官方