零售VLA大模型,能为你的生意带来什么?开源技术,机器人应用会更简单吗?

2025-10-19 09:30:12 作者:Vali编辑部

2025年北京智源大会在6月6日至7日召开,这场汇聚了全球顶尖科研机构、技术领军企业和开源社群的具身智能领域盛会,成为行业观察者关注的焦点。作为大会的重要看点,银河通用机器人Galbot的亮相引发广泛讨论,其在主论坛的全球直播首秀,展示了具身大模型在商业场景中的实际应用价值。

在大会主论坛的直播环节,Galbot G1机器人以无遥控、无预采集的模式,完成了货架精准取货任务。这项看似简单的动作背后,是银河通用团队研发的端到端具身大模型GroceryVLA的深度应用。机器人在王鹤博士的语音指令下,自主识别货架位置并完成商品抓取,其稳定高效的作业表现,获得了现场专家和媒体的高度评价。

从技术角度看,GroceryVLA的五大核心能力展现出显著优势。其强适用性突破了传统"视觉+轨迹规划"方案的局限,在密集排布、商品种类繁多的货架环境中,能够自主识别并完成抓取任务。这种无需路径规划的作业方式,大幅提升了操作效率和灵活性,标志着端到端大模型驱动的闭环控制已具备商用能力。

在通用性方面,GroceryVLA支持软硬包装商品的统一抓取策略。无论是袋装面包、卤蛋这类柔性物品,还是塑料瓶、透明果冻杯等硬质包装,都能实现精准取放。这种跨品类的适应能力,为零售场景的多样化需求提供了技术保障。

跨场景泛化能力是GroceryVLA的另一亮点。通过大规模仿真数据训练,该模型可直接应用于新环境。在展会现场的首次异地实战部署中,面对光照变化、货物随机摆放等复杂条件依然保持稳定表现,展现了强大的零样本泛化能力。

自主决策能力则体现在对相似商品的动态判断上。当货架上有多个同类商品时,系统能根据任务需求选择最优抓取目标,这种基于任务理解的灵活调度,确保了操作流程的高效执行。

强抗干扰性是GroceryVLA在实际应用中的关键优势。面对人为干扰如货物被移走、增加或推挤,模型能通过实时闭环策略快速调整,甚至在抓取动作中瓶子被碰倒后重新扶正,这种鲁棒性确保了任务连续高效完成。

在展会现场,Galbot展现的不仅是技术实力,更是具身智能产品商业落地的可行性。从视觉感知到目标识别,从语言指令到精准操作,整个流程的闭环控制体系,验证了模型在真实复杂环境中的工程稳定性。

除了零售场景的突破,银河通用还在人形机器人领域取得重要进展。OpenWBT开源系统的发布,解决了传统遥操作系统部署繁琐、兼容性差的问题。这款全球首款全开源、多机型、跨虚实的人形机器人全身遥操作系统,让普通用户仅凭VR眼镜和普通电脑即可完成系统搭建。

OpenWBT的三大核心突破值得关注。快速部署能力让初学者能在数小时内完成系统搭建,这种低门槛设计显著降低了技术应用门槛。多机型兼容性支持Unitree G1、H1等多款机器人,覆盖不同自由度和身高规格,满足多样化硬件需求。

对虚实遥操的灵活支持,使系统既能控制真实物理机器人,也能兼容虚拟仿真环境。这种双向兼容性为大规模数据采集和模型训练提供了便利,加速了具身智能技术的迭代进程。

在动作控制方面,OpenWBT将机器人运动拆解为"走路、蹲下、弯腰、触达"等基础技能,通过先进的技能融合算法,系统能自动组合这些原子动作,实现连贯复杂的任务序列。这种全身动作协调能力,让机器人能够完成碰天触地的复杂操作。

OpenWBT的开源发布,标志着银河通用在构建开放共享具身智能生态方面迈出重要一步。作为全球首个标准化、模块化的人形机器人全身遥操作框架,它为科研机构和产业界提供了稳定高效的训练平台,推动了开放社区生态的建设。

从技术角度看,GroceryVLA和OpenWBT的突破,不仅验证了具身智能技术的商业化潜力,更为行业应用提供了切实可行的解决方案。这些创新成果,正在加速具身大模型技术从实验室走向实际应用,为更多行业场景的智能化升级提供支撑。

未来,随着具身智能技术的持续发展,我们有望看到更多像Galbot这样的机器人,真正实现"工作起来"的目标。银河通用的持续创新,将为构建更加智能、高效、可持续的未来社会注入新动能。