星海图数据集真机数据,能解决什么难题?VLA开源模型,实用性如何评估?

2025-10-13 11:05:48 作者:Vali编辑部

在人工智能技术飞速发展的今天,机器人领域的数据开源仍处于起步阶段。相比模型开源的热闹景象,真实场景数据的开放显得尤为稀缺。有企业直言"数据不可能开源",但星海图却选择逆流而上,用行动证明开放路线的可行性。

硅星人独家获悉,这家成立不足两年的公司即将发布全球首个开放场景高质量真机数据集Galaxea Open-World Dataset,以及配套的G0-快慢双系统全身智能VLA模型。这一举措不仅突破了传统机器人研发模式,更在行业内掀起了一场数据共享的变革。

数据集的突破性在于其真实性和完整性的完美结合。涵盖500小时真实世界移动操作数据,覆盖家庭、厨房、零售、办公等50个场景、150类任务、1600+物体、58种操作技能。这些数据全部来自真实生活和工作环境,通过统一硬件平台采集,确保了动作空间一致性与语言标注的高精度对齐。

在机器人领域,数据集往往面临三大难题:规模有限、环境单一、数据不一致。而星海图的数据集不仅规模庞大,更重要的是覆盖了真实应用场景。这种数据采集方式让机器人能更准确理解人类指令,提升任务执行效率。

G0快慢双系统模型采用System-2(规划,VLM)+ System-1(执行,VLA)架构,分别在2Hz与200Hz异步运行。这种设计灵感来源于人类认知的"双系统理论",将深度思考与快速反应结合。慢系统负责理解复杂指令、分析环境状况、制定执行计划,快系统则专注动作执行和实时反馈。

这种异步协作机制显著提升了执行效率。在整理床铺等需要全身协调的任务中,系统能同时处理柔性物体操作、长序列规划等复杂动作。这种能力让机器人在真实环境中展现出更强的适应性和稳定性。

三阶段训练方法是G0模型的亮点。先进行跨本体预训练,泛化感知与语言理解;再用单本体高质量数据精训动作控制;最后通过少样本后训练提升特定任务表现。这种渐进式训练方法解决了机器人学习中的核心问题:如何在保持通用性的同时实现精确控制。

星海图团队发现,当预训练平台与目标机器人存在较大表现差距时,跨平台预训练效果会减弱甚至产生负面影响。这一发现颠覆了业界对跨平台预训练必然有益的传统认知,强调了单平台预训练的重要性,特别是对需要精确全身协调的复杂任务。

实际测试中,G0在柔性物体操作、全身移动控制、长程任务与泛化性等方面表现突出。特别是在整理床铺等任务中,系统能同时处理多个技术难点,展现出强大的执行能力。这些成功案例验证了技术方案的有效性,也证明了真实世界数据训练的价值。

从行业角度看,高质量数据集的开源将显著降低中小企业和研究机构的研发门槛。过去收集大规模真实数据需要巨额投入,现在研究者可以直接基于Galaxea数据集进行算法创新,缩短从研究到应用的周期。

统一的数据格式和标注标准有助于建立行业基准,推动机器人领域规范化发展。不同团队的研究成果将具有可比性,避免重复建设。这种标准化还为监管部门制定相关政策提供了重要参考,有助于建立机器人安全、伦理等方面的行业规范。

开源数据集还为不同领域的专家提供了共同研究平台,激发跨学科创新活力。计算机视觉、自然语言处理、控制理论等不同领域的研究者可以在同一数据基础上验证理论和算法。这种跨领域合作往往能产生意想不到的创新突破。

硬件厂商、软件开发者、系统集成商等产业链各环节也能基于统一数据标准更好协作,形成良性生态循环。正如开源软件推动了互联网繁荣,开源机器人数据和模型或将催生出更加开放、协作、创新的机器人生态系统。

这家"不走寻常路"的公司,用实际行动证明了有时候"反叛"并不意味着对抗,而是为了推动整个行业向前发展。或许正在为机器人行业找到新的方向。