WRC机器人模型究竟藏了什么诀窍? 靠微调就能完成任务,原理是什么?

2025-10-13 11:05:09 作者:Vali编辑部

在真实生活场景中,机器人要完成从整理床铺到操作家电的复杂任务,仅需少量微调就能实现连续自主操作。这种能力不仅体现在动作执行上,更在于机器人能实时展现其思考过程,让使用者直观看到“机器人是如何决策、如何行动”的。

在2025WRC展会上,星海图将G0模型带入现场,通过大屏幕实时投射机器人的思考轨迹与动作过程,刷新了传统展示方式。这种将“思维可视化”的做法,让观众能清晰看到机器人如何解析指令、规划路径、执行动作,展现出非结构化环境下的高适应性。

星海图推出的端到端双系统全身智能VLA模型G0,将大规模开放世界真机数据集与双系统视觉-语言-动作架构结合,为机器人在复杂场景中提供更强大的泛化能力。该模型通过分阶段训练策略,验证了其在长程、柔性、全身移动任务中的稳定性与效率。

如何实现高效任务执行?星海图G0模型的核心在于构建了覆盖50种环境的Galaxea Open-World数据集,包含500小时高质量移动操作数据。这些数据覆盖住宅、厨房、零售和办公等场景,涉及150种任务、1600多种操作对象,为模型训练提供了真实世界的训练样本。

为何选择双系统架构?G0模型采用分层控制设计,将机器人控制分为高层任务规划与低层动作执行两个模块。高层G0-VLM负责解析自然语言指令,进行多模态推理并分解为可执行子任务;低层G0-VLA则以高频率执行具体动作并进行闭环控制,形成“慢思考、快执行”的协同机制。

数据集的多样性如何保障?Galaxea Open-World Dataset基于统一的星海图R1 Lite平台采集,配备双6自由度机械臂、3自由度躯干、全向移动底盘和多视角RGB-D摄像头。这种硬件配置确保了数据的一致性,使模型能在不同任务中保持动作参数的稳定性。

任务复杂度如何体现?数据集包含从桌面整理到铺床等长时序任务,覆盖从简单抓取到复杂多步骤流程的广泛范围。这种多样化任务分布显著提升了模型的适应能力,使其能应对真实场景中的各种挑战。

数据集的标注体系有何优势?每个任务都被分解为多个具有明确语义的动作步骤,实现子任务级语言标注。这种细粒度标注不仅支持动作级别的监督学习,还为高层任务规划模块提供了可直接利用的序列化知识。

模型训练如何分阶段进行?G0模型采用三阶段训练策略:第一阶段在多种机器人形态的大规模无标注数据上预训练,获取通用感知-动作先验;第二阶段在目标平台进行单本体预训练,强化语言与动作的精确对齐;第三阶段使用少量高质量示范数据进行微调,掌握特定复杂技能。

模型性能如何验证?在桌面整理、微波炉操作、铺床和积木堆叠四个基准任务中,G0模型表现突出。仅用100条任务轨迹微调,其平均进度得分全面超越Benchmark模型π-0,尤其在物体拾取与放置任务中优势明显。

少样本迁移效果如何?单本体预训练使模型仅需20条轨迹就能在新任务中实现平稳执行。针对G0-VLM的任务特定指令微调(SFT)进一步提升了指令-动作对齐准确率,增幅超过50%,任务分解正确率接近100%。

模型的实际应用价值何在?Galaxea Open-World Dataset与G0双系统VLA模型的结合,为具身智能提供了高保真、可扩展的技术路径。通过真实世界数据采集、规划与执行分离的架构设计,以及分阶段课程学习策略,机器人在非结构化环境中展现出更强的泛化性与稳定性。

开源技术如何推动发展?随着数据与模型的开放,星海图为全球开发者搭建起跨越技术鸿沟的桥梁。这种开放生态不仅加速了具身智能从实验室创新向普惠性社会价值的转化,更让每一份创新都能融入具身智能突破的浪潮,共同书写机器人服务人类、赋能世界的未来篇章。