00后创业:灵巧手能玩转哪些新花样?机器人领域,下一个爆点在哪里?
在机器人领域,手部动作的精细程度直接影响整体表现。灵初智能最新推出的自研灵巧手,以21个自由度打破了行业常规。这种设计不仅超越了市面上常见的6自由度抓取器,更在夹持、旋转、精准插拔等操作上展现出远超预期的性能。与人类27个自由度的手相比,特斯拉最新款Optimus Gen-3灵巧手仅有22个自由度,而灵初智能的21个自由度在机械结构复杂度和制造难度上都达到新高度。
这种高精度操作能力背后,是灵初智能对成本控制的精准把握。目前市面上很多团队光灵巧手就要花费几十万元,但灵初的目标是将整机价格控制在10000美元(约71885元)级别,对标特斯拉Model 3的定价策略。这种价格优势不仅来自于硬件设计,更源于系统层面的深度整合。灵初智能选择将整机打造为"轮式+双手"的形态,这种设计既保留了移动灵活性,又兼顾了操作精度。
在技术路线选择上,灵初智能从一开始就摒弃了传统夹爪方案。创始团队认为,单纯的抓取能力难以应对复杂任务需求。比如使用工具、精密装配、翻页、扫码等操作,都需要更高自由度与触觉反馈。耶鲁大学等机构在2013年研究显示,家庭和机械车间环境中人类手部的高频抓取动作多达10种,这些动作都需要高自由度手部配合才能完成。
工业场景中很多手中操作(如转动螺丝刀)和精密操作(如电池抓取与摄像头校准)对低自由度的灵巧手来说仍是挑战。因此灵初智能在研发初期就确立了不采用夹爪的路线。这种选择源于对市场产品的不满,同时也得益于团队深厚的技术积累。公司首席科学家杨耀东作为北京大学人工智能研究院助理教授,在强化学习领域有扎实研究基础。
2022年,杨耀东带领团队在NeurIPS 2022具身灵巧操作竞赛中获得冠军,这为灵巧手研发奠定了技术基础。团队中00后成员陈源培,师从李飞飞和Karen Liu,曾在全球首次实现强化学习在真实世界同时控制双臂、双手多技能操作。这种技术积累让灵初在灵巧手研发上具备独特优势。
在机器人领域,强化学习的应用面临诸多挑战。自由度越高训练难度越大,目前常见机器狗仅有12个自由度,训练尚且不易。灵初智能的21个自由度灵巧手对算法训练提出更高要求。具身智能在真实世界完成开放场景长程复杂任务时,容易出现误差累积。比如完成十个步骤的任务,第二步1cm的偏差可能导致最终结果大相径庭。
团队通过分层端到端快慢脑架构技术路线,解决了这些问题。快脑S1专注操作,灵巧操作经过tokenize后作为S2慢脑的输入,与语言、视觉模态融合。基于Causal VLM自回归架构,实现多模态融合的推理和任务规划。这种架构让快脑控制手部完成精细动作,慢脑基于视觉感知处理开放环境规则变化,形成"动作感知-环境反馈-动态决策"的闭环。
灵初推出的Psi-R1模型,结合历史动作与当前环境状态,理解动作的长期影响。这种设计避免了重复试错和误差积累,建立动作与环境变化的因果链。这套技术路线让灵巧手在复杂任务中展现出更强的适应能力。
在产业化道路上,灵初智能选择走Model 3式的路径。王启斌表示,灵巧手不会单卖,而是作为整机系统的一部分。这种软硬件深度耦合的策略,强调系统闭环与数据链条完整性。整机采用标志性紫色轮足双手设计,动作系统已迭代至Psi-R1,数据积累从单场景逐步扩展,任务交付以ToB为主,重点布局3C制造和仓储物流。
这种产业化策略与特斯拉Model 3的路径高度相似。Model 3通过降低价格进入大众市场,实现销量突破。灵初智能的目标是将机器人成本控制在10000美元左右,构建硬件+软件+数据的生态闭环。这种模式让机器人真正成为可商用工具,而非实验室展品。
王启斌认为,具身智能需等到硬件成本降至10万元人民币级(预计2030年),且单场景出货量突破百万台,才能触发生态爆发。这种期待与Model 3对智能电车行业的推动相似。灵初智能正在为机器人世界的"Model 3"打基础,目标是成为首个将机器人真正转化为实用工具的团队。