这家初创企业靠什么脱颖而出?人脸机器人视频背后,有什么技术秘密?

2025-10-17 10:50:19 作者:Vali编辑部

最近,首形科技完成了新一轮融资,由招商局创投和深创投共同领投,五源资本、浔商创投跟投。这个消息在业内引起不小震动,毕竟这家公司的技术突破已经不是第一次了。就在几个月前,创始人发布的一段视频让整个社交平台沸腾——那台仿生机器人睁眼的瞬间,仿佛真的活了过来,连评论区都炸开了锅。有人感叹"这感觉就像看到真实的人在动",也有人直呼"恐怖谷效应彻底被打破"。

说实话,要形容首形科技带来的改变很难用一个词概括。但多数人从那段视频中感受到的,是一种前所未有的真实感。从细腻的脸部表情到自然的情绪互动,从流畅的微表情到富有感染力的肢体语言,这些细节组合起来,让仿生机器人突破了传统机械的刻板印象。更关键的是,这种真实感背后,是巨大的市场潜力——当机器人能够引发真实的情感波动,那些曾经只存在于科幻小说中的场景,正在一步步变成现实。

哥大博士胡宇航:唤醒机器人"自我"的创造者

胡宇航,首形科技创始人,哥伦比亚大学博士,美国自然科学基金会人工智能研究所项目成员。他研究的方向很特别,不是单纯追求机器人的功能性,而是想解决一个更根本的问题:机器人能不能像人一样理解自己、理解别人,并通过自我学习走向具身智能?这和传统机器人研究者关注的生产力提升不同,他的研究更偏向于机器人的"自我认知"。

在博士阶段,他就在机器人领域顶级期刊上发表过两篇重要论文,引起行业广泛关注:

《Teaching Robots to Build Simulations of Themselves》,Nature Machine Intelligence:提出了一种以自监督学习和自我建模为核心的方法体系。机器人可以通过观察自身视频,重建结构和运动规律,实现从感知到控制的闭环学习。这项技术让机器人具备了自我适应能力,为实现通用机器人提供了技术路径;

《Human-Robot Facial Coexpression》,Science Robotics:提出面部共情表达预测模型,让机器人能提前捕捉人类情绪信号,并生成自然的面部回应。这不仅让机器人成为观察者或响应者,更让它成为一个能主动交互的共情个体。

这些研究成果构成了首比科技后续产品的技术起点。配合最新的技术,在视频中机器人"睁眼"的那一刻,所有伏笔汇聚,展现出仿生机器人觉醒的轮廓。

三大技术体系:机器人自主学习、情绪基座模型、仿生人脸硬件

视频中机器人的真实感,源于首形的三大技术体系积累

1.机器人自主学习:自监督学习与自我建模

首形科技认为,与其一次性"教会"机器人某个固定技能,不如赋予它"自主学习"能力。这个理念源自胡宇航在哥伦比亚大学的博士研究:自监督学习与机器人自我建模。

A.自监督学习,源于机器人"照镜子"的能力

机器人不需要依赖人工标注或遥控操作,而是通过自身传感器获取的运动数据,像人类对着镜子观察自己一样,自动推理出结构、关节运动规律与控制策略。这种能力打破了传统对预设模型和环境依赖的限制,实现了从感知、建模到控制的闭环学习。

B.自我建模,让机器人"理解自己"

自我建模是指机器人在不依赖环境标签或外部干预的前提下,仅凭自身感知建立对身体结构与动力学行为的内部模型。关键在于"主体建模"与"环境建模"的解耦:主体建模强调机器人对自身身体的认知,如电机响应、柔性变形等;环境建模则涉及任务层面的理解,如地形、物体形状或外力反馈。

通过解耦,机器人可以在复杂或未知环境中,先从"认识自己"开始,逐步扩展到与外界的交互建模。例如:当硬件磨损、外部载荷改变或新工具接入时,它能够即时重建自身模型,自主适应新状态,而无需重新训练整个系统。

这种能力让机器人具备了"可解释性强、适应性高、独立性强"的底层智能,是通往通用机器人的关键路径之一。

C.终生学习,机器人自主学习的未来

自我建模能力的建立,也为机器人实现"终身学习"奠定了基础:模型一旦学会"如何学习",即可迁移到新硬件、新场景乃至全身关节系统,实现新任务的持续学习,新环境的适应以及自身损坏的修复。凭借这一技术范式,首形科技让机器人具备了持续进化的可能。

2.情绪基座模型:让机器人懂人心

人类判断一个事物是否真实,往往需要三个层次:首先是结构是否符合预期,其次是动态是否自然,最后是是否能引发情感共鸣。首形科技在仿生机器人面部设计上追求极致,从材料选择到机械结构,从嵌入式软硬件到皮肤工艺,都进行了全面自主开发。

这种追求让用户的大脑不自觉地完成"像真实"、"是熟悉的"、"值得信任"的判定,从而产生共情。这种设计让机器人不仅看起来像人,更能让人类感受到被理解。

3.仿生人脸工艺:打造真实感

人类对人脸的判断,需要同时满足三个层次:首先是基础结构是否符合预期,其次是动态表情是否自然,最后是是否能引发情感共鸣。首形科技在面部精细度上的极致追求,让用户的大脑不自觉地完成"像真实"、"是熟悉的"、"值得信任"的判定,使人类产生与之共情的可能。

商业价值:仿生机器人如何基于"情绪价值"带来广阔的应用价值?

首形科技提出:类人共情价值(Humanoid Empathy Value):情感连接带来的稀缺注意力资产

在人工智能全面渗透生活的今天,大语言模型(LLM)正在改变"语言"交互,但真正能触达人的,是"情感"交互。相比于语音助手或虚拟对话界面,一个具备自然表情与情绪回应的人形机器人,能在瞬时激发人类"情感"冲动。人形机器人之所以在每一次亮相中引爆话题,也是因为它"像人"的特点能唤起了人类的共情。

这种现象被定义为:"类人共情价值"。

人形机器人能成为一种情感触发器,是一种在任何公共空间都能制造"围观效应"的引力核心。所以,人形机器人天然具备成为注意力经济的中心资产的能力——无论是短视频平台、展陈场所还是零售门店,乃至未来随家用/商用人形机器人普及率提升进入千家万户,它所能带来的传播效率与情绪连接,是普通机器人、传统硬件、甚至大模型界面都无法比拟的。

注意力经济是以争夺用户注意力为核心的经济模型。在这个模型中,类人机器人通过激发"类人共情价值",成为注意力市场中最具传播力和记忆点的内容载体,从而转化为流量、品牌和变现的杠杆。而在信息过载、内容同质的当下,注意力获取的方式正在逐渐从"堆内容"走向"建关系":谁能将关注转化为情感唤起与持续共情链接,谁就掌握了未来的注意力入口乃至未来的商业价值入口。

在人工智能和人形机器人高速发展的今天,首形科技希望成为引领"机器人情感觉醒时代"的奠基者。