体操训练卡关?AI视频模型能带来新思路吗?

2025-10-18 10:20:09 作者:Vali编辑部

前两天,MiniMax的M1文章里,我提到过一个观点:他们必须推出一个视频模型。结果,就在前天深夜,他们真的发布了Hailuo 02。

这个模型在正式上线前,就已经放出了预告片。当我看完后,整个人都愣住了。这不光是AI视频模型的突破,更像是在视觉领域开了一扇新窗。你见过能生成杂技动作的AI视频吗?别看它还只是个预告片,但已经让不少人惊呼"这玩意太离谱了"。

我转完朋友圈,朋友都惊了。这模型直接冲着所有视频模型的弱点开大,就像武林高手找到对方的破绽。体操动作,被公认为AI视频的图灵时刻。谁能解决体操视频生成问题,谁就是真神。杂技动作的难度,也仅次于体操。

昨天白天Hailuo 02上线后,我就开始做测试。比如上周末,我二刷了《碟中谍8》。虽然前面的文戏又臭又长让人犯困,但到了熟悉的动作戏段落,看到阿汤哥又是潜入深海又是高空扒飞机,我还是真情实感地喊出了牛逼。

一个六旬老人,兢兢业业跑了三十年,不顾安危,一直用血肉之躯挑战mission impossible,就为了让你在银幕上看到最炸裂的视觉效果。这让我想起电影院里看到扒飞机动作时的震撼,那时候我还在感慨,这种动作AI恐怕是做不来。

但Hailuo 02上线后,我直接推翻了这个看法。你把这个片段把水印去掉,发给一个不是特别了解AI的人看,这谁看谁懵逼。动作的幅度、丝滑度,完全不像很多模型为了稳,做的全是慢动作。而是像真实世界的表演一样。

我觉得普通的肢体表演,真的难不倒它。所以直接上图灵测试吧。跳体操这个动作,就是最能检验AI视频模型的试金石。

先给大家看看一年前,第一个DiT架构的视频模型Luma AI上线时生成的跳体操视频。对,这是一年前。视频里,运动员的四肢在空中扭曲变形。这段由Luma生成的视频不仅让近百万网友围观,还让包括LeCun在内的AI大佬们吵得不可开交。

我们再来看看,一年以后,模型进化到今天时,各家的跳体操表现。英文版提示词:A gymnast launches off the high bar, does two full spins, and catches the bar again. The camera whips and tilts to capture the arc。

中文版提示词:一位选手从高杠跃出,完成两次空中旋转后再次抓杠。摄影机快速摇摄并倾斜捕捉轨迹。前方高能预警(绝无拉踩之一,只是单case对比)。

这是Veo3。就很魔幻,运动员一碰到垫子就变形。这是Runway。动作僵硬得像木偶。这是Hailuo 02。动作流畅得像真人。

除了这次整个人物肢体动作的史诗级进化之外,Hailuo的表演也一直是所有模型领域里独树一帜的。当年Hailuo 01的时候,在全球一统江湖,就是因为他们超级牛逼的情绪表演。

而这一次,在表演的基础上,加上巨幅的人物动作,超牛逼的物理效果,Hailuo的表演真的达到了登峰造极的水平。

多说无益,直接给大家看一些超级棒的例子。一个大型机甲从天而降,胸口写着Hailuo2。浓烟中,消防员登上梯子,砸破窗户。这个case是最离谱的,因为,我没想到,他真的砸碎了玻璃,玻璃渣还掉了下来,我当时看到,我人都麻了。

我真的想说:啊????????????一个小偷被人发现,狼狈逃窜,还摔了一跤。最后真的摔了一跤,是我万万没想到的。

两个舞女展示"Hailuo2.0"字样。从一个女人悲伤的瞳孔中看到了战火连天。一名拉拉队员将队友抛向空中,队友翻转两次后完美接住。镜头向右平移并向上倾斜。一名棒球投手投出快速曲线球。

这可能是最近两个月以来,我用的最心潮澎湃的AI视频模型。太爽了。你让它在同一场景下连续做几个动作,再配上镜头运动,它也能满足你。

网址在此:https://www.valimart.net/在下方生成的时候,选用Hailuo 02模型就行。而且,也终于支持原生1080P了。

最主要的是,Hailuo也是真的便宜。新人有500的免费积分,而生成一个768p的六秒视频只需要25积分,1080p也只需要80积分,768p的10秒视频是50积分。

只能说,便宜又大碗。作为第一个通过AI视频领域体操难题的玩家,这个价格,我只能说。海螺,牛逼,Minimax,牛逼。

人终有老去的一天。阿汤哥三十年的职业精神,成就了电影史上的传奇。而如今,AI也许同样可以用自己的方式,以另一种传奇书写历史。

那些我们曾经以为AI不可能攻克的视觉难题,一个接一个地被打破。人间一天,AI一年。这样的时代,真好。