美图AI视觉Agent,能做什么? 免费使用,体验如何?

2025-10-16 09:35:28 作者:Vali编辑部

美图公司最近动作频频,先是暂停了连续举办三届的"美图影像节",转而投入AI Agent研发。原本期待8月新品发布会能为中期财报添彩,没想到仅用20天就推出了名为RoboNeo的AI Agent,并且直接面向所有用户免费开放。这个时间节点选择颇具深意,恰逢图像生成领域迎来技术突破,让RoboNeo的上线显得格外引人注目。

从技术发展轨迹来看,AI图像工具的进化路径清晰可循。2月我们曾观察到,随着DeepSeek等推理模型上线,不少图像产品开始加入"自然语言改图"功能。但彼时的生图模型能力尚显不足,往往需要用户重新生成图像,效果参差不齐。直到3月GPT-4o解锁原生图片编辑能力,6月底FLUX.1 Kontext模型开源,图像生成技术才真正迈入新阶段。这两项技术虽在细节上各有侧重,但都标志着生图模型开始具备理解文字与图像的双重能力,能实现局部精准编辑和跨场景角色一致性优化。

技术进步为AI Agent的落地提供了坚实基础。从早期火爆的Lovart到如今上线的RoboNeo,图像生成工具的迭代速度明显加快。笔者近期对RoboNeo进行了初步测试,发现其交互体验颇具特色。打开应用后首先映入眼帘的是一个聊天框,用户只需用自然语言表达需求即可生成图像,无需手动编写Prompt。这种设计降低了使用门槛,让普通用户也能快速上手。

界面布局采用左右分屏设计,左侧是对话区,右侧是自由画布。生成或修改后的图像会实时显示在画布区域,用户可自由缩放、移动、编辑图层。功能模块包括文字编辑、素材上传、改图、扩图、增强、消除、抠图等操作。这种模块化设计让创作过程更加直观,用户能随时调整细节,实现更精准的图像处理。

在实际测试中,我尝试用RoboNeo制作文章封面图。整体效果令人满意,特别是在生图过程中,除了提出需求外,用户还可以上传参考图。AI会先分析参考图的线条、色彩、造型和风格,提炼出优化要点并应用到生成任务中。这种"读图-分析-优化"的流程,让生成的图像更符合用户预期。

测试中,我先要求生成"双手托举爱心的机器人"图像,随后上传参考图并要求"卡通风格"。AI生成的四张图确实参考了风格特点,但与原图差异较大。这说明模型在理解风格特征上还有提升空间,需要通过多轮交互逐步优化结果。不过,这种迭代机制反而让创作过程更有趣味性。

当图像生成完成后,进入改图阶段。RoboNeo提供了丰富的编辑功能,用户可直接将满意图像添加到聊天框,用自然语言指令让AI进行修改。AI在改图过程中仍会进行审美分析,使输出效果更自然。例如,我要求在机器人胸前添加美图秀秀Logo,AI自动将方形图标变为圆形,这种细节处理让最终效果更协调。

在消除、添加图片等基础功能测试中,AI表现稳定。完成"变主体颜色"等简单指令仅需15秒左右,效率令人满意。与Lovart相比,RoboNeo在处理人像变美任务时展现出明显优势。上传AI生成的人像图后,要求完成"变头发颜色"、"变淡妆"、"涂口红"三项任务,结果呈现出清晰的发丝纹理,面部细节处理自然,没有出现变形或失真。

但遇到"AI换衣"这种复杂任务时,RoboNeo的表现略显不足。测试发现,要么无法生成符合要求的图像,要么生成效果不够自然,衣褶处理有待提升。这说明在处理复杂场景时,模型仍需进一步优化。不过,从整体测试来看,RoboNeo基本能完成各项任务,且生成图像效果符合预期。

视频处理方面,RoboNeo也展现出一定能力。测试中让其去除视频水印,AI能准确识别并消除目标区域。虽然目前只完成了基础测试,但这种能力为后续更复杂的视频编辑任务打下基础。结合其在图像处理领域的优势,RoboNeo有望成为一款多功能的AI创作工具。

从测试结果来看,RoboNeo在图像生成和基础编辑方面表现不俗,特别是在人像美化领域展现出独特优势。虽然在处理复杂任务时还有提升空间,但其直观的操作界面和高效的处理速度,让用户能更专注于创意表达。随着技术的不断迭代,这类AI工具或将重塑图像创作的流程,让专业级的图像处理变得更加触手可及。