中国智能体突围,效率提升能提多少?打工人拿到手,究竟能做什么?
在AI智能体领域,GAIA榜单已成为衡量工具实力的重要风向标。天工超级智能体(Skywork Super Agents)凭借扎实的技术积累,在榜单中表现抢眼,尤其在前两个Level的测试中,明显优于Manus和Deep Research。这项测试不仅考验智能体的基础能力,更对多模态处理、复杂推理等综合素养提出更高要求。
GAIA榜单的含金量在于其设计逻辑——通过450个真实场景问题,涵盖推理、多模态处理、网页浏览等核心能力。测试分为三个难度层级,Level 1侧重基础操作,Level 2需要组合工具完成任务,Level 3则要求智能体具备完整行动序列和世界感知能力。这种分层设计让测试结果更具参考价值,也暴露出不同工具的优劣势。
从技术能力到用户体验,天工超级智能体展现出独特优势。其多模态生成能力覆盖文本、图像、音频、视频等类型,用户可随时编辑调整内容。这种可溯源、可编辑的特性,解决了传统AI工具内容不可控的问题。测试中,智能体不仅能生成高质量文档,还能将企业数据、会议记录等私有信息融入输出结果,实现个性化定制。
在实际应用层面,天工的「三件套」模式(Excel、Word、PPT)表现尤为突出。Excel模式下,智能体能快速统计GitHub热门项目并生成排名表;Word模式则能为AI产品经理岗位生成专业问答示例。这些成果经验证可直接用于工作场景,无需额外调整。更值得一提的是,智能体支持后台任务持续运行,用户可专注于核心工作,智能体自动完成辅助任务。
开源生态的建设进一步拓展了工具的使用边界。天工团队将DeepResearch Agent框架开源,并集成多模态处理能力(MCP),让开发者能灵活调用。这种开放姿态不仅降低技术门槛,也推动了AI工具的普及应用。从技术实力到生态建设,天工正在重塑AI智能体的价值标准。
行业观察人士指出,天工的突破标志着AI工具从「技术秀场」向「真实生产力工具」的转变。其多模态生成、可编辑、可溯源的特性,让AI不再是辅助工具,而是能参与核心工作的智能伙伴。这种从「有用」到「敢用」再到「好用」的进化路径,正在改变职场人对AI的认知,为大规模应用奠定基础。
当前全球AI智能体竞争白热化,OpenAI、Google等巨头押注通用智能体,而Genspark、Manus等创业公司也在加速布局。天工的出现,为中国玩家提供了差异化竞争的可能。其以用户体验为核心的设计理念,正在探索一条更本质的进化路径:AI的价值不在于炫技刷榜,而在于能否真正融入真实工作场景。
这场从「有用」到「好用」的进化,或许正是撬动AI大规模落地的关键。随着更多开发者加入生态建设,AI智能体将不再局限于实验室,而是成为职场人不可或缺的生产力工具。天工超级智能体的实践,为这一进程提供了重要参考样本。