中国智能体突围，效率提升能提多少？打工人拿到手，究竟能做什么？

2025-10-20 10:40:29 作者：Vali编辑部

在AI智能体领域，GAIA榜单已成为衡量工具实力的重要风向标。天工超级智能体（Skywork Super Agents）凭借扎实的技术积累，在榜单中表现抢眼，尤其在前两个Level的测试中，明显优于Manus和Deep Research。这项测试不仅考验智能体的基础能力，更对多模态处理、复杂推理等综合素养提出更高要求。

GAIA榜单的含金量在于其设计逻辑——通过450个真实场景问题，涵盖推理、多模态处理、网页浏览等核心能力。测试分为三个难度层级，Level 1侧重基础操作，Level 2需要组合工具完成任务，Level 3则要求智能体具备完整行动序列和世界感知能力。这种分层设计让测试结果更具参考价值，也暴露出不同工具的优劣势。

从技术能力到用户体验，天工超级智能体展现出独特优势。其多模态生成能力覆盖文本、图像、音频、视频等类型，用户可随时编辑调整内容。这种可溯源、可编辑的特性，解决了传统AI工具内容不可控的问题。测试中，智能体不仅能生成高质量文档，还能将企业数据、会议记录等私有信息融入输出结果，实现个性化定制。

在实际应用层面，天工的「三件套」模式（Excel、Word、PPT）表现尤为突出。Excel模式下，智能体能快速统计GitHub热门项目并生成排名表；Word模式则能为AI产品经理岗位生成专业问答示例。这些成果经验证可直接用于工作场景，无需额外调整。更值得一提的是，智能体支持后台任务持续运行，用户可专注于核心工作，智能体自动完成辅助任务。

开源生态的建设进一步拓展了工具的使用边界。天工团队将DeepResearch Agent框架开源，并集成多模态处理能力（MCP），让开发者能灵活调用。这种开放姿态不仅降低技术门槛，也推动了AI工具的普及应用。从技术实力到生态建设，天工正在重塑AI智能体的价值标准。

行业观察人士指出，天工的突破标志着AI工具从「技术秀场」向「真实生产力工具」的转变。其多模态生成、可编辑、可溯源的特性，让AI不再是辅助工具，而是能参与核心工作的智能伙伴。这种从「有用」到「敢用」再到「好用」的进化路径，正在改变职场人对AI的认知，为大规模应用奠定基础。

当前全球AI智能体竞争白热化，OpenAI、Google等巨头押注通用智能体，而Genspark、Manus等创业公司也在加速布局。天工的出现，为中国玩家提供了差异化竞争的可能。其以用户体验为核心的设计理念，正在探索一条更本质的进化路径：AI的价值不在于炫技刷榜，而在于能否真正融入真实工作场景。

这场从「有用」到「好用」的进化，或许正是撬动AI大规模落地的关键。随着更多开发者加入生态建设，AI智能体将不再局限于实验室，而是成为职场人不可或缺的生产力工具。天工超级智能体的实践，为这一进程提供了重要参考样本。