Manus蹿红背后,是哪款AI技术在驱动?它能真正让AI像人类一样上网吗?

2025-10-21 08:35:07 作者:Vali编辑部

Browser Use是一款开源工具,让AI Agent能够像真实用户一样操作浏览器完成任务。它支持AI Agent自动切换身份,允许用户按需运行多个并行任务。这款工具在登录自动化、数据提取、QA测试和CRM集成等领域都有广泛应用。自推出以来,Browser Use凭借其高效性和灵活性,成为增长最快的开源项目之一。

Browser Use的开发者团队来自瑞士苏黎世联邦理工学院,两位创始人Magnus Müller和Gregor Zunic在完成数据科学硕士项目后相识。2024年,他们在学生项目之家加速器推出原型版本。2025年3月,Browser Use获得1700万美元种子轮融资,由Felicis Ventures领投,多家知名投资机构跟投。这款工具的出现,让AI Agent与浏览器的交互变得前所未有的顺畅。

技术亮点

Browser Use的核心价值在于解决了AI Agent操作浏览器时的三大难题。首先,网页结构频繁变化会破坏自动化脚本,而Browser Use通过视觉识别与HTML结构分析结合,让Agent能适应不同页面布局。其次,网站常识别机器人,Browser Use支持IP轮换和验证码模拟,让Agent操作更接近真人。最后,大语言模型在抓取时常遇到速率限制和解析错误,Browser Use通过智能纠错机制,让任务执行更稳定。

准确率表现

Browser Use在WebVoyager基准测试中取得89.1%的成功率,远超行业平均水平。在Huggingface网站上,AI Agent完成任务的成功率可达100%;即使在Booking.com这样复杂的场景,成功率也达到80%。这款工具能处理从文档编辑到航班查询等日常任务,覆盖范围非常广泛。其操作流程透明可追溯,用户能实时查看Agent执行步骤和数据交互过程。

创始人故事

Magnus Müller和Gregor Zunic的创业故事始于几次午餐间的随意讨论。他们最初只是想做一个小项目发到Hacker News上,没想到迅速获得关注。Müller提到,很多AI Agent依赖视觉识别系统,但网站经常改变布局导致任务失败。Browser Use通过将网页转换为AI可理解内容,让任务执行更高效。Y Combinator冬季批次中有20多家公司使用该工具,说明其技术价值得到认可。

Magnus Müller的履历显示,他曾在GreenWAI公司用浮动汽车数据优化红绿灯系统,还参与过交通管理相关项目。Gregor Zunic则专注于用AI提升工作体验,曾创建过帮助创业者优化SEO的Spexia公司。两位创始人将技术积累转化为Browser Use,让AI Agent与网页交互更自然。

融资进展

Browser Use的1700万美元种子轮融资,标志着其技术路线获得市场认可。Felicis Ventures认为,这款工具正在构建AI Agent基础设施的关键环节。它通过提取HTML和页面元素,大幅简化了Agent与网站的交互过程。相比依赖视觉识别的系统,Browser Use能以确定性方式重复执行任务,提升可靠性、速度和效率。

技术优势

Browser Use的持久会话功能让Agent能保持登录状态,无需重复验证。智能纠错机制让Agent在网页布局变化时自动调整策略,避免任务中断。这些特性让AI Agent能更稳定地处理复杂任务,为开发者提供更可靠的工具支持。随着更多公司采用该工具,Browser Use的技术价值将进一步得到验证。

未来展望

Browser Use的出现,让AI Agent与网页的交互变得前所未有的顺畅。随着更多企业采用该工具,其技术优势将进一步体现。从日常办公到复杂业务流程,Browser Use都展现出了强大的适应能力。这款工具的持续发展,将为AI Agent的应用场景拓展提供更多可能性。