AI 屏幕洞察,能帮我工作更高效吗?这波技术,未来会取代人工吗?

2025-10-16 10:50:03 作者:Vali编辑部

AI工具正在经历一场从「功能堆砌」到「思维延伸」的蜕变。几周前,我在撰写行业深度文章时,面对堆积如山的数据文件和浏览器标签页,连续两天都在和信息洪流进行拉锯战。那种感觉就像在自己的知识库里溺水——明明记得看过某个数据、某段论述,却总也抓不住它们的尾巴。

这种数字时代的「失忆症」已经成为常态,我们习惯性地将希望寄托在AI身上。就像一个耐心的饲养员,不断在应用之间复制、粘贴、切换,把上下文一点点「喂」给ChatGPT,只为换取一次灵光乍现。但当一个名为「Glass」的项目出现在视野中时,这种习惯性依赖开始出现裂痕。

Glass的出现颠覆了我对AI工具的认知。它不是又一个聊天框的变体,而是一个完全迥异的存在。这个项目将「被动观察」这一理念注入到我的macOS系统中,让我得以一窥当AI成为你心智延伸时,人机交互的终极形态究竟有多远。

01

面向未来的AI助手,但保持了开发者视角

Glass没有传统意义上的「界面」。它的「安装」更像一套开发者环境的配置流程,需要你熟悉Python和Node.js。它的「实体」则只是一个静默地躺在菜单栏的图标。这种设计让整个操作过程充满了开发者思维,而非普通用户习惯。

Glass安装界面| 图片来源:极客公园

进入Glass后,首先是几个直接的权限请求:屏幕录制权限、麦克风访问权限、辅助功能权限。这些权限都直指其核心:一个需要完整观察你、倾听你的AI。这种设计让Glass在隐私保护和功能实现之间找到了微妙平衡。

02

记忆延伸的实践与挑战

Glass的首秀就解决了当前AI助手最大的痛点——上下文缺失和跨应用操作的割裂感。它就像一个永不疲倦的书记员,将稍纵即逝的多模态内容流沉淀为结构化的信息资产。这种能力让它的应用场景远超普通笔记工具。

在实际体验中,Glass的表现让人印象深刻。它能够无视应用边界自动转录屏幕内容,将动态的用户行为转化为可检索的信息。这种能力在处理多任务工作场景时展现出独特优势,让信息管理变得更加高效。

但这种强大功能也带来了硬件压力。目前Glass仅支持macOS版本,Windows版仍在开发中。对于内存小于16GB的Mac设备,长时间运行会产生明显卡顿。这种硬件需求成为其普及的门槛。

03

从Memex到数字克隆的进化之路

Glass的推出虽然只是一个开源项目,但其理念可以追溯到上个世纪。1945年范尼瓦·布什提出的「记忆扩展器」概念,如今在AI时代找到了新的实现形式。这种从静态存储到动态记录的转变,标志着数字记忆系统进入新阶段。

Glass的终极目标是为每个人建立一个活的数字克隆。这种「数字孪生」概念在AI领域具有深远意义,它不仅存储信息,更试图理解用户、模仿用户,甚至代替用户执行任务。这种从工具到代理的转变,预示着AI功能的进化方向。

目前Glass的体验距离这个目标还有一定距离。它需要手动输入OpenAI或Gemini的API密钥,使用过程中还需要前置安装Python和Node环境库。尽管这些门槛并不高,但尚未达到「开箱即用」的境界。

在开源社区的反响中,Glass展现出强大生命力。短短四天就在GitHub上获得超过3K星标,迅速在AI工具圈走红。这种关注度印证了其理念的前瞻性,也说明了用户对更智能工具的期待。

Glass的出现不仅是一个工具创新,更是对数字记忆系统的一次重新定义。它将用户行为转化为可索引的信息资产,为AI辅助工作提供了全新思路。这种从被动记录到主动感知的转变,或许正是未来智能工具发展的方向。

文章来自公众号“极客公园”,作者“张勇毅”