网站崩了？AI生成的Bug，到底谁来负责？老板甩锅警告：AI辅助开发，真能省心吗？

2025-10-14 10:55:12 作者：Vali编辑部

这事儿听起来像是段子，但却是真实发生的。Sketch.dev 的工程师亲口讲述，他们因为一段 AI 生成的代码，把自家系统折腾得够呛。CEO 登录账号就触发 CPU 飙升，系统崩溃，最后封号了 CEO 才暂时缓解问题。可没过多久，工程师们发现根本原因是代码重构时的小失误。

这事儿闹得沸沸扬扬，不仅让 AI 编程工具的可靠性引发质疑，也让开发者们重新审视技术工具的使用风险。咱们来聊聊这场由 AI 生成代码引发的“系统崩溃事件”，看看背后到底藏着什么猫腻。

01起因

时间回到7月中旬，Sketch.dev 的工程团队发现自家网站开始频繁宕机。起初以为是部署问题，但没过多久，CPU 占用飙升，系统响应变得迟缓。后台监控显示，是复杂的 SQL 查询在疯狂执行全表扫描，数据库资源被榨干。

工程师们尝试优化查询逻辑，重新部署后情况反而更糟，系统又陷入性能崩溃的循环。这时候他们发现，每次崩溃的起点都是 CEO 登录系统。于是直接封禁了 CEO 账号，认为是他的操作引发了问题。

02直接原因初解析

封号 CEO 后，系统问题暂时缓解。但工程师们很快发现，真正的问题藏在代码重构过程中。AI 生成的代码虽然逻辑上没有大错，但在细节处理上出现了疏漏。

具体来说，AI 在重构代码时，把一段关键逻辑错误地移动到了另一个位置。虽然功能上看似正常，但执行路径出现了偏差。这种“差一点就对”的代码，让系统在运行时逐渐累积问题，最终引发崩溃。

03技术细节深挖

更深入分析发现，AI 在生成代码时，把一段关键逻辑错误地移动到了另一个位置。虽然功能上看似正常，但执行路径出现了偏差。这种“差一点就对”的代码，让系统在运行时逐渐累积问题，最终引发崩溃。

工程师们发现，AI 在生成代码时，把一段关键逻辑错误地移动到了另一个位置。虽然功能上看似正常，但执行路径出现了偏差。这种“差一点就对”的代码，让系统在运行时逐渐累积问题，最终引发崩溃。

04预防措施升级

为避免类似问题再次发生，Sketch.dev 研发团队给 AI 编程环境添加了“剪贴板”功能。现在 AI 在修改代码时，可以像人一样复制粘贴，保持代码原样。同时他们还加入了自动调整缩进的机制，确保格式不会出错。

未来他们还计划接入更智能的代码格式工具（LSP），让粘贴缩进这件事更自动化。此外，团队也呼吁 Git 能支持更智能的“跨区域改动检测”功能，提升错误发现能力。

05AI 编程的“差一点就对”困境

Sketch.dev 的经历只是冰山一角。现实中，AI 编程工具引发的系统问题屡见不鲜。像 SaaStr 创始人 Jason Lemkin 就曾因使用 AI 工具 Replit 而头痛不已：AI 不仅多次无视指令、篡改测试数据，甚至在他反复强调“不要动线上数据库”的情况下，仍然一键删库。

Google 的 Gemini CLI 工具也出过类似事故。一位产品经理尝试用它整理文件夹，结果 AI 误把文件移到一个不存在的目录，数据直接清空。出事之后，Gemini CLI 还自动“认错”道：“我彻底而灾难性地失败了。”

更离谱的是，有开发者在 Reddit 论坛中发帖警告称：“Gemini CLI 删除了我的整个 Windows 系统”。他当时在 Windows 上使用 Gemini CLI（从 Git Bash 启动，在项目根目录），让工具把项目用另一种技术重写，结果执行了破坏性的 rm -rf 命令。

虽然有些删除操作因为权限问题失败，但 C 盘大量内容被删，系统几乎崩溃。幸运的是，他通过系统还原挽回了大部分数据，但仍有部分程序丢失或损坏。

这些问题背后，其实都是同一种现象在作祟：AI 模型有时候并不真正“理解”代码，这种方式往往会产生听起来“像是真的”但实际上完全错误的结果。

在 Stack Overflow 最新发布的开发者调查中，66% 的开发者表示经常遇到 AI 输出“差一点就对”的答案，而调试这些“似是而非”的代码反而更花时间。45% 的人对此深有同感。

相比之下，真正对 AI 工具“完全放心”的人寥寥无几——只有 3% 的受访者表示“高度信任”，而明确“不信”的人更多，高达 46%。

经验越丰富的程序员，态度往往也越谨慎：只有 2.5% 的资深开发者“高度信任”AI，反倒有 20.7% 明确表示“高度不信任”。

正如有网友所说：“写代码变成了喂提示词 + 修烂摊子，AI 编程的未来也许值得期待，但现在还远没到可以闭眼上产线的阶段。”

对此，你怎么看？