AI 越来越强: 你却越来越累

时间：2026-07-04 08:59:42 来源：互联网

过去半年，AI 的能力提升非常迅猛，编写代码、补充测试、生成文档、开展调研、修复缺陷等任务，原本需要数天甚至数周才能完成，如今几小时便可搞定。然而一个愈发明显的感受是：AI 越来越强，人却没有因此变得更轻松，反而更累了——这种累不仅是工作量增加，更是注意力、判断力和责任被进一步透支。

AI 很快，但人必须兜底。Agent 可以一次生成大量代码和测试，但最终是否正确、是否安全、是否符合产品目标，仍然要由人判断。问题是，AI 的生产速度已经远远超过人的审查速度：一个 Agent 一小时能生成几千行代码，而工程师很难在同样时间内真正理解这些代码。于是出现了一个悖论：不 Review，风险不可控；认真 Review，AI 带来的速度优势又会迅速消失。现实中，很多人已经没有足够时间去完整检查 Agent 的工作，只能看看能否运行、测试是否通过、页面是否正常，然后默认任务完成。但“可以运行”和“真正正确”之间，往往还有很长的距离。

看到分享《说好的烧一辈子 token 呢》里提到，AI 可能生成大量价值有限的测试，拖慢 CI/CD；出现问题后，人既不知道哪些该删，也很难判断所谓的修复，究竟是解决了真实问题，还是只用 mock 绕过了问题。我们交付了很多，却没有沉淀多少。

另一个更深的问题是：我们用 AI 做了很多事情，但自己似乎没有因此积累更多经验。传统开发中，人通常知道一个功能为什么存在、方案为什么这样设计、哪些路径被放弃、当前实现有什么限制。即使代码并不完美，参与者至少理解整个决策过程。但在 Agent Coding 中，工作流程常常变成：人提出需求，Agent 搜索代码、生成方案、不断修改，最后功能跑通。结果留下来的通常只有代码。至于 Agent 为什么这样写、做过哪些判断、哪些约束来自产品、哪些只是模型的临时选择，往往无从得知。于是，产品虽然交付了，产品背后的知识却没有被交付。几个月后，团队只看见一堆可以运行的代码，却很难解释它为什么是现在这个样子。

这意味着，大量 Token 只完成了一次性劳动，并没有转化成长期的组织资产。真正值得沉淀的，不只是代码，而是：

如何定义问题；
确认了哪些事实；
做出了什么取舍；
为什么选择这个方案；
哪些假设仍然没有验证。

如果这些内容没有留下来，下一次遇到类似问题时，团队依然要从头烧 Token。返工的根源，往往不是模型不够强。很多 AI 返工，表面上看是 Agent 没理解需求。但继续追问会发现，问题往往不是 Agent 不够聪明，而是团队自己也没有形成稳定、明确、可引用的产品定义。产品经理在聊天里说过一种方案，设计稿表达另一种方案，代码里保留着历史逻辑，会议上又临时改变了边界。Agent 每次工作，都要重新拼接这些碎片。于是，大量 Token 被消耗在重新理解项目、搜索历史信息、猜测真实需求、修正上一轮误解上。

更麻烦的是，今天的 Agent 大多是 Local First 的。它运行在某个人的电脑和代码仓库里，拥有一段局部上下文。一个工程师和 Agent 讨论了一下午，第二天另一个 Agent 并不知道发生过什么。Git 可以同步代码，却很难同步产品认知。Agent 之上，需要一层产品事实。

这也是我正在做 Product Spec 系统的原因。

它不是一个普通的 PRD 管理工具，而是一个面向 Agent 的人机协作系统，也可以理解成位于所有 Agent 之上的“产品事实层”。

每次 Agent 工作时，都会产生大量与产品定义有关的信息，例如：

一个功能为什么存在；
用户身份应该如何合并；
哪些版本只向部分用户开放；
某个字段为什么废弃；
哪个方案因为安全或成本被否决；
什么才算真正完成。

这些内容不应该只存在于一次性对话里，而应该被提取出来，形成可版本化、可追踪、可确认的产品事实。这样，新的 Agent 在开始工作前，不需要重新猜测产品，而是可以直接读取当前有效的产品定义；工作完成后，再把新产生的事实、决策和变更提交回来。代码仓库保存“系统现在是什么样”，Product Spec 保存“系统为什么变成这样”。

人不应该审核一切，而应该负责关键判断。“Human in the loop”不应该意味着，人要逐行检查 Agent 的所有输出。如果所有代码、测试、文档和操作都必须由人逐项确认，人迟早会成为整个系统的瓶颈。更合理的分工是：

Agent 负责搜索、整理、生成、执行和验证；
人负责目标、优先级、边界、取舍、品味和责任。

人真正应该关注的，不是 Agent 每一步怎么做，而是：

为什么要做；
做到什么程度；
什么才算完成；
哪些结果可以接受；
哪些代价不能接受。

AI 时代真正稀缺的，不再只是编码能力，而是稳定的注意力、清晰的问题定义、产品判断和组织记忆。未来衡量 AI 生产力，不应该只看烧了多少 Token、生成了多少代码、完成了多少任务，而应该看：每一次 Agent 工作之后，组织究竟留下了什么？如果只留下代码，我们只是制造了更多未来需要理解和返工的东西。如果还能留下事实、决策、约束和认知，那么 AI 才真正从一次性工具，变成组织能力的一部分。

上一篇：阿里云老用户福利：消费多少返多少个人最高返还 100 元企业最高返还 200 元下一篇：Cowart：给 Codex 配一个无限画布：直接在图片上标注修改