AI 越来越强: 你却越来越累
过去半年,AI 的能力提升非常迅猛,编写代码、补充测试、生成文档、开展调研、修复缺陷等任务,原本需要数天甚至数周才能完成,如今几小时便可搞定。然而一个愈发明显的感受是:AI 越来越强,人却没有因此变得更轻松,反而更累了——这种累不仅是工作量增加,更是注意力、判断力和责任被进一步透支。
AI 很快,但人必须兜底。Agent 可以一次生成大量代码和测试,但最终是否正确、是否安全、是否符合产品目标,仍然要由人判断。问题是,AI 的生产速度已经远远超过人的审查速度:一个 Agent 一小时能生成几千行代码,而工程师很难在同样时间内真正理解这些代码。于是出现了一个悖论:不 Review,风险不可控;认真 Review,AI 带来的速度优势又会迅速消失。现实中,很多人已经没有足够时间去完整检查 Agent 的工作,只能看看能否运行、测试是否通过、页面是否正常,然后默认任务完成。但“可以运行”和“真正正确”之间,往往还有很长的距离。
看到分享《说好的烧一辈子 token 呢》里提到,AI 可能生成大量价值有限的测试,拖慢 CI/CD;出现问题后,人既不知道哪些该删,也很难判断所谓的修复,究竟是解决了真实问题,还是只用 mock 绕过了问题。我们交付了很多,却没有沉淀多少。
另一个更深的问题是:我们用 AI 做了很多事情,但自己似乎没有因此积累更多经验。传统开发中,人通常知道一个功能为什么存在、方案为什么这样设计、哪些路径被放弃、当前实现有什么限制。即使代码并不完美,参与者至少理解整个决策过程。但在 Agent Coding 中,工作流程常常变成:人提出需求,Agent 搜索代码、生成方案、不断修改,最后功能跑通。结果留下来的通常只有代码。至于 Agent 为什么这样写、做过哪些判断、哪些约束来自产品、哪些只是模型的临时选择,往往无从得知。于是,产品虽然交付了,产品背后的知识却没有被交付。几个月后,团队只看见一堆可以运行的代码,却很难解释它为什么是现在这个样子。
这意味着,大量 Token 只完成了一次性劳动,并没有转化成长期的组织资产。真正值得沉淀的,不只是代码,而是:
- 如何定义问题;
- 确认了哪些事实;
- 做出了什么取舍;
- 为什么选择这个方案;
- 哪些假设仍然没有验证。
如果这些内容没有留下来,下一次遇到类似问题时,团队依然要从头烧 Token。返工的根源,往往不是模型不够强。很多 AI 返工,表面上看是 Agent 没理解需求。但继续追问会发现,问题往往不是 Agent 不够聪明,而是团队自己也没有形成稳定、明确、可引用的产品定义。产品经理在聊天里说过一种方案,设计稿表达另一种方案,代码里保留着历史逻辑,会议上又临时改变了边界。Agent 每次工作,都要重新拼接这些碎片。于是,大量 Token 被消耗在重新理解项目、搜索历史信息、猜测真实需求、修正上一轮误解上。
更麻烦的是,今天的 Agent 大多是 Local First 的。它运行在某个人的电脑和代码仓库里,拥有一段局部上下文。一个工程师和 Agent 讨论了一下午,第二天另一个 Agent 并不知道发生过什么。Git 可以同步代码,却很难同步产品认知。Agent 之上,需要一层产品事实。
这也是我正在做 Product Spec 系统的原因。

它不是一个普通的 PRD 管理工具,而是一个面向 Agent 的人机协作系统,也可以理解成位于所有 Agent 之上的“产品事实层”。

每次 Agent 工作时,都会产生大量与产品定义有关的信息,例如:
- 一个功能为什么存在;
- 用户身份应该如何合并;
- 哪些版本只向部分用户开放;
- 某个字段为什么废弃;
- 哪个方案因为安全或成本被否决;
- 什么才算真正完成。
这些内容不应该只存在于一次性对话里,而应该被提取出来,形成可版本化、可追踪、可确认的产品事实。这样,新的 Agent 在开始工作前,不需要重新猜测产品,而是可以直接读取当前有效的产品定义;工作完成后,再把新产生的事实、决策和变更提交回来。代码仓库保存“系统现在是什么样”,Product Spec 保存“系统为什么变成这样”。
人不应该审核一切,而应该负责关键判断。“Human in the loop”不应该意味着,人要逐行检查 Agent 的所有输出。如果所有代码、测试、文档和操作都必须由人逐项确认,人迟早会成为整个系统的瓶颈。更合理的分工是:
- Agent 负责搜索、整理、生成、执行和验证;
- 人负责目标、优先级、边界、取舍、品味和责任。
人真正应该关注的,不是 Agent 每一步怎么做,而是:
- 为什么要做;
- 做到什么程度;
- 什么才算完成;
- 哪些结果可以接受;
- 哪些代价不能接受。
AI 时代真正稀缺的,不再只是编码能力,而是稳定的注意力、清晰的问题定义、产品判断和组织记忆。未来衡量 AI 生产力,不应该只看烧了多少 Token、生成了多少代码、完成了多少任务,而应该看:每一次 Agent 工作之后,组织究竟留下了什么?如果只留下代码,我们只是制造了更多未来需要理解和返工的东西。如果还能留下事实、决策、约束和认知,那么 AI 才真正从一次性工具,变成组织能力的一部分。