在既有项目里,AI 最大的风险不是“写不出来”,而是改了却没人真正验证。测试策略的价值,就是把 AI 输出放进更可靠的检查体系里,让问题更早暴露、更容易定位。

核心目标先验证,再相信

不要把模型输出直接当结果,而要把它放进可重复、可对抗的验证流程里。

适用场景已有系统持续迭代

越是已有复杂逻辑和历史包袱的项目,越需要把测试策略前置。

推荐思路从覆盖走向对抗

先补基础覆盖,再补跨层验证,最后用对抗方式进一步提高可靠性。

三层测试模型

既有项目最稳妥的方式,不是只加一种测试,而是让不同层级共同承担验证责任。

  • 单元测试:验证核心函数和局部逻辑。
  • 集成测试:验证模块之间的协作和数据流。
  • 对抗测试:用更强的怀疑视角主动找出潜在问题。

核心工具

testspec 的价值不只是“多测一点”,而是通过两个 AI 互相挑刺,把潜在问题提前暴露出来。

  • 让一个 AI 负责生成实现或测试。
  • 让另一个 AI 负责从反例和漏洞角度找问题。
  • 把 AI 从“生成器”变成“生成 + 质疑”双重角色。
去 testspec 看看 →

实施步骤

1. 补充单元测试

先把最关键的核心逻辑覆盖起来,保证 AI 生成代码后有最基本的回归保护。

2. 建立集成测试

把服务之间、模块之间和接口之间的协作关系验证起来。

3. 引入对抗测试

让 AI 从反例、边界和失败路径角度主动挑刺。

4. 持续优化覆盖率

把测试结果反过来推动 Spec、实现和协作流程持续改进。