在既有项目里,AI 最大的风险不是“写不出来”,而是改了却没人真正验证。测试策略的价值,就是把 AI 输出放进更可靠的检查体系里,让问题更早暴露、更容易定位。
核心目标先验证,再相信
不要把模型输出直接当结果,而要把它放进可重复、可对抗的验证流程里。
适用场景已有系统持续迭代
越是已有复杂逻辑和历史包袱的项目,越需要把测试策略前置。
推荐思路从覆盖走向对抗
先补基础覆盖,再补跨层验证,最后用对抗方式进一步提高可靠性。
三层测试模型
既有项目最稳妥的方式,不是只加一种测试,而是让不同层级共同承担验证责任。
- 单元测试:验证核心函数和局部逻辑。
- 集成测试:验证模块之间的协作和数据流。
- 对抗测试:用更强的怀疑视角主动找出潜在问题。
核心工具
testspec 的价值不只是“多测一点”,而是通过两个 AI 互相挑刺,把潜在问题提前暴露出来。
- 让一个 AI 负责生成实现或测试。
- 让另一个 AI 负责从反例和漏洞角度找问题。
- 把 AI 从“生成器”变成“生成 + 质疑”双重角色。
实施步骤
1. 补充单元测试
先把最关键的核心逻辑覆盖起来,保证 AI 生成代码后有最基本的回归保护。
2. 建立集成测试
把服务之间、模块之间和接口之间的协作关系验证起来。
3. 引入对抗测试
让 AI 从反例、边界和失败路径角度主动挑刺。
4. 持续优化覆盖率
把测试结果反过来推动 Spec、实现和协作流程持续改进。