[ PROMPT_NODE_26128 ]
testing-skills-with-subagents
[ SKILL_DOCUMENTATION ]
# 使用子智能体测试技能
**加载此参考的时机:** 创建或编辑技能时,在部署之前,以验证它们在压力下是否有效并能抵御合理化借口。
## 概述
**测试技能就是应用于流程文档的 TDD(测试驱动开发)。**
你在没有技能的情况下运行场景(红色 - 观察智能体失败),编写解决这些失败的技能(绿色 - 观察智能体合规),然后堵住漏洞(重构 - 保持合规)。
**核心原则:** 如果你没有观察过智能体在没有技能的情况下失败,你就不知道该技能是否能防止正确的失败。
**必需背景:** 在使用此技能之前,你必须理解 superpowers:test-driven-development。该技能定义了基础的红-绿-重构循环。此技能提供了特定于技能的测试格式(压力场景、合理化表格)。
**完整示例:** 请参阅 examples/CLAUDE_MD_TESTING.md,了解测试 CLAUDE.md 文档变体的完整测试活动。
## 何时使用
测试以下技能:
- 执行纪律(TDD、测试要求)
- 具有合规成本(时间、精力、返工)
- 可能被合理化绕过(“就这一次”)
- 与即时目标相冲突(速度优先于质量)
不要测试:
- 纯参考技能(API 文档、语法指南)
- 没有违规规则的技能
- 智能体没有动力去绕过的技能
## 技能测试的 TDD 映射
| TDD 阶段 | 技能测试 | 你要做什么 |
|-----------|---------------|-------------|
| **红色 (RED)** | 基准测试 | 在没有技能的情况下运行场景,观察智能体失败 |
| **验证红色** | 捕获合理化借口 | 逐字记录确切的失败原因 |
| **绿色 (GREEN)** | 编写技能 | 解决特定的基准失败 |
| **验证绿色** | 压力测试 | 在有技能的情况下运行场景,验证合规性 |
| **重构 (REFACTOR)** | 堵住漏洞 | 发现新的合理化借口,添加反制措施 |
| **保持绿色** | 重新验证 | 再次测试,确保仍然合规 |
与代码 TDD 相同的循环,只是测试格式不同。
## 红色阶段:基准测试(观察它失败)
**目标:** 在没有技能的情况下运行测试 - 观察智能体失败,记录确切的失败。
这与 TDD 的“先写失败测试”相同 - 在编写技能之前,你必须看到智能体自然会做什么。
**流程:**
- [ ] **创建压力场景**(3 个以上的组合压力)
- [ ] **在没有技能的情况下运行** - 给智能体一个带有压力的现实任务
- [ ] **逐字记录选择和合理化借口**
- [ ] **识别模式** - 哪些借口反复出现?
- [ ] **记录有效的压力点**