检查清单
📋 检查清单
Section titled “📋 检查清单”设计/上线前的速查清单。深度展开见各对应页。
✅ Skill 自检
Section titled “✅ Skill 自检”- description 写触发条件/触发词(不是「我能做什么」),正反例都给
- SKILL.md ≤ 200–500 行,细节迁 references
- 写了「何时用 / 何时不用」
- 稳定动作靠 scripts/CLI,不靠模型自由发挥
- 高风险动作有确认规则
- 有 examples + troubleshooting + 明确完成标准
✅ CLI/CI 自检
Section titled “✅ CLI/CI 自检”- 有
doctor/help/schema - stdout 纯 JSON,stderr 走日志/进度
- 错误结构化:
error_code+hint+details - 写操作有
dry-run,高风险要--yes - 写后有
verify/readback,返回 evidence - 命令名是业务动词、参数业务化(不是 API URL /
--guid1) - 命令短;复杂度封进命令内部
- 按场景 preset 暴露最小命令集
✅ 安全分级(R0–R3)
Section titled “✅ 安全分级(R0–R3)”| 等级 | 类型 | 策略 |
|---|---|---|
| R0 | 纯读 | 直接执行 |
| R1 | 低风险写 | 明确意图即可 |
| R2 | 状态变更 | 默认 dry-run,需确认 |
| R3 | 财务/删除/撤销/外发 | dry-run + 人工确认 + audit + readback |
✅ 评测红线(一票否决)
Section titled “✅ 评测红线(一票否决)”- 数据准确率 100%
- 不造数据
- 不靠检索/记忆作答
→ 评测与改进/评测
✅ 失败归因决策树(是不是「模型不行」?)
Section titled “✅ 失败归因决策树(是不是「模型不行」?)”1 Skill/工具说明清楚吗? 否 → 改文档2 参数 schema 稳定可解析吗? 否 → 改 CLI3 模型能看到必要上下文吗? 否 → 改上下文4 错误给了可操作 hint 吗? 否 → 改错误输出5 多模型都失败? 是 → 流程/工具问题6 只有某模型清晰指令下反复违约? 才更可能是模型遵循问题✅ 没有 evidence 不算 done
Section titled “✅ 没有 evidence 不算 done”| 任务 | 必须验证 |
|---|---|
| 文件生成 | ls -lh / 编码 / 大小 / 读回 |
| 图片视频 | file / 尺寸 / 发送 messageId |
| API 写操作 | 写后 query/readback |
| Git | status / commit hash / push result |
✅ 问数类立项 / 上线(专题)
Section titled “✅ 问数类立项 / 上线(专题)”← 返回 参考