Skill封装
④ Skill 封装
Section titled “④ Skill 封装”定位:不用重新训练模型。一份精心设计的 Skill + 本体 + CLI,就能把通用模型变成特定领域专家——这是成本最低的杠杆,也是本 cookbook 的主线。前三件事让 Agent「能持续干活」,这一件让它「在你的业务里干得对」。
📎 上级:设计指南/Agent设计;出处:实践分享第一章 P6(4 件事之四)+ 第二章起全书主线。
一、一句话:一个 MD 文件,胜过微调百万参数
Section titled “一、一句话:一个 MD 文件,胜过微调百万参数”通用 Claude + [skills/tax.md] = 税务专家同一模型 + [skills/law.md] = 法律顾问模型不变,外挂的领域资产变——换一份 Skill,就换一个专家。不碰参数,改一个文件就能迭代。
二、为什么是「最低成本的杠杆」
Section titled “二、为什么是「最低成本的杠杆」”| 路线 | 成本 | 可控性 | 迭代 |
|---|---|---|---|
| 重新训练 / 微调 | 高(算力 + 数据 + 周期) | 黑盒,难定位 | 慢,改一点要重训 |
| 纯 RAG | 中 | 检索质量看运气 | 改语料,口径仍可能飘 |
| Skill + 本体 + CLI | 低(写文件) | 白盒,规则可读可审 | 改 MD 即生效 |
杠杆的本质:把领域经验、口径、动作写成模型读得懂、Harness 跑得动的资产——而不是寄望模型「天生就懂你的业务」。
三、三件套:各管一段
Section titled “三、三件套:各管一段”| 件 | 注入什么 | 一句话 | 深入 |
|---|---|---|---|
| Skill | 经验 / 流程 / 输出契约 | 把一个场景的 SOP 与踩坑沉淀成可复用能力包(按需加载) | 设计指南/Skill设计 |
| 本体 | 语义 / 口径 / 关系 | 让 AI 按业务真相推理,而不是靠通识猜(TBox + ABox) | 设计指南/本体设计 |
| CLI | 动作 / 指令系统 | 给 AI 的稳定工具集——把领域动作收敛成可组合命令 | 设计指南/CLI设计 |
三者分工:Skill 管「怎么做」,本体管「业务是什么」,CLI 管「用什么动作做」。再配上人机协作的 设计指南/AUI设计,就是一个完整的垂直 Agent。
四、和前三件事的关系
Section titled “四、和前三件事的关系”- ①感知-行动循环 给 Agent 手脚 → CLI 就是这套手脚的领域化。
- ②记忆管理 + ③上下文管理 给 Agent 干净的工作台 → Skill 的渐进披露,正是在这块工作台上「只放该放的领域知识」。
- ④Skill 封装 决定 Agent 干得对不对 → 没有它,前三件事造出的是个「能干活但不懂你业务」的通用壳。
五、案例:从「写了 2000 字还答错」到「一个文件就成专家」
Section titled “五、案例:从「写了 2000 字还答错」到「一个文件就成专家」”新人想让通用 Claude 当成本分析师,办法是把 prompt 越写越长:口径说明、字段含义、注意事项……堆到 2000 字。结果还是飘——问「建安单方」,一会儿除建筑面积、一会儿除可售面积;父子科目一起加,货值翻三倍。每次出错就再往 prompt 里补一句,补成一团浆糊,换个人问法又崩。
换成封装的思路后:
通用 Claude + skills/cost-query.md ← Skill:问数 SOP + 踩坑 + 输出契约(按需加载) + 成本本体 (TBox/ABox) ← 本体:末级科目、含税口径、父子不混算「写死」成护栏 + cost-query CLI ← CLI:把取数动作收敛成稳定命令 = 成本分析师- 「默认只取末级科目」成了本体里的 axiom,引擎自动补
WHERE isEndCost=1——模型再厉害也绕不过,货值三倍 bug 从根上消失(见 设计指南/本体设计 的护栏)。 - 真正惊艳的是可迁移:把
cost-query.md换成tax.md,同一个模型立刻变税务专家;控制价审核的判断标准写成一套 Skill+CLI,它又成了审核专家(见 实践分享/控制价审核CLI化实战)。
一句话收尾:2000 字 prompt 是「求模型记住」,封装是「给模型外挂一套领域资产」。前者越补越乱,后者改一个 MD 文件就迭代——一个文件,胜过微调百万参数。
- 三大设计层(本 cookbook 主体):设计指南/Skill设计 · 设计指南/本体设计 · 设计指南/CLI设计 · 设计指南/AUI设计
- 按场景落地:场景指南(录入 / 问数 / 报告 / 审核)
- 完整专题:场景指南/问数;真实案例:实践分享/控制价审核CLI化实战
- 回到 Harness 全景 → 设计指南/Agent设计