Skip to content

Skill封装

定位:不用重新训练模型。一份精心设计的 Skill + 本体 + CLI,就能把通用模型变成特定领域专家——这是成本最低的杠杆,也是本 cookbook 的主线。前三件事让 Agent「能持续干活」,这一件让它「在你的业务里干得对」。

📎 上级:设计指南/Agent设计;出处:实践分享第一章 P6(4 件事之四)+ 第二章起全书主线。


一、一句话:一个 MD 文件,胜过微调百万参数

Section titled “一、一句话:一个 MD 文件,胜过微调百万参数”
通用 Claude + [skills/tax.md] = 税务专家
同一模型 + [skills/law.md] = 法律顾问

模型不变,外挂的领域资产变——换一份 Skill,就换一个专家。不碰参数,改一个文件就能迭代。

二、为什么是「最低成本的杠杆」

Section titled “二、为什么是「最低成本的杠杆」”
路线成本可控性迭代
重新训练 / 微调高(算力 + 数据 + 周期)黑盒,难定位慢,改一点要重训
纯 RAG检索质量看运气改语料,口径仍可能飘
Skill + 本体 + CLI低(写文件)白盒,规则可读可审改 MD 即生效

杠杆的本质:把领域经验、口径、动作写成模型读得懂、Harness 跑得动的资产——而不是寄望模型「天生就懂你的业务」。

注入什么一句话深入
Skill经验 / 流程 / 输出契约把一个场景的 SOP 与踩坑沉淀成可复用能力包(按需加载)设计指南/Skill设计
本体语义 / 口径 / 关系让 AI 按业务真相推理,而不是靠通识猜(TBox + ABox)设计指南/本体设计
CLI动作 / 指令系统给 AI 的稳定工具集——把领域动作收敛成可组合命令设计指南/CLI设计

三者分工:Skill 管「怎么做」,本体管「业务是什么」,CLI 管「用什么动作做」。再配上人机协作的 设计指南/AUI设计,就是一个完整的垂直 Agent。

  • ①感知-行动循环 给 Agent 手脚 → CLI 就是这套手脚的领域化。
  • ②记忆管理 + ③上下文管理 给 Agent 干净的工作台 → Skill 的渐进披露,正是在这块工作台上「只放该放的领域知识」。
  • ④Skill 封装 决定 Agent 干得对不对 → 没有它,前三件事造出的是个「能干活但不懂你业务」的通用壳。

五、案例:从「写了 2000 字还答错」到「一个文件就成专家」

Section titled “五、案例:从「写了 2000 字还答错」到「一个文件就成专家」”

新人想让通用 Claude 当成本分析师,办法是把 prompt 越写越长:口径说明、字段含义、注意事项……堆到 2000 字。结果还是飘——问「建安单方」,一会儿除建筑面积、一会儿除可售面积;父子科目一起加,货值翻三倍。每次出错就再往 prompt 里补一句,补成一团浆糊,换个人问法又崩。

换成封装的思路后:

通用 Claude
+ skills/cost-query.md ← Skill:问数 SOP + 踩坑 + 输出契约(按需加载)
+ 成本本体 (TBox/ABox) ← 本体:末级科目、含税口径、父子不混算「写死」成护栏
+ cost-query CLI ← CLI:把取数动作收敛成稳定命令
= 成本分析师
  • 「默认只取末级科目」成了本体里的 axiom,引擎自动补 WHERE isEndCost=1——模型再厉害也绕不过,货值三倍 bug 从根上消失(见 设计指南/本体设计 的护栏)。
  • 真正惊艳的是可迁移:把 cost-query.md 换成 tax.md,同一个模型立刻变税务专家;控制价审核的判断标准写成一套 Skill+CLI,它又成了审核专家(见 实践分享/控制价审核CLI化实战)。

一句话收尾:2000 字 prompt 是「求模型记住」,封装是「给模型外挂一套领域资产」。前者越补越乱,后者改一个 MD 文件就迭代——一个文件,胜过微调百万参数