Skill封装

④ Skill 封装

定位:不用重新训练模型。一份精心设计的 Skill + 本体 + CLI,就能把通用模型变成特定领域专家——这是成本最低的杠杆,也是本 cookbook 的主线。前三件事让 Agent「能持续干活」,这一件让它「在你的业务里干得对」。

📎 上级:设计指南/Agent设计;出处:实践分享第一章 P6(4 件事之四)+ 第二章起全书主线。

一、一句话:一个 MD 文件,胜过微调百万参数

通用 Claude  +  [skills/tax.md]   =  税务专家
同一模型     +  [skills/law.md]   =  法律顾问

模型不变,外挂的领域资产变——换一份 Skill,就换一个专家。不碰参数,改一个文件就能迭代。

二、为什么是「最低成本的杠杆」

路线	成本	可控性	迭代
重新训练 / 微调	高(算力 + 数据 + 周期)	黑盒,难定位	慢,改一点要重训
纯 RAG	中	检索质量看运气	改语料,口径仍可能飘
Skill + 本体 + CLI	低(写文件)	白盒,规则可读可审	改 MD 即生效

杠杆的本质:把领域经验、口径、动作写成模型读得懂、Harness 跑得动的资产——而不是寄望模型「天生就懂你的业务」。

三、三件套:各管一段

件	注入什么	一句话	深入
Skill	经验 / 流程 / 输出契约	把一个场景的 SOP 与踩坑沉淀成可复用能力包(按需加载)	设计指南/Skill设计
本体	语义 / 口径 / 关系	让 AI 按业务真相推理,而不是靠通识猜(TBox + ABox)	设计指南/本体设计
CLI	动作 / 指令系统	给 AI 的稳定工具集——把领域动作收敛成可组合命令	设计指南/CLI设计

三者分工:Skill 管「怎么做」,本体管「业务是什么」,CLI 管「用什么动作做」。再配上人机协作的设计指南/AUI设计,就是一个完整的垂直 Agent。

四、和前三件事的关系

①感知-行动循环给 Agent 手脚 → CLI 就是这套手脚的领域化。
②记忆管理 + ③上下文管理给 Agent 干净的工作台 → Skill 的渐进披露,正是在这块工作台上「只放该放的领域知识」。
④Skill 封装决定 Agent 干得对不对 → 没有它,前三件事造出的是个「能干活但不懂你业务」的通用壳。

五、案例:从「写了 2000 字还答错」到「一个文件就成专家」

新人想让通用 Claude 当成本分析师,办法是把 prompt 越写越长:口径说明、字段含义、注意事项……堆到 2000 字。结果还是飘——问「建安单方」,一会儿除建筑面积、一会儿除可售面积;父子科目一起加,货值翻三倍。每次出错就再往 prompt 里补一句,补成一团浆糊,换个人问法又崩。

换成封装的思路后:

通用 Claude
  + skills/cost-query.md   ← Skill:问数 SOP + 踩坑 + 输出契约(按需加载)
  + 成本本体 (TBox/ABox)    ← 本体:末级科目、含税口径、父子不混算「写死」成护栏
  + cost-query CLI          ← CLI:把取数动作收敛成稳定命令
  = 成本分析师

「默认只取末级科目」成了本体里的 axiom,引擎自动补 WHERE isEndCost=1——模型再厉害也绕不过,货值三倍 bug 从根上消失(见设计指南/本体设计的护栏)。
真正惊艳的是可迁移:把 cost-query.md 换成 tax.md,同一个模型立刻变税务专家;控制价审核的判断标准写成一套 Skill+CLI,它又成了审核专家(见实践分享/控制价审核CLI化实战)。

一句话收尾:2000 字 prompt 是「求模型记住」,封装是「给模型外挂一套领域资产」。前者越补越乱,后者改一个 MD 文件就迭代——一个文件,胜过微调百万参数。

参考与延伸

三大设计层(本 cookbook 主体):设计指南/Skill设计 · 设计指南/本体设计 · 设计指南/CLI设计 · 设计指南/AUI设计
按场景落地:场景指南(录入 / 问数 / 报告 / 审核)
完整专题:场景指南/问数;真实案例:实践分享/控制价审核CLI化实战
回到 Harness 全景 → 设计指南/Agent设计