Skip to content

术语表

全 cookbook 核心术语速查。问数领域专有术语(cube/measure/收口门/五差等)见 场景指南/问数/附录C。

术语含义
Harness包着模型的那层「壳」,把单次预测机器变成能持续干活的 Agent。见 设计指南/Agent设计
Agent = Model + HarnessAgent 不是更聪明的模型,是模型 + 让它干活的装置
笨循环生成→评估→再来的感知-行动循环,Harness 的心脏
4 件根本的事工具调用 / 记忆与上下文 / 注意力管理 / 领域能力注入
子 agent(Sub-Agent)独立上下文的并行/流水线执行单元
术语含义
Skill把场景的经验/流程/工具/输出契约沉淀成给 AI 用的可复用资产。见 设计指南/Skill设计
SKILL.mdSkill 正文,200–500 行,放核心流程/触发/边界/导航
三级加载L1 metadata 常驻 / L2 SKILL.md 按需 / L3 references·scripts 关联
渐进披露正文只放决策所需最小信息,其余按需加载
descriptionfrontmatter 触发描述,决定 Skill 能否被叫起来
六大缺陷知识时效/私有知识/会踩坑/缺标准/不知用啥工具/缺样例——Skill 用确定性逐一钉死
术语含义
CLI / CI(Command Interface)给 Agent 调用的指令系统:稳定、短、可验证、可组合。见 设计指南/CLI设计
AI 原生 CLI服务对象是模型:JSON 输出、error_code+hint、schema 可验证
物理隔离让 AI 看不到的从文件系统上让它看不到(强于文档约定)
三种 CLI 原型查询类(API)/ 分析类(DSL)/ 操作类(API)
doctor / schema / dry-run / verify / auditCLI 基础命令:探活 / 取参数 / 预演 / 写后验证 / 审计
R0–R3风险分级:纯读 / 低风险写 / 状态变更 / 财务删除外发
evidence成功必须带的证据(readback_ok、audit_id),没它=假完成
preset按场景只暴露最小必要命令集(lark-mcp 范式)
术语含义
本体 Ontology让 AI 理解业务的语义层(≠ 宽表)。见 设计指南/本体设计
TBox术语/概念层:类·属性·关系·约束,DSL 的词典。见 设计指南/本体设计/TBox
ABox断言/实例层:真实事实 + 关系,支撑下钻归因。见 设计指南/本体设计/ABox
DSLfind / aggregate / rank 三指令,模型填 JSON、引擎编 SQL
defaultFilters(护栏)写在本体的口径铁律,引擎自动注入 WHERE,用户无感
resonance / substituteABox 关系:共振(一特征带多科目)/ 替代(互斥方案)
宽表物理查询手段之一;本体可对接宽表也可对接 API
术语含义
AUI(Agent UI)把 AI 当「用户」设计交互 + 教 AI 跟用户交互,人机双向。见 设计指南/AUI设计
先问后做口径不明确时先 Ask Question 确认,再执行(不抢答)
Ask Question把模糊问题压成 A/B/C 点选的确认机制
术语含义
Agent-as-Judge评测主体也会干活,看「整个任务做得好不好」。见 评测与改进/评测
红线层 / 质量层红线一票否决(数据准确率100%/不造数);质量层综合打分
三层金字塔L1 单测 / L2 Skill 测试 / L3 E2E
会话 JSONLClaude Code 自动落的对话流水,客观评测数据源
8 层排查任务理解→Skill触发→上下文→工具→参数→环境→恢复→验证。见 评测与改进/失败分析与治理
错误 taxonomyINTENT/SKILL_TRIGGER/CONTEXT/ARGUMENT/ENV… 错误打标签
假完成 false_done看起来完成实则没产物(没 evidence)

← 返回 参考