Skip to content

术语表

📔 术语表

全 cookbook 核心术语速查。问数领域专有术语(cube/measure/收口门/五差等)见场景指南/问数/附录C。

编排 / Harness

术语	含义
Harness	包着模型的那层「壳」,把单次预测机器变成能持续干活的 Agent。见设计指南/Agent设计
Agent = Model + Harness	Agent 不是更聪明的模型,是模型 + 让它干活的装置
笨循环	生成→评估→再来的感知-行动循环,Harness 的心脏
4 件根本的事	工具调用 / 记忆与上下文 / 注意力管理 / 领域能力注入
子 agent(Sub-Agent)	独立上下文的并行/流水线执行单元

Skill

术语	含义
Skill	把场景的经验/流程/工具/输出契约沉淀成给 AI 用的可复用资产。见设计指南/Skill设计
SKILL.md	Skill 正文,200–500 行,放核心流程/触发/边界/导航
三级加载	L1 metadata 常驻 / L2 SKILL.md 按需 / L3 references·scripts 关联
渐进披露	正文只放决策所需最小信息,其余按需加载
description	frontmatter 触发描述,决定 Skill 能否被叫起来
六大缺陷	知识时效/私有知识/会踩坑/缺标准/不知用啥工具/缺样例——Skill 用确定性逐一钉死

CLI / CI

术语	含义
CLI / CI(Command Interface)	给 Agent 调用的指令系统:稳定、短、可验证、可组合。见设计指南/CLI设计
AI 原生 CLI	服务对象是模型:JSON 输出、error_code+hint、schema 可验证
物理隔离	让 AI 看不到的从文件系统上让它看不到(强于文档约定)
三种 CLI 原型	查询类(API)/ 分析类(DSL)/ 操作类(API)
doctor / schema / dry-run / verify / audit	CLI 基础命令:探活 / 取参数 / 预演 / 写后验证 / 审计
R0–R3	风险分级:纯读 / 低风险写 / 状态变更 / 财务删除外发
evidence	成功必须带的证据(readback_ok、audit_id),没它=假完成
preset	按场景只暴露最小必要命令集(lark-mcp 范式)

本体 / DSL

术语	含义
本体 Ontology	让 AI 理解业务的语义层(≠ 宽表)。见设计指南/本体设计
TBox	术语/概念层:类·属性·关系·约束,DSL 的词典。见设计指南/本体设计/TBox
ABox	断言/实例层:真实事实 + 关系,支撑下钻归因。见设计指南/本体设计/ABox
DSL	find / aggregate / rank 三指令,模型填 JSON、引擎编 SQL
defaultFilters(护栏)	写在本体的口径铁律,引擎自动注入 WHERE,用户无感
resonance / substitute	ABox 关系:共振(一特征带多科目)/ 替代(互斥方案)
宽表	物理查询手段之一;本体可对接宽表也可对接 API

AUI

术语	含义
AUI(Agent UI)	把 AI 当「用户」设计交互 + 教 AI 跟用户交互,人机双向。见设计指南/AUI设计
先问后做	口径不明确时先 Ask Question 确认,再执行(不抢答)
Ask Question	把模糊问题压成 A/B/C 点选的确认机制

质量 / 治理

术语	含义
Agent-as-Judge	评测主体也会干活,看「整个任务做得好不好」。见评测与改进/评测
红线层 / 质量层	红线一票否决(数据准确率100%/不造数)；质量层综合打分
三层金字塔	L1 单测 / L2 Skill 测试 / L3 E2E
会话 JSONL	Claude Code 自动落的对话流水,客观评测数据源
8 层排查	任务理解→Skill触发→上下文→工具→参数→环境→恢复→验证。见评测与改进/失败分析与治理
错误 taxonomy	INTENT/SKILL_TRIGGER/CONTEXT/ARGUMENT/ENV… 错误打标签
假完成 false_done	看起来完成实则没产物(没 evidence)

← 返回参考