真实面经题目 · 原创解析

Agent Skill 如何用渐进式披露按需加载能力说明、执行步骤和工具细节?

这题考察 Agent Skill 的核心机制,以及如何通过渐进式披露降低上下文负担。Skill 不是简单工具函数,而是一组可被 Agent 发现、选择和执行的能力包,通常包含能力说明、适用条件、输入输出、执行步骤、工具依赖和失败处理。渐进式披露的关键是先暴露轻量索引和选择信号,只有命中时再加载详细说明、示例和执行细节。

出现于:快手 · AI 应用开发

60 秒回答模板

Agent Skill 可以理解为把某类任务的知识、流程和工具调用封装成可复用能力。渐进式披露的设计目标是避免把所有 Skill 的完整说明一次性塞进上下文,而是分层加载:第一层只给技能名称、简短描述、触发条件和风险等级,帮助 Agent 判断是否需要;第二层在选中后加载详细输入输出、步骤、约束和示例;第三层执行时再加载工具 schema、校验规则、回滚方式和异常处理。这样既能减少 token 和干扰,又能让 Agent 在需要时拿到足够细节。工程上要配合检索、权限、版本、日志和评估,避免 Skill 被误触发或执行失控。

考点 先索引再细节
难度 真实面经题
回答目标 展示你理解 Skill 作为 Agent 能力包的工程价值,并能设计按需加载机制来兼顾效果、成本和可靠性。

深入解析

01

Skill 定义

Skill 应描述它能解决什么任务、何时适用、需要什么输入、会产出什么结果、依赖哪些工具、有哪些限制。它比普通 tool 更高层,通常包含一段操作流程和领域经验;它也比系统 prompt 更模块化,可以按需启用、版本化和治理。

02

分层暴露

渐进式披露通常分为索引层、说明层和执行层。索引层用于选择,内容短且稳定;说明层用于规划,包含步骤、约束和示例;执行层用于真正调用工具,包含参数 schema、错误码、权限和补偿策略。不同层在不同阶段加载,可以减少无关信息污染。

03

触发与选择

Agent 可以通过关键词、意图分类、向量检索、规则匹配或模型选择来决定是否加载某个 Skill。触发条件要写清楚,不只写“可用于处理文档”,还要说明适合什么输入、不适合什么场景、与相似 Skill 的区别。否则模型容易误选或重复加载。

04

执行可靠性

Skill 执行时要有输入校验、步骤检查点、工具调用日志和失败恢复。对于外部副作用操作,Skill 应暴露风险级别、审批要求、dry-run 能力和回滚说明。这样 Agent 不会因为加载了执行细节就直接越权操作。

05

治理与评估

Skill 需要版本管理和效果评估。可以统计触发准确率、执行成功率、平均 token 成本、人工接管率、错误恢复率。发现问题后,不一定改大模型,可能是 Skill 描述不清、触发条件太宽、示例不足或工具错误信息不可读。

易错点

  • 把 Skill 等同于一个函数或 API,忽略任务流程、适用条件和失败处理。
  • 一次性把所有 Skill 细节塞进上下文,导致 token 浪费和模型混淆。
  • 触发条件写得过宽,Agent 无法区分相似 Skill。
  • 只描述成功路径,没有权限、风险、重试、回滚和日志设计。

面试官追问

Skill 和 MCP tool 有什么区别?

Tool 更像具体外部能力接口,强调参数和调用;Skill 更像任务解决方案,描述何时使用、怎么规划、调用哪些工具、如何处理失败。Skill 可以调用多个 tool,也可以只提供操作流程。

如何避免加载太多 Skill?

可以先给短描述索引,通过意图分类或检索召回少量候选,再让模型二次选择。还应设置互斥关系、优先级和置信阈值,低置信时要求澄清或不加载。

Skill 文档应该写多细?

索引层要短,执行层要具体。被模型直接执行的步骤、输入约束、错误处理和工具 schema 必须清晰;背景解释和长篇原理应尽量放到按需加载的深层文档里。

如何评估渐进式披露是否有效?

看 token 成本是否下降、误触发是否减少、任务成功率是否保持或提升、工具参数错误是否降低。还可以对比全量加载和分层加载在同一任务集上的表现。