真实面经题目 · 原创解析

Prompt 优化有哪些常见方法?

Prompt 优化的核心是降低任务歧义、补齐上下文、明确输出约束,并建立可评估的迭代过程。常见方法包括明确目标和受众、给出背景材料、拆解任务步骤、规定输出格式、提供正反例、使用分隔符、约束边界条件、要求模型列出假设和不确定性,以及通过测试集持续比较效果。

出现于:字节跳动 · 前端

60 秒回答模板

Prompt 优化可以从任务、上下文、格式、示例和评估五方面回答。任务上,要明确让模型做什么、为谁做、成功标准是什么;上下文上,要提供必要事实、输入数据、业务约束和禁止事项,并用分隔符区分指令与材料;格式上,要规定输出结构、字段、长度、语言和风格;示例上,可以给 few-shot 正例和反例,让模型学习边界;复杂任务上,可以先拆解为分析、生成、检查或让模型输出简短依据和假设。最后一定要用真实样本评估,而不是凭一次结果感觉好坏。涉及生产系统时,还要考虑提示注入、上下文污染、敏感信息和失败兜底。

考点 降低歧义
难度 真实面经高频题
回答目标 讲清机制、边界和追问

深入解析

01

明确任务

很多 Prompt 效果差不是模型能力不足,而是任务描述含糊。优化的第一步是把目标、输入、输出、受众、场景和成功标准写清楚。例如生成文案、抽取字段、分类、改写、代码审查、问答和规划,是完全不同的任务。一个好 Prompt 应该让模型知道优先优化准确性、完整性、简洁性、创意性还是格式稳定性。

02

补充上下文

模型无法自动知道业务背景、术语定义、数据来源、用户意图和产品边界。上下文应提供完成任务所必需的事实,同时避免无关材料淹没重点。使用清晰分隔符标记输入资料、用户文本、系统规则和参考样例,可以降低模型把材料误当指令的概率。对于检索增强任务,还要要求模型只基于给定资料回答,并说明资料不足时如何处理。

03

规定格式

如果输出要被程序消费,格式约束比语气描述更重要。可以指定 JSON 字段、Markdown 层级、表格列、字数范围、语言、是否允许空值、排序规则和错误时的返回结构。格式越明确,后处理越稳定。结构化输出任务还应避免让模型自由发挥字段名,并明确缺失信息时返回 null、空数组还是解释性文本。

04

提供示例

Few-shot 示例能显著帮助模型理解边界,尤其是分类、抽取、语气改写、复杂格式和领域术语任务。正例展示理想答案,反例展示哪些输出不合格。示例要覆盖常见难点,而不是只放最简单样本。示例过多也会占用上下文并可能引入偏差,所以需要用代表性案例而不是堆材料。

05

评估迭代

Prompt 优化应该像工程调参一样有样本集和评价标准。每次修改要比较准确率、格式通过率、幻觉率、拒答率、长度稳定性和成本延迟。对复杂任务,可以把一个大 Prompt 拆成抽取、判断、生成、校验多个阶段;也可以加入自检清单,让模型检查是否遗漏约束。生产环境还要加入安全过滤、超时重试和人工兜底。

易错点

  • 只写一句泛泛要求,例如回答得专业一点,没有目标、上下文和评价标准。
  • 把业务资料、用户输入和模型指令混在一起,增加提示注入和误解风险。
  • 要求固定 JSON 却不给字段定义、缺失值规则和错误返回格式。
  • 只凭单次输出调整 Prompt,没有用真实样本集比较准确率、格式稳定性和失败案例。

面试官追问

Prompt 越长越好吗?

不是。Prompt 要足够明确,但冗长无关的上下文会稀释重点、增加成本并引入干扰。好的 Prompt 是信息密度高,必要约束清楚,示例覆盖关键边界。

什么时候需要 few-shot 示例?

当任务边界难以用规则说清,或输出风格、分类标准、抽取格式需要稳定复现时,few-shot 很有价值。简单问答或明确转换任务可能不需要示例。

如何减少模型幻觉?

提供可靠上下文,要求只基于给定资料回答,明确资料不足时说明无法判断;让模型列出依据来源或引用片段;降低开放生成空间;对关键事实加检索、校验或人工审核。

为什么要让模型说明假设和不确定性?

很多任务输入不完整,模型容易补全不存在的信息。要求列出假设和不确定性,可以把隐含猜测显性化,帮助调用方决定是否继续追问、检索或人工确认。