Prompt 优化有哪些常见方法？｜字节跳动前端面经解析

60 秒回答模板

Prompt 优化可以从任务、上下文、格式、示例和评估五方面回答。任务上，要明确让模型做什么、为谁做、成功标准是什么；上下文上，要提供必要事实、输入数据、业务约束和禁止事项，并用分隔符区分指令与材料；格式上，要规定输出结构、字段、长度、语言和风格；示例上，可以给 few-shot 正例和反例，让模型学习边界；复杂任务上，可以先拆解为分析、生成、检查或让模型输出简短依据和假设。最后一定要用真实样本评估，而不是凭一次结果感觉好坏。涉及生产系统时，还要考虑提示注入、上下文污染、敏感信息和失败兜底。

考点 明确任务

主线 补充上下文

易错点 只写一句泛泛要求，例如回答得专业一点，没有目标、上下文…

深入解析

明确任务

很多 Prompt 效果差不是模型能力不足，而是任务描述含糊。优化的第一步是把目标、输入、输出、受众、场景和成功标准写清楚。例如生成文案、抽取字段、分类、改写、代码审查、问答和规划，是完全不同的任务。一个好 Prompt 应该让模型知道优先优化准确性、完整性、简洁性、创意性还是格式稳定性。

补充上下文

模型无法自动知道业务背景、术语定义、数据来源、用户意图和产品边界。上下文应提供完成任务所必需的事实，同时避免无关材料淹没重点。使用清晰分隔符标记输入资料、用户文本、系统规则和参考样例，可以降低模型把材料误当指令的概率。对于检索增强任务，还要要求模型只基于给定资料回答，并说明资料不足时如何处理。

规定格式

如果输出要被程序消费，格式约束比语气描述更重要。可以指定 JSON 字段、Markdown 层级、表格列、字数范围、语言、是否允许空值、排序规则和错误时的返回结构。格式越明确，后处理越稳定。结构化输出任务还应避免让模型自由发挥字段名，并明确缺失信息时返回 null、空数组还是解释性文本。

提供示例

Few-shot 示例能显著帮助模型理解边界，尤其是分类、抽取、语气改写、复杂格式和领域术语任务。正例展示理想答案，反例展示哪些输出不合格。示例要覆盖常见难点，而不是只放最简单样本。示例过多也会占用上下文并可能引入偏差，所以需要用代表性案例而不是堆材料。

评估迭代

Prompt 优化应该像工程调参一样有样本集和评价标准。每次修改要比较准确率、格式通过率、幻觉率、拒答率、长度稳定性和成本延迟。对复杂任务，可以把一个大 Prompt 拆成抽取、判断、生成、校验多个阶段；也可以加入自检清单，让模型检查是否遗漏约束。生产环境还要加入安全过滤、超时重试和人工兜底。

易错点

只写一句泛泛要求，例如回答得专业一点，没有目标、上下文和评价标准。
把业务资料、用户输入和模型指令混在一起，增加提示注入和误解风险。
要求固定 JSON 却不给字段定义、缺失值规则和错误返回格式。
只凭单次输出调整 Prompt，没有用真实样本集比较准确率、格式稳定性和失败案例。

面试官追问

Prompt 越长越好吗？

不是。Prompt 要足够明确，但冗长无关的上下文会稀释重点、增加成本并引入干扰。好的 Prompt 是信息密度高，必要约束清楚，示例覆盖关键边界。

什么时候需要 few-shot 示例？

当任务边界难以用规则说清，或输出风格、分类标准、抽取格式需要稳定复现时，few-shot 很有价值。简单问答或明确转换任务可能不需要示例。

如何减少模型幻觉？

提供可靠上下文，要求只基于给定资料回答，明确资料不足时说明无法判断；让模型列出依据来源或引用片段；降低开放生成空间；对关键事实加检索、校验或人工审核。

为什么要让模型说明假设和不确定性？

很多任务输入不完整，模型容易补全不存在的信息。要求列出假设和不确定性，可以把隐含猜测显性化，帮助调用方决定是否继续追问、检索或人工确认。