Prompt 编写有哪些关键注意点？｜字节跳动技术客户成功面经解析

60 秒回答模板

回答时可以按“任务定义、上下文、约束、格式、样例、校验”来展开。首先明确模型要完成什么任务、面向谁、成功标准是什么；其次提供必要背景和输入字段，避免让模型自己猜；然后写清约束，例如不能编造、缺失信息如何处理、语气和长度要求；再给出可解析的输出格式，必要时用 JSON schema、表格字段或分段模板固定结构；对于复杂任务，可以给少量高质量样例帮助模型对齐风格；最后设计评估方式，比如检查事实一致性、字段完整性、格式合法性和边界输入表现。Prompt 要尽量具体、可验证、可迭代，而不是依赖玄学词汇。

考点 先定义任务目标

主线 提供充分但不过载的上下文

易错点 只写“你是专家”这类角色设定，却没有说明任务、输入、约…

深入解析

先定义任务目标

Prompt 的第一层是让模型明确自己在做什么。模糊的指令会把大量决策交给模型自由发挥，导致结果不可控。一个稳定的 Prompt 应说明任务类型、受众、输入来源、输出用途和完成标准。例如同样是总结文本，面向客服质检、搜索摘要、法务审阅和产品周报的重点完全不同。目标越清晰，模型越容易在信息取舍、语气、结构和细节密度上保持一致。

提供充分但不过载的上下文

模型不能可靠知道业务系统里的隐含背景，因此 Prompt 要补足必要上下文，包括术语定义、字段含义、业务规则、时间范围、用户角色和已知事实。但上下文不是越多越好，冗余信息会挤占窗口并增加干扰。工程上常把上下文分成稳定规则和本次输入两类，稳定规则放在系统或开发者指令中，本次输入放在清晰边界内，避免模型把示例、说明和待处理文本混淆。

把约束写成可执行规则

好的约束应该能直接影响模型行为，而不是抽象口号。比如“不要胡说”不如写成“若输入中没有证据，输出 unknown 并说明缺失字段”；“简洁”不如写成“每点不超过 30 个汉字”。常见约束包括事实来源、禁止编造、缺失值处理、语言风格、长度、字段顺序、敏感信息处理和错误返回。越是要接入生产链路，越要让约束可检测。

固定输出结构

如果结果要进入程序，Prompt 必须明确输出格式。可以要求只输出 JSON、固定字段、数组长度、枚举值、日期格式或 Markdown 标题层级，并说明不能添加额外解释。结构化输出能降低下游解析成本，也方便做自动校验。复杂 JSON 还可以配合 schema、函数调用或工具调用，让模型把自然语言理解和结构化生成分离，减少格式漂移。

用样例和评估闭环迭代

少量高质量样例能告诉模型期望的判断尺度和表达风格，尤其适合分类、抽取、改写和评分任务。但样例要覆盖正常输入、边界输入和反例，避免模型学到偶然模式。Prompt 上线后还要用固定测试集评估，包括准确率、召回率、格式合法率、人工偏好和失败类型。Prompt 工程不是一次写完，而是像接口契约一样持续版本化和回归测试。

易错点

只写“你是专家”这类角色设定，却没有说明任务、输入、约束和输出标准。
让模型自由输出自然语言，导致下游解析困难、字段缺失或格式漂移。
把缺失信息处理交给模型猜测，没有明确 unknown、跳过或报错策略。
只用少数成功样例验证 Prompt，没有覆盖长文本、噪声输入和边界条件。

面试官追问

Prompt 里要不要写思考过程？

通常不应要求模型输出完整思考过程。更稳妥的是要求它在内部分析后给出结论、关键依据和可核验的简要解释，既能提升可读性，也减少冗长和泄露中间推理的风险。

Few-shot 示例越多越好吗？

不是。示例过多会占用上下文并引入噪声。更重要的是样例质量和覆盖面，最好包含典型正例、边界情况和反例，并保持输出格式完全一致。

如何降低模型编造？

要限制答案来源，要求缺失信息显式返回 unknown 或 insufficient_context，并把可引用证据放进输入中。对于高风险场景，还应加检索、校验器、人工审核或工具调用。

Prompt 为什么需要版本管理？

Prompt 的变化会影响线上行为，和代码改动一样需要追踪。版本管理能帮助回滚、对比评估结果、定位质量波动，并让不同模型升级时有稳定基准。