真实面经题目 · 原创解析
Prompt 编写有哪些关键注意点?
Prompt 编写的核心不是堆砌提示词,而是把目标、上下文、约束、输入输出格式、推理边界和评估标准表达清楚。好的 Prompt 能降低模型歧义,稳定输出结构,减少幻觉和无关内容,并让结果更容易被程序消费和人工复核。
真实面经题目 · 原创解析
Prompt 编写的核心不是堆砌提示词,而是把目标、上下文、约束、输入输出格式、推理边界和评估标准表达清楚。好的 Prompt 能降低模型歧义,稳定输出结构,减少幻觉和无关内容,并让结果更容易被程序消费和人工复核。
回答时可以按“任务定义、上下文、约束、格式、样例、校验”来展开。首先明确模型要完成什么任务、面向谁、成功标准是什么;其次提供必要背景和输入字段,避免让模型自己猜;然后写清约束,例如不能编造、缺失信息如何处理、语气和长度要求;再给出可解析的输出格式,必要时用 JSON schema、表格字段或分段模板固定结构;对于复杂任务,可以给少量高质量样例帮助模型对齐风格;最后设计评估方式,比如检查事实一致性、字段完整性、格式合法性和边界输入表现。Prompt 要尽量具体、可验证、可迭代,而不是依赖玄学词汇。
Prompt 的第一层是让模型明确自己在做什么。模糊的指令会把大量决策交给模型自由发挥,导致结果不可控。一个稳定的 Prompt 应说明任务类型、受众、输入来源、输出用途和完成标准。例如同样是总结文本,面向客服质检、搜索摘要、法务审阅和产品周报的重点完全不同。目标越清晰,模型越容易在信息取舍、语气、结构和细节密度上保持一致。
模型不能可靠知道业务系统里的隐含背景,因此 Prompt 要补足必要上下文,包括术语定义、字段含义、业务规则、时间范围、用户角色和已知事实。但上下文不是越多越好,冗余信息会挤占窗口并增加干扰。工程上常把上下文分成稳定规则和本次输入两类,稳定规则放在系统或开发者指令中,本次输入放在清晰边界内,避免模型把示例、说明和待处理文本混淆。
好的约束应该能直接影响模型行为,而不是抽象口号。比如“不要胡说”不如写成“若输入中没有证据,输出 unknown 并说明缺失字段”;“简洁”不如写成“每点不超过 30 个汉字”。常见约束包括事实来源、禁止编造、缺失值处理、语言风格、长度、字段顺序、敏感信息处理和错误返回。越是要接入生产链路,越要让约束可检测。
如果结果要进入程序,Prompt 必须明确输出格式。可以要求只输出 JSON、固定字段、数组长度、枚举值、日期格式或 Markdown 标题层级,并说明不能添加额外解释。结构化输出能降低下游解析成本,也方便做自动校验。复杂 JSON 还可以配合 schema、函数调用或工具调用,让模型把自然语言理解和结构化生成分离,减少格式漂移。
少量高质量样例能告诉模型期望的判断尺度和表达风格,尤其适合分类、抽取、改写和评分任务。但样例要覆盖正常输入、边界输入和反例,避免模型学到偶然模式。Prompt 上线后还要用固定测试集评估,包括准确率、召回率、格式合法率、人工偏好和失败类型。Prompt 工程不是一次写完,而是像接口契约一样持续版本化和回归测试。
通常不应要求模型输出完整思考过程。更稳妥的是要求它在内部分析后给出结论、关键依据和可核验的简要解释,既能提升可读性,也减少冗长和泄露中间推理的风险。
不是。示例过多会占用上下文并引入噪声。更重要的是样例质量和覆盖面,最好包含典型正例、边界情况和反例,并保持输出格式完全一致。
要限制答案来源,要求缺失信息显式返回 unknown 或 insufficient_context,并把可引用证据放进输入中。对于高风险场景,还应加检索、校验器、人工审核或工具调用。
Prompt 的变化会影响线上行为,和代码改动一样需要追踪。版本管理能帮助回滚、对比评估结果、定位质量波动,并让不同模型升级时有稳定基准。