60 秒回答模板

我会把这个内容生成 Agent 设计成一个有状态流程。入口先接收主题、目标受众、风格、长度、禁区和输出格式;然后做 query 改写和知识检索,从知识库、素材库或规则库拿到可引用证据;接着进行证据筛选、去重、排序和摘要,形成生成上下文;生成节点按结构化大纲产出初稿;审核节点检查事实依据、敏感内容、重复内容、风格一致性和格式约束;不通过时根据失败原因回到检索、重写或人工确认节点。LangGraph 的价值在于把这些节点、条件边、状态快照和重试路径显式化,RAG 的价值是让内容基于可追溯资料。工程上还要记录来源、版本、审核结果、人工修改和线上反馈,用于后续评估和知识库更新。

考点 有状态流程
难度 真实面经题
回答目标 讲清工程边界与实现取舍

深入解析

01

先定义内容任务契约

入口不应只有一句主题,还要包含目标受众、内容类型、长度、风格、必须覆盖的信息、禁止表达、素材范围和输出格式。契约越清楚,后续检索、生成和审核越容易自动化。

02

检索前要做任务理解

RAG 不是直接拿用户原话向量搜索。可以先抽取实体、意图、场景、关键词和缺失信息,生成多个检索 query,再从知识库或素材库中召回候选资料。召回后要按相关性、新鲜度、权威性和权限过滤。

03

证据整理决定生成质量

检索结果进入生成前要去重、聚类、摘要和标注来源,区分强证据、弱证据、背景材料和禁止使用内容。否则模型可能把相互冲突或低相关材料混在一起,生成看似流畅但依据不稳的内容。

04

用图节点表达生成和审核

可以把流程拆成规划、检索、证据整理、初稿生成、事实校验、风格校验、安全审核、重写和人工确认节点。条件边根据审核结果决定结束、重写、补检索或进入人工处理,避免所有逻辑藏在一个 Prompt 里。

05

失败恢复要按原因分流

事实证据不足应回到检索或澄清,风格不符应进入重写,敏感风险应阻断或人工审核,格式错误可以局部修复。不同失败原因走不同边,才能避免无意义地重复生成。

06

评估要覆盖内容和流程

指标包括事实正确率、证据支持率、审核通过率、重写次数、人工修改比例、生成延迟、token 成本、用户采纳和线上反馈。只有把 trace 和最终效果结合,才能知道问题来自检索、证据整理、生成还是审核。

易错点

  • 把答案写成普通 RAG 问答,没有覆盖内容生成和审核流程。
  • 检索结果不做证据整理,直接拼进 Prompt。
  • 把事实校验、安全审核、风格审核混成一个笼统评分。
  • 失败后只让模型无限重写,不按原因补检索、阻断或人工处理。
  • 没有记录来源和审核 trace,内容问题无法追责和改进。
  • 加入未经来源支持的具体业务场景或内部平台实现。

面试官追问

为什么内容生成 Agent 需要 RAG?

RAG 提供可追溯资料,降低凭空编造风险,也能让内容符合最新素材、规则和业务知识。

审核失败后一定要重新生成吗?

不一定。事实不足要补检索,风格问题可以局部重写,格式问题可以修复,敏感风险可能要阻断或人工审核。

LangGraph 在这里解决什么问题?

它把多步骤流程、条件分支、重试、人工确认和状态快照显式化,让内容生成不只是一次模型调用。

如何评估生成内容是否基于证据?

检查关键结论是否能回溯到检索材料,引用是否支持表述,是否混入无来源断言,并统计证据支持率和人工修正比例。