基于 LangGraph 和 RAG 的内容生成 Agent，应如何设计检索、生成和审核流程？｜快手后端开发面经解析

60 秒回答模板

我会把这个内容生成 Agent 设计成一个有状态流程。入口先接收主题、目标受众、风格、长度、禁区和输出格式；然后做 query 改写和知识检索，从知识库、素材库或规则库拿到可引用证据；接着进行证据筛选、去重、排序和摘要，形成生成上下文；生成节点按结构化大纲产出初稿；审核节点检查事实依据、敏感内容、重复内容、风格一致性和格式约束；不通过时根据失败原因回到检索、重写或人工确认节点。LangGraph 的价值在于把这些节点、条件边、状态快照和重试路径显式化，RAG 的价值是让内容基于可追溯资料。工程上还要记录来源、版本、审核结果、人工修改和线上反馈，用于后续评估和知识库更新。

考点 有状态流程

难度 真实面经题

回答目标 讲清工程边界与实现取舍

深入解析

先定义内容任务契约

入口不应只有一句主题，还要包含目标受众、内容类型、长度、风格、必须覆盖的信息、禁止表达、素材范围和输出格式。契约越清楚，后续检索、生成和审核越容易自动化。

检索前要做任务理解

RAG 不是直接拿用户原话向量搜索。可以先抽取实体、意图、场景、关键词和缺失信息，生成多个检索 query，再从知识库或素材库中召回候选资料。召回后要按相关性、新鲜度、权威性和权限过滤。

证据整理决定生成质量

检索结果进入生成前要去重、聚类、摘要和标注来源，区分强证据、弱证据、背景材料和禁止使用内容。否则模型可能把相互冲突或低相关材料混在一起，生成看似流畅但依据不稳的内容。

用图节点表达生成和审核

可以把流程拆成规划、检索、证据整理、初稿生成、事实校验、风格校验、安全审核、重写和人工确认节点。条件边根据审核结果决定结束、重写、补检索或进入人工处理，避免所有逻辑藏在一个 Prompt 里。

失败恢复要按原因分流

事实证据不足应回到检索或澄清，风格不符应进入重写，敏感风险应阻断或人工审核，格式错误可以局部修复。不同失败原因走不同边，才能避免无意义地重复生成。

评估要覆盖内容和流程

指标包括事实正确率、证据支持率、审核通过率、重写次数、人工修改比例、生成延迟、token 成本、用户采纳和线上反馈。只有把 trace 和最终效果结合，才能知道问题来自检索、证据整理、生成还是审核。

易错点

把答案写成普通 RAG 问答，没有覆盖内容生成和审核流程。
检索结果不做证据整理，直接拼进 Prompt。
把事实校验、安全审核、风格审核混成一个笼统评分。
失败后只让模型无限重写，不按原因补检索、阻断或人工处理。
没有记录来源和审核 trace，内容问题无法追责和改进。
加入未经来源支持的具体业务场景或内部平台实现。

面试官追问

为什么内容生成 Agent 需要 RAG？

RAG 提供可追溯资料，降低凭空编造风险，也能让内容符合最新素材、规则和业务知识。

审核失败后一定要重新生成吗？

不一定。事实不足要补检索，风格问题可以局部重写，格式问题可以修复，敏感风险可能要阻断或人工审核。

LangGraph 在这里解决什么问题？

它把多步骤流程、条件分支、重试、人工确认和状态快照显式化，让内容生成不只是一次模型调用。

如何评估生成内容是否基于证据？

检查关键结论是否能回溯到检索材料，引用是否支持表述，是否混入无来源断言，并统计证据支持率和人工修正比例。