真实面经题目 · 原创解析
基于 LangGraph 和 RAG 的内容生成 Agent,应如何设计检索、生成和审核流程?
这题考用 LangGraph 和 RAG 设计内容生成 Agent 的端到端流程,回答重点是检索、证据整理、生成、审核、重试和发布前控制,而不是只讲向量召回。
真实面经题目 · 原创解析
这题考用 LangGraph 和 RAG 设计内容生成 Agent 的端到端流程,回答重点是检索、证据整理、生成、审核、重试和发布前控制,而不是只讲向量召回。
我会把这个内容生成 Agent 设计成一个有状态流程。入口先接收主题、目标受众、风格、长度、禁区和输出格式;然后做 query 改写和知识检索,从知识库、素材库或规则库拿到可引用证据;接着进行证据筛选、去重、排序和摘要,形成生成上下文;生成节点按结构化大纲产出初稿;审核节点检查事实依据、敏感内容、重复内容、风格一致性和格式约束;不通过时根据失败原因回到检索、重写或人工确认节点。LangGraph 的价值在于把这些节点、条件边、状态快照和重试路径显式化,RAG 的价值是让内容基于可追溯资料。工程上还要记录来源、版本、审核结果、人工修改和线上反馈,用于后续评估和知识库更新。
入口不应只有一句主题,还要包含目标受众、内容类型、长度、风格、必须覆盖的信息、禁止表达、素材范围和输出格式。契约越清楚,后续检索、生成和审核越容易自动化。
RAG 不是直接拿用户原话向量搜索。可以先抽取实体、意图、场景、关键词和缺失信息,生成多个检索 query,再从知识库或素材库中召回候选资料。召回后要按相关性、新鲜度、权威性和权限过滤。
检索结果进入生成前要去重、聚类、摘要和标注来源,区分强证据、弱证据、背景材料和禁止使用内容。否则模型可能把相互冲突或低相关材料混在一起,生成看似流畅但依据不稳的内容。
可以把流程拆成规划、检索、证据整理、初稿生成、事实校验、风格校验、安全审核、重写和人工确认节点。条件边根据审核结果决定结束、重写、补检索或进入人工处理,避免所有逻辑藏在一个 Prompt 里。
事实证据不足应回到检索或澄清,风格不符应进入重写,敏感风险应阻断或人工审核,格式错误可以局部修复。不同失败原因走不同边,才能避免无意义地重复生成。
指标包括事实正确率、证据支持率、审核通过率、重写次数、人工修改比例、生成延迟、token 成本、用户采纳和线上反馈。只有把 trace 和最终效果结合,才能知道问题来自检索、证据整理、生成还是审核。
RAG 提供可追溯资料,降低凭空编造风险,也能让内容符合最新素材、规则和业务知识。
不一定。事实不足要补检索,风格问题可以局部重写,格式问题可以修复,敏感风险可能要阻断或人工审核。
它把多步骤流程、条件分支、重试、人工确认和状态快照显式化,让内容生成不只是一次模型调用。
检查关键结论是否能回溯到检索材料,引用是否支持表述,是否混入无来源断言,并统计证据支持率和人工修正比例。