60 秒回答模板

传统大模型更像一次输入到一次输出的语言能力接口,核心能力是理解、生成、推理和知识表达。Agent 是把大模型放进一个任务执行框架里,围绕目标做任务拆解、计划选择、工具调用、环境观察、记忆管理和结果校验。两者不是替代关系,Agent 通常以 LLM 为大脑,再接检索、代码执行、搜索、数据库、业务 API 和权限控制等工具,形成可迭代的闭环。区别主要看是否能持续感知状态、调用外部能力并根据反馈调整下一步。

考点 LLM 是底座
难度 真实面经题
回答目标 讲清方法、取舍和追问

深入解析

01

能力边界不同

传统 LLM 主要在上下文窗口内完成问答、总结、生成和推理,输入输出边界清晰。Agent 面向的是一个目标任务,需要把问题拆成多个步骤,并在执行过程中决定下一步动作。

02

执行闭环不同

Agent 通常有 plan、act、observe、reflect 的循环:先规划,再调用工具或业务系统,拿到环境反馈后更新状态,必要时重试或改计划。普通 LLM 调用通常没有这个持续状态循环。

03

外部能力不同

LLM 本身不能直接访问实时数据库、代码运行环境或业务接口。Agent 会通过工具层接搜索、RAG、工作流、函数调用、浏览器、数据库和内部服务,因此能完成更具体的操作型任务。

04

工程约束不同

Agent 落地要考虑权限、工具选择、调用成本、状态持久化、失败恢复、可观测性和安全边界。传统 LLM 服务更关注 prompt、上下文、延迟、吞吐和输出质量。

05

评价方式不同

LLM 常看单轮答案质量、事实性和格式遵循。Agent 更要看任务完成率、步骤正确性、工具调用成功率、成本、耗时、可恢复性和是否越权执行。

易错点

  • 不要把 Agent 只说成更强的大模型,关键是任务执行框架和闭环。
  • 不要忽略工具权限和安全审计,Agent 能执行动作就会带来工程风险。
  • 不要把所有多轮对话都叫 Agent,多轮聊天未必有规划和环境反馈。
  • 不要只谈概念,要能落到工具调用、状态管理和任务完成率。

面试官追问

是不是会调用工具的 LLM 就是 Agent?

不一定。只做一次函数调用更像工具增强问答;如果系统能围绕目标连续规划、观察反馈并调整动作,才更接近 Agent。

Agent 落地最容易出什么问题?

常见问题是计划漂移、工具误选、权限过大、状态污染、循环重试失控、成本不可控和结果不可解释。

什么时候不需要 Agent?

单轮问答、简单生成、固定模板抽取或明确的一次 API 调用不一定需要 Agent,普通 LLM 或规则工作流更稳定便宜。