标签题目
测试覆盖率相关面试题
有一个状态机模型时,如何设计状态、转移、异常路径和覆盖率测试?
这题考状态机测试的建模能力。高质量答案要先把状态机拆成状态、事件、转移、守卫条件和动作,再说明如何覆盖正常路径、非法转移、异常恢复、并发和持久化一致性,最后用覆盖矩阵和运行证据证明测试有效。
AI 生成代码进入工程仓库前,如何用沙箱分支、最小改动范围、测试和 review 防止污染主分支?
这题考 AI 生成代码的分支治理和合入门禁。优秀回答要把主分支保护、沙箱隔离、diff 范围、自动化检查、人工 review、回滚审计串成一条工程流程。
在现有 LangGraph Agent 上新增功能时,如何设计节点、边、state schema、工具注册和回归测试?
这题考的是把 Agent 功能扩展做成可维护的状态机工程,而不是在一个大 prompt 或一个大节点里继续堆逻辑。高质量回答应说明如何先界定新功能的触发条件和输出契约,再决定是否新增节点、边、state 字段和工具,并用可回放测试证明新增路径没有破坏原有 Agent 行为。
Agent 项目中的 harness engineering 是什么,如何支撑工具模拟、回放、评测、回归和线上前验证?
这题考的是 Agent 工程里的验证基础设施意识。harness engineering 不是写几个单测,而是为不稳定的模型输出、外部工具、副作用和多轮状态机建立可控运行环境,让开发者能模拟工具、回放真实轨迹、做离线评测、跑回归并在上线前发现风险。
如何评价并落地 AI 辅助开发:它能提升哪些开发环节,开发者仍必须承担哪些工程责任?
这道题考候选人对 AI 编程工具的工程判断。好答案要说明 AI 能提升需求拆解、代码阅读、样板代码、测试、排错和文档效率,也要明确架构决策、正确性、安全、隐私、性能、代码审查和最终交付责任仍在开发者。
同题还出现在 1 个公司岗位
Agent 或 LLM 应用的评估数据集规模如何确定,bad case 应按任务类型、工具链路、检索、生成、成本和风险哪些维度分析?
这题考察 Agent 或 LLM 应用评估体系。数据集规模不应拍脑袋,而要按任务复杂度、风险等级、链路覆盖、指标置信度和迭代阶段确定;bad case 分析要覆盖任务类型、工具调用、检索、生成、成本和风险。