已解析题目 测试开发工程师相关题目 滴滴 / 测开 大模型输出准确度测试应该覆盖哪些测试点和评估口径? 这题考测试开发视角下的大模型输出准确度测试,答案要覆盖测试 oracle、评测集、规则断言、人工标注、LLM-as-judge 校准、回归测试和非确定性处理。 数据库 Oracle SQL 分析 大语言模型 模型评估 质量工程
滴滴 / 测开 大模型输出准确度测试应该覆盖哪些测试点和评估口径? 这题考测试开发视角下的大模型输出准确度测试,答案要覆盖测试 oracle、评测集、规则断言、人工标注、LLM-as-judge 校准、回归测试和非确定性处理。 数据库 Oracle SQL 分析 大语言模型 模型评估 质量工程