已解析题目
算法工程师相关题目
RAG 生成阶段如何把 top3/top10 文本块和文档信息组织进 Prompt,控制模型基于证据输出?
这题考 RAG 生成阶段的证据组织和约束生成能力,重点是把 top3/top10 chunk、文档元数据、冲突处理和引用规则放进 Prompt,而不是简单拼接检索结果。回答要聚焦 evidence packing 和 grounded generation,不要扩成泛泛的召回优化。
ASR 识别文本中的错别字如何结合置信度、上下文纠错、专名词典、语言模型或 LLM 后处理修复,并评估纠错收益?
这题考 ASR 后处理纠错的系统设计。重点是利用识别置信度、N-best 或 lattice、上下文语言模型、专名热词词典和 LLM 后处理,在不改变原意的前提下修复同音错字、专名错误、断句和领域词误识别,并用离线和线上指标证明收益。