岗位题目
技术客户成功相关面试题
Redis 主从同步有哪些策略?
Redis 主从同步主要包括全量同步、部分重同步和命令传播三类链路。第一次复制或偏移量缺失时走全量,短暂断线且复制积压缓冲区仍保留缺失命令时走部分重同步,正常状态下主节点持续把写命令传播给从节点。
Redis 怎么做数据迁移?
Redis 数据迁移没有单一标准答案,要按停机窗口、数据规模、是否跨版本、是否集群、是否需要保留 TTL 和一致性要求选择方案。常见方式包括 RDB/AOF 迁移、主从复制切换、SCAN+DUMP/RESTORE、MIGRATE、集群 reshard 和专用同步工具。
聊天 AI 应用中如何减少大模型幻觉?
减少聊天 AI 应用中的大模型幻觉,需要同时处理知识来源、提示约束、检索增强、工具调用、输出校验、拒答策略、评测监控和用户体验。核心原则是让模型少凭空补全,多基于可验证证据回答,并在证据不足时明确不确定。
注意力机制中为什么要计算 Q 和 K 的相似度?
注意力机制计算 Q 和 K 的相似度,是为了让每个位置根据当前查询目标,从所有候选位置中动态分配信息权重。Q 表示当前位置想找什么,K 表示每个位置能被什么条件匹配,相似度越高,对应 V 的信息越应该被聚合进当前表示。
调用大模型服务时需要关注哪些核心指标?
调用大模型服务时,核心指标不能只看接口是否成功,还要同时关注效果、成本、性能、稳定性和安全。典型指标包括请求成功率、错误率、首 token 延迟、总延迟、吞吐、Token 用量、单次成本、质量评分、幻觉率、拒答率、重试率、限流率和用户满意度。
做 AI 项目时如何选择和使用大模型?
做 AI 项目选择和使用大模型,不能只看榜单或单次体验,而要从业务目标、任务类型、质量要求、成本预算、延迟约束、上下文长度、工具能力、数据安全、供应商稳定性和可观测性综合评估。正确姿势是小范围评测、多模型分层、持续监控和可替换架构。
Prompt 编写有哪些关键注意点?
Prompt 编写的核心不是堆砌提示词,而是把目标、上下文、约束、输入输出格式、推理边界和评估标准表达清楚。好的 Prompt 能降低模型歧义,稳定输出结构,减少幻觉和无关内容,并让结果更容易被程序消费和人工复核。
Transformer 中 Q、K、V 分别表示什么?
Transformer 中的 Q、K、V 分别是 Query、Key、Value,是注意力机制对输入向量做三组线性变换得到的表示。Q 用来发起查询,K 用来被匹配,Q 与 K 的相似度决定关注权重,V 承载最终被加权汇聚的信息。
什么是 TTFT,如何降低大模型首字延迟?
TTFT 是 Time To First Token,表示从请求发出或服务端接收请求到模型返回第一个 token 的时间。它直接影响用户对大模型应用是否“响应快”的感知,优化要覆盖排队、网络、鉴权、Prompt 构造、预填充计算、调度和流式返回。