技术客户成功面试题库｜公司面经解析

岗位题目

技术客户成功相关面试题

Redis 主从同步主要包括全量同步、部分重同步和命令传播三类链路。第一次复制或偏移量缺失时走全量，短暂断线且复制积压缓冲区仍保留缺失命令时走部分重同步，正常状态下主节点持续把写命令传播给从节点。

Redis 数据迁移没有单一标准答案，要按停机窗口、数据规模、是否跨版本、是否集群、是否需要保留 TTL 和一致性要求选择方案。常见方式包括 RDB/AOF 迁移、主从复制切换、SCAN+DUMP/RESTORE、MIGRATE、集群 reshard 和专用同步工具。

减少聊天 AI 应用中的大模型幻觉，需要同时处理知识来源、提示约束、检索增强、工具调用、输出校验、拒答策略、评测监控和用户体验。核心原则是让模型少凭空补全，多基于可验证证据回答，并在证据不足时明确不确定。

同题还出现在 1 个公司岗位

注意力机制计算 Q 和 K 的相似度，是为了让每个位置根据当前查询目标，从所有候选位置中动态分配信息权重。Q 表示当前位置想找什么，K 表示每个位置能被什么条件匹配，相似度越高，对应 V 的信息越应该被聚合进当前表示。

调用大模型服务时，核心指标不能只看接口是否成功，还要同时关注效果、成本、性能、稳定性和安全。典型指标包括请求成功率、错误率、首 token 延迟、总延迟、吞吐、Token 用量、单次成本、质量评分、幻觉率、拒答率、重试率、限流率和用户满意度。

做 AI 项目选择和使用大模型，不能只看榜单或单次体验，而要从业务目标、任务类型、质量要求、成本预算、延迟约束、上下文长度、工具能力、数据安全、供应商稳定性和可观测性综合评估。正确姿势是小范围评测、多模型分层、持续监控和可替换架构。

同题还出现在 1 个公司岗位

Prompt 编写的核心不是堆砌提示词，而是把目标、上下文、约束、输入输出格式、推理边界和评估标准表达清楚。好的 Prompt 能降低模型歧义，稳定输出结构，减少幻觉和无关内容，并让结果更容易被程序消费和人工复核。

Transformer 中的 Q、K、V 分别是 Query、Key、Value，是注意力机制对输入向量做三组线性变换得到的表示。Q 用来发起查询，K 用来被匹配，Q 与 K 的相似度决定关注权重，V 承载最终被加权汇聚的信息。

TTFT 是 Time To First Token，表示从请求发出或服务端接收请求到模型返回第一个 token 的时间。它直接影响用户对大模型应用是否“响应快”的感知，优化要覆盖排队、网络、鉴权、Prompt 构造、预填充计算、调度和流式返回。