数据分析面试题解析

如何分析用户流失是否由推送过于频繁导致？

判断用户流失是否由推送过于频繁导致，不能只看推送次数和留存同时变化，而要建立频次暴露、用户分层、时间先后、剂量反应和对照实验。最可靠的方法是设计推送频次 A/B Test 或 holdout，对退订、卸载、次日活跃和长期留存做联合评估。

广告收益下降时应该从哪些角度分析？

广告收益下降要先做收入公式拆解，再沿流量、库存、填充、竞价、点击转化、价格、策略和技术链路逐层排查。核心不是罗列指标，而是判断下降来自曝光规模、变现效率、广告主需求还是埋点和结算口径变化。

如果日活下降是竞品原因，怎么证明？

证明日活下降由竞品导致，需要建立时间重合、用户迁移、外部强度、受影响分组和排除内部原因五类证据。最有力的结论通常来自竞品活动或上线节奏与本产品 DAU 变化之间的差分对比，而不是单纯说竞品最近很火。

留存率下降时如何分析原因？

留存率下降要从口径、分母结构、用户质量、产品体验、供给内容、触达策略和外部环境逐层拆解。好的分析会先定位哪个 cohort、哪个生命周期和哪个用户分组在下降，再寻找导致用户没有回来的具体机制。

A/B Test 中如何判断差异是否显著？

A/B Test 判断显著性，要先明确假设、主指标、样本量和实验单位，再用合适的统计检验计算 p 值、置信区间和效应量。显著不等于值得上线，还要检查随机化、样本比例、实验污染、护栏指标和业务收益。

数据分析业务指标 A/B 测试

MySQL 最左前缀原则是什么？

最左前缀原则是联合索引按定义顺序从左到右建立有序结构，查询只有从最左列开始连续使用索引列，才能充分利用联合索引。它影响 where 条件、范围查询、排序、分组和覆盖索引设计。

数据分析数据库 MySQL

阿里巴巴 / 算法

Prompt 优化模块的 A/B 测试方案如何设计？

Prompt 优化模块的 A/B 测试考察的不是简单会不会分流，而是能否把生成式能力放到真实业务链路中评估。高质量回答需要同时讲清实验目标、用户随机化、指标体系、统计检验、版本控制、冷启动影响、离线评测和线上实验的衔接，以及异常情况下的灰度和回滚机制。

同题还出现在 1 个公司岗位

业务指标数据分析大语言模型

A/B 实验如何设计和评估？

A/B 实验的核心是用随机分流把策略变化与其他干扰因素隔离开，再用预先定义的指标体系和统计检验判断新方案是否真的带来增益。完整回答应覆盖实验目标、假设、实验单元、分流机制、指标设计、样本量与周期、过程监控、显著性检验、分层分析、风险控制和最终决策。

A/B 测试业务指标数据分析

订单 ID 本身不会天然关联活动，关联关系通常来自业务系统在下单链路中写入的活动标识、优惠信息、渠道参数和下单快照，再由数据仓库把埋点行为与交易事实按统一口径 join 起来。回答时要区分业务绑定、数据归因和数仓建模三层：业务上看订单明细、优惠明细、营销活动明细；数据上看 activity_id、campaign_id、coupon_id、channel、utm 参数等是否被传递和落库；分析上看归因窗口、去重规则、退款修正、跨天口径和多活动优先级。

数据分析业务指标增长运营

考核某个运营活动的数据指标是哪些？

考核运营活动不能只盯成交额或参与人数，而要先明确活动目标，再按目标指标、过程漏斗、商业结果、用户沉淀、成本效率、增量效果、风险护栏、数据可信度的框架拆解。优秀回答应体现指标分层、前中后评估、对照组思维和归因意识，说明哪些指标用于判断活动是否达成目标，哪些指标用于定位问题，哪些指标用于判断是否值得复用。

业务指标数据分析增长运营用户增长

供应链运营重点关注哪些指标？

供应链运营指标不能只报一串名词，核心是围绕客户拿得到、拿得快、库存不浪费、履约成本可控、资金周转健康建立指标体系。回答时应先分层说明服务、时效、库存、预测、采购、物流、财务和异常管理，再说明不同业务阶段如何选择最重要的北极星指标，并把具体动作与指标变化挂钩。

业务指标数据分析

如何把相对宏观的指标拆解成一个过程指标，拟合成最终结果作为团队目标，同时搭建类似于数据化的产品，去支撑业务的场景？

这类题考察的不是单纯会不会搭指标体系，而是能否把一个宏观、滞后的业务结果，拆成可理解、可控制、可监控、可复盘的过程系统。高质量回答应围绕先定义北极星指标和结果口径，再用驱动树找到关键杠杆，选择可控过程指标，通过历史数据建模拟合结果，拆解目标到团队动作，并把指标、诊断、预警、实验和复盘产品化展开，体现数据分析既服务目标制定，也服务业务经营。

业务指标数据分析产品管理

有什么运营指标？

回答“有什么运营指标”时，核心不是罗列 DAU、转化率、留存率，而是说明指标如何服务经营目标：先明确北极星目标，再按“获取、激活、留存、活跃、转化、收入、成本效率、质量风险”拆解，最后用分群、分渠道、分周期和队列视角判断问题发生在哪里。

业务指标数据分析增长运营用户增长

如何说明自己对一个业务指标负责？

这道题考察的不是“你有没有做过很多事”，而是你能否把一段运营、采购或数据分析经历讲成清晰的指标经营闭环。高质量回答要说明指标是什么、为什么归你负责、你能影响哪些杠杆、做了哪些动作、如何衡量效果，以及结果中哪些可以合理归因于你。

业务指标数据分析

电商业务分析应该关注哪些核心指标？

电商业务分析的核心不是罗列 GMV、订单量、转化率，而是建立一套从流量获取、用户行为、交易转化、商品供给、履约体验到长期利润的指标体系。分析时要先明确业务目标，再把指标拆成可定位问题的树状结构：规模看 GMV 和订单，效率看转化率和客单价，健康度看复购、留存和退款，经营质量看毛利、补贴效率和库存周转。真正有价值的分析，应能回答增长来自哪里、损失发生在哪一环、应该优先优化什么。

业务指标数据分析电商

做过最酷的事情是什么，然后延伸扩展一些问题？

这是一道行为面试题，核心不是让候选人讲一个听起来很酷的故事，而是考察你是否能识别高价值问题、主动推进、用数据或用户反馈验证结果，并完成复盘。产品/数据分析方向最适合选择一个真实的业务改进、分析洞察、流程优化、用户增长、实验验证或跨团队推动案例，而不是泛泛讲兴趣爱好或个人挑战。

数据分析

数据分析时如何看待短期数据和长期数据？

短期数据反映近期变化和即时反馈，长期数据反映趋势、周期和结构性规律。优秀的数据分析不会简单地说短期数据不可靠、长期数据更重要，而是根据问题类型、业务周期、样本量、指标口径和决策场景，把两类数据结合起来判断：用短期数据发现异常和验证动作，用长期数据校准方向和识别真实趋势。

数据分析

阿里巴巴 / 产品

如何分析用户留存和转化漏斗？

分析用户留存和转化漏斗不要只背公式，而要先定义业务目标、用户起点、活跃口径、漏斗步骤和观察窗口，再用 cohort、分群、归因和实验闭环定位问题。留存回答用户是否持续回来，漏斗回答用户在哪一步流失，二者结合才能判断是拉新质量、首日体验、关键价值触达、交易链路还是后续运营策略出了问题。

业务指标数据分析

腾讯 / 算法

文本分类有哪些模型？

文本分类有哪些模型？这道腾讯牛客题的关键是围绕“文本分类模型选择”讲清概念、机制、取舍和边界。文本分类可以从传统机器学习到深度模型分层回答：朴素贝叶斯、LR/SVM 配 TF-IDF 适合轻量基线；TextCNN 捕捉局部 n-gram；RNN/LSTM 建模序列；Transformer/BERT 通过上下文表示处理语义和长距离依赖。

模型训练数据分析

腾讯 / 算法

做ABtest，样本量太少怎么优化？

做ABtest，样本量太少怎么优化？这道腾讯牛客题的关键是围绕“A/B Test 样本量不足处理”讲清概念、机制、取舍和边界。A/B 样本量太少时，先判断统计功效是否不足：基线转化率、期望 MDE、方差、显著性水平和流量共同决定所需样本。处理方向不是套模型指标，而是延长实验、扩大流量、降低方差、调整实验设计或接受只能发现更大效应。

A/B 测试业务指标数据分析

拼多多 / 数据分析

如何设计 A/B 实验评估大模型智能客服是否提升用户满意度？

这题考用数据分析方法验证大模型客服是否提升满意度，重点是实验假设、随机化单位、主指标与护栏指标、样本量、显著性和长期效果判断。

数据分析 A/B 测试大语言模型 AI 产品产品指标模型评估

Shopee / 后端开发

转化率不达标时，如何把用户行为会话整理成大模型意图识别输入，并输出可分析的结构化标签？

这题考 AI 应用工程和数据分析的结合：转化率不达标只是结果，补数据给大模型做意图识别的目标是把用户会话从行为流水转成可分群、可诊断、可回流实验的结构化标签。

大语言模型意图识别数据分析产品指标 AI 产品

AI 评测数据和预期不符时，产品经理如何排查评测集、指标口径和模型真实问题？

这题考的是 AI 产品评测异常诊断能力：不要急着判断模型变好或变差，而要按预期、数据、指标、标注、模型行为和线上验证逐层排查。

AI 产品模型评估产品管理数据分析产品指标

用 Prompt Engineering 构造评测或训练数据效果不理想时，如何迭代任务定义、样本分布和质检标准？

这题考 Prompt Engineering 构造数据的迭代能力：先判断数据用途，再从任务定义、prompt 模板、样本分布、人工质检、失败切片和真实数据混合上优化。

AI 产品 Prompt 工程模型评估模型训练数据分析

AI 标注数据质量不稳定且标注团队不认可评估标准时，产品经理如何对齐口径并推动改进？

这题不是普通职场沟通题，而是 AI 数据质量治理题；核心是用明确 rubric、样本证据、一致性指标、校准机制和改进闭环化解标准争议。

AI 产品模型评估质量工程产品管理数据分析

字节跳动 / 后端开发

给定群聊数据表，如何为公开搜索排序设计群聊特征提取系统，并从 UID、群主、兴趣、活跃度等字段构建可用特征？

这题考特征工程和数据系统设计：要能把原始群聊表变成可供搜索排序使用的群、用户、群主、兴趣、活跃度、质量和实时特征，并保证一致性、可解释性和可监控。

特征工程 AI 搜索推荐系统系统设计数据分析