标签题目
数据分析相关面试题
为什么选择 Qwen 作为评测裁判,如何做消融实验和指标评估?
选择 Qwen 作为评测裁判,核心理由通常是中文语义能力、开源可控、成本可控、可本地部署和版本可复现。消融实验要证明裁判选择、提示词、评分规则、样例、检索上下文和投票策略分别带来什么影响,并用人类一致性、排序相关性、稳定性、偏置和成本指标评估。
如何分析用户流失是否由推送过于频繁导致?
判断用户流失是否由推送过于频繁导致,不能只看推送次数和留存同时变化,而要建立频次暴露、用户分层、时间先后、剂量反应和对照实验。最可靠的方法是设计推送频次 A/B Test 或 holdout,对退订、卸载、次日活跃和长期留存做联合评估。
广告收益下降时应该从哪些角度分析?
广告收益下降要先做收入公式拆解,再沿流量、库存、填充、竞价、点击转化、价格、策略和技术链路逐层排查。核心不是罗列指标,而是判断下降来自曝光规模、变现效率、广告主需求还是埋点和结算口径变化。
如果日活下降是竞品原因,怎么证明?
证明日活下降由竞品导致,需要建立时间重合、用户迁移、外部强度、受影响分组和排除内部原因五类证据。最有力的结论通常来自竞品活动或上线节奏与本产品 DAU 变化之间的差分对比,而不是单纯说竞品最近很火。
留存率下降时如何分析原因?
留存率下降要从口径、分母结构、用户质量、产品体验、供给内容、触达策略和外部环境逐层拆解。好的分析会先定位哪个 cohort、哪个生命周期和哪个用户分组在下降,再寻找导致用户没有回来的具体机制。
A/B Test 中如何判断差异是否显著?
A/B Test 判断显著性,要先明确假设、主指标、样本量和实验单位,再用合适的统计检验计算 p 值、置信区间和效应量。显著不等于值得上线,还要检查随机化、样本比例、实验污染、护栏指标和业务收益。
MySQL 最左前缀原则是什么?
最左前缀原则是联合索引按定义顺序从左到右建立有序结构,查询只有从最左列开始连续使用索引列,才能充分利用联合索引。它影响 where 条件、范围查询、排序、分组和覆盖索引设计。
调用大模型服务时需要关注哪些核心指标?
调用大模型服务时,核心指标不能只看接口是否成功,还要同时关注效果、成本、性能、稳定性和安全。典型指标包括请求成功率、错误率、首 token 延迟、总延迟、吞吐、Token 用量、单次成本、质量评分、幻觉率、拒答率、重试率、限流率和用户满意度。
AI 自动生成 SQL 数据分析代码的大概技术实现方案是什么?
AI 自动生成 SQL 数据分析代码的技术实现,通常不是让模型直接自由输出 SQL,而是构建一个受约束的自然语言到查询系统。核心流程包括理解用户问题、识别指标和维度、检索数据表与字段、结合业务口径生成 SQL、做语法和权限校验、试运行与错误修复、返回结果解释,并把用户反馈沉淀为语义层和评测集。
如果要实现 AI 自动生成 SQL 数据分析代码,它的核心难点是什么?
AI 自动生成 SQL 的核心难点不只是模型会不会写语法,而是能否在复杂业务语义、分散数据资产、权限安全、执行成本和用户意图不完整的情况下,稳定生成可信查询。最难的是把业务语言准确映射到正确指标、表、字段、过滤条件和关联关系,并通过校验和反馈机制避免看似正确但实际口径错误的结果。