已解析题目
数据分析师相关题目
如果要对城市做聚类,会选择哪些特征,如何覆盖供需、地理、用户结构、时段、价格和运营指标?
城市聚类不是把所有城市指标堆进模型,而是先明确聚类用途,再构造可比较的城市级特征,覆盖供需、地理、用户结构、时段、价格和运营表现,并通过标准化、降维、稳定性检验和业务解释验证分群是否可用。
如何向非技术同学解释因果推断和相关分析的差异,并用出行定价策略举例?
相关分析回答的是两个现象是否一起变化,因果推断回答的是如果主动改变价格策略会造成什么结果;在出行定价中,关键是识别混杂因素、设计对照、估计干预效果,并用业务同学能理解的语言解释不应把相关当因果。
在样本不平衡问题中,除了修正数据集,还能有哪些方法?
样本不平衡除了修正数据集,还可以从损失函数、样本权重、阈值移动、指标选择、模型集成、概率校准和业务决策成本入手。回答要说明不同方法解决的是训练偏差、预测阈值还是评估偏差。
同题还出现在 1 个公司岗位
滴滴近一周新客首单转化率下降时,第一轮诊断应如何分层排查?
这题强调“第一轮诊断”,不是马上做完整因果归因。高质量回答要在滴滴新客首单链路里快速分层排查:先验指标和埋点,再按渠道新客质量、城市时段产品线、发券和价格、叫车供需、等待时长、司机接单、取消、支付、版本异常等层级找最大断点。