标签题目
因果推断相关面试题
Uplift模型评估指标有哪些?
Uplift 模型评估的核心不是预测转化概率,而是衡量干预带来的增量效果。回答应覆盖 uplift curve、Qini curve、AUUC、Qini 系数、分组 uplift、Top-K 增益和 A/B 验证。
Uplift模型与传统分类模型的核心区别是什么?
Uplift 模型和传统分类模型的核心区别在目标变量:分类预测用户会不会转化,Uplift 预测干预会让转化概率提升多少。面试要讲清训练数据、标签构造、模型输出、评估指标和业务使用方式的差异。
因果推断中,混淆变量和中介变量有什么区别?
混淆变量和中介变量的区别在于因果位置不同:混淆变量同时影响处理和结果,需要控制;中介变量位于处理到结果的路径上,解释作用机制,是否控制取决于要估计总效应还是直接效应。
因果推断中,无法获取随机对照数据时如何估计因果效应?
没有随机对照数据时估计因果效应,需要用观察数据方法尽量构造可比组。常见思路包括倾向评分、匹配、分层、回归控制、DID、工具变量、断点回归、DML 和敏感性分析,但结论可信度依赖假设。
同题还出现在 1 个公司岗位
DragonNet如何保证输出的单调性和一致性?
DragonNet 这类因果效应模型要保证输出单调性和一致性,核心是把业务约束写进模型结构、输出变换、损失函数和训练校验中。回答时要区分预测值的数学约束、处理效应的一致性,以及线上分桶后的业务单调。
特征工程中,如何量化特征与目标变量的因果关系?
量化特征与目标变量的因果关系,不能只看相关系数或特征重要性,而要定义干预、构造对照、控制混淆并估计处理效应。常见方法包括 RCT、倾向评分、DID、IV、DML 和因果图分析。
如何向非技术同学解释因果推断和相关分析的差异,并用出行定价策略举例?
相关分析回答的是两个现象是否一起变化,因果推断回答的是如果主动改变价格策略会造成什么结果;在出行定价中,关键是识别混杂因素、设计对照、估计干预效果,并用业务同学能理解的语言解释不应把相关当因果。
作为数据分析师,遇到辛普森悖论导致汇总数据和分层数据结论相反时,应如何判断和处理?
这题考辛普森悖论下的数据判断能力,重点不是机械选择汇总或分层,而是先确认业务问题、分层变量是否为混杂因素,再用因果和实验思路给出可执行结论。
多变量回归结果好不好,应该看哪些指标和诊断结果?
这题考多变量回归的完整评估框架,不能只说 R²,而要从拟合优度、泛化误差、变量显著性、模型假设、共线性和业务解释一起判断。