因果推断面试题解析

标签题目

因果推断相关面试题

Uplift 模型评估的核心不是预测转化概率，而是衡量干预带来的增量效果。回答应覆盖 uplift curve、Qini curve、AUUC、Qini 系数、分组 uplift、Top-K 增益和 A/B 验证。

Uplift 模型和传统分类模型的核心区别在目标变量：分类预测用户会不会转化，Uplift 预测干预会让转化概率提升多少。面试要讲清训练数据、标签构造、模型输出、评估指标和业务使用方式的差异。

混淆变量和中介变量的区别在于因果位置不同：混淆变量同时影响处理和结果，需要控制；中介变量位于处理到结果的路径上，解释作用机制，是否控制取决于要估计总效应还是直接效应。

没有随机对照数据时估计因果效应，需要用观察数据方法尽量构造可比组。常见思路包括倾向评分、匹配、分层、回归控制、DID、工具变量、断点回归、DML 和敏感性分析，但结论可信度依赖假设。

同题还出现在 1 个公司岗位

DragonNet 这类因果效应模型要保证输出单调性和一致性，核心是把业务约束写进模型结构、输出变换、损失函数和训练校验中。回答时要区分预测值的数学约束、处理效应的一致性，以及线上分桶后的业务单调。

量化特征与目标变量的因果关系，不能只看相关系数或特征重要性，而要定义干预、构造对照、控制混淆并估计处理效应。常见方法包括 RCT、倾向评分、DID、IV、DML 和因果图分析。

相关分析回答的是两个现象是否一起变化，因果推断回答的是如果主动改变价格策略会造成什么结果；在出行定价中，关键是识别混杂因素、设计对照、估计干预效果，并用业务同学能理解的语言解释不应把相关当因果。

这题考辛普森悖论下的数据判断能力，重点不是机械选择汇总或分层，而是先确认业务问题、分层变量是否为混杂因素，再用因果和实验思路给出可执行结论。

这题考多变量回归的完整评估框架，不能只说 R²，而要从拟合优度、泛化误差、变量显著性、模型假设、共线性和业务解释一起判断。