真实面经题目 · 原创解析
模型在线训练和离线训练有什么区别?
在线训练和离线训练的区别在于数据更新频率、训练时效、系统复杂度和稳定性要求;推荐场景常用离线主模型加在线增量或实时特征的混合方案。
出现于:快手 · 算法
真实面经题目 · 原创解析
在线训练和离线训练的区别在于数据更新频率、训练时效、系统复杂度和稳定性要求;推荐场景常用离线主模型加在线增量或实时特征的混合方案。
离线训练通常用历史日志批量构建样本,周期性训练模型,优点是稳定、可复现、资源可控,缺点是对新兴趣和新物料响应慢。在线训练会用实时或近实时反馈不断更新模型或部分参数,优点是时效性强,能快速适应热点和用户兴趣变化,但对数据质量、延迟、漂移、监控和回滚要求更高。实际线上常把离线训练作为基础,再结合实时特征、增量更新或在线学习模块。
离线训练基于历史批量日志,例如天级或小时级样本;在线训练会接入实时曝光、点击、转化或负反馈,更快反映用户和业务变化。
离线训练流程更容易固定数据版本、特征口径、模型版本和评估结果。在线训练持续更新,必须处理脏数据、延迟反馈、异常流量和模型漂移。
离线训练适合学习稳定规律和长期偏好,在线训练适合热点、短期兴趣、新物料和强时效场景。推荐系统中二者通常互补,因为单靠离线模型会反应慢,单靠在线更新又容易被短期噪声带偏。
在线训练需要实时特征、流式样本、在线参数更新、灰度、监控、回滚和降级。任何数据链路抖动都可能直接影响线上排序,因此要有异常检测、版本隔离和快速切回离线稳定模型的能力。
实际系统常用离线训练产出主模型,在线部分只更新用户向量、物料统计、校准层或轻量参数,同时用实时特征增强精排。这样能兼顾稳定性和时效性,也更容易控制线上风险。
监控样本量、特征缺失、标签延迟、模型参数漂移、线上指标、延迟和异常回滚触发。
全量在线训练成本和风险高,难以复现,容易被异常流量污染,稳定业务通常需要离线基座。
实时特征是把最新行为喂给模型推理,模型参数未必更新;在线训练会根据新样本更新模型或部分参数。