真实面经题目 · 原创解析
大模型产出的向量或相似度可用于推荐链路的哪些环节?
大模型产出的向量或相似度可以用于推荐链路的召回、粗排、精排特征、重排和解释环节,但不能把整条链路都交给大模型直接排序。
真实面经题目 · 原创解析
大模型产出的向量或相似度可以用于推荐链路的召回、粗排、精排特征、重排和解释环节,但不能把整条链路都交给大模型直接排序。
我会先把推荐链路拆成召回、粗排、精排、重排和解释。大模型生成的文本向量、多模态向量或相似度分数,最直接可用于语义召回和候选扩展;也可以作为粗排、精排的特征,补充用户兴趣、物料语义和 query 意图;在重排阶段可以辅助多样性、相似内容去重和解释生成。线上使用时要注意延迟、成本、向量更新、离在线一致和 A/B 实验验证。
推荐系统通常不是一个模型直接给最终列表,而是先从海量物料召回候选,再经过粗排、精排、重排和策略过滤。回答时先画清这些环节,才能说明大模型向量分别能放在哪里。
大模型向量适合表达文本、图片、视频、query 和用户兴趣的语义相似性。它能补充传统协同过滤或倒排召回找不到的同义、跨模态、长尾内容,但也要配合热门、规则和业务召回保覆盖。
粗排和精排不一定直接用大模型输出最终分数,更常见的是把相似度、类目语义、内容摘要、用户兴趣向量等作为特征,和点击率、转化率、时效性、价格等特征一起进入排序模型。
重排阶段可以用语义相似度做去重、多样性控制、兴趣覆盖和推荐理由生成。但大模型输出要被业务规则、频控、风控和内容安全约束,不能覆盖硬性策略。
线上要关注向量生成延迟、索引更新频率、召回量、召回命中、排序收益、成本和稳定性。最终要通过 A/B 实验看点击、停留、转化、长尾覆盖和投诉等指标是否真实变好。
召回收益通常更直接,因为语义向量能扩大候选覆盖;精排也能用,但需要控制特征稳定性、成本和在线延迟。
离线看召回命中、相关性和特征增益,线上用 A/B 实验看点击、停留、转化、长尾覆盖和负反馈。
用户兴趣和物料内容变化快时,旧向量会让召回和排序滞后,尤其影响热点、时效内容和近期兴趣建模。