大模型产出的向量或相似度可用于推荐链路的哪些环节？｜百度算法面经解析

60 秒回答模板

我会先把推荐链路拆成召回、粗排、精排、重排和解释。大模型生成的文本向量、多模态向量或相似度分数，最直接可用于语义召回和候选扩展；也可以作为粗排、精排的特征，补充用户兴趣、物料语义和 query 意图；在重排阶段可以辅助多样性、相似内容去重和解释生成。线上使用时要注意延迟、成本、向量更新、离在线一致和 A/B 实验验证。

考点 链路分层

难度 真实面经题

回答目标 讲清方法、取舍和追问

深入解析

先定位推荐链路

推荐系统通常不是一个模型直接给最终列表，而是先从海量物料召回候选，再经过粗排、精排、重排和策略过滤。回答时先画清这些环节，才能说明大模型向量分别能放在哪里。

召回阶段用语义覆盖

大模型向量适合表达文本、图片、视频、query 和用户兴趣的语义相似性。它能补充传统协同过滤或倒排召回找不到的同义、跨模态、长尾内容，但也要配合热门、规则和业务召回保覆盖。

排序阶段做特征补充

粗排和精排不一定直接用大模型输出最终分数，更常见的是把相似度、类目语义、内容摘要、用户兴趣向量等作为特征，和点击率、转化率、时效性、价格等特征一起进入排序模型。

重排和解释要受约束

重排阶段可以用语义相似度做去重、多样性控制、兴趣覆盖和推荐理由生成。但大模型输出要被业务规则、频控、风控和内容安全约束，不能覆盖硬性策略。

工程评估看闭环

线上要关注向量生成延迟、索引更新频率、召回量、召回命中、排序收益、成本和稳定性。最终要通过 A/B 实验看点击、停留、转化、长尾覆盖和投诉等指标是否真实变好。

易错点

不要只说“做向量检索”，要对应到推荐链路中的具体环节。
不要把大模型相似度当作唯一排序依据，排序还要考虑业务目标和实时特征。
不要忽略向量索引更新、延迟和离在线一致问题。

面试官追问

大模型向量更适合召回还是精排？

召回收益通常更直接，因为语义向量能扩大候选覆盖；精排也能用，但需要控制特征稳定性、成本和在线延迟。

如何验证大模型向量有效？

离线看召回命中、相关性和特征增益，线上用 A/B 实验看点击、停留、转化、长尾覆盖和负反馈。

向量更新不及时会有什么问题？

用户兴趣和物料内容变化快时，旧向量会让召回和排序滞后，尤其影响热点、时效内容和近期兴趣建模。