60 秒回答模板

我会先把推荐链路拆成召回、粗排、精排、重排和解释。大模型生成的文本向量、多模态向量或相似度分数,最直接可用于语义召回和候选扩展;也可以作为粗排、精排的特征,补充用户兴趣、物料语义和 query 意图;在重排阶段可以辅助多样性、相似内容去重和解释生成。线上使用时要注意延迟、成本、向量更新、离在线一致和 A/B 实验验证。

考点 链路分层
难度 真实面经题
回答目标 讲清方法、取舍和追问

深入解析

01

先定位推荐链路

推荐系统通常不是一个模型直接给最终列表,而是先从海量物料召回候选,再经过粗排、精排、重排和策略过滤。回答时先画清这些环节,才能说明大模型向量分别能放在哪里。

02

召回阶段用语义覆盖

大模型向量适合表达文本、图片、视频、query 和用户兴趣的语义相似性。它能补充传统协同过滤或倒排召回找不到的同义、跨模态、长尾内容,但也要配合热门、规则和业务召回保覆盖。

03

排序阶段做特征补充

粗排和精排不一定直接用大模型输出最终分数,更常见的是把相似度、类目语义、内容摘要、用户兴趣向量等作为特征,和点击率、转化率、时效性、价格等特征一起进入排序模型。

04

重排和解释要受约束

重排阶段可以用语义相似度做去重、多样性控制、兴趣覆盖和推荐理由生成。但大模型输出要被业务规则、频控、风控和内容安全约束,不能覆盖硬性策略。

05

工程评估看闭环

线上要关注向量生成延迟、索引更新频率、召回量、召回命中、排序收益、成本和稳定性。最终要通过 A/B 实验看点击、停留、转化、长尾覆盖和投诉等指标是否真实变好。

易错点

  • 不要只说“做向量检索”,要对应到推荐链路中的具体环节。
  • 不要把大模型相似度当作唯一排序依据,排序还要考虑业务目标和实时特征。
  • 不要忽略向量索引更新、延迟和离在线一致问题。

面试官追问

大模型向量更适合召回还是精排?

召回收益通常更直接,因为语义向量能扩大候选覆盖;精排也能用,但需要控制特征稳定性、成本和在线延迟。

如何验证大模型向量有效?

离线看召回命中、相关性和特征增益,线上用 A/B 实验看点击、停留、转化、长尾覆盖和负反馈。

向量更新不及时会有什么问题?

用户兴趣和物料内容变化快时,旧向量会让召回和排序滞后,尤其影响热点、时效内容和近期兴趣建模。