标签题目
Matching 方法相关面试题
笔记里多个实体和情感词如何抽取实体-情感关系?
这题考面向真实文本的关系抽取方案,重点是先识别实体和情感词,再做候选配对、关系判断和冲突消解。
订单粒度和人车粒度做派单召回有什么区别?
这题考派单系统的召回建模粒度:订单粒度从订单找候选司机,人车粒度从司机或人车状态找候选订单,差异体现在实时性、容量约束和全局匹配效率。
关键词不在库里但商品对应另一个关键词,怎么解决?
这是电商搜索中的 query 覆盖与语义召回问题。可通过同义词和别名词库、query rewrite、拼写纠错、类目和属性归一、向量召回、用户行为挖掘等方式,把未入库关键词映射到可召回商品的标准词或相关词,同时通过相关性排序和人工审核控制误召回。
如何从数据和搜索两个角度设计一个电影垂直搜索系统?
电影垂直搜索要从数据侧建立结构化电影实体、别名、演员导演、类型、地区、上映时间和资源状态,从搜索侧完成 query 理解、多路召回、相关性排序和结果展示。回答重点是把数据质量、实体归一、检索链路和效果评估连成闭环。
出行派单中,如何建模乘客对“顺路”的感知,并构造训练数据?
这道题考察出行派单里如何把“地理上看似顺路”转成“乘客主观感知也顺路”的可训练问题。高质量回答要讲清建模目标、弱监督标签、规则样本、特征设计、偏差处理、评估指标和线上体验护栏,而不是只回答最短路或 ETA。
出行派单中,给定乘客-司机候选边和权重,如何建模最大权匹配?
这道题考察出行派单如何从“乘客和司机两两配对”抽象成带约束的最大权二分图匹配。高质量回答要先定义候选边和权重,再讲一对一约束、不可匹配处理、算法选择、在线批量求解、业务护栏和效果评估,而不是只背匈牙利算法。
给定包含目标实体的文本,如何把实体链接到知识库,主要难点是什么?
这题考实体链接到知识库的完整链路,回答要覆盖 mention 规范化、候选召回、上下文排序、歧义消解、NIL 处理、知识库更新和评估指标。
在非随机实验或 A/B 分析中,Matching 方法如何构造可比样本并降低选择偏差?
这题考非随机实验分析能力。Matching 的核心是用处理前特征为实验组找到可比对照组,降低选择偏差,但它只能控制可观测混杂,必须配合重叠性、平衡性诊断和敏感性分析。