已解析题目
算法工程师相关题目
编码解码模型具体怎么实现的?
编码解码模型的实现核心是编码器把输入序列压成上下文表示,解码器基于上下文和已生成 token 逐步输出目标序列。不同实现可以是 RNN seq2seq、attention seq2seq 或 Transformer encoder-decoder。
Dijkstra 算法和 Prim 算法有什么区别?
Dijkstra 求单源最短路径,Prim 求最小生成树;两者都可用贪心和优先队列,但目标、状态含义和边权约束不同。
如何反转单链表?
反转单链表的标准做法是迭代维护 prev、curr、next 三个指针,逐个改变 next 指向,最后返回 prev。
KG embedding 如何支持 mini-batch 训练,图谱属性缺失怎么处理?
这题考知识图谱表示学习的工程训练能力:mini-batch 训练要处理三元组采样、负采样和邻域依赖,属性缺失要区分未知、不可用和真实为空。
膨胀卷积和模型压缩分别解决什么问题?
膨胀卷积主要在不增加太多参数和不降低特征图分辨率的情况下扩大感受野,常用于分割、检测等需要上下文的视觉任务。模型压缩主要解决模型体积、推理延迟、显存和功耗问题,常见方法包括剪枝、量化、蒸馏、低秩分解和轻量化结构设计。
意图识别使用 LR、命名实体识别使用 HMM 时,实体如何提取,模型如何训练?
这道题考察经典 NLP 任务拆分:LR 适合把句子级特征映射到意图类别,HMM 适合把 token 序列映射到 BIO 实体标签序列。回答要讲清文本预处理、特征构造、HMM 初始/转移/发射概率训练、Viterbi 解码和实体字段回收。
图像融合算法怎么实现?像素级、特征级和决策级融合分别适合什么场景?
这题考的是对图像融合任务的完整建模能力:不仅要说把多张图加权平均,还要能区分像素级、特征级和决策级融合在信息粒度、配准要求、鲁棒性、可解释性、计算代价和适用场景上的差异,并给出可落地的实现、评估和故障排查思路。
常见预训练模型可以如何分类?它们在架构、训练目标和适用任务上有什么差别?
常见预训练模型可以按架构分为 encoder-only、decoder-only、encoder-decoder,以及对比学习或多模态模型。核心差别来自信息流方向、训练目标和下游任务形态:BERT 类 encoder 更适合理解、分类、抽取;GPT 类 decoder 更适合生成和对话;T5/BART 类 encoder-decoder 更适合输入到输出的转换;CLIP 等对比学习模型更适合检索、匹配和跨模态对齐。
卷积层为什么能抽取图像特征,如何从局部连接、权重共享、感受野、平移等变性和多层组合解释?
卷积层能抽取图像特征,核心在于用局部连接和权重共享把同一个模式检测器滑过整张图,再通过多通道卷积、非线性、多层感受野扩张和下采样,把边缘、纹理、部件逐步组合成更高层语义特征。
机器学习模型训练和评估的基本流程是什么?
机器学习模型训练和评估的基本流程,本质是在业务目标约束下,把原始数据转化为可泛化模型,并通过离线验证、线上实验和持续监控判断模型是否真正有效。回答时不能只背训练步骤,还要说明数据质量、切分方式、指标选择、过拟合与数据泄漏控制,以及上线后的反馈闭环。
同题还出现在 2 个公司岗位