已解析题目
华为相关面试题
编码解码模型具体怎么实现的?
编码解码模型的实现核心是编码器把输入序列压成上下文表示,解码器基于上下文和已生成 token 逐步输出目标序列。不同实现可以是 RNN seq2seq、attention seq2seq 或 Transformer encoder-decoder。
给定整数数组,如何求和为 m 且长度最短的子数组长度?
求和为 m 的最短连续子数组要先确认数组元素是否都为正,正数数组可用滑动窗口,含负数时要改用前缀和和哈希结构。
Dijkstra 算法和 Prim 算法有什么区别?
Dijkstra 求单源最短路径,Prim 求最小生成树;两者都可用贪心和优先队列,但目标、状态含义和边权约束不同。
如何用链表实现两个大数字相加?
链表大数相加要逐位处理两个链表和进位,核心是对齐位序、维护 carry,并在末尾补上最后的进位节点。
树的遍历方式有哪些,分别如何实现?
树的遍历要区分深度优先和广度优先,二叉树常见前序、中序、后序,通用树还包括层序和递归/迭代两类实现。
如何反转单链表?
反转单链表的标准做法是迭代维护 prev、curr、next 三个指针,逐个改变 next 指向,最后返回 prev。
KG embedding 如何支持 mini-batch 训练,图谱属性缺失怎么处理?
这题考知识图谱表示学习的工程训练能力:mini-batch 训练要处理三元组采样、负采样和邻域依赖,属性缺失要区分未知、不可用和真实为空。
膨胀卷积和模型压缩分别解决什么问题?
膨胀卷积主要在不增加太多参数和不降低特征图分辨率的情况下扩大感受野,常用于分割、检测等需要上下文的视觉任务。模型压缩主要解决模型体积、推理延迟、显存和功耗问题,常见方法包括剪枝、量化、蒸馏、低秩分解和轻量化结构设计。
意图识别使用 LR、命名实体识别使用 HMM 时,实体如何提取,模型如何训练?
这道题考察经典 NLP 任务拆分:LR 适合把句子级特征映射到意图类别,HMM 适合把 token 序列映射到 BIO 实体标签序列。回答要讲清文本预处理、特征构造、HMM 初始/转移/发射概率训练、Viterbi 解码和实体字段回收。
图像融合算法怎么实现?像素级、特征级和决策级融合分别适合什么场景?
这题考的是对图像融合任务的完整建模能力:不仅要说把多张图加权平均,还要能区分像素级、特征级和决策级融合在信息粒度、配准要求、鲁棒性、可解释性、计算代价和适用场景上的差异,并给出可落地的实现、评估和故障排查思路。
常见预训练模型可以如何分类?它们在架构、训练目标和适用任务上有什么差别?
常见预训练模型可以按架构分为 encoder-only、decoder-only、encoder-decoder,以及对比学习或多模态模型。核心差别来自信息流方向、训练目标和下游任务形态:BERT 类 encoder 更适合理解、分类、抽取;GPT 类 decoder 更适合生成和对话;T5/BART 类 encoder-decoder 更适合输入到输出的转换;CLIP 等对比学习模型更适合检索、匹配和跨模态对齐。
如何判断一个机器学习任务已经训练充分,可以从离线指标、泛化能力、过拟合、线上验证和业务门槛验收?
这题考察的是候选人是否能从测试和工程视角判断机器学习模型“训练好了”。好的回答不能只说 loss 收敛,而要覆盖目标指标、训练/验证曲线、泛化能力、过拟合排查、基线对比、鲁棒性测试、线上验证和业务验收门槛。
评价模型优劣时,传统计量模型和机器学习模型的指标有什么不同,如何按解释性、预测效果和业务风险选择?
这题考察的是数据分析候选人能否区分传统计量模型和机器学习模型的评估目标。传统计量模型更关注解释性、参数显著性、假设检验和残差诊断;机器学习模型更关注样本外预测、泛化能力、过拟合控制和业务损失。优秀回答还要说明不同业务风险下如何选指标。
卷积层为什么能抽取图像特征,如何从局部连接、权重共享、感受野、平移等变性和多层组合解释?
卷积层能抽取图像特征,核心在于用局部连接和权重共享把同一个模式检测器滑过整张图,再通过多通道卷积、非线性、多层感受野扩张和下采样,把边缘、纹理、部件逐步组合成更高层语义特征。
机器学习模型训练和评估的基本流程是什么?
机器学习模型训练和评估的基本流程,本质是在业务目标约束下,把原始数据转化为可泛化模型,并通过离线验证、线上实验和持续监控判断模型是否真正有效。回答时不能只背训练步骤,还要说明数据质量、切分方式、指标选择、过拟合与数据泄漏控制,以及上线后的反馈闭环。
同题还出现在 2 个公司岗位
在华为云 BD 场景中,人工智能和大数据如何改变传统 BD 工作模式?你会如何设计“智能 BD”的能力和效果指标?
这道题考察候选人是否理解云服务 BD 已经从单纯拜访客户、维护关系,升级为数据驱动的机会发现、客户洞察、方案匹配和销售预测。高质量回答要把智能 BD 定义为人机协同的商业增长系统:用大数据识别行业机会和客户信号,用 AI 做线索评分、需求理解、方案推荐、话术和材料辅助、CRM 自动化、风险预警和预测管理;同时保留 BD 的关系判断、复杂谈判和合规责任。指标上要覆盖线索质量、转化效率、销售周期、赢单率、管道质量、预测准确率、客单价、续费和人效。
RAG 检索召回无关内容时,如何从 query rewrite、混合检索、rerank、过滤和拒答机制处理?
这题考察候选人能否把 RAG 无关召回拆成可诊断、可治理、可评估的检索链路问题,而不是只说调提示词或换模型。
同题还出现在 1 个公司岗位