公司题库

京东面经题库

29 道题 5 个岗位 49 个标签

已解析题目

京东相关面试题

京东 / 算法

ESMM模型里，CVR和CTR任务共享Embedding层，这个在代码层面具体是怎么实现的？

ESMM 中 CTR 和 CVR 任务共享 Embedding 的代码实现，本质是同一批稀疏特征经过同一组 Embedding layer 查表，得到共享底层表示，再分别进入 CTR tower 和 CVR tower。回答要讲清共享参数、前向路径、loss 设计和训练样本空间。

同题还出现在 1 个公司岗位

推荐系统 Embedding 模型训练

京东 / 算法

给定一个未排序数组，如何输出第K大的数字？

未排序数组找第 K 大，常见解法有排序、大小为 K 的小顶堆和 Quickselect。面试中最推荐先给出复杂度对比，再重点讲 Quickselect 的 partition 思路和边界处理。

TopK 数据结构算法

京东 / 算法

数据预处理一般用 OpenCV 做什么？

OpenCV 在数据预处理中常用于图像读取、格式转换、尺寸调整、归一化、去噪、增强、几何变换、颜色空间处理和基础标注清洗。回答要把训练数据处理和上线推理一致性一起讲清楚。

计算机视觉特征工程模型训练

京东 / 后端开发

大模型使用向量数据库的诉求是什么？

大模型使用向量数据库的核心诉求是把外部知识、私域文档和长尾内容以语义检索方式接入模型，弥补上下文长度、知识时效和幻觉问题。它通常服务于 RAG、记忆、相似检索和推荐召回。

大语言模型向量数据库 RAG

京东 / 后端开发

Agent 和传统大模型有什么区别？

Agent 和传统大模型的核心区别在于是否具备面向目标的规划、工具调用、状态管理和执行闭环。回答时要把 LLM 说成能力底座，把 Agent 说成围绕任务运行的系统。

AI Agent 大语言模型系统设计

京东 / 算法

Self-Attention 中为什么需要 Softmax？

Self-Attention 中 Softmax 的作用是把相似度分数转换成归一化注意力权重，让模型用概率分布对 value 做加权聚合。

注意力机制大语言模型模型训练

京东 / 算法

Self-Attention 中为什么要做 QKV 线性变换？

QKV 线性变换让同一个输入表示分别投影到查询、键和值三个语义空间，使 Attention 能学习匹配关系和被聚合内容，而不是用原始 embedding 直接相乘。

注意力机制大语言模型模型训练

京东 / 算法

遗传算法优化和梯度下降优化有什么区别？

遗传算法和梯度下降的区别在于优化信息、搜索方式和适用问题不同：前者是群体式全局启发搜索，后者依赖梯度做连续参数局部迭代。

算法模型训练统计学

京东 / 算法

LSTM 的输入门、遗忘门和输出门是如何工作的？

LSTM 用遗忘门、输入门和输出门控制细胞状态的保留、写入和暴露，从而缓解普通 RNN 的长期依赖和梯度衰减问题。

同题还出现在 1 个公司岗位

神经网络推荐系统

京东 / 算法

关键词不在库里但商品对应另一个关键词，怎么解决？

这是电商搜索中的 query 覆盖与语义召回问题。可通过同义词和别名词库、query rewrite、拼写纠错、类目和属性归一、向量召回、用户行为挖掘等方式，把未入库关键词映射到可召回商品的标准词或相关词，同时通过相关性排序和人工审核控制误召回。

搜索产品 Matching 方法电商

京东 / 算法

为什么 XGB+LR 可以提高模型效果，XGB 在其中充当什么角色？

XGB+LR 中 XGB 通常充当自动特征组合和非线性分桶器，把样本映射到各棵树的叶子节点，再将叶子索引 one-hot 后交给 LR 学线性权重。它能把原始特征空间中的非线性关系转成稀疏组合特征，同时保留 LR 训练快、可校准、部署简单的优点。

XGBoost 特征工程模型训练

京东 / 算法

Qwen-VL 如何压缩图片 token，多模态大模型中图像 token 和文本 token 的处理链路有什么差异？

这道题考察多模态大模型里视觉 token 的压缩和图文 token 进入 LLM 前的差异。回答要说清图片先变成连续视觉特征再压缩投影，文本则经过离散 tokenizer 直接得到词向量，两者在融合前的链路不同。

通义千问多模态学习大语言模型 Transformer

京东 / 后端开发

向量数据库和传统数据库在查询方式、索引结构和事务能力上有什么区别？

这题考向量数据库和传统数据库的边界，回答要围绕查询目标、索引结构、事务一致性和工程搭配展开。

大语言模型向量数据库数据库数据库索引事务

京东 / 算法

LoRA 微调能否注入领域知识，应该如何验证效果边界？

这题考 LoRA 微调能否注入领域知识及其边界。答案要区分格式/风格/任务适配与事实知识注入，并比较 LoRA、SFT、继续预训练和 RAG 的验证方法。

同公司岗位有 2 条面经记录

大语言模型模型微调模型评估模型训练 SFT

京东 / 测开

Agent 的 think-execute 循环如何控制规划路径，避免偏离业务预期或无限循环？

这题考 Agent 循环规划的可控性，重点是说明为什么需要 think-execute，以及如何用目标约束、状态机、校验器、评估器、停止条件和测试回放确保路径不跑偏。

同题还出现在 1 个公司岗位

AI Agent 大语言模型工作流质量工程测试用例设计稳定性

京东 / 测开

RAG 外部知识库分片过大时，如何重新切分、保留语义边界并控制召回噪声？

这题考 RAG 知识库切分的工程细节，重点是说明分片过大会稀释 embedding、挤占上下文、引入噪声，并给出递归切分、层级索引、元数据继承、召回重排和回归评测方案。

同题还出现在 1 个公司岗位

RAG Embedding 向量数据库大语言模型质量工程系统设计

京东 / 产品

电商和零售业务中，如何判断哪些场景适合落地 AI 产品？

这题考的是 AI 产品落地判断能力：能否从用户任务、数据基础、AI 增量、风险控制、ROI 和运营闭环中筛选适合电商零售的高价值场景。

AI 产品产品管理业务指标商业化

京东 / 算法

LoRA 微调通常插入哪些层，epoch、learning_rate 等常用训练参数如何设置？

这题考 LoRA 微调的工程落点：适配器插到哪些线性层，常用 rank、alpha、dropout、epoch、learning_rate、batch 和 scheduler 如何取舍。好的回答不能只说冻结原模型、训练低秩矩阵，而要能根据任务类型、数据规模、显存预算和过拟合风险解释从 q/v 到 attention+MLP 的 target module 选择，以及为什么 LoRA 学习率通常比全参微调更高但仍需验证集约束。

大语言模型模型微调模型训练 SFT

京东 / 算法

训练中把 loss 除以 10 和把学习率除以 10 有什么区别？

这题考优化器细节：把 loss 除以 10 会先把反向传播得到的梯度缩小 10 倍；把学习率除以 10 是在优化器更新参数时缩小 step size。二者在最简单的无动量 SGD、无正则、无裁剪场景下近似等价，但在 Adam/AdamW、动量、weight decay、gradient clipping、混合精度、多任务 loss、分布式梯度累积等真实训练中会产生明显差异。

模型训练神经网络

京东 / 算法

大模型训练中的 3D 并行和 DeepSpeed 分别解决什么问题，如何组合使用？

这题考的是大模型训练系统的分解能力：3D 并行解决模型和计算如何切到多卡上，DeepSpeed 提供 ZeRO、混合精度、checkpoint、offload 和并行编排等工程能力，两者可以组合但不是同一个概念。

大语言模型模型训练分布式系统 GPU 性能排查系统设计

京东 / 后端开发

文本搜图场景如何设计图片搜索系统，让用户搜“小狗”时能召回包含小狗的图片？

文本搜图系统要让用户输入“小狗”时召回包含小狗的图片，核心不是只按文件名搜索，而是建立图片内容理解、文本语义表示、索引召回和排序评估的完整链路。图片侧需要离线或实时提取对象标签、检测框、caption、OCR、视觉向量和多模态向量；查询侧需要把文本解析成语义向量和关键词；召回侧结合倒排索引、向量检索和元数据过滤；排序侧再按语义匹配、对象置信度、图片质量和用户意图重排。

计算机视觉多模态学习 Embedding AI 搜索系统设计向量数据库

京东 / 后端开发

Agent 中模型调用、本地函数调用、MCP 调用和 Skill 调用有什么区别？

这题考 Agent 调用边界设计，回答重点是模型调用、本地函数调用、MCP 调用和 Skill 调用在调用方、协议、信任边界、生命周期和失败处理上的区别。

同题还出现在 1 个公司岗位

AI Agent 大语言模型系统设计

京东 / 后端开发

做 AI 项目时如何选择和使用大模型？

做 AI 项目选择和使用大模型，不能只看榜单或单次体验，而要从业务目标、任务类型、质量要求、成本预算、延迟约束、上下文长度、工具能力、数据安全、供应商稳定性和可观测性综合评估。正确姿势是小范围评测、多模型分层、持续监控和可替换架构。

同题还出现在 1 个公司岗位

大语言模型

京东 / 数据分析

在财务经营分析中，如何用大数据和 AI 提升分析效率与准确性？

在财务经营分析中，大数据和 AI 的价值不是替代财务判断，而是提升数据整合、异常发现、预测预警、归因分析和报告生成的效率与准确性。回答应围绕经营分析链路展开：数据口径统一、自动化取数、指标监控、异常检测、预算预测、成本收入归因、报告自动化和人审机制，避免空泛谈 AI。

数据分析商业分析业务指标 AI 产品指标体系

京东 / 产品

AI 产品选型时，如何判断用自研模型、开源模型还是第三方 API，并说明选择理由？

这题考 AI 产品经理是否能把模型来源选择讲成业务目标、效果验证、数据风险、成本延迟、可控性和 fallback 的综合决策，而不是按热度报模型名字。

同题还出现在 1 个公司岗位

Java 并发并发多线程 AI 产品大语言模型产品管理

京东 / 算法

1x1 卷积核在 CNN 中有什么作用？

这道题考察 CNN 中 1x1 卷积的真实作用。它不是用来扩大空间感受野，而是在每个空间位置上做通道维度的线性组合，常用于通道融合、升降维、减少计算量、构造瓶颈层，以及在合适网络结构中增强表达效率。

计算机视觉神经网络模型训练

京东 / 数据分析

Dropout 在训练和推理阶段分别如何处理，为什么测试时通常关闭随机丢弃？

这题考 Dropout 的训练和推理差异。高质量回答要说明训练期采样 Bernoulli mask，常用 inverted dropout 按 1/(1-p) 放大保留激活；推理期切到 eval 模式关闭随机丢弃，使用完整网络并保持期望一致，同时补充 MC Dropout 例外和框架常见坑。

神经网络正则化模型训练

京东 / 算法

超分辨率模型中，上采样层放在网络前面还是后面，各自有什么速度、显存和效果取舍？

这题考超分辨率网络中上采样位置的架构取舍。高质量回答要对比 SRCNN 式前置上采样和 FSRCNN/ESPCN 式后置上采样，讲清计算量、显存、速度、感受野、重建质量、尺度适配和棋盘伪影，并说明 sub-pixel、transpose convolution、resize-conv 等方案差异。

计算机视觉神经网络模型训练

京东 / 算法

京东商品详情页“XXX 也买过”推荐模块如何设计，如何做候选召回、排序特征、冷启动和线上 CTR/CVR/GMV 评估？

这题考商品详情页 item-to-item 推荐模块设计。回答应围绕“也买过”的共购语义，讲清候选召回、排序特征、冷启动、去重多样性、业务约束，以及用 CTR、CVR、GMV、加购率和护栏指标做线上实验评估。

推荐系统电商产品指标数据分析