为什么数据库索引常用 B+ 树，B 树、B+ 树和二叉树有什么区别？｜腾讯 C/C++面经解析

60 秒回答模板

可以这样回答：数据库索引常用 B+ 树，是因为它适合磁盘页和范围查询。B+ 树分叉多、树高低，非叶子节点只存 key 和子页指针，叶子节点顺序保存数据或主键并通过链表相连，能减少随机 I/O 并高效范围扫描。二叉树每个节点分叉少，数据量大时高度高，磁盘访问次数多；B 树节点也多路，但数据可能分布在内外节点；B+ 树把数据集中到叶子层，非叶子层更小、扇出更大，叶子链表支持顺序遍历。 B+ 树适合读多和范围查询，但写入会有页分裂、合并和维护成本。哈希索引等值查询快但不支持有序范围；LSM 树写入友好但读放大和压缩成本不同。不要只比较 O(log n)。数据库索引的瓶颈是页 I/O、缓存命中、范围扫描和局部性，B+ 树的价值来自页式存储和有序叶子链表。验证时重点看：用执行计划、索引高度、扫描行数、回表次数、Buffer Pool 命中率和范围查询耗时验证索引效果。

考点 考点边界

主线 核心机制

易错点 只说 B+ 树复杂度是 log n，没有联系磁盘页、扇…

深入解析

考点边界

这题是数据库索引结构题，边界在磁盘页、扇出、树高、叶子链表和范围扫描，不应泛化到缓存、事务或普通后端读写路径。本题对应“数据库索引为什么常用 B+ 树”，核心前提是：数据库索引常用 B+ 树，是因为它适合磁盘页和范围查询。B+ 树分叉多、树高低，非叶子节点只存 key 和子页指针，叶子节点顺序保存数据或主键并通过链表相连，能减少随机 I/O 并高效范围扫描。

核心机制

二叉树每个节点分叉少，数据量大时高度高，磁盘访问次数多；B 树节点也多路，但数据可能分布在内外节点；B+ 树把数据集中到叶子层，非叶子层更小、扇出更大，叶子链表支持顺序遍历。关键证据要落到读写路径、索引访问、锁/MVCC、执行计划，这样才能说明机制为什么能支撑题目结论。如果继续展开，要把访问路径、索引选择、锁范围、MVCC、回表成本或存储引擎差异放到同一条读写链路里解释。

关键取舍

B+ 树适合读多和范围查询，但写入会有页分裂、合并和维护成本。哈希索引等值查询快但不支持有序范围；LSM 树写入友好但读放大和压缩成本不同。因此要同时看读写比例、执行计划、锁等待、回表成本和事务边界，避免局部优化放大写入或并发成本。这些取舍决定了方案在不同输入规模、延迟、内存、并发、泛化或一致性要求下是否仍然成立。

边界风险

不要只比较 O(log n)。数据库索引的瓶颈是页 I/O、缓存命中、范围扫描和局部性，B+ 树的价值来自页式存储和有序叶子链表。排查时优先看 EXPLAIN、慢查询、扫描行数、锁等待、事务隔离、回表次数和异常数据分布。需要特别关注极端输入、数据分布变化、资源不足、并发竞争或观测口径错误带来的退化。修复时要先复现实执行计划和数据分布，再决定改 SQL、建索引、缩事务、调整隔离级别还是做冷热拆分。

验证抓手

验证时看 EXPLAIN/EXPLAIN ANALYZE、慢查询、扫描行数、回表、Using index/filesort/temporary、锁等待、事务隔离级别、Buffer Pool 命中率和实际耗时。索引或事务结论都要能用这些证据闭环。针对本题，最有价值的验证信号是：用执行计划、索引高度、扫描行数、回表次数、Buffer Pool 命中率和范围查询耗时验证索引效果。把验证抓手说出来，可以让答案从知识点延伸到数据库访问路径、性能和一致性验证。

易错点

只说 B+ 树复杂度是 log n，没有联系磁盘页、扇出和 I/O。
忽略 B 树和 B+ 树数据存放位置、叶子链表和范围扫描能力的差异。
把相邻概念混用，没有明确说明这道题真正考察的边界。
没有给出验证方式，导致答案听起来完整但无法判断是否真的生效。

面试官追问

B+ 树为什么比二叉树更适合磁盘索引？

B+ 树一个节点可以放很多 key，对应一个磁盘页，扇出大、树高低。二叉树分叉少，同样数据量下高度更高，需要更多随机页访问。

B+ 树为什么适合范围查询？

所有数据项都在叶子层，叶子节点按 key 有序并通过链表连接。定位范围起点后，可以沿叶子链表顺序扫描，减少反复从根节点查找。

“为什么数据库索引常用 B+ 树 B 树 B+”继续追问时最该补哪条边界？

应该围绕“数据库索引为什么常用 B+ 树”补适用前提、失败场景和验证证据。先说明哪些条件下这个机制成立，再说明哪些输入规模、并发状态、数据分布或资源限制会让答案需要调整。

“为什么数据库索引常用 B+ 树 B 树 B+”怎样回答才不是只背概念？

看它能否把“数据库索引为什么常用 B+ 树”的机制链路、关键取舍和可观测信号连起来。回答时应落到具体状态变化、数据路径、复杂度、指标或排查工具，而不是只复述定义。

MySQL 题为什么要先看执行计划？

执行计划能确认访问类型、候选索引、实际使用索引、扫描行数、回表、排序和临时表。没有它，索引优化和性能判断很容易停在猜测。