MySQL B+ 树索引的实现｜高频面试题解析

60 秒回答模板

InnoDB 的索引通常用 B+ 树组织，节点按页存储。非叶子页保存索引键和子页指针，叶子页按键值有序；等值查询从根页逐层定位到叶子页，范围查询先找到起点，再沿叶子页之间的有序链表顺序扫描。聚簇索引的叶子页保存整行记录，二级索引的叶子页保存二级索引键和主键值，所以二级索引查不到所需列时要拿主键回到聚簇索引取行。选择 B+ 树不是因为它抽象上最平衡，而是因为分叉高、树高低、顺序扫描友好，适合数据库的页式磁盘访问。

考点 索引结构与磁盘页

难度 中频基础题

回答目标 讲清查找路径和范围扫描

深入解析

从磁盘页理解索引

数据库索引首先要减少随机 I/O。InnoDB 把索引节点放在固定大小的数据页里，一个页能放很多 key 和指针，因此 B+ 树的 fanout 很高，几层树就能覆盖大量数据。

非叶子页只负责导航

非叶子页主要保存分隔 key 和子页指针，不保存完整行。查找时在当前页内定位分支，再跳到下一层页；这让每一层访问都尽量变成一次页定位。

叶子页承担有序数据访问

所有真实索引项都在叶子页，叶子页按 key 有序，并通过前后指针连接。等值查询落到一个叶子位置，范围查询则从起点开始沿叶子链表连续扫描。

聚簇索引和二级索引要分开讲

聚簇索引按主键组织表数据，叶子页直接存整行；二级索引叶子页存二级 key 和主键。二级索引如果不能覆盖查询字段，就要用主键再次查聚簇索引，这就是回表。

写入成本来自页维护

索引不是免费加速。插入、删除、更新索引列时要维护 B+ 树；随机主键或无序写入可能触发页分裂、页合并和碎片，影响写性能和缓存命中。

易错点

说 B+ 树节点都存整行，忽略非叶子页、二级索引叶子页和聚簇索引叶子页的差异。
只背“树高低”，没有解释树高低如何减少页访问和随机磁盘 I/O。
把范围查询说成每个 key 都从根节点重新查，漏掉叶子页有序链表。
讨论索引只讲查询加速，不提写入维护、页分裂和回表成本。

面试官追问

为什么数据库索引常用 B+ 树，而不是红黑树？

红黑树分叉少，数据量大时高度更高，随机 I/O 次数多。B+ 树一个页能容纳大量 key，树高低，更符合磁盘和页缓存的访问模型。

B+ 树为什么比 B 树更适合范围查询？

B+ 树把数据项集中在叶子页，并让叶子页有序相连。范围查询只要定位起点，就能顺序扫描叶子链表；B 树数据分散在各层，范围遍历更复杂。

什么情况下二级索引不需要回表？

查询所需字段都能从二级索引叶子页拿到时就是覆盖索引，不需要再查聚簇索引。典型场景是 select 的列都包含在联合索引中。

自增主键为什么通常比随机 UUID 更友好？

自增主键大多追加到索引右侧，页分裂少；随机 UUID 会分散插入到各个叶子页，更容易造成页分裂、碎片和缓存命中下降。