从63 秒到 0.482 秒:深入剖析 MySQL 分页查询优化
创作时间:
作者:
@小白创作中心
从63 秒到 0.482 秒:深入剖析 MySQL 分页查询优化
引用
CSDN
1.
https://blog.csdn.net/qq_51447436/article/details/145320461
在数据库开发中,分页查询性能问题一直是一个常见的痛点。本文将从MySQL索引机制入手,深入剖析其底层原理(B+树),结合实际场景讲解分页查询优化的技巧,并通过实验数据展示优化效果。通过本文的学习,你将能够掌握如何将查询从几十秒缩短到几百毫秒的优化方法。
MySQL 索引机制
索引是什么?
索引是一种提高查询速度的数据结构。它的作用类似于书的目录,可以帮助 MySQL 快速找到目标数据,而不是逐页翻找。
MySQL 的索引类型
- 聚簇索引(Clustered Index):
- InnoDB 存储引擎默认的主键索引。
- 特点:数据和索引存储在一起,叶子节点存储的是完整行的数据。
- 每个表只能有一个聚簇索引。
- 示例:假设一张用户表以
id为主键,索引结构如下:根节点 → 中间节点 → 叶子节点(存储完整行数据)
- 辅助索引(Secondary Index):
- 除主键外的其他索引,例如普通索引和唯一索引。
- 特点:叶子节点存储的是主键值,通过主键值回表查询完整数据。
- 适用场景:用于加速非主键列的查询。
MySQL 缓存机制的变化
MySQL 8.0 删除了查询缓存(Query Cache):
原因:查询缓存频繁失效,影响性能,在高并发写场景下尤为明显。
查询缓存的替代:更高效的优化器和 InnoDB 缓存机制。
MySQL 的 Buffer Pool:
依旧是核心性能优化手段。
功能:将数据页、索引页缓存到内存中,减少磁盘 I/O。
特点:即使查询缓存被删除,Buffer Pool 仍然支持高效的索引查询和数据读取。
索引的底层原理
什么是 B+树?
B+树是一种平衡多路搜索树,广泛应用于数据库和文件系统中,用于存储索引。
B+树的结构
- 非叶子节点:
- 只存储索引键,起到导航作用。
- 减少了节点大小,提高了节点的分支因子。
- 叶子节点:
- 存储所有实际数据(聚簇索引)或主键值(辅助索引)。
- 通过链表指针串联,便于范围查询。
B+树的特点
- 平衡性:所有叶子节点都在同一层,查询效率稳定。
- 磁盘友好:每个节点存储多个索引键,减少了磁盘 I/O 次数。
- 范围查询高效:叶子节点的链表结构支持顺序遍历。
为什么 MySQL 使用 B+树?
- 相比 B 树:B+树的非叶子节点存储更多的索引键,更适合大规模数据存储。
- 相比哈希索引:B+树支持范围查询和排序,而哈希索引只支持等值查询。
优化 SQL 排序分页查询的场景
问题描述
假设我们需要从 content 表中查询最近的第 2000000 条到第 2000010 条数据:
SELECT * FROM content ORDER BY create_time DESC LIMIT 2000000, 10;
存在的问题
- 大偏移量(OFFSET):
- 数据库需要扫描并丢弃前 2000000 条记录,浪费资源。
- 即使有索引,MySQL 仍需逐一读取和排序这些记录。
- 全表扫描的风险:
- 如果
create_time没有索引,查询会触发全表扫描。
优化思路
- 利用子查询限定范围:
- 子查询通过索引直接定位目标主键范围。
- 主表查询通过主键精确匹配记录,减少无效扫描。
优化前后对比
优化前 SQL:
SELECT * FROM content ORDER BY create_time DESC LIMIT 2000000, 10;
优化后 SQL:
SELECT *
FROM content
INNER JOIN (
SELECT id
FROM content
ORDER BY create_time DESC
LIMIT 2000000, 10
) temp_content
ON content.id = temp_content.id;
优化前后性能数据
优化前:
查询耗时:63s
原因:扫描大量数据并丢弃前 2000000 条记录,逻辑开销大。
优化后:
查询耗时:0.482s
原因:子查询通过索引快速定位到目标记录范围,主表只查询需要的数据。
为什么优化后性能提升显著?
- 子查询利用索引
- 子查询
SELECT id FROM content ORDER BY create_time DESC LIMIT 2000000, 10利用了create_time索引。 - 索引通过 B+树快速定位到目标范围,减少了全表扫描。
- 减少了无效的数据处理
- 优化前:扫描并丢弃了 2000000 条数据。
- 优化后:只查询需要的数据。
- 高效利用缓存
- 优化后的查询范围更小,Buffer Pool 的命中率更高。
- 避免了大范围扫描导致的缓存失效问题。
- 排序开销显著降低
- 子查询已经完成排序,主查询不需要重复排序,节省了计算资源。
热门推荐
十次暴涨 大事件驱动:BTC如何从避险资产到全球货币
一文了解币圈的涨跌靠什么?
如何在金融市场中合理运用杠杆工具?这种杠杆工具存在哪些潜在风险?
车险电子保单怎么查询?汇总三种查询渠道,第一种方法很ok
桂皮的作用与功效是什么
ArduPilot开源代码之FMU+IOMCU设计
在新加坡开设食品工厂的流程及要求
跨境电商+产业带:协同助力经济高质量发展
爱吃坚果的你请注意
心理活动描写片段训练
成都:美食融合史 也是一部亚洲交流互鉴史
爱,真的只是爱吗?揭秘情感分类背后的哲学思考
化解团队冲突,牢记两点就足够了
洗头突发心梗?注意这个致命细节!
U盘格式化完全指南:掌握正确步骤避免数据丢失
怪物猎人OL:防具选择大揭秘,轻甲与重甲的终极对决
揭秘月亮天秤女:优雅迷人的星座特质与独特魅力
U盘插入电脑不显示?五步轻松解决这个常见问题
哪吒爆了!这些基金“赚翻”了
头上的虱子怎么去除
江苏省南京市秦淮区下辖街道介绍
打印机偏色怎么调 简单几招搞定!
打印机颜色不对怎么办?一文详解打印机颜色校正方法
网络安全甲方:责任、挑战与应对策略
肉毒素瘦脸是什么
15道懒人快手菜,到家后十分钟搞定,并且味道还不错
耳鸣的常见诱因及其影响(探讨引发耳鸣的各种因素)
辽宁省人口流动与产业结构、房价的关系
新发型剪失败了?别慌!詹尼尔教你三招轻松拯救你的发型危机
英国的首都是哪个城市