问小白 wenxiaobai

资讯

历史

科技

环境与自然

成长

游戏

财经

文学与艺术

美食

健康

家居

文化

情感

汽车

三农

军事

旅行

运动

教育

生活

星座命理

OFFSET和LIMIT分页方式的性能问题及优化方案

创作时间:

作者:

@小白创作中心

OFFSET和LIMIT分页方式的性能问题及优化方案

引用

CSDN

1.

https://blog.csdn.net/weixin_52100990/article/details/137457651

在大数据量下，传统的OFFSET和LIMIT分页方式可能会导致严重的性能问题。本文将探讨这种分页方式存在的问题，并介绍一种更高效的基于游标（指针）的分页方案。

不需要担心数据库性能优化问题的日子已经一去不复返了。随着时代的进步，随着野心勃勃的企业想要变成下一个Facebook，随着为机器学习预测收集尽可能多数据的想法的出现。作为开发人员，我们要不断地打磨我们的API，让它们提供可靠和有效的端点，从而毫不费力地浏览海量数据。

如果你做过后台开发或数据库架构，你可能是这么分页的：

SELECT * FROM table ORDER BY id LIMIT 20 OFFSET 5000000;

如果你真的是这么分页，那么我不得不抱歉地说，你这样做是错的。你不以为然？没关系。Slack、Shopify和Mixmax这些公司都在用，我们今天将要讨论的方式进行分页。

我想你很难找出一个不使用OFFSET和LIMIT进行数据库分页的人。对于简单的小型应用程序和数据量不是很大的场景，这种方式还是能够“应付”的。但如果你想从头开始构建一个可靠且高效的系统，在一开始就要把它做好。

1. OFFSET和LIMIT有什么问题？

正如前面段落所说的那样，OFFSET和LIMIT对于数据量少的项目来说是没有问题的。但是，当数据库里的数据量超过服务器内存能够存储的能力，并且需要对所有数据进行分页，问题就会出现。

为了实现分页，每次收到分页请求时，数据库都需要进行低效的全表扫描。什么是全表扫描？全表扫描（又称顺序扫描）就是在数据库中进行逐行扫描，顺序读取表中的每一行记录，然后检查各个列是否符合查询条件。

这种扫描是已知最慢的，因为需要进行大量的磁盘I/O，而且从磁盘到内存的传输开销也很大。这意味着，如果你有1亿个用户，OFFSET是5千万，那么它需要获取所有这些记录（包括那么多根本不需要的数据），将它们放入内存，然后获取LIMIT指定的20条结果。

也就是说，为了获取一页的数据：

10万行中的第5万行到第5万零20行

需要先获取5万行。这么做是多么低效？如果你不相信，可以看看这个例子：

DB Fiddle示例

左边的Schema SQL将插入10万行数据，右边有一个性能很差的查询和一个较好的解决方案。只需单击顶部的Run，就可以比较它们的执行时间。第一个查询的运行时间至少是第二个查询的30倍。

数据越多，情况就越糟。看看我对10万行数据进行的PoC：

现在你应该知道这背后都发生了什么：OFFSET越高，查询时间就越长。

2. 替代方案

你应该这样做：

这是一种基于指针的分页。你要在本地保存上一次接收到的主键（通常是一个ID）和LIMIT，而不是OFFSET和LIMIT，那么每一次的查询可能都与此类似：

为什么？因为通过显式告知数据库最新行，数据库就确切地知道从哪里开始搜索（基于有效的索引），而不需要考虑目标范围之外的记录。

比较这个查询：

和优化的版本：

返回同样的结果，第一个查询使用了12.80秒，而第二个仅用了0.01秒。

要使用这种基于游标的分页，需要有一个惟一的序列字段（或多个），比如惟一的整数ID或时间戳，但在某些特定情况下可能无法满足这个条件。我的建议是，不管怎样都要考虑每种解决方案的优缺点，以及需要执行哪种查询。

如果需要基于大量数据做查询操作，Rick James的文章提供了更深入的指导：

MySQL性能优化指南

如果我们的表没有主键，比如是具有多对多关系的表，那么就使用传统的OFFSET/LIMIT方式，只是这样做存在潜在的慢查询问题。我建议在需要分页的表中使用自动递增的主键，即使只是为了分页。

热门推荐

电气线路故障、用电超负荷……这些火灾隐患不容忽视！

电气线路故障、用电超负荷……这些火灾隐患不容忽视！

为什么医生不建议低血压的人多喝茶？建议了解

为什么医生不建议低血压的人多喝茶？建议了解

多喝米酒对身体有好处吗

多喝米酒对身体有好处吗

水瓶座的形像在不同文化中有何差異？

水瓶座的形像在不同文化中有何差異？

美国学校中人际关系的复杂性与挑战

美国学校中人际关系的复杂性与挑战

企业年金离职后的处理方式是什么？这种处理方式对员工有何影响？

企业年金离职后的处理方式是什么？这种处理方式对员工有何影响？

数学学习中的记忆技巧

数学学习中的记忆技巧

泄漏检测与修复(LDAR)技术实施流程及常见问题剖析

泄漏检测与修复(LDAR)技术实施流程及常见问题剖析

如何通过五行平衡理论调节金旺火弱，实现身体健康与运势提升

如何通过五行平衡理论调节金旺火弱，实现身体健康与运势提升

电子烟危害小吗？它对身体的伤害，可能超出你的想象！

电子烟危害小吗？它对身体的伤害，可能超出你的想象！

浙江高考等级分怎么换算？赋分规则详解

浙江高考等级分怎么换算？赋分规则详解

中式霸总接管好莱坞？｜微短剧本土化出海洞察

中式霸总接管好莱坞？｜微短剧本土化出海洞察

病毒性心肌炎：认识、预防与应对

病毒性心肌炎：认识、预防与应对

如何撰写有效的群公告：清晰、简洁与互动的重要性

如何撰写有效的群公告：清晰、简洁与互动的重要性

每天吃多少菠萝蜜最合适？过量食用的危害与注意事项

每天吃多少菠萝蜜最合适？过量食用的危害与注意事项

两个人若是真心相爱，一定会有这4个表现

两个人若是真心相爱，一定会有这4个表现

智齿发炎时使用甲硝唑的治疗效果与注意事项

智齿发炎时使用甲硝唑的治疗效果与注意事项

产前需要准备些什么东西

产前需要准备些什么东西

借助AI变革翻译之旅：使用ChatGPT提升翻译质量的最佳实践

借助AI变革翻译之旅：使用ChatGPT提升翻译质量的最佳实践

公交车安全逃生知识普及，助力市民提升自救能力

公交车安全逃生知识普及，助力市民提升自救能力

银耳汤保温一晚上第二天能喝吗？银耳汤几小时后不能吃？

银耳汤保温一晚上第二天能喝吗？银耳汤几小时后不能吃？

带状疱疹，不只是疼痛那么简单，治疗与预防全攻略！

带状疱疹，不只是疼痛那么简单，治疗与预防全攻略！

OLED屏幕更伤眼？来看看如何减少蓝光伤害！

OLED屏幕更伤眼？来看看如何减少蓝光伤害！

回撤率是什么？回撤率的计算方法和对投资的意义是什么？

回撤率是什么？回撤率的计算方法和对投资的意义是什么？

血脂异常怎么办？这份实用指南请收好

血脂异常怎么办？这份实用指南请收好

爱情与友情有何区别？

爱情与友情有何区别？

十一自驾游安全攻略：这些行车注意事项请收好！

十一自驾游安全攻略：这些行车注意事项请收好！

米豆腐：贵州钟爱的风味小吃，Q弹爽滑，酸辣诱人

米豆腐：贵州钟爱的风味小吃，Q弹爽滑，酸辣诱人

基金投资策略：稳健与进取的平衡之道

基金投资策略：稳健与进取的平衡之道

留学韩国住宿方式的选择

留学韩国住宿方式的选择

© 2023 北京元石科技有限公司 ◎ 京公网安备 11010802042949号