当前位置 : 祺云SEO > 互联网资讯>

MyBatis千万数据表如何快速分页？MyBatis处理百万级数据分页优化

时间：2026-06-26 来源：祺云SEO

面对MyBatis处理千万级数据表的分页难题，核心解法并非优化SQL本身，而是通过“延迟关联”或“游标分页”策略，将全表扫描转化为索引覆盖扫描，从而在毫秒级完成响应。

当数据量突破千万大关,传统的LIMIToffset,size分页机制会遭遇严重的性能瓶颈，随着偏移量offset的增加，数据库需要读取并丢弃大量无效数据，导致查询时间呈线性甚至指数级增长，对于后端开发人员而言，这不仅是代码效率问题，更是系统稳定性的生死线，业内专家指出，在高并发场景下，这种“深分页”问题往往是导致数据库CPU飙升、连接池耗尽的根本原因，掌握针对海量数据的快速分页技巧，已成为现代Java后端开发的必备技能。

加载中

领导让我SQL优化！千万级数据分页查询我只用了5毫秒，就问还有比我快的吗!!!

百里说Java

2.3万

356

13原视频地址

为什么传统分页在千万数据面前失效

要解决问题,首先得看清痛点，很多开发者习惯直接使用MyBatis的<select>配合LIMIT，这在数据量小时毫无压力，但一旦进入千万级区间，问题便暴露无遗。

深分页的性能陷阱

当用户翻到第1000页,每页10条数据时，SQL大致如下：

SELECTFROMordersLIMIT9990,10;

数据库引擎在执行这条语句时,必须先扫描前9990条记录，将它们全部加载到内存中，然后丢弃前9990条，只保留最后10条返回给应用层，这个过程涉及大量的IO操作和CPU计算，据统计，随着偏移量的增加，查询耗时显著上升，当偏移量达到百万级别时，响应时间可能从几毫秒恶化至数秒甚至超时。

索引失效与全表扫描

更糟糕的情况发生在没有合适索引或索引选择性低的时候,如果LIMIT前的排序字段未建立索引，或者索引无法覆盖查询所需的所有字段，数据库将不得不进行全表扫描，在千万级数据表上，全表扫描意味着读取数GB甚至数十GB的数据，这对任何关系型数据库都是灾难性的。

MyBatis千万数据表快速分页实战方案

解决这一问题的思路主要有两种：一是优化SQL逻辑，利用索引加速；二是改变分页策略，避免深偏移，以下是两种经过生产环境验证的高效方案。

延迟关联（SeekMethod）

这是最经典且兼容性最好的方案,其核心思想是“先查主键，再查详情”。

具体实施步骤

第一步：利用索引获取主键ID
首先执行一个只包含主键ID和排序字段的查询，并利用索引快速定位到起始位置。
<selectid="selectIdsByPage"resultType="Long">SELECTidFROMordersORDERBYcreate_timeDESC,idDESCLIMIT#{offset},#{pageSize}</select>
由于create_time和id通常建有联合索引，这一步查询非常快，因为它只需要读取索引树，无需回表。
第二步：根据ID列表查询完整数据
拿到ID列表后，再通过IN查询获取完整的订单详情。
<selectid="selectOrdersByIds"resultType="Order">SELECTFROMordersWHEREidIN<foreachcollection="idList"item="id"open="("separator=","close=")">#{id}</foreach></select>
这种方式将一次昂贵的深分页查询,拆解为两次轻量级的查询，第一次查询利用索引快速跳过大量数据，第二次查询通过主键聚簇索引直接定位数据，避免了回表带来的随机IO开销。

适用场景与优势

这种方案特别适用于MyBatis千万数据表查询优化场景，它不依赖数据库的特殊功能，MySQL、PostgreSQL等主流数据库均支持，在大多数电商订单、日志系统中，这种“主键先行”的策略能将查询速度提升10倍以上。

游标分页（KeysetPagination）

对于实时性要求极高、数据持续增长的场景，游标分页是更优雅的选择，它不依赖偏移量，而是基于上一次查询的最后一条记录的位置。

实现逻辑

不再使用LIMIToffset,size，而是使用WHEREcolumn>last_valueLIMITsize。

<selectid="selectOrdersByCursor"resultType="Order">SELECTFROMordersWHEREcreate_time<#{lastCreateTime}OR(create_time=#{lastCreateTime}ANDid<#{lastId})ORDERBYcreate_timeDESC,idDESCLIMIT#{pageSize}</select>

优势分析

性能恒定：无论翻到第几页，查询时间都保持稳定，因为每次只读取固定数量的索引节点。
适合无限滚动：非常适合前端“加载更多”或“无限滚动”的交互模式，避免了传统分页中“第1页到第1000页”的跳跃式体验。
数据一致性：在数据插入频繁的场景下，传统分页可能出现数据重复或遗漏，而游标分页基于物理位置，能更好地保证数据完整性。

方案对比：延迟关联vs游标分页

特性延迟关联(SeekMethod) 游标分页(KeysetPagination)

查询复杂度

中等（需两次查询）低（单次查询）

性能表现

随页码增加略有波动，但远低于传统分页恒定，与页码无关

适用场景

需要显示总页数、支持任意页跳转无限滚动、新闻流、实时数据

实现难度

低，MyBatis原生支持中，需维护状态（last_value）

总页数计算

容易（COUNT()）困难（需近似估算）

进阶优化：MyBatisPlus与分页插件的正确姿势

在实际开发中,很多团队使用MyBatisPlus等框架，其内置的分页插件PaginationInterceptor默认也是基于LIMIT的，面对千万数据，必须对插件进行定制或切换策略。

避免COUNT查询的性能黑洞

在分页组件中,通常会自动执行SELECTCOUNT()FROMtable，在千万级数据表中，如果表没有合适的统计信息或索引，

COUNT()可能非常慢。

缓存总数
对于非实时性要求极高的后台管理系统，可以将总数缓存到Redis中，定期更新。
近似估算
如果业务允许，可以使用EXPLAIN语句中的rows字段进行近似估算，或者在特定条件下返回固定总数。
禁用COUNT
在无限滚动或仅展示“是否有更多数据”的场景下，直接禁用COUNT查询，只返回当前页数据。

索引设计的黄金法则

无论采用何种分页策略,索引都是性能的基石。

覆盖索引：确保查询所需的字段都在索引中，避免回表，上述延迟关联方案中，只查询ID，完美利用主键索引。
最左前缀原则：如果排序字段是复合索引，必须遵循最左前缀原则，索引(create_time,user_id)，排序必须包含create_time。
避免函数操作：不要在WHERE或ORDERBY中对索引字段使用函数，如ORDERBYYEAR(create_time)，这会导致索引失效。

常见问题解答

MyBatis如何处理千万级数据分页的总记录数统计？

对于千万级数据,直接COUNT()往往耗时过长，建议采用异步更新缓存总数的方式，或者在后台管理系统中，如果不需要精确到个位数，可以使用近似值，若必须精确，可考虑使用专门的分析型数据库（如ClickHouse）来同步统计数据，而非在主业务数据库中硬扛。

游标分页是否支持前端跳转到任意页？

不支持,游标分页是基于“当前位置”的连续读取，无法直接计算第N页的数据，如果业务强需求是“跳转到第500页”，则必须使用传统的延迟关联方案，或者在游标分页的基础上，结合延迟关联技术实现“跳转”功能，但这会牺牲部分性能。

在MyBatis中实现延迟关联分页的最佳实践是什么？

最佳实践是在Service层封装逻辑：先调用Mapper查询ID列表，再调用Mapper根据ID列表查询实体对象，注意使用IN查询时，参数列表不宜过长，建议分批处理（如每批1000个ID），以防止SQL语句过长导致解析性能下降或数据库连接异常。

上一篇：Spring最常用的7大类注解有哪些？Spring注解分类详解

下一篇：CloudCone新年VPS真的便宜吗？1核512M内存3T流量性价比如何

热门新闻

ajax如何实现加载数据功能？前端ajax异步请求数据教程
AJAX实现加载数据功能的核心在于利用JavaScript的XMLHttpRequest或Fetch API向服务器发送异步请求，在不刷新页面的情况下获取并更新局部HTML内容，从而显著提升用户体验和页面性能，在传统Web开发中，每次用户请求新数据，浏览器都会重新加载整个页面，这种全量刷新不仅浪费带宽，还导致用……...
2026年云服务器如何部署大模型？大模型部署成本与性能优化
2026年云服务器大模型部署的核心在于采用“存算分离”架构搭配弹性GPU实例，通过容器化微调与推理加速技术，将成本降低40%并实现秒级响应，2026年云服务器大模型部署架构解析从单体部署到混合云协同在2026年的技术语境下，大模型部署早已告别了早期“买断式”的硬件囤积模式，业内专家指出，当前的主流方案是构建基于……...
http cdn3是什么？http cdn3加速原理及配置教程
http cdn3 并非单一软件，而是指代基于HTTP协议、通过第三级节点或特定优化策略加速内容分发的CDN服务架构，其核心价值在于显著降低延迟并提升大规模并发下的访问稳定性，理解http cdn3的技术本质与应用场景在探讨具体的加速方案时,我们需要先厘清“http cdn3”这一概念在行业内的实际指向，它通常……...
JazzVPS美国VPS好用吗，美国VPS推荐哪家稳定
JazzVPS（原DiaHosting）凭借其在香港节点的低延迟优势以及美国线路的国内/国际双优化策略，是目前平衡访问速度与稳定性的高性价比选择，适合对海外服务器有特定网络环境需求的用户，JazzVPS品牌演变与核心定位解析JazzVPS的前身是业内知名的DiaHosting,这一品牌更迭并非简单的更名，而是服……...
个人使用的数据可视化工具哪个好用？免费数据可视化软件推荐
个人使用的数据可视化工具首选Tableau Public或Python的Matplotlib库，前者适合零代码快速出图，后者适合深度定制与自动化分析，具体选择取决于你的技术背景与业务场景，在2026年的数据环境下,个人开发者或业务分析师面临的挑战不再是获取数据，而是如何高效地将杂乱的信息转化为直观的洞察，市面上……...
共享流量包到底能打折多少？如何购买最便宜的流量包
共享流量包打折多少在云计算资源日益普及的今天,服务器带宽与流量成本已成为企业和个人开发者最为关注的核心指标之一，特别是对于内容分发、视频直播、API接口调用等高并发场景，共享流量包因其高性价比和灵活性，成为了许多用户优化IT预算的首选方案，面对市场上琳琅满目的促销活动，用户往往困惑于“共享流量包打折多少”以及……...

相关资讯

ajax跨域post请求数据库怎么解决？ajax跨域post请求数据库报错怎么办
AJAX跨域POST请求数据库的核心在于通过后端代理或配置CORS头来绕过浏览器同源策略，确保前端能安全地向不同域名的服务器发送数据并接收JSON响应，在Web开发中,前端页面与后端数据库之间往往隔着域名、端口或协议的差异，当你在本地调试或前后端分离架构下，直接发起POST请求通常会遭遇“跨域”拦截，这并非代码……...
2026年云服务器Serverless是什么？Serverless架构优势有哪些
2026年的云服务器Serverless不再是简单的计算资源抽象，而是通过事件驱动与自动扩缩容，帮助开发者实现“按实际调用量付费”的极致降本增效方案，特别适合高并发波动场景，Serverless架构在2026年的核心演进逻辑从容器化到无服务器的认知升级在2026年，传统的IaaS（基础设施即服务）思维正在被彻底……...
CDN回源劫持怎么解决？网站被劫持了怎么办
CDN回源劫持并非黑客入侵，而是CDN节点与源站之间配置错误或中间人攻击导致的内容篡改，核心解决路径在于开启HTTPS回源、校验源站完整性并部署WAF防护，当你的网站访问速度飞快,但用户看到的页面却变了样，或者出现奇怪的弹窗广告时，这往往不是前端代码的问题，而是发生在CDN节点与源站之间的“黑箱”操作，这种现象……...
数脉科技最新促销香港自营/阿里云CN2 BGP直连线路独立服务器5.5折优惠月付300元起附优惠码及测试IP
数脉科技近期推出的香港自营及阿里云CN2 BGP线路独立服务器享受5.5折优惠，月付低至300元起，适合对网络延迟和稳定性有高要求的跨境业务场景，在跨境业务布局中，网络链路的稳定性往往决定了业务的生死，对于许多中小企业而言，选择服务器不仅要看价格，更要看背后的线路质量，数脉科技此次推出的促销活动，直击痛点，将高……...
个人私有云服务器怎么备案？云服务器备案流程和条件详解
个人使用的私有云服务器通常无法直接进行ICP备案，因为国内主流云服务商的备案系统仅对挂载在备案主体名下的域名和服务器资源开放，个人用户需通过购买具备备案资质的“备案专用”虚拟主机或云服务器实例，并配合域名注册商完成流程，很多刚接触云计算的朋友容易陷入一个误区，认为只要自己买台服务器就能随意建站，工信部对于互联网……...
共建中国智慧物流研究院，如何推动物流行业数字化转型
【共建中国智慧物流研究院】服务器性能深度测评与选型指南在“共建中国智慧物流研究院”这一宏大愿景的推动下，物流行业的数字化转型已进入深水区，从仓储机器人的实时调度到干线运输的路径优化，再到末端配送的智能分拣，数据量的爆发式增长对底层算力基础设施提出了前所未有的挑战，服务器作为数据处理的“心脏”，其稳定性、并发处理……...

祺云网络SEO优化

综合热门资讯