一次Mysql使用IN大数据量的优化记录

作者：mobiledu2402851323 | 2021-11-12 20:03

这篇文章主要给大家介绍了关于Mysql使用IN大数据量的优化的实战记录，文中通过示例代码介绍的非常详细，对大家的学习或者工作具有一定的参考学习价值，需要的朋友们下面随着小编来一起学习学习吧

mysql版本号是5.7.28，表A有390W条记录，使用InnoDB引擎，其中varchar类型字段mac已建立索引，索引方法为B-tree。B表仅有5000+条记录。

有一条SQL指令是这样写的：

SELECT * FROM A WHERE mac IN("aa:aa:aa:aa:aa:aa","bb:bb:bb:bb:bb:b",...此外省略900+条)

通过查询出来的结果耗时294.428s。没错，将近5分钟。

使用EXPLAIN分析下：

访问类型type是range，且已命中索引，rows行也只有587776，可为什么查询耗时要这么久？

mac的索引方法使用了B-tree，那对比下它与HASH的区别，简单地总结下：B-tree索引可以用于进行 =,>,>=,<,<=和between的计算，而HASH只能进行等值运算，不能进行范围查找。那IN是等值运算，两种索引方法都适用。即然这样，把mac的索引方法修改为HASH，同样的查询耗时为。

既然调整索引方法并不能明显地提升语句的查询性能，那只能从语句本身中进行处理。其实明眼人刚开始一看就知道，SELECT * 是很耗性能的，那我们只查业务上需要的字段，语句调整为：

SELECT id,mileage FROM A WHERE mac IN("aa:aa:aa:aa:aa:aa","bb:bb:bb:bb:bb:b",...此外省略900+条)

耗时并没有明显的提升。

竟然IN的方式这么难优化，是不是可以放弃使用LEFT JOIN呢？语句调整为：

SELECT a.id,a.mileage FROM A a LEFT JOIN B b ON b.mac = a.mac WHERE b.create_time >= '2020-01-01'

耗时超过5分钟，放弃。

我们知道，在条件量少的情况，EXISTS和IN的效果没有显示的差别。但条件多的时候，IN要比EXISTS的效率也高，来试下EXISTS：

SELECT id,mileage FROM A a WHERE EXISTS(SELECT mac FROM B WHERE create_time >= '2020-01-01' AND mac = a.mac)

耗时也是超过5分钟，IN的效率确实要比EXISTS高，放弃。

所以最后的结论是，如果IN后接大数据量的String，要慎重。

在项目中我把mac作为唯一标识建立与id的对应表，在A表使用mac_id代替mac，查询的时候使用IN(1,2,3...)。效率会提高一些。当前使用NoSQL也是一种方式。

总结

到此这篇关于一次Mysql使用IN大数据量优化的文章就介绍到这了,更多相关Mysql使用IN大数据量优化内容请搜索以前的文章或继续浏览下面的相关文章希望大家以后多多支持！

推荐阅读

程序员
Flexbox,方形div的响应网格保持纵横比

如何解决《Flexbox,方形div的响应网格保持纵横比》经验，为你挑选了1个好方法。 ... [详细]
程序员
如何为UINavigation栏添加阴影效果

如何解决《如何为UINavigation栏添加阴影效果》经验，为你挑选了2个好方法。 ... [详细]
程序员
删除Django admin中的默认删除操作

如何解决《删除Djangoadmin中的默认删除操作》经验，为你挑选了4个好方法。 ... [详细]
程序员
遗留系统的CQRS

如何解决《遗留系统的CQRS》经验，为你挑选了1个好方法。 ... [详细]
程序员
在两个物理服务器中托管ASP.NET MVC项目

如何解决《在两个物理服务器中托管ASP.NETMVC项目》经验，为你挑选了1个好方法。 ... [详细]
程序员
LXC和libcontainer之间的区别

如何解决《LXC和libcontainer之间的区别》经验，为你挑选了1个好方法。 ... [详细]
程序员
什么问题可以在互斥范围外调用std :: list/vector/map/deque :: empty()？

如何解决《什么问题可以在互斥范围外调用std::list/vector/map/deque::empty()？》经验，为你挑选了1个好方法。 ... [详细]
程序员
android animate()withEndAction()vs setListener()onAnimationEnd()

如何解决《androidanimate()withEndAction()vssetListener()onAnimationEnd()》经验，为你挑选了1个好方法。 ... [详细]
程序员
在C/C++中自动检测OS

如何解决《在C/C++中自动检测OS》经验，为你挑选了2个好方法。 ... [详细]
程序员
使用require()使用OpenSeadragon的示例

如何解决《使用require()使用OpenSeadragon的示例》经验，为你挑选了1个好方法。 ... [详细]
程序员
ng-map拖动标记后获取地址

如何解决《ng-map拖动标记后获取地址》经验，为你挑选了1个好方法。 ... [详细]
程序员
调试时NodeJS没有响应(在VS代码中)

如何解决《调试时NodeJS没有响应(在VS代码中)》经验，为你挑选了2个好方法。 ... [详细]
程序员
R,如何将此操作矢量化

如何解决《R,如何将此操作矢量化》经验，为你挑选了1个好方法。 ... [详细]
程序员
结合多个Linq Where语句

如何解决《结合多个LinqWhere语句》经验，为你挑选了1个好方法。 ... [详细]
程序员
Google Map:InvalidValueError:setLabel:不是字符串; 没有文字属性

如何解决《GoogleMap:InvalidValueError:setLabel:不是字符串;没有文字属性》经验，为你挑选了1个好方法。 ... [详细]
程序员
在列表对象中排序

如何解决《在列表对象中排序》经验，为你挑选了2个好方法。 ... [详细]
程序员
PHP:如何解析JSON字符串并获取变量？

如何解决《PHP:如何解析JSON字符串并获取变量？》经验，为你挑选了1个好方法。 ... [详细]
程序员
Django-自定义装饰器，仅允许ajax请求

如何解决《Django-自定义装饰器，仅允许ajax请求》经验，为你挑选了2个好方法。 ... [详细]
程序员
使用PHP 7和WAMP

如何解决《使用PHP7和WAMP》经验，为你挑选了2个好方法。 ... [详细]
程序员
如何从Linux内核维护者的开发分支下载最新的Linux内核代码？

如何解决《如何从Linux内核维护者的开发分支下载最新的Linux内核代码？》经验，为你挑选了1个好方法。 ... [详细]

mobiledu2402851323

这个屌丝很懒，什么也没留下！

关注作者

Tags | 热门标签

RankList | 热门文章