9赞

当前位置: 开发笔记 > 后端 > 正文

MySQL中聚合函数count的使用和性能优化技巧

作者：郑谊099_448 | 2023-01-16 10:54

这篇文章主要介绍了Windows10，MySQL版本是5.7.12-log环境下mysql中聚合函数count的使用和性能优化,需要的朋友可以参考下

本文的环境是Windows 10，MySQL版本是5.7.12-log

一、基本使用

count的基本作用是有两个：

统计某个列的数据的数量；
统计结果集的行数；

用来获取满足条件的数据的数量。但是其中有一些与使用中印象不同的情况，比如当count作用一列、多列、以及使用*来表达整行产生的效果是不同的。

示例表如下：

CREATE TABLE `NewTable` (
`id` int(11) NULL DEFAULT NULL ,
`name` varchar(30) NULL DEFAULT NULL ,
`country` varchar(50) NULL DEFAULT NULL ,
`province` varchar(30) NULL DEFAULT NULL ,
`city` varchar(30) NULL DEFAULT NULL 
)ENGINE=InnoDB

这里写图片描述

1.1 不计算NULL的值

如果有NULL值，在返回的结果中会被过滤掉

select count(country) from person;

返回结果如下：

这里写图片描述

如果满足条件的数据项不存在，则结构返回0，经常通过这种方式判断是否有满足条件的数据存在；返回的数据类型是bigint。

1.2 对count(*)的处理

count(*)的处理是有点不同的，它会返回所有数据的数量，但是不会过滤其中的NULL值，它也并不是相当于展开成所有的列，而是直接会忽略所有的列而直接统计所有的行数。语句如下：

select count(*) from person;

返回结果如下：

这里写图片描述

当想要返回所有的数据的数量的时候，但是又不想包括全部是NULL的列，使用count(*)是不可能做到的，但是在1.1中说到count作用于列的时候会过滤NULL，那么直接这么写是不是对？

select count(id, `name`, country, province, city) from person;

那就错了，count只能作用于单列，不能作用于多列，所以上面的写法是错误的。

另外针对count(*)语句，在MyISAM存储引擎中做了优化，每个表的数据行数都会存储在存储引擎中，可以很快拿到；但是在事务性的存储引擎中，比如InnoDB中，因为会涉及到多个事务；

1.3 对count(distinct …)的处理

count(distinct …)会返回彼此不同但是非NULL的数据的行数。这一点和只使用distinct是有区别的，因为distinct是不过滤NULL值的，详见MySQL中distinct的使用方法。

- 如果没有符合条件的数据则返回0；
- 该语句可以作用于多列，是当各个列之间有一个不同，就认为整行数据不同，与distinct作用于多列时效果相同；

select count(DISTINCT country) from person;

返回结果如下：

这里写图片描述

但是对于count(*)和count(distinct )两者的结合，如下：

select count(DISTINCT *) from person;

该语句是错误的，无法执行，因此与select count(DISTINCT *) from person 还是有区别的。

二、性能优化

通常情况下，count(*)操作需要大量扫描数据表中的行，如果避免扫描大量的数据就成为优化该语句的关键所在。针对这个问题可以从如下两个角度考虑。

2.1 在数据库的层次上优化

2.1.1 针对count(*)

在MySQL内部已经针对count(*)进行了优化，使用explain查询如下：

EXPLAIN select count(*) from person;

这里写图片描述

从中可以看出该查询没有使用全表扫描也没有使用索引，甚至不需要查询数据表，在上面的示例数据库中得知，该库的存储引擎是InnoDB ，而且其中既没有主键也没有索引。

2.2 针对单个列进行count

查询如下：

EXPLAIN select count(country) from person where id > 2;

这里写图片描述

发现在没有主键和索引的情况下，对全表进行了扫描。在数据中避免大量扫描数据行，一个最直接的方法使用索引：

当对id设置为一般索引：INDEX abc (id) USING BTREE 。

执行查询如下：

EXPLAIN select count(country) from person where id > 2;

结果如下：

这里写图片描述

此时发现并没有使用索引，仍然进行的是全表扫描，当执行如下时：

EXPLAIN select count(country) from person where id > 4;

结果如下：

这里写图片描述

这是使用了索引进行了范围查询，显然比上面的要好。

但是问题来了，为什么有时候使用索引，有时候不用索引？在上面的第一次查询中已经能够检测出可能的key但是并没有使用？如果有知道的大神给解读一下！

对id设置为主键，执行查询如下：

EXPLAIN select count(country) from person where id > 2;

结果如下：

这里写图片描述

2.2 在应用的层次上优化

在应用的层次上优化，可以考虑在系统架构中引入缓存子系统，比如在过去中常用的Memcached，或者现在非常流行的Redis，但是这样会增加系统的复杂性。

mysql group by与聚合函数(sum,count等)实例

首先我们先来了解一下mysql聚合函数

mysql中一种特殊的函数:聚合函数，SUM, COUNT, MAX, MIN, AVG等。这些函数和其它函数的根本区别就是它们一般作用在多条记录上。例如：

SELECT SUM(score) FROM table

这个sql的意思是查询表table里面所有score列的总和。

接着我们通过一个实例来讲解group by语句中如何使用聚合函数。

book表如下：

id	first_name	last_name	city
1	Jason	Martin	Toronto
2	Alison	Mathews	Vancouver
3	James	Mathews	Vancouver
4	Celia	Rice	Vancouver
5	David	Larry	New York

现在我们要对city进行分组查询，并获取每个分组有多少条数据，我们需要count聚合函数。

SELECT *,count(*) FROM book GROUP BY city

结果为：

id	first_name	last_name	city	count(*)
1	Jason	Martin	Toronto	1
2	Alison	Mathews	Vancouver	3
5	David	Larry	New York	1

先以city把返回记录分成多个组，这就是GROUP BY的字面含义。分完组后，然后用聚合函数对每组中的不同字段(一或多条记录)作运算。

推荐阅读

程序员
iOS展示了特定的排行榜Game Center

如何解决《iOS展示了特定的排行榜GameCenter》经验，为你挑选了0个好方法。 ... [详细]
程序员
Tensorflow使用标签读取图像

如何解决《Tensorflow使用标签读取图像》经验，为你挑选了2个好方法。 ... [详细]
程序员
在jq中将字符串转换为json

如何解决《在jq中将字符串转换为json》经验，为你挑选了1个好方法。 ... [详细]
程序员
以ansible条件评估返回代码

如何解决《以ansible条件评估返回代码》经验，为你挑选了1个好方法。 ... [详细]
程序员
在OS X上安装C++库

如何解决《在OSX上安装C++库》经验，为你挑选了1个好方法。 ... [详细]
程序员
带参数的ZSH别名

如何解决《带参数的ZSH别名》经验，为你挑选了3个好方法。 ... [详细]
程序员
Qt/C++ - 生成的条形码不可读

如何解决《Qt/C++-生成的条形码不可读》经验，为你挑选了1个好方法。 ... [详细]
程序员
在R Shiny中使用jQuery时，情节消失

如何解决《在RShiny中使用jQuery时，情节消失》经验，为你挑选了1个好方法。 ... [详细]
程序员
在ubuntu中找不到pthread_create

如何解决《在ubuntu中找不到pthread_create》经验，为你挑选了1个好方法。 ... [详细]
程序员
如何围绕sourceRect的角落来寻找Peek和Pop 3D Touch？

如何解决《如何围绕sourceRect的角落来寻找Peek和Pop3DTouch？》经验，为你挑选了1个好方法。 ... [详细]
程序员
我应该在控制器或模型中使用Ecto.Repo用于Elixir Phoenix吗？

如何解决《我应该在控制器或模型中使用Ecto.Repo用于ElixirPhoenix吗？》经验，为你挑选了1个好方法。 ... [详细]
程序员
适配器类中的super.onActivityResult？Android的

如何解决《适配器类中的super.onActivityResult？Android的》经验，为你挑选了1个好方法。 ... [详细]
程序员
使用bash进程替换和尾部的结果不正确？

如何解决《使用bash进程替换和尾部的结果不正确？》经验，为你挑选了1个好方法。 ... [详细]
程序员
自定义构建键绑定sublime文本

如何解决《自定义构建键绑定sublime文本》经验，为你挑选了1个好方法。 ... [详细]
程序员
由从未引用的对象创建的垃圾

如何解决《由从未引用的对象创建的垃圾》经验，为你挑选了1个好方法。 ... [详细]
程序员
SymbolFinder.FindReferencesAsync找不到任何内容

如何解决《SymbolFinder.FindReferencesAsync找不到任何内容》经验，为你挑选了1个好方法。 ... [详细]
程序员
是否有一个基本的角度指令用于读取更多/更少的文本

如何解决《是否有一个基本的角度指令用于读取更多/更少的文本》经验，为你挑选了0个好方法。 ... [详细]
程序员
Firebase未向REST请求添加CORS标头

如何解决《Firebase未向REST请求添加CORS标头》经验，为你挑选了1个好方法。 ... [详细]
程序员
long-poll jQuery.ajax()在手机休眠后无法回调？

如何解决《long-polljQuery.ajax()在手机休眠后无法回调？》经验，为你挑选了0个好方法。 ... [详细]
程序员
iOS UI测试在一个被隔绝的看法

如何解决《iOSUI测试在一个被隔绝的看法》经验，为你挑选了2个好方法。 ... [详细]

郑谊099_448

这个屌丝很懒，什么也没留下！

关注作者

Tags | 热门标签

RankList | 热门文章