索引可以用来提高查询性能,这个大家都知道。但是很多时候,明明有索引了,但查询还是很慢,用执行计划一看发现没有走索引,这时候你可能懵逼了。 其实关键,你对使用索引的细节不够了解,本文将带你深入分析索引失效的底层原理,然后通过几个索引失效的场景进行加强,相信再也不用担心为什么你的SQL慢了。

可能大家多多少少都听过,查询没遵循最左前缀法则、范围查询的右边会导致索引失效等等,但是有想过为什么吗?
谈到索引失效的原理前,我们需要先弄明白MySQL是怎么利用索引去查询数据的。
数据准备:
一张用户表user, 数据如下:
| id | name | age | sex |
|---|---|---|---|
| 1 | a | 18 | 男 |
| 2 | b | 8 | 男 |
| 3 | a | 16 | 女 |
| 4 | b | 8 | 男 |
| 5 | c | 5 | 女 |
| 6 | e | 6 | 男 |
最终得到的索引如下图所示:

现在如果要执行select * from user where name='a' and age = 8语句,它的整个查询执行流程是怎么样的?
'(a,8)'通过二分法快速找到它的下一层目录节点所在的页。前面分析了一个基于索引进行查询的执行流程,简单来说,它是拿着你索引字段的查询值去B+树中匹配,快速的定位它所在的数据行。
那如果我们的查询值,不是按照B+树中存储的顺序去查,那MySQL显然就无法通过索引去快速查找了,直接上例子。
例子: 查找select * from user where age = 8
因为联合索引B+树中的顺序是根据先对name排序,其次在name确定的情况下,在name下对age排序,所以age=8可能出现在任何一个目录节点中。现在name都没有,MySQL就无法快速通过二分法查找了,难不成让它对B+树中的每个节点,那我还不如直接全表查询呢。
同理,like 'aaaa%' 支持索引, like '%aaaa'不支持,因为like 'aaaa%' 前面部分是确定的,可以利用B+树去搜索。
这也就是我们通常说的 “最左前缀法则” 。
是不是用上索引,最终都是优化器说了箅。优化器是基于什么的优化器?基于cost开销(CostBaseOptimizer),它不是基于规则(Rule_BasedOptimizer),也不是基于语义。怎么样开销小就怎么来。另外,SQL语句是否使用索引,跟数据库版本、数据量、数据选择度都有关系。
准备数据:
CREATE TABLE `student` (
`id` INT(11) NOT NULL AUTO_INCREMENT,
`stuno` INT NOT NULL ,
`name` VARCHAR(20) DEFAULT NULL,
`age` INT(3) DEFAULT NULL,
`classId` INT(11) DEFAULT NULL,
PRIMARY KEY (`id`)
#CONSTRAINT `fk_class_id` FOREIGN KEY (`classId`) REFERENCES `t_class` (`id`)
) ENGINE=INNODB AUTO_INCREMENT=1 DEFAULT CHARSET=utf8;
复制代码
存在联合索引:
CREATE INDEX idx_age_classid_name ON student(age,classId,name);
复制代码
例子:没有走索引

age, classId, name, where条件中没有calssId, 不满足最左前缀法则,不走索引。存在联合索引:
CREATE INDEX idx_age_classid_name ON student(age,classId,name);
例子:
正常情况下:

范围查询> :

classId无法确定,所以name字段在B+树中的查找无法确定导致无法走索引。
存在索引:
CREATE INDEX idx_name ON student(NAME);
复制代码
例子:

存在索引:
CREATE INDEX idx_name ON student(NAME);
例子:

where CAST(name AS signed int) = 123。存在索引:
CREATE INDEX idx_name ON student(NAME);
复制代码
例子:

存在索引:
CREATE INDEX idx_name ON student(NAME);
复制代码
例子:

Not Null,比如可以用0等特殊值表示null 的情况。is null的情况是走索引的。存在索引:
CREATE INDEX idx_name ON student(NAME);
例子:

存在索引:
CREATE INDEX idx_name ON student(NAME);
例子:

表中的字段很集中,比如性别,这时候MySQL评估使用索引比全表更慢,则不使用索引。有一种说法是当查询的数据量超过全表的30%,就不再走索引,而直接全表扫描。
统一使用utf8mb4兼容性更好,统一字符集可以避免由于字符集转换产生的乱码。不同的字符集进行比较前需要进行转换会造成索引失效。
本文讲解了索引失效的深层次原因,以及常见的一些索引失效的情况,大家可以反查下项目中的SQL, 是否有踩雷的。如果本文对你有帮助的话,请留下一个赞吧。