Mysql索引最佳实践


索引基础知识

     Mysql索引类型及创建/删除,一位博友整理的很详细,参见: https://www.cnblogs.com/luyucheng/p/6289714.html,再此不多做赘述。

索引的优点

  • 大大加快数据的查询速度
  • 使用分组和排序进行数据查询时,可以显著减少查询时分组和排序的时间
  • 创建唯一索引,能够保证数据库表中每一行数据的唯一性
  • 在实现数据的参考完整性方面,可以加速表和表之间的连接

索引的缺点

  • 创建索引和维护索引需要消耗时间,并且随着数据量的增加,时间也会增加
  • 索引需要占据磁盘空间
  • 对数据表中的数据进行增加,修改,删除时,索引也要动态的维护,降低了维护的速度

索引的创建原则

  • 更新频繁的列不应设置索引
  • 数据量小的表不要使用索引(毕竟总共2页的文档,还要目录吗?)
  • 重复数据多的字段不应设为索引(比如性别,只有男和女,一般来说:重复的数据超过百分之15就不该建索引)
  • 首先应该考虑对where 和 order by 涉及的列上建立索引

Expain执行计划

确认索引是否已使用:explain select username from user where id=1

结果为:

字段说明:

  • select_type  simple表示简单查询 还有其他如primary,union,subquery等
  • table  表名
  • partitions  匹配的分区
  • type  引擎在表中找到所需行的方式 由差到好为:all(全表扫描),index(只遍历索引树),range(索引范围扫描,常见于between,>,< 等查询中),ref(非唯一性索引扫描),eq_ref(唯一性索引扫描),const / system(当MySQL对查询某部分进行优化,并转换为一个常量时,使用这些类型访问),null(MySQL在优化过程中分解语句,执行时甚至不用访问表或索引)
  • possible_keys  可供选择的索引
  • key  使用的索引
  • key_len  索引字节数的长度,数值越小,运行速度越快
  • ref  连接匹配条件,即哪些列或常量被用于查找索引列上的值
  • rows  返回的数据行数
  • filtered  被表条件过滤的行数的百分比
  • extra  额外信息  类型: using index(表示select操作中使用了覆盖索引),using where(mysql服务器在存储引擎受到记录后进行“后过滤“),using temporary(表示mysql需要使用临时表来存储结果集,常见于排序和分组查询), using filesort(mysql中无法使用索引完成的排序操作,成为“文件排序”)

注意: 通过key就能判断索引是否执行

注意事项

  • 避免在where条件语句 '=' 的左边进行函数,运算符或表达式的计算,因为索引不会生效(引擎会放弃使用索引,进行全表扫描)。
  • 避免使用 <>,!=,not in ,因为索引不会生效。但<,<=,=,>,>=, BETWEEN, IN可以用到索引。
  • 避免对字段进行null的判断,复合索引中只要有一列含有NULL值,这一列对于此复合索引就是无效的。所以在数据库设计时不要让字段的默认值为NULL,可以用一个默认值代替l,如-1。
  • 使用like模糊查询时,like '%xx%'会导致索引不生效,like 'xx%' 索引能够被使用,所以避免使用第一种。
  • 组合索引的第一个字段必须出现在查询组句中,这个索引才会被用到。
  • 数据类型隐形转换,索引不会生效:如 select name from user where phone=13155667788;(phone字段在数据库中为varchar类型,应改成 phone='13155667788')。
  • 索引列覆盖查询字段可以大幅提高查询效率。
  • 使用短索引,短索引不仅可以提高查询速度而且可以节省磁盘空间和I/O操作。(短索引用法?)
  • 索引列排序。mysql查询只使用一个索引,因此如果where子句中已经使用了索引的话,那么order by中的列是不会使用索引的。因此数据库默认排序可以符合要求的情况下不要使用排序操作,尽量不要包含多个列的排序,如果需要最好给这些列建复合索引。
  • 持续更新

 

拓展:EXIST和 IN的使用中的却区别:https://blog.csdn.net/qq_27409289/article/details/85963089