星河

醉后不知天在水,满船清梦压星河

数据库

mingzaily / 2019-10-18


数据库架构

数据库设计

索引模块

官方方对索引的定义为:索引是帮助 MySQL 高效获取数据的数据结构

  1. 为什么要用索引

    • 快速查询数据
    • 保证数据的唯一性
  2. 索引的优缺点

    • 优点
      • 大大加快数据检索速度
      • 创建唯一索引,保证数据库表中每行数据的唯一性
      • 加速表之间的连接
      • 减少查询中分组和排序的时间
    • 缺点
      • 需要占用物理空间
      • 对表中数据进行增加、删除和修改时索引也要更新,降低了数据维护速度
  3. 什么样的信息能成为索引

    • 主键、唯一键以及普通键等等
  4. 索引的数据结构

    • 生成索引,建立二叉查找树进行二分查找 效率 O(logn)
    • 生成索引,建立 B-Tree 进行查找 效率 O(logn)
      • B-Tree
      • 根节点至少包括两个孩子
      • 树中每个节点最多含有 m 个孩子(m>=2)
      • 除根节点和叶子节点外,其他每个节点至少有 ceil(m/2)个孩子
      • 所有叶子节点都位于同一层
    • 生成索引,建立 B+-Tree 进行查找(主流)
      • 定义基本与 B-Tree 一致
      • 非叶子节点的子树指针与关键字个数相同
      • 非叶子节点仅使用索引,数据都保存在叶子节点中
      • 所有叶子节点均有一个链指针指向下一个叶子节点
      • B+-Tree 更适合用来做存储引擎
        • B+树的磁盘读写代价更低
        • B+树的查询效率更加稳定
        • B+树更有利于对数据库的扫描
    • 生成索引,建立 Hash 结构进行查找
      • 查询效率更高
      • 缺点
        • 仅仅能满足"=",“IN”,不能使用范围查询
        • 无法被用来避免数据的排序操作
        • 不能利用部分索引键查询
        • 不能避免表扫码
        • 遇到大量 Hash 值相等的情况后性能并不一定就会比 B-Tree 索引高
    • BitMap 索引
  5. 密集索引和稀疏索引的区别

    • 密集索引文件中的每个搜索码值都对应一个索引值
    • 稀疏索引文件只为索引码的某些值建立索引项
  6. 如何定位并优化慢查询 sql

    • 根据慢日志定位慢查询 sql
    • 使用 explain 等工具分析 sql
    • 修改 sql 或者尽量让 sql 走索引
  7. 联合索引的最左匹配原则的成因

    • mysql 创建复合索引的规则是首先会对复合索引的最左边,也就是索引中的第一个字段进行排序,在第 一个字段排序的基础上,在对索引上第二个字段进行排序,其实就像是实现类似 order by 字段 1,字段 2 这样的排序规则,那么第一个字段是绝对有序的,而第二个字段就是无序的了,因此一般情况下直接只用第二个字段判断是用不到索引的,这就是为什么 mysql 要强调联合索引最左匹配原则的原因
  8. 索引是建立得越多越好吗

    • 数据量小的表不需要建立索引,建立会增加额外的索引开销
    • 数据变更需要维护索引,意味着更多的索引意味着更多的维护成本
    • 更多的索引也需要跟多的存储空间