mysql-storage-engine

数据库 > mysql

Created At : 2023-08-29 09:37

Count:2.4k Views 👀 :

mysql-存储引擎

mysql-存储引擎

mysql体系结构

连接层，服务层，引擎层，存储层

存储引擎

存储引擎是存储数据，建立索引，更新/查询数据等技术的实现方式。存储引擎是基于表的，而不是基于库的，所以存储引擎可以被称为表类型。

InnoDB

兼顾高可靠性和高性能的通用存储引擎，在mysql5.5之后，InnoDB是默认的存储引擎。

特点：

DML操作遵循ACID模型，支持事务；

行级锁，提高并发访问性能；

支持外键foreign key约束，保证数据的完整性和正确性。

文件：

xxx.ibd：xxx代表的是表名，innoDB引擎的每张表都会对应这样一个表空间文件，存储该表的表结构（frm，sdi），索引和数据。

参数：innodb_file_per_table

MyISM

mysql早期的默认存储引擎。

特点：

不支持事务，不支持外键

支持表锁，不支持行锁

访问速度快

文件：

xxx.sdi：存储表结构信息

xxx.MYD：存储数据
xxx.MYI：存储索引

MyISAM 引擎中，B+Tree 叶节点的 data 域存放的是数据记录的地址。在索引检索的时候，首先按照 B+Tree 搜索算法搜索索引，如果指定的 Key 存在，则取出其 data 域的值，然后以 data 域的值为地址读取相应的数据记录。这被称为“非聚簇索引（非聚集索引）”。

Memory

表数据存储在内存中，由于受到硬件问题，或断电问题的影响，只能将这些表作为临时表或缓存使用

特点：

内存存放

hash索引（默认）

文件：

xxx.sdi：存储表结构信息

InnoDB

表空间

ibd文件，一个mysql实例可以对应多个表空间，用于存储记录（行数据），索引（主键索引，辅助索引）等数据。在ibd文件的内部，数据和索引是采用b+树存储，减少磁盘io。因为b+树的索引页全是索引，这样一个数据页能够查询到很多索引降低了下一次去磁盘再拿索引页的可能性，降低了磁盘的io。（符合磁盘访问的局部性原则）
红黑树不适合的理由：
1.数据量大，数的深度就变大了，查询效率是logn
2.叶子节点，数据没有按照指针的顺序来排序，范围查找困难。

段

分为数据段，索引段，回滚段，innodb是索引组织表，数据段就是b+树的叶子节点，索引段为b+树的非叶子节点。

区

表空间的单元结构，每个区的大小为1M。默认情况下，innodb存储引擎页大小为16k，即一个区中一共有64个连续的页。

页

innodb存储引擎磁盘管理的最小单元，每个页的大小默认为16kb，为了保证页的连续性，innodb存储引擎每次从磁盘申请4-5个区。

行

innodb存储引擎数据是按行进行存放的。

InnoDB 引擎中，其数据文件本身就是索引文件。相比 MyISAM，索引文件和数据文件是分离的，其表数据文件本身就是按 B+Tree 组织的一个索引结构，树的叶节点 data 域保存了完整的数据记录。这个索引的 key 是数据表的主键，因此 InnoDB 表数据文件本身就是主索引。这被称为“聚簇索引（聚集索引）”，而其余的索引都作为辅助索引，辅助索引的 data 域存储相应记录主键的值而不是地址，这也是和 MyISAM 不同的地方。在根据主索引搜索时，直接找到 key 所在的节点即可取出数据；在根据辅助索引查找时，则需要先取出主键的值，再走一遍主索引。因此，在设计表的时候，不建议使用过长的字段作为主键，也不建议使用非单调的字段作为主键，这样会造成主索引频繁分裂。

架构

后台线程

master thread

核心后台线程，负责调度其他线程，还负责将缓冲池中的数据异步刷新到磁盘中，保持数据的一致性，还包括脏页的刷新，合并插入缓存，undo页的回收

io thread

大量使用了aio来处理io请求，这样可以极大地提高数据库的性能，而io thread负责这些io的回调

线程类型	默认个数	职责
read thread	4	负责读操作
write thread	4	负责写操作
log thread	1	负责将日志缓冲区刷新到磁盘
insert buffer thread	1	负责将写缓冲区内容刷新到磁盘

purge thread

主要用于回收事务已经提交了的undo log，在事务提交之后，undo log可能不用了，就用它来回收。

page cleaner thread

协助master thread刷新脏页到磁盘的线程，他可以减轻master thread的工作压力，减少阻塞

事务原理

不可分割的工作单位，把所有的操作作为一个整体一起向系统提交或撤销操作请求，即这些操作要么同时成功，要么同时失败。

acid特性

原子性，一致性，持久性是由redo log，undo log决定的。

隔离性是由锁，mvcc决定的。

redo log：重做日志，记录的是事务提交时数据页的物理修改，是用来实现事务的持久性。改日志文件由两部分组成：重做日志缓冲（redo log buffer）以及重做日志文件（redo log file），前者是在内存中，后者在磁盘中。当事务提交之后会把所有修改信息都存到改日志文件中，用于在刷新脏页到磁盘，发生错误时，进行数据恢复使用。

undo log：回滚日志，用于记录数据被修改前的信息，作用包含两个：提供回滚和mvcc（多版本并发控制）

undo log和redo log记录物理日志不一样，它是逻辑日志。

undo log销毁：undo log在事务执行时产生，事务提交时，并不会立即删除undo log，因为这些日志可能还用于mvcc

undo log存储：undo log采用段的方式进行管理和记录，存放在前面介绍rollback segment回滚段中，内部包含1024个undo log segment

当insert的时候,产生的undo log日志只在回滚时需要,在事务提交后,可被立即删除.

而update,delete的时候,产生的undo log日志不仅在回滚时需要,在快照时也需要,不会立即被删除

undo log版本链:不同事务或相同事务对同一条记录进行修改,会导致该记录的undolog生成一条记录版本链表,链表的头部是最新的旧记录,链表尾部是最早的旧记录.

默认隔离级别

在可重复读下对于快照读（select。。。）用mvcc解决幻读，对于当前读（selelct 。。。for update）用next-key解决幻读，但是在极限情况下还是会出现幻读

事务Aselect一条不存在的记录（快照读），事务B加入那条不存在的记录，事务A此时再次读取出现幻读
事务Aselect 。。。 > xxx（用快照读），事务B往后面加入记录，事务A采用当前读出现幻读
所以一般在事务开启的时候查询最好用快照读

MVCC

当前读

读取的是记录的最新版本，读取时还要保证其他并发事务不能修改当前记录，会对读取的记录进行加锁。对于我们日常的操作，如：select…lock in share mode(共享锁)，select…for update,update,insert,delete(排他锁)都是一种当前读

快照读

简单的select（不加锁）就是快照读，快照读，读取的是记录数据的可见版本，有可能是历史数据，不加锁，是非阻塞读

read committed：每次select，都生成一个快照读

repeatable read：开启事务后第一个select语句才是快照读的地方

serializable：快照读会退化为当前读

mvcc

多版本并发控制.指维护一个数据的多个版本,使得读写操作没有冲突,快照读为mysql实现mvcc提供了一个非阻塞读功能.mvcc的具体实现,需要依赖于数据库记录中的三个隐式字段,undo log日志,readview.

三个隐式字段

隐藏字段	含义
db_trx_id	最近修改事务id,记录插入这条记录或最后一次修改该记录的事务ID
db_roll_ptr	回滚指针,指向这条记录的上一个版本,用于配合undo log,指向上一个版本
db_row_id	隐藏主键,如果表结构没有指定主键,将会生成该隐藏字段

readview

readview是快照读sql执行时mvcc提供数据的依据,记录并维护系统当前活跃的事务(未提交的)id.

readview中包含四个核心字段

字段	含义
m_ids	当前活跃的事务id集合
min_trx_id	最小活跃事务id
max_trx_id	预分配事务id,当前最大事务id+1(因为事务id是自增的)
creator_trx_id	readview创建者的事务id

不同的隔离级别,生成readview的时机不同

read committed:在事务中每一次执行快照时生成readview

repeatable read:仅在事务中第一次执行快照读时生成readview,后续复用readview

转载请注明来源，欢迎对文章中的引用来源进行考证，欢迎指出任何有错误或不够清晰的表达。