1. 日志1. Redo Log又叫做重做日志,InnoDB提供的用于保证 Crash Safety 的日志功能,保证了事物的持久性(Durability)。目的:通过WAL(Write-Ahead Logging)来保证Crash Safety;WAL顺序写入的特性也使得写操作更快(推迟了实际的随机写)。容量:大小固定。写入方式:循环写入(双指针):write pos:写入位置;check point:待擦除位置(对应的buffer pool中的脏页被实际刷盘后便会擦除redo log中的记录);日志内容:物理日志,记录的是“在某个数据页上做了什么修改”。原理:redo log中的内容代表还未被刷盘的变动,每个txn会生成一条redo log record,当修改的数据(脏页)实际刷盘后对应的redo log会被擦除。每一条redo log有prepare和commit两个状态,当系统重启时会检查redo log file并将所有处于commit的redo log records刷盘并擦除。2. Bin Log Binlog也称为归档日志,是Server层自己的日志。目的:用于备份恢复、主从复制。容量:不固定,可扩容(无大小限制)。写入方式:追加写,写满一个文件切换到下一个。日志内容:逻辑日志,记录的是这个语句的原始逻辑,比如“给ID=2这一行的c字段加1 ”。原理:备份恢复:Binlog 文件保存的是全量的日志,也就是保存了所有数据变更的情况,配合全量备份可以恢复数据库状态到任意时刻;主从复制:MySQL 主库在收到客户端提交事务的请求之后,会先写入 binlog,再提交事务,更新存储引擎中的数据,事务提交完成后,返回给客户端“操作成功”的响应;从库会创建一个专门的 I/O 线程,连接主库的 log dump 线程,来接收主库的 binlog 日志,再把 binlog 信息写入 relay log 的中继日志里,再返回给主库“复制成功”的响应;从库会创建一个用于回放 binlog 的线程,去读 relay log 中继日志,然后回放 binlog 更新存储引擎中的数据,最终实现主从的数据一致性。3. Undo LogUndo log又称为回滚日志,用于实现事务回滚与MVCC。Undo log的写操作发生在最开始,将更新前的原始数据保存在undo log中。Undo log在事务开始前产生。Undo log也会产生redo log。目的:实现原子性事务提交前可能发生的回滚;构建MVCC来实现事务间的隔离级别容量:不固定,可扩容。写入方式:追加写,写满一个文件切换到下一个。日志内容:每条undo log中的日志分为两部分,基本信息和操作信息基本信息记录了该条日志的undo类型,表id等等信息;操作信息根据操作类型不同分为三类(15445中的DELTA STORAGE):增:主键值,主键长等主键信息;删:主键信息以及旧的事物id,旧的row ptr(用于构建有序的undo版本链);改:如果不更新主键:主键信息以及旧的事物id,旧的row ptr,更新的信息;更新主键:两条,一条删除一条新增;Insert的undo log在提交后就可以删除了(只在回滚时起作用),delete和modify需要保留来实现undo版本链。Undo log页分为两大类:新增操作和删除/修改操作;新增操作的在提交后直接删除;原理:在操作真正数据之前将undo log写入磁盘之中,以保证可以实现撤销。实际数据行与undo logs之间通过row ptr连接构成undo版本链来实现MVCC。2. 索引2.1 联合索引联合索引:为多个属性构成的复合值建立索引;最左匹配原则,当遇到范围查询(>、<、between、like)就会停止匹配;将区分度高的字段放在前面,区分度低的字段放后面。SELECT * FROM `table` WHERE a = 1 ORDER BY b;如何建立索引?对(a,b)建索引,当a = 1的时候,b相对有序,可以避免再次排序。SELECT * FROM `table` WHERE a > 1 ORDER BY b;如何建立索引? 对(a)建立索引,因为a的值是一个范围,这个范围内b值是无序的,没有必要对(a,b)建立索引。SELECT * FROM `table` WHERE a IN (1,2,3) and b > 1;如何建立索引?还是对(a,b)建立索引,因为IN在这里可以视为等值引用,不会中止索引匹配,所以还是(a,b)。2.2 覆盖索引覆盖索引:通过联合索引来减少回表。例如一个表的主键是id,同时经常有通过a查b的需求:SELECT b FROM `table` WHERE a = 1;那么相比于为a建立索引,为(a, b)建立联合索引可以减少一次回表。2.3 聚簇索引从物理存储的角度来看,索引分为聚簇索引(主键索引)、二级索引(辅助索引)。聚簇索引是对有序文件的排序字段建立的索引B+Tree 的叶子节点存放的是实际数据,所有完整的用户记录都存放在主键索引的 B+Tree 的叶子节点里;辅助索引是对文件的非排序字段建立索引二级索引的 B+Tree 的叶子节点存放的是主键值,而不是实际数据。所以,在查询时使用了二级索引,如果查询的数据能在二级索引里查询的到,那么就不需要回表,这个过程就是覆盖索引。如果查询的数据不在二级索引里,就会先检索二级索引,找到对应的叶子节点,获取到主键值后,然后再检索主键索引,就能查询到数据了,这个过程就是回表。3. MVCCMVCC是为了解决读与写之间的阻塞问题,让读写互不阻塞:Writers do not block readers;Readers do not block writers.MVCC只能在Read Committed和Repeatable Read两个隔离级别下工作。Read Committed和Repeatable Read的区别是生成Read View的时机不同在隔离级别为读已提交(Read Committed)时,一个事务中的每一次 SELECT 查询都会重新获取一次Read View;当隔离级别为可重复读(Repeatable Read)的时候,就避免了不可重复读,这是因为一个事务只在第一次SELECT的时候会获取一次Read View,而后面所有的SELECT都会复用这个Read ViewMVCC解决了脏读问题,在视图的作用下事务无法读取未提交的版本。MVCC并没有解决丢失更新(Lost Update)的问题,为此额外添加了一条规则:更新数据都是先读后写的,而这个读,只能读当前的值,称为“当前读”(current read)。当前读会按照2PL协议加锁,事务提交时才释放。MySQL在Repeatable Read隔离界别下,不存在幻读问题。
点赞 3
评论 0
全部评论

相关推荐

点赞 评论 收藏
转发
点赞 收藏 评论
分享
牛客网
牛客企业服务