MVCC

MVCC的介绍

MVCC的好处

读不加锁,读写不冲突。读写不冲突时非常重要的,可以增加系统的并发性能。

MVCC有两种读操作:

  • 快照读:也叫一致性读、该事务启动时根据某个条件读取到的数据,直到事务结束时,再次执行相同条件,还是读到同一份数据,不会发生变化。查询语句默认就是快照读
  • 当前读:加锁、读取最新的数据。


快照读

快照是如何实现的?

  • 事务开始的时候向InnoDB的事务系统申请事务ID,叫做transaction_id。每个事务都有一个唯一的事务ID。
  • 当每次事务更新数据的时候,都会生成一个新的数据版本,并且把transaction_id赋值给这个数据版本的事务ID,记作row_trx_id。

例如:

图中表示的是同一行数据的4个版本。
当前最新版本是V4,k值是22,它是被transaction_id = 25的事务更新的,所以row trx_id也是25。这个也解释了上面两行文字的意思。

  • 图中的三个虚线箭头就是undo log,而v1、v2、v3并不是物理上真实存在的,而每次需要的时候根据当前版本和undo log计算出来的
  • undo log里面记录了更新时数据的版本,所以支持回滚保证原子性。
  • 数据库实际上存储的是最新版本的数据。但是对于事务来说,需要根据版本号+undo log日志计算出该事务对应的数据。

当前事务的一致性视图?

视图数组和高水位组成了当前事务的一致性视图。
  • 视图数组:InnoDB为每个无数构造了一个数组,用来保存这个事务启动瞬间,当前正在活跃的所有事务ID,活跃指的是启动了但是还没有提交。数组里的事务ID的最小值记为低水位
  • 高水位:当前系统里面已经创建过的事务ID的最大值加1记为高水位。

如何判断数据版本的可见性?

  • 如果当前是数据版本的row trx_id小于低水位,证明该版本是已经提交的事务或者当前事务自己生成的,数据可见
  • 如果当前数据版本在低水位和高水位之间:
                        若row trx_id在数组中,表示这个版本是由还没有提交的事务生成的,不可见。
                        若row trx_id不在数组中,说明这个版本是已经提交的事务生成的,可见。
  • 如果当前数据版本高于高水位,说明该版本是已经提交了的事务生成的,不可见。

总结:

当事务启动的时候会创建一个视图read-view,这个一致性视图由视图数组(事务启动瞬间保存当前启动未提交的所有事务ID)和高水位(当前系统里面创建过的事务ID的最大值加1)组成。当访问某一行数据的时候,根据当前数据版本的row trx_id(事务开始的时候会被分配一个transaction_id,当事务更新的时候会把transaction_id赋给row trx_id)与该事务的一致性视图里面的低水位、高水位的关系,判断当前数据版本的可见性。如果不可见通过当前版本和undo log计算出旧的数据版本(row trx_id)再次判断是否可见

例如:
当某事务启动时,低水位为10、高水位为15。视图数组为[10, 11, 14]。当访问的当前数据的版本row trx_id为11,在视图数组中说明这个版本是由没有提交的事务生成,不可见。就会根据当前版本和undo log计算出旧的数据版本row trx_id假如为9,根据版本的可见性说明可见。读取的也就是row trx_id的数据版本。
某事务启动时,申请到的transaction_id是100。而访问的当前数据的版本row trx_id也是100,说明此数据是当前事务更新的,直接使用即可。

当前读

概念:

更新数据的时候,都是先读后写,这个读,只能读当前的值(也就是最新的数据版本),叫做当前读。

场景:

  • 更新数据的时候(update、delete、insert语句)
  • select查询语句加锁的时候。(for update、lock in share mode)

如何实现的当前读?

依靠行锁的两阶段锁协议,当前读必须要读取最新的数据,如果读取的行数据有事务未提交,则需要等待事务提交释放行锁,才能执行当前读。

总结:

  • 一致性读,也叫快照读依赖MVCC的快照,利用一致性视图、当前的事务ID、当前数据的row trx_id、以及undo log实现。
  • 当前读,通过行锁实现。需要等待占有该行事务的提交才能继续进行当前读。

补充

多版本的控制管理器、就是对每一行的数据都有多个版本、同时也相当于对行锁的优化、使读写不发生冲突。通过readView(快照)实现,同时也保证了数据的一致性、防止幻读。
hshuo的面试之路 文章被收录于专栏

作者目标是找到一份Java后端方向的工作 此专栏用来记录从Bilibili、书本、其他优质博客上面学习的内容 用于巩固、总结内容 主要包含Docker、Dubbo、Java基础、JUC、Maven、MySQL、Redis、SpringBoot、SpringCloud、数据结构、杂文、算法、计算机网络、操作系统、设计模式等相关内容

全部评论

相关推荐

上周组里招人,我面了六个候选人,回来跟同事吃饭的时候聊起一个让我挺感慨的现象。前三个候选人,算法题写得都不错。第一道二分查找,五分钟之内给出解法,边界条件也处理得干净。第二道动态规划,状态转移方程写对了,空间复杂度也优化了一版。我翻他们的简历,力扣刷题量都在300以上。后三个呢,就有点参差不齐了。有的边界条件没处理好,有的直接说这道题没刷过能不能换个思路讲讲。其中有一个女生,我印象特别深——她拿到题之后没有马上写,而是先问我:“面试官,我能先跟你确认一下我对题目的理解吗?”然后她把自己的思路讲了一遍,虽然最后代码写得不是最优解,但整个沟通过程非常顺畅。这个女生的代码不是最优的,但当我问她“如果这里是线上环境,你会怎么设计’的时候,她给我讲了一套完整的方案——异常怎么处理、日志怎么打、怎么平滑发布。她对这是之前在实习的时候踩过的坑。”我在想LeetCode到底在筛选什么?我自己的经历可能有点代表性。我当年校招的时候,也是刷了三百多道题才敢去面试。那时候大家都刷,你不刷就过不了笔试关。后来工作了,前三年基本没再打开过力扣。真正干活的时候,没人让你写反转链表,也没人让你手撕红黑树。更多的是:这个接口为什么慢了、那个服务为什么OOM了、线上数据对不上了得排查一下。所以后来我当面试官,慢慢调整了自己的评判标准。算法题我还会出,但目的变了。我出算法题,不是想看你能不能背出最优解。而是想看你拿到一个陌生问题的时候,是怎么思考的。你会先理清题意吗?你会主动问边界条件吗?你想不出来的时候会怎么办?你写出来的代码,变量命名乱不乱、结构清不清楚?这些才是工作中真正用得到的能力。LeetCode是一个工具,不是目的。它帮你熟悉数据结构和常见算法思路,这没问题。但如果你刷了三百道题,却说不清楚自己的项目解决了什么问题、遇到了什么困难、你是怎么解决的,那这三百道题可能真的白刷了。所以还要不要刷LeetCode?要刷,但别只刷题。刷题的时候,多问自己几个为什么:为什么用这个数据结构?为什么这个解法比那个好?如果换个条件,解法还成立吗?把刷题当成锻炼思维的方式,而不是背答案的任务。毕竟面试官想看到的,从来不是一台背题机器,而是一个能解决问题的人。
牛客51274894...:意思是光刷力扣还不够卷
AI时代还有必要刷lee...
点赞 评论 收藏
分享
04-13 09:56
已编辑
嵌入式工程师
点赞 评论 收藏
分享
评论
2
3
分享

创作者周榜

更多
牛客网
牛客网在线编程
牛客网题解
牛客企业服务