已删除

2021-05-13 14:31 已编辑

关注

饿了么高级架构师分享：MongoDB是如何逐步提高可靠性的

Agenda

架构

Standalone

loss update异常之- -: 不确认
loss update异常之二: 无持久化

Replica set

loss update异常之三:无冗余
loss update异常之四:无副本确认
loss update异常之五:不正确的选主
loss update异常之六:脑裂
loss update异常之七:使用物理时间
Dirty read异常
Stale read异常

架构

MongoDB由4个组件构成，mongod, mongos, configserver, client。
独立(standalone) 模式
replica set模式

Standalone模式

loss update异常之- - -:不确认
loss update异常之二:无持久化

loss update异常之一:不确认

异步写入
网络故障或者服务器故障(如重启)
丢失大量写入(即loss update)，客户端难以处理
原因:不确认
解决:写入确认(write acknowledgement)
选项: write concern: w
注意点:
在写入确认下，是同步写入
当前写入操作失败
客户端处理简单-重试

loss update异常之二:未持久化

写入操作未落磁盘
网络故障或者服务器故障(如重启)
Loss acknowledged update ( 简称loss ack update)
原因:未及时持久化
解决:写入日志(journaling)
选项: write concern: j

Replica set模式

loss update异常之三:无冗余
loss update异常之四:无副本确认
loss update异常之五:不正确的选主
loss update异常之六:脑裂
loss update异常之七:使用物理时间
Dirty read异常
Stale read异常

loss update异常之三:无冗余

宕机故障
Loss data (可认为是loss ack update的特例)
原因:无冗余
解决:
复制
Oplog
Replicated state machine
选项:使用replica set模式

loss update异常之,四:无副本确认

异步复制过程
Primary宕机故障
Loss ack update
解决:副本写入通知
选项: write concern: w
注意
无法彻底解决
概率问题
影响可用性

loss update异常之五:不正确的选主(1)

选主(election)
如果错误的选择了- - 个不包含最新数据的secondary成为primary
Loss ack update
原因:不正确的选主

loss update异常之五:不正确的选主(2)

protocol v0
Optime时间戳
选主的原则:
大多数同意.
针对- -次选举，只能投票- -次
不同意optime比自己小的
保证只选出一个主

loss update异常之五:不正确的选主(3)

解决:达到大多数的副本写入通知
选项: Write concern:W

loss update异常六:脑裂

网络分区故障
脑裂，stepdown, step down前的短暂时间，回滚( rollback)
loss ack update
原因:脑裂
解决:(与异常五相同)达到大多数的副本写入通知
选项: Write concern: w

loss update异常七:使用物理时间(1)

A-B-A场景
这种场景发生的概率小
Clockskew故障加剧异常的出现

loss update异常七:使用物理时间(2)

loss ack update
原因:使用物理时间
Protocol v1
term

脏读异常:

异步写入或者叫Non-blocking读
影响
没有故障时，是先知
有故障时，会脏读(dirty read)异常或者未提交读(read uncc
使用Read preference，从secondary读也会出现
原因:未成功写入大多数，后被rolback
解决:大多数读
选项:
Read concern:: majority
注意
大多数读仍然是non-blocking的

陈旧读异常：脑裂

大多数是带来陈旧读问题
陈旧读(stale read)异常
陈旧读不是因为读取历史版本数据
原因:处于网络分区的旧primary仍然可以提供读服务
解决:线性读
空写入操作，并且blocking等待写入完成
选项: Read concern: linearable

一致性分析

Cassandra NWR(w>majority, r>majority)
Cassandra的majoriy read是blocking的
Protocol v1与raft类似，但不是raft
可以达到与etcd、zookeeper类似的一致性等级，类似于zk的sync达到线性一- 致性
Raft的index是连续的
Raft是committed后应用到状态机
Raft是推送日志
达到数据库隔离级别: RC (read committed)
可以达到CAP中的CP
但默认都不是，Write concern、 read concern要设置成majority。
以上内容是拟出版的书中的一部分。

结语：

讲述MongoDB架构，以及该架构下引发MongoDB的多种丢数据的异常、脏读异常、陈旧读异常，MongoDB是如何致力于引入新版本的复制协议逐步消除了所有这些异常，最终让MongoDB达到一个high level的一致性和可靠性，成为一个可信任的数据库。

Java架构师福利

（架构级别资料分享）

准备了一些架构级别的知识点，有高可用、高并发、高性能及分布式、Jvm性能调优、Spring，MyBatis，Netty源码分析,Redis,Kafka,Mysql,Zookeeper,Tomcat,Docker,Dubbo,Nginx等多个知识点视频，文档资料分享！

免费领取方式：一键三联（点赞+收藏+关注）后直接添加微信：mxh5261 即可百分百免费获取！

领取方式：一键三联（点赞+收藏+关注）后直接添加微信：mxh5261 即可百分百免费获取！

全部评论

推荐最新楼层

05-15 13:45

青岛大学 C++

实习

在一家小公司实习，最近都是带薪自习，怎么办？好慌！！！

注意力770：还是日子太爽了😷

滴！实习打卡我的实习求职记录

点赞评论收藏

05-15 22:13

门头沟学院嵌入式软件工程师

26届嵌入式面经&秋招日记_02

简单介绍学历双非，在校期间以大学生电子设计大赛和RoboMaster为主力赛事学习嵌入式方面的技术。大二升大三阶段更想参与到产品的实际开发，于是以半离队的状态在外参加实习。各大公司陆续开始秋招，在此记录自己面试的经历，在自己学习复查的同时，也希望能帮到同期的朋友们（日记_01附上个人简历，需要简历模板可以联系，也希望有大佬帮忙拷打/点评）面试经历_02本次记录的面经是一家做运动相机的企业，面试过程如下：1.自我介绍2.讲一讲对指针的理解，讲一讲字节对齐3.如果需要发送奇数个字节的数据，你会采用什么方案？4.讲一讲智能指针的用法以及为什么使用智能指针5.讲一讲stm32的底层架构6.在mcu程序...

点赞评论收藏

05-05 21:45

已编辑

广州大学 Java

五月还有机会找到实习吗😭😭😭

26双非，java后端，现在找实习还有机会吗😭😭😭#实习，投递多份简历没人回复怎么办#

真烦好烦真烦：有吧，还有不少公司的暑期有hc，大胆投

实习，投递多份简历没人回复怎么办

点赞评论收藏

04-15 12:59

武汉科技大学 C++

投了很多感觉没什么人要

是不是双非基本找不到工作

喜欢喜欢喜欢：这是我见过最长最臭的简历

点赞评论收藏

05-13 20:16

中国科学技术大学 Java

0 offer 暑期颗粒无收

五月还有HC吗，bg2本9硕。本科一段中小厂后端，研一一段算法实习。实习鼠鼠投的晚了，4月10号开始投了10+大厂后端，零星的几次面试还都挂了。蚂蚁笔试挂淘天一面挂字节三面排序挂饿了么二面挂美团下午二面，无手撕，纯聊天，面完秒进人才库

Aronek：投就完事了，我五月面试比四月多你敢信。你还有实习经历，bg还比我好一些。

点赞评论收藏

全站热榜

创作者周榜

正在热议