首页
题库
公司真题
专项练习
面试题库
在线编程
面试
面试经验
AI 模拟面试
简历
求职
学习
课程
专栏·文章
竞赛
搜索
我要招人
发布职位
发布职位、邀约牛人
更多企业解决方案
在线笔面试、雇主品牌宣传
登录
/
注册
遥遥领先的Java
华为_2012实验室_Java工程师
关注
已关注
取消关注
#我的求职思考#
你觉得哪个最好?
@遥遥领先的Java:
【RPC最强专栏】服务发现:CP or AP?
1 服务发现的意义为高可用,生产环境中服务提供方都以集群对外提供服务,集群里这些IP随时可能变化,也需要用一本“通信录”及时获取对应服务节点,这获取过程即“服务发现”。对服务调用方和服务提供方,其契约就是接口,相当于“通信录”中的姓名,服务节点就是提供该契约的一个具体实例。服务IP集合作为“通信录”中的地址,从而可通过接口获取服务IP的集合来完成服务的发现。即PRC框架的服务发现:RPC服务发现原理图1.1 服务注册在服务提供方启动时,将对外暴露的接口注册到注册中心,注册中心将这个服务节点的IP和接口保存1.2 服务订阅在服务调用方启动时,去注册中心查找并订阅服务提供方的IP,然后缓存到本地,并用于后续的远程调用2 为何不使用DNS?服务发现的本质,就是完成接口跟服务提供者IP的映射。能否把服务提供者IP统一换成一个域名,利用DNS实现?2.1 DNS流程DNS查询流程:所有服务提供者节点都配置在同一域名下,调用方是可通过DNS拿到随机的一个服务提供者的IP,并建立长连接,但业界为何不用这方案?异常考虑若该IP端口下线了,服务调用者能否及时摘除服务节点若在之前已上线一部分服务节点,突然对这服务扩容,新上线的服务节点能否及时接收到流量都不能。为提升性能和减少DNS服务压力,DNS采取多级缓存,缓存时间较长,尤其JVM默认缓存是永久有效,所以服务调用者不能及时感知服务节点变化。是否能加个负载均衡设备?将域名绑定到这台负载均衡设备,通过DNS拿到负载均衡的IP。服务调用时,服务调用方就能直接跟VIP建立连接,然后由VIP机器完成TCP转发:VIP方案:这是能解决DNS遇到的一些问题,但RPC里不是很合适:搭建负载均衡设备或TCP/IP四层代理,需额外成本请求流量都经过负载均衡设备,多经过一次网络传输,浪费性能负载均衡添加节点和摘除节点,一般要手动添加,当大批量扩容和下线时,会有大量人工操作和生效延迟服务治理时,需更灵活的负载均衡策略,目前负载均衡设备的算法不满足灵活需求由此可见,DNS或者VIP方案虽然可以充当服务发现的角色,但在RPC场景里面直接用还是很难的。3 基于zk的服务发现(CP)服务发现的本质:完成接口跟服务提供者IP的映射。就是一种命名服务,还希望注册中心完成实时变更推送,zk、etcd都能实现。搭建一个zk集群作为注册中心集群,服务注册时,只需服务节点向zk写入注册信息,利用zk的Watcher机制完成服务订阅与服务下发功能。整体流程基于ZooKeeper服务发现结构图:服务平台管理端先在zk创建一个服务根路径,可根据接口名命名(如:/service/com.javaedge.xxService),在这路径再创建服务提供方目录与服务调用方目录(如:provider、consumer),分别存储服务提供方、服务调用方的节点信息当服务提供方发起注册时,会在服务提供方目录中创建一个临时节点,节点中存储该服务提供方的注册信息当服务调用方发起订阅时,则在服务调用方目录中创建一个临时节点,节点中存储该服务调用方的信息,同时服务调用方watch该服务的服务提供方目录(/service/com.demo.xxService/provider)中所有的服务节点数据。当服务提供方目录下有节点数据发生变更时,zk通知给发起订阅的服务调用方zk缺陷早期RPC框架服务发现就是基于zk实现,但后续团队微服务化程度越来越高,zk集群整体压力越来越高,尤其在集中上线时越发明显。“集中爆发”是在一次大规模上线时,当时有超大批量服务节点在同时发起注册操作,ZooKeeper集群的CPU飙升,导致集群不能工作,也无法立马将zk集群重新启动,一直到zk集群恢复后业务才能继续上线。根本原因就是zk本身性能问题,当连接到zk的节点数量特多,对zk读写特频繁,且zk存储目录达到一定数量,zk将不再稳定,CPU持续升高,最终宕机。宕机后,由于各业务的节点还在持续发送读写请求,刚一启动,zk就因无法承受瞬间的读写压力,马上宕机。要重新考虑服务发现方案。4 消息总线(AP)zk强一致性,集群的每个节点的数据每次发生更新操作,都通知其它节点同时执行更新。它要求保证每个节点的数据实时完全一致,直接导致集群性能下降。而RPC框架的服务发现,在服务节点刚上线时,服务调用方可容忍在一段时间后(如几s后)发现这个新上线的节点。毕竟服务节点刚上线后的几s内,甚至更长的一段时间内没有接收到请求流量,对整个服务集群没有什么影响,可牺牲掉CP(强制一致性),选择AP(最终一致),换取整个注册中心集群的性能和稳定性。是否有一种简单、高效,并且最终一致的更新机制,代替zk数据强一致的数据更新机制?最终一致性,可考虑消息总线机制。注册数据可全量缓存在每个注册中心的内存,通过消息总线来同步数据。当有一个注册中心节点接收到服务节点注册时,会产生一个消息推送给消息总线,再通过消息总线通知给其它注册中心节点更新数据并进行服务下发,从而达到注册中心间数据最终一致性。4.1 总体流程服务上线,注册中心节点收到注册请求,服务列表数据变化,生成一个消息,推送给消息总线,每个消息都有整体递增的版本消息总线主动推送消息到各注册中心,同时注册中心定时拉取消息。对获取到消息的,在消息回放模块里面回放,只接受大于本地版本号的消息,小于本地版本号的消息直接丢弃,实现最终一致性消费者订阅可从注册中心内存拿到指定接口的全部服务实例,并缓存到消费者的内存采用推拉模式,消费者可及时拿到服务实例增量变化情况,并和内存中的缓存数据进行合并。为性能,这里采用两级缓存,注册中心和消费者的内存缓存,通过异步推拉模式确保最终一致性。服务调用方拿到的服务节点不是最新的,所以目标节点存在已下线或不提供指定接口服务的情况,这时咋办?这问题放到RPC框架里处理,在服务调用方发送请求到目标节点后,目标节点会进行合法性验证,若指定接口服务不存在或正在下线,则拒绝该请求。服务调用方收到拒绝异常后,会安全重试到其它节点。通过消息总线,完成注册中心集群间数据变更的通知,保证数据最终一致性,并能及时触发注册中心的服务下发。服务发现的特性是允许我们在设计超大规模集群服务发现系统的时候,舍弃强一致性,更多考虑系统健壮性。最终一致性才是分布式系统设计更常用策略。5 总结通常可使用zk、etcd或分布式缓存(如Hazelcast)解决事件通知问题,但当集群达到一定规模之后,依赖的ZooKeeper集群、etcd集群可能就不稳定,无法满足需求。在超大规模的服务集群下,注册中心所面临的挑战就是超大批量服务节点同时上下线,注册中心集群接受到大量服务变更请求,集群间各节点间需要同步大量服务节点数据,导致:注册中心负载过高各节点数据不一致服务下发不及时或下发错误的服务节点列表RPC框架依赖的注册中心的服务数据的一致性其实并不需要满足CP,只要满足AP即可。我们就是采用“消息总线”的通知机制,来保证注册中心数据的最终一致性,来解决这些问题的。如服务节点数据的推送采用增量更新的方式,这种方式提高了注册中心“服务下发”的效率,而这种方式,还可用于如统一配置中心,用此方式可以提升统一配置中心下发配置的效率。关注我,紧跟本系列专栏文章,咱们下篇再续!作者简介:魔都技术专家兼架构,多家大厂后端一线研发经验,各大技术社区头部专家博主,编程严选网创始人。具有丰富的引领团队经验,深厚业务架构和解决方案的积累。负责:中央/分销预订系统性能优化活动&优惠券等营销中台建设交易平台及数据中台等架构和开发设计目前主攻降低软件复杂性设计、构建高可用系统方向。参考:编程严选网
点赞 1
评论 0
我的求职思考
全部评论
推荐
最新
楼层
滴滴
校招火热招聘中
官网直投
相关推荐
呋呋喃喃
05-14 21:34
已编辑
西安电子科技大学 电子信息类
华为暑期实习面经(已入池)
(未经本人授权,禁止转载) 背景:西部某211,电子信息类本科。 时间线:3.15 投递 -> 4.10 机试 -> 4.19 综测 -> 5.10 上午线下面试(原本安排4.25面试,但由于面试官时间冲突,推迟到5.10) 专业面试1(45min) 面试官非常和蔼、友好,并且很有礼貌!线下面的同学记得打印简历,保险起见打印三份比较合适。 首先是自我介绍,大概三分钟左右,介绍一下自己在校的基本情况以及竞赛和项目经历等等。然后面试官会问几道机试题目,讲一下自己当时是怎么做的,实在不会的也没关系,就说自己不会,但还是要讲一下思路的,千万不能一点都不说。 接下来就是按照简历上的项目...
我发现了面试通关密码
通信硬件人笔面经互助
点赞
评论
收藏
转发
牛客349244894号
05-12 12:39
门头沟学院
自动驾驶感知算法/部署岗秋招总结
在秋招过程中,各种平台上的内容和博主对自己帮助很大,也来分享下自己的秋招经历,作为对自己研究生三年的总结,也希望可以帮助到大家~ 先介绍下楼主BG,楼主211本硕,车辆本计算机硕,无论文,4实习,在2023年秋招中,拿到了元戎,地平线,字节AI Lab,旷视,美团,百度,NVIDIA,图森等offer,最终选择了NVIDIA作为职业生涯的第一站。 秋招秋招投递方向主要为自动驾驶感知算法岗和模型部署岗,进面的公司基本都拿到了offer。 首先说下对工业界就业的整体认知,工业界比较在意能不能进来就上手干活,能证明这件事情的,楼主觉得主要就两个:相关实习项目和强相关论文。除非实验室的方向...
投递图森未来等公司10个岗位 >
点赞
评论
收藏
转发
Stupid_Pig
03-25 22:59
广州应用科技学院 计算机类
三本仔想进外包都进不了啊😭😭
点赞
评论
收藏
转发
答案说明不了所有
05-15 20:38
已编辑
西安电子科技大学 计算机类
华为主管面挂了?
Hr说收到这个感谢就是挂了?好离谱???更新,已通过,被hr虚晃一枪
华为主管面88人在聊
点赞
评论
收藏
转发
梦屿千寻a
05-13 21:37
华南理工大学 机械类
阿里控股一面
问一下牛油,面试官让你手撕,你写的代码没问题,但是面试官准备的答案或者说力扣的答案里面没有这种解法。然后面试官说你的代码思路不对,应该怎么办啊。
阿里巴巴一面187人在聊
点赞
评论
收藏
转发
点赞
收藏
评论
分享
回复帖子
招聘动态
查看更多
滴滴
2025届秋招储备实习生招聘
全站热榜
1
...
5.16校招&实习招聘信息汇总
8585
2
...
送花给牛友,不做“白嫖党”!牛客互动新功能上线啦!
8041
3
...
瑞幸java校招二面(史诗级80min)
7498
4
...
CS硕 只看40w+且965 能投啥
5692
5
...
腾讯 后台开发 一面
5397
6
...
【进面核心】如何紧盯个人简历与企业需求的契合度
4685
7
...
阿里oc
4556
8
...
为什么选择做测试开发
3668
9
...
滴滴秋储后端(秒挂)
3646
10
...
有没有一种可能,仅仅是一种可能
3021
正在热议
#
牛客帮帮团来啦!有问必答
#
736298次浏览
11803人参与
#
海康威视求职进展汇总
#
92238次浏览
1098人参与
#
非技术岗是怎么找实习的
#
75085次浏览
1407人参与
#
学历对求职的影响
#
131978次浏览
1494人参与
#
面试等了一周没回复,还有戏吗
#
40797次浏览
501人参与
#
产品实习,你更倾向大公司or小公司
#
36739次浏览
568人参与
#
0offer是寒冬太冷还是我太菜
#
415720次浏览
4825人参与
#
铜五铁六真的存在吗?
#
28583次浏览
300人参与
#
通信硬件人笔面经互助
#
113001次浏览
2269人参与
#
Offer比较,你最看重什么?
#
51066次浏览
491人参与
#
本周投递记录
#
198809次浏览
5077人参与
#
无实习如何秋招上岸
#
229165次浏览
3582人参与
#
美的求职进展汇总
#
39211次浏览
419人参与
#
为什么国企只招应届生
#
53255次浏览
366人参与
#
浅聊一下我实习的辛苦费
#
81855次浏览
765人参与
#
如何写一份好简历
#
263990次浏览
3973人参与
#
找工作,你会甘心进小厂还是猛冲大厂
#
35789次浏览
357人参与
#
投了多少份简历才上岸
#
57665次浏览
954人参与
#
比亚迪求职进展汇总
#
165889次浏览
1232人参与
#
数据人offer决赛圈怎么选
#
44966次浏览
728人参与
牛客网
牛客企业服务