首页
题库
公司真题
专项练习
面试题库
在线编程
面试
面试经验
AI 模拟面试
简历
求职
学习
基础学习课
实战项目课
求职辅导课
专栏&文章
竞赛
搜索
我要招人
发布职位
发布职位、邀约牛人
更多企业解决方案
AI面试、笔试、校招、雇品
HR免费试用AI面试
最新面试提效必备
登录
/
注册
JavaEdge
华为_2012实验室_Java工程师
关注
已关注
取消关注
#我的求职思考#
你觉得哪个最好?
@JavaEdge:
【RPC最强专栏】服务发现:CP or AP?
1 服务发现的意义为高可用,生产环境中服务提供方都以集群对外提供服务,集群里这些IP随时可能变化,也需要用一本“通信录”及时获取对应服务节点,这获取过程即“服务发现”。对服务调用方和服务提供方,其契约就是接口,相当于“通信录”中的姓名,服务节点就是提供该契约的一个具体实例。服务IP集合作为“通信录”中的地址,从而可通过接口获取服务IP的集合来完成服务的发现。即PRC框架的服务发现:RPC服务发现原理图1.1 服务注册在服务提供方启动时,将对外暴露的接口注册到注册中心,注册中心将这个服务节点的IP和接口保存1.2 服务订阅在服务调用方启动时,去注册中心查找并订阅服务提供方的IP,然后缓存到本地,并用于后续的远程调用2 为何不使用DNS?服务发现的本质,就是完成接口跟服务提供者IP的映射。能否把服务提供者IP统一换成一个域名,利用DNS实现?2.1 DNS流程DNS查询流程:所有服务提供者节点都配置在同一域名下,调用方是可通过DNS拿到随机的一个服务提供者的IP,并建立长连接,但业界为何不用这方案?异常考虑若该IP端口下线了,服务调用者能否及时摘除服务节点若在之前已上线一部分服务节点,突然对这服务扩容,新上线的服务节点能否及时接收到流量都不能。为提升性能和减少DNS服务压力,DNS采取多级缓存,缓存时间较长,尤其JVM默认缓存是永久有效,所以服务调用者不能及时感知服务节点变化。是否能加个负载均衡设备?将域名绑定到这台负载均衡设备,通过DNS拿到负载均衡的IP。服务调用时,服务调用方就能直接跟VIP建立连接,然后由VIP机器完成TCP转发:VIP方案:这是能解决DNS遇到的一些问题,但RPC里不是很合适:搭建负载均衡设备或TCP/IP四层代理,需额外成本请求流量都经过负载均衡设备,多经过一次网络传输,浪费性能负载均衡添加节点和摘除节点,一般要手动添加,当大批量扩容和下线时,会有大量人工操作和生效延迟服务治理时,需更灵活的负载均衡策略,目前负载均衡设备的算法不满足灵活需求由此可见,DNS或者VIP方案虽然可以充当服务发现的角色,但在RPC场景里面直接用还是很难的。3 基于zk的服务发现(CP)服务发现的本质:完成接口跟服务提供者IP的映射。就是一种命名服务,还希望注册中心完成实时变更推送,zk、etcd都能实现。搭建一个zk集群作为注册中心集群,服务注册时,只需服务节点向zk写入注册信息,利用zk的Watcher机制完成服务订阅与服务下发功能。整体流程基于ZooKeeper服务发现结构图:服务平台管理端先在zk创建一个服务根路径,可根据接口名命名(如:/service/com.javaedge.xxService),在这路径再创建服务提供方目录与服务调用方目录(如:provider、consumer),分别存储服务提供方、服务调用方的节点信息当服务提供方发起注册时,会在服务提供方目录中创建一个临时节点,节点中存储该服务提供方的注册信息当服务调用方发起订阅时,则在服务调用方目录中创建一个临时节点,节点中存储该服务调用方的信息,同时服务调用方watch该服务的服务提供方目录(/service/com.demo.xxService/provider)中所有的服务节点数据。当服务提供方目录下有节点数据发生变更时,zk通知给发起订阅的服务调用方zk缺陷早期RPC框架服务发现就是基于zk实现,但后续团队微服务化程度越来越高,zk集群整体压力越来越高,尤其在集中上线时越发明显。“集中爆发”是在一次大规模上线时,当时有超大批量服务节点在同时发起注册操作,ZooKeeper集群的CPU飙升,导致集群不能工作,也无法立马将zk集群重新启动,一直到zk集群恢复后业务才能继续上线。根本原因就是zk本身性能问题,当连接到zk的节点数量特多,对zk读写特频繁,且zk存储目录达到一定数量,zk将不再稳定,CPU持续升高,最终宕机。宕机后,由于各业务的节点还在持续发送读写请求,刚一启动,zk就因无法承受瞬间的读写压力,马上宕机。要重新考虑服务发现方案。4 消息总线(AP)zk强一致性,集群的每个节点的数据每次发生更新操作,都通知其它节点同时执行更新。它要求保证每个节点的数据实时完全一致,直接导致集群性能下降。而RPC框架的服务发现,在服务节点刚上线时,服务调用方可容忍在一段时间后(如几s后)发现这个新上线的节点。毕竟服务节点刚上线后的几s内,甚至更长的一段时间内没有接收到请求流量,对整个服务集群没有什么影响,可牺牲掉CP(强制一致性),选择AP(最终一致),换取整个注册中心集群的性能和稳定性。是否有一种简单、高效,并且最终一致的更新机制,代替zk数据强一致的数据更新机制?最终一致性,可考虑消息总线机制。注册数据可全量缓存在每个注册中心的内存,通过消息总线来同步数据。当有一个注册中心节点接收到服务节点注册时,会产生一个消息推送给消息总线,再通过消息总线通知给其它注册中心节点更新数据并进行服务下发,从而达到注册中心间数据最终一致性。4.1 总体流程服务上线,注册中心节点收到注册请求,服务列表数据变化,生成一个消息,推送给消息总线,每个消息都有整体递增的版本消息总线主动推送消息到各注册中心,同时注册中心定时拉取消息。对获取到消息的,在消息回放模块里面回放,只接受大于本地版本号的消息,小于本地版本号的消息直接丢弃,实现最终一致性消费者订阅可从注册中心内存拿到指定接口的全部服务实例,并缓存到消费者的内存采用推拉模式,消费者可及时拿到服务实例增量变化情况,并和内存中的缓存数据进行合并。为性能,这里采用两级缓存,注册中心和消费者的内存缓存,通过异步推拉模式确保最终一致性。服务调用方拿到的服务节点不是最新的,所以目标节点存在已下线或不提供指定接口服务的情况,这时咋办?这问题放到RPC框架里处理,在服务调用方发送请求到目标节点后,目标节点会进行合法性验证,若指定接口服务不存在或正在下线,则拒绝该请求。服务调用方收到拒绝异常后,会安全重试到其它节点。通过消息总线,完成注册中心集群间数据变更的通知,保证数据最终一致性,并能及时触发注册中心的服务下发。服务发现的特性是允许我们在设计超大规模集群服务发现系统的时候,舍弃强一致性,更多考虑系统健壮性。最终一致性才是分布式系统设计更常用策略。5 总结通常可使用zk、etcd或分布式缓存(如Hazelcast)解决事件通知问题,但当集群达到一定规模之后,依赖的ZooKeeper集群、etcd集群可能就不稳定,无法满足需求。在超大规模的服务集群下,注册中心所面临的挑战就是超大批量服务节点同时上下线,注册中心集群接受到大量服务变更请求,集群间各节点间需要同步大量服务节点数据,导致:注册中心负载过高各节点数据不一致服务下发不及时或下发错误的服务节点列表RPC框架依赖的注册中心的服务数据的一致性其实并不需要满足CP,只要满足AP即可。我们就是采用“消息总线”的通知机制,来保证注册中心数据的最终一致性,来解决这些问题的。如服务节点数据的推送采用增量更新的方式,这种方式提高了注册中心“服务下发”的效率,而这种方式,还可用于如统一配置中心,用此方式可以提升统一配置中心下发配置的效率。关注我,紧跟本系列专栏文章,咱们下篇再续!作者简介:魔都技术专家兼架构,多家大厂后端一线研发经验,各大技术社区头部专家博主,编程严选网创始人。具有丰富的引领团队经验,深厚业务架构和解决方案的积累。负责:中央/分销预订系统性能优化活动&优惠券等营销中台建设交易平台及数据中台等架构和开发设计目前主攻降低软件复杂性设计、构建高可用系统方向。参考:编程严选网
点赞 1
评论 0
我的求职思考
全部评论
推荐
最新
楼层
暂无评论,快来抢首评~
相关推荐
昨天 13:55
广东工业大学 Java
想做个计算机应届就业调查,毕业生多少比例能找到对口工作(全班)
点赞
评论
收藏
分享
2025-11-05 14:35
重庆邮电大学 前端工程师
HR面挂了...
如题,今天微信上面问HR多久能发offer,结果HR问我方不方便接电话,其实当时鼠鼠就能感觉情况不对劲了,HR说offer审批要给部门的leader审核,结果审核的时候leader感觉我还是不太合适(也没说哪不合适),然后审批就失败了HR说后面会努力再帮我申请一下,但我感觉说的是些安慰人的话吧,毕竟第一次都没通过后面怎么可能会通过呢其实如果面试过程中把我挂了我都不会这么难受,但是面了整整四面到头来还是没走到最后一步,鼠鼠知道HR面也可能会挂人但是没想到自己居然真的这么倒霉,投个日常实习也能在HR面挂掉唉,无语凝噎了
牛客35671670...:
招个实习生最后还要横向挂人😅,还是日常实习生。这给惯的。实习生最终审核还挂就不要走这么多轮技术面。我爱说实话
点赞
评论
收藏
分享
2025-11-08 20:23
香港教育大学 营销
这个咋样
这种微初创得我害怕 总经理助理
点赞
评论
收藏
分享
2025-12-30 13:18
门头沟学院 C++
究竟是什么样的前程值得我们如此?
停下来就有负罪感?明明是周末,躺在床上刷手机却觉得心慌; 看到同龄人升职加薪、晒offer,第一反应不是祝福,而是焦虑自己“被落下了”; 潜意识里觉得:如果不优秀,我就不配被爱;如果不成功,我就是个loser。优绩主义给我们编织了一个完美的谎言:只要你努力,就能成功;如果你没成功,那就是你不够努力。但这太残酷了,也太傲慢了。 它忽略了运气、忽略了环境、忽略了起跑线的不同。它让我们变成了在这个系统里疯狂奔跑的仓鼠,不敢停下,生怕被甩出转轮。回看这一年,我像是个被上了发条的玩偶,却不知道开关在哪。 4月: 开始备战实习,焦虑的种子埋下; 实习期: 以为上岸会轻松,结果压力不降反增,每天都在自我怀疑...
我们是不是被“优绩主义”...
点赞
评论
收藏
分享
评论
点赞成功,聊一聊 >
点赞
收藏
分享
评论
提到的真题
返回内容
全站热榜
更多
1
...
都 2026 年了,还在神话 AI Agent开发吗?
315
2
...
2025找工年终总结
252
3
...
Goodnight World!文科转码兜兜转转的那些年……
168
4
...
为什么你的实习是“无效实习”?又该如何做
129
5
...
我的秋招回忆录:从惨败到硕果的成长之路
126
6
...
简历求锐评,211硕士找实习
126
7
...
24h一面到oc速通字节!挑战全网最快timeline
98
8
...
简历求拷打
96
9
...
新年第一篇,关于实习背调…
94
10
...
27届暑期实习准备指南!!
79
创作者周榜
更多
正在热议
更多
#
实习没人带,苟住还是跑路?
#
17530次浏览
322人参与
#
春招前还要继续实习吗?
#
10543次浏览
114人参与
#
我们是不是被“优绩主义”绑架了?
#
12380次浏览
324人参与
#
对2025年忏悔
#
8215次浏览
155人参与
#
牛客2025仙途报告
#
49190次浏览
534人参与
#
应届生,你找到工作了吗
#
97306次浏览
593人参与
#
机械求职避坑tips
#
82474次浏览
534人参与
#
为了秋招你都做了哪些准备?
#
30059次浏览
528人参与
#
经纬恒润求职进展汇总
#
145889次浏览
1075人参与
#
毕业季,你想好怎么跟生活对线了吗?
#
266779次浏览
3863人参与
#
一人说一家双休的公司
#
11752次浏览
130人参与
#
每个月的工资都是怎么分配的?
#
81591次浏览
662人参与
#
面试官问过你最刁钻的问题是什么?
#
14105次浏览
123人参与
#
秋招被确诊为……
#
280178次浏览
1587人参与
#
秋招投递攻略
#
255964次浏览
2520人参与
#
AI时代,哪些岗位最容易被淘汰
#
25706次浏览
219人参与
#
2025秋招体验点评
#
86443次浏览
719人参与
#
实习在多还是在精
#
78025次浏览
494人参与
#
你收到了团子的OC了吗
#
1491334次浏览
11813人参与
#
职场新人生存指南
#
492308次浏览
9518人参与
牛客网
牛客网在线编程
牛客网题解
牛客企业服务