首页
题库
公司真题
专项练习
面试题库
在线编程
面试
面试经验
AI 模拟面试
简历
求职
学习
基础学习课
实战项目课
求职辅导课
专栏&文章
竞赛
搜索
我要招人
发布职位
发布职位、邀约牛人
更多企业解决方案
AI面试、笔试、校招、雇品
HR免费试用AI面试
最新面试提效必备
登录
/
注册
JavaEdge
华为_2012实验室_Java工程师
关注
已关注
取消关注
#我的求职思考#
你觉得哪个最好?
@JavaEdge:
【RPC最强专栏】服务发现:CP or AP?
1 服务发现的意义为高可用,生产环境中服务提供方都以集群对外提供服务,集群里这些IP随时可能变化,也需要用一本“通信录”及时获取对应服务节点,这获取过程即“服务发现”。对服务调用方和服务提供方,其契约就是接口,相当于“通信录”中的姓名,服务节点就是提供该契约的一个具体实例。服务IP集合作为“通信录”中的地址,从而可通过接口获取服务IP的集合来完成服务的发现。即PRC框架的服务发现:RPC服务发现原理图1.1 服务注册在服务提供方启动时,将对外暴露的接口注册到注册中心,注册中心将这个服务节点的IP和接口保存1.2 服务订阅在服务调用方启动时,去注册中心查找并订阅服务提供方的IP,然后缓存到本地,并用于后续的远程调用2 为何不使用DNS?服务发现的本质,就是完成接口跟服务提供者IP的映射。能否把服务提供者IP统一换成一个域名,利用DNS实现?2.1 DNS流程DNS查询流程:所有服务提供者节点都配置在同一域名下,调用方是可通过DNS拿到随机的一个服务提供者的IP,并建立长连接,但业界为何不用这方案?异常考虑若该IP端口下线了,服务调用者能否及时摘除服务节点若在之前已上线一部分服务节点,突然对这服务扩容,新上线的服务节点能否及时接收到流量都不能。为提升性能和减少DNS服务压力,DNS采取多级缓存,缓存时间较长,尤其JVM默认缓存是永久有效,所以服务调用者不能及时感知服务节点变化。是否能加个负载均衡设备?将域名绑定到这台负载均衡设备,通过DNS拿到负载均衡的IP。服务调用时,服务调用方就能直接跟VIP建立连接,然后由VIP机器完成TCP转发:VIP方案:这是能解决DNS遇到的一些问题,但RPC里不是很合适:搭建负载均衡设备或TCP/IP四层代理,需额外成本请求流量都经过负载均衡设备,多经过一次网络传输,浪费性能负载均衡添加节点和摘除节点,一般要手动添加,当大批量扩容和下线时,会有大量人工操作和生效延迟服务治理时,需更灵活的负载均衡策略,目前负载均衡设备的算法不满足灵活需求由此可见,DNS或者VIP方案虽然可以充当服务发现的角色,但在RPC场景里面直接用还是很难的。3 基于zk的服务发现(CP)服务发现的本质:完成接口跟服务提供者IP的映射。就是一种命名服务,还希望注册中心完成实时变更推送,zk、etcd都能实现。搭建一个zk集群作为注册中心集群,服务注册时,只需服务节点向zk写入注册信息,利用zk的Watcher机制完成服务订阅与服务下发功能。整体流程基于ZooKeeper服务发现结构图:服务平台管理端先在zk创建一个服务根路径,可根据接口名命名(如:/service/com.javaedge.xxService),在这路径再创建服务提供方目录与服务调用方目录(如:provider、consumer),分别存储服务提供方、服务调用方的节点信息当服务提供方发起注册时,会在服务提供方目录中创建一个临时节点,节点中存储该服务提供方的注册信息当服务调用方发起订阅时,则在服务调用方目录中创建一个临时节点,节点中存储该服务调用方的信息,同时服务调用方watch该服务的服务提供方目录(/service/com.demo.xxService/provider)中所有的服务节点数据。当服务提供方目录下有节点数据发生变更时,zk通知给发起订阅的服务调用方zk缺陷早期RPC框架服务发现就是基于zk实现,但后续团队微服务化程度越来越高,zk集群整体压力越来越高,尤其在集中上线时越发明显。“集中爆发”是在一次大规模上线时,当时有超大批量服务节点在同时发起注册操作,ZooKeeper集群的CPU飙升,导致集群不能工作,也无法立马将zk集群重新启动,一直到zk集群恢复后业务才能继续上线。根本原因就是zk本身性能问题,当连接到zk的节点数量特多,对zk读写特频繁,且zk存储目录达到一定数量,zk将不再稳定,CPU持续升高,最终宕机。宕机后,由于各业务的节点还在持续发送读写请求,刚一启动,zk就因无法承受瞬间的读写压力,马上宕机。要重新考虑服务发现方案。4 消息总线(AP)zk强一致性,集群的每个节点的数据每次发生更新操作,都通知其它节点同时执行更新。它要求保证每个节点的数据实时完全一致,直接导致集群性能下降。而RPC框架的服务发现,在服务节点刚上线时,服务调用方可容忍在一段时间后(如几s后)发现这个新上线的节点。毕竟服务节点刚上线后的几s内,甚至更长的一段时间内没有接收到请求流量,对整个服务集群没有什么影响,可牺牲掉CP(强制一致性),选择AP(最终一致),换取整个注册中心集群的性能和稳定性。是否有一种简单、高效,并且最终一致的更新机制,代替zk数据强一致的数据更新机制?最终一致性,可考虑消息总线机制。注册数据可全量缓存在每个注册中心的内存,通过消息总线来同步数据。当有一个注册中心节点接收到服务节点注册时,会产生一个消息推送给消息总线,再通过消息总线通知给其它注册中心节点更新数据并进行服务下发,从而达到注册中心间数据最终一致性。4.1 总体流程服务上线,注册中心节点收到注册请求,服务列表数据变化,生成一个消息,推送给消息总线,每个消息都有整体递增的版本消息总线主动推送消息到各注册中心,同时注册中心定时拉取消息。对获取到消息的,在消息回放模块里面回放,只接受大于本地版本号的消息,小于本地版本号的消息直接丢弃,实现最终一致性消费者订阅可从注册中心内存拿到指定接口的全部服务实例,并缓存到消费者的内存采用推拉模式,消费者可及时拿到服务实例增量变化情况,并和内存中的缓存数据进行合并。为性能,这里采用两级缓存,注册中心和消费者的内存缓存,通过异步推拉模式确保最终一致性。服务调用方拿到的服务节点不是最新的,所以目标节点存在已下线或不提供指定接口服务的情况,这时咋办?这问题放到RPC框架里处理,在服务调用方发送请求到目标节点后,目标节点会进行合法性验证,若指定接口服务不存在或正在下线,则拒绝该请求。服务调用方收到拒绝异常后,会安全重试到其它节点。通过消息总线,完成注册中心集群间数据变更的通知,保证数据最终一致性,并能及时触发注册中心的服务下发。服务发现的特性是允许我们在设计超大规模集群服务发现系统的时候,舍弃强一致性,更多考虑系统健壮性。最终一致性才是分布式系统设计更常用策略。5 总结通常可使用zk、etcd或分布式缓存(如Hazelcast)解决事件通知问题,但当集群达到一定规模之后,依赖的ZooKeeper集群、etcd集群可能就不稳定,无法满足需求。在超大规模的服务集群下,注册中心所面临的挑战就是超大批量服务节点同时上下线,注册中心集群接受到大量服务变更请求,集群间各节点间需要同步大量服务节点数据,导致:注册中心负载过高各节点数据不一致服务下发不及时或下发错误的服务节点列表RPC框架依赖的注册中心的服务数据的一致性其实并不需要满足CP,只要满足AP即可。我们就是采用“消息总线”的通知机制,来保证注册中心数据的最终一致性,来解决这些问题的。如服务节点数据的推送采用增量更新的方式,这种方式提高了注册中心“服务下发”的效率,而这种方式,还可用于如统一配置中心,用此方式可以提升统一配置中心下发配置的效率。关注我,紧跟本系列专栏文章,咱们下篇再续!作者简介:魔都技术专家兼架构,多家大厂后端一线研发经验,各大技术社区头部专家博主,编程严选网创始人。具有丰富的引领团队经验,深厚业务架构和解决方案的积累。负责:中央/分销预订系统性能优化活动&优惠券等营销中台建设交易平台及数据中台等架构和开发设计目前主攻降低软件复杂性设计、构建高可用系统方向。参考:编程严选网
点赞 1
评论 0
我的求职思考
全部评论
推荐
最新
楼层
暂无评论,快来抢首评~
相关推荐
昨天 20:47
已编辑
门头沟学院 Web前端
React基本介绍
这是一份基本的React结构,我将一部分一部分的介绍1.react库首先是react所引用的两个库(1)第一个库react是网页端react以及移动端react共享部分(2)第二个库react.dom是网页端react单独使用的部分2.babel库react中会使用到JSX语法,babel库的作用可以将JSX编译成JS帮助浏览器理解3.JSX语法在js中书写html元素的方法(1)首先引入babel库(2)在含有babel的标签中就可以书写html元素这是使用jsx语法以及普通dom元素在js语法中创建html元素的方法,可以看到,jsx语法要简洁的多,但是也会遇到下面的问题-我们的浏览器无法...
点赞
评论
收藏
分享
01-05 16:22
已编辑
门头沟学院 Java
京东科技测开一面凉经(30min左右,无算法)
问题:自我介绍项目中最困难的一件事?项目中使用继承与多态的案例?ArrayList和LinkedList的区别和实际应用场景?科研项目中最有成就感的一件事?为什么使用Transformer而不是CNN、RNN?如何对AI进行选型?AI如何赋能测试开发?用的测试工具有哪些?Apifox和postman的区别?反问:做什么业务?结果大概什么时候出?面试官还行,该答的都答出来了,看不出反馈,一直在写面评
京东科技一面18人在聊
点赞
评论
收藏
分享
2025-11-23 15:14
中原工学院 Java
27届简历求指导
想找个寒假实习
程序员花海_:
实习和校招简历正确格式应该是教育背景+实习+项目经历+个人评价 其中项目经历注意要体现业务 实习经历里面的业务更是要自圆其说 简历模板尽可能保持干净整洁 不要太花哨的
点赞
评论
收藏
分享
2025-11-14 13:29
门头沟学院 产品经理
秋招结束了
签了京东,这场两年的持久战结束了
点赞
评论
收藏
分享
01-04 17:22
阿里云_研发工程师JAVA(准入职员工)
阿里云内推,阿里云内推码
入职一个多月了,来分享一些landing的感受~ 整体说下:可以打85分,毕竟当时辞职就是想要走出舒适圈,的确也会有些不舒适,但基本上是因为阿里和网易风格有差别,需要一些时间适应 我所在的产品线整体风格不卷,加班不严重,周末大家都安排自己的生活,可以安心放下手机,也让我彻底放下“不秒回羞耻症” 阿里云团队规模太大,分工很细,人也很多,想搞清楚一件事情要对接好多好多人,要熟悉的流程也贼多,这个过程的确有些累,但我估计只要在大厂都会这样 感觉这边做事情自由度更高,换句话说,老板只要结果,过程怎么做自己想办法去 凡事凡人都爱讲价值。初次对接的其他部门的同事,也会直接问我,“你对业务的价值是什么” 前...
阿里云成长空间 781人发布
点赞
评论
收藏
分享
评论
点赞成功,聊一聊 >
点赞
收藏
分享
评论
提到的真题
返回内容
全站热榜
更多
1
...
🔥2026创作新起点:《新年启航计划》来袭,三大赛道等你来冲!
1.9W
2
...
一大波手撕正在靠近!
1.4W
3
...
百度java一面 28届的第一次大厂面试 感觉g了
1.2W
4
...
27前端鼠鼠快手二面
4842
5
...
拥抱人机共生,锻造不可替代的“金头脑”
4813
6
...
双非老鼠的悲惨秋招
3524
7
...
腾讯游戏后端一面
3332
8
...
塞翁失马,焉知非福
3169
9
...
面试手撕题总结
3057
10
...
uu们,面试的时候一定要大大方方的啊!
2794
创作者周榜
更多
正在热议
更多
#
去年的flag与今年的小目标
#
1984次浏览
61人参与
#
应届生应该先就业还是先择业
#
160829次浏览
810人参与
#
26年哪些行业会变好/更差
#
2847次浏览
49人参与
#
哪些公司在招寒假实习?
#
1421次浏览
26人参与
#
你都用AI做什么
#
2074次浏览
57人参与
#
卷__卷不过你们,只能卷__了
#
1246次浏览
27人参与
#
有深度的简历长什么样?
#
5225次浏览
98人参与
#
写论文的崩溃时刻
#
1418次浏览
31人参与
#
入职第一天
#
4216次浏览
48人参与
#
秋招你被哪家公司挂了?
#
998969次浏览
7664人参与
#
这个工作能去吗
#
99553次浏览
614人参与
#
一人分享一道面试手撕题
#
8087次浏览
424人参与
#
你不能接受的企业文化有哪些
#
2623次浏览
56人参与
#
为什么国企只招应届生
#
227667次浏览
1273人参与
#
研究所VS国企,该如何选
#
236817次浏览
1965人参与
#
跳槽时有那些注意事项
#
117518次浏览
585人参与
#
小米求职进展汇总
#
998127次浏览
6501人参与
#
机械应届生薪资要多少才合适?
#
35392次浏览
106人参与
#
机械人的薪资开到多少,才适合去?
#
158306次浏览
553人参与
#
非技术岗薪资爆料
#
471017次浏览
3015人参与
牛客网
牛客网在线编程
牛客网题解
牛客企业服务