为什么kafka延迟比RocketMQ高?
1 kafka
说kafka延迟比rocketmq延迟高 是有一个前提的 就是topic较多的时候 这个和这2个MQ的数据存储结构有关系的 在topic少的时候延迟基本一致。
kafka的数据存储结构设计师尽可能的保证吞吐量,所以在设计时是尽可能保证log日志小,它的数据结构如下 其中topic只是逻辑概念,分区对应就是一个物理文件夹:
所以topic很多时,分区文件数量会很庞大,磁盘顺序读效率变得低下,则会在topic比较多时,磁盘顺序读就蜕变为随机读,延迟就高了。即 kafka 性能对于topic 有阈值(20 个)。
2 RockertMQ
淘宝业务比较复杂,topic很多,为解决这痛点,RockertMQ诞生。其数据存储结构对此做了优化,日志目录只有一个commit log:
出发点不一样,kafka定位就是处理日志和大数据 在这些业务领域,topic不会太多,延迟问题自然也就没有。
数据存储结构是主要原因,还有就是kafka只支持pull模式。而rocketmq有pull、push两种模式 (虽然这个push模式是假push),push模式延迟肯定是比pull模式延迟低。
push模式是基于pull模式的,本地有个定时线程去pull broker的消息,缓存到本地,然后push到消费线程那边。
3 RabbitMQ
rabbit 的push模式是真push 所以延迟最低的就是兔子。 但不支持分布式,只支持主从模式 本身设计就是小而美的单机版。cpu消耗比kafka之类低多了。