RocketMQ最佳实践

1 Producer

  1. 一个应用尽可能用一个Topic,消息子类型用tags来标识,tags可以由应用自由设置

只有发送消息设置了tags,消费方在订阅消息时,才可以利用tags在broker做消息过滤

message.setTags("TagA");
  1. 如有可靠性需要,消息发送成功或者失败,要打印消息日志(sendresult和key信 息)

  2. 如果相同性质的消息量大,使用批量消息,可以提升性能

  3. 建议消息大小不超过512KB

  4. send(msg)会阻塞,如果有性能要求,可以使用异步的方式: send(msg, callback)

  5. 如果在一个JVM中,有多个生产者进行大数据处理,建议: ● 少数生产者使用异步发送方式(3~5个就够了) ● 通过setInstanceName方法,给每个生产者设置一个实例名

  6. send消息方法,只要不抛异常,就代表发送成功 , 但是发送成功会有多个状态, 在sendStatus类里定义● SEND OK : 消息发送成功 ● FLUSH DISK_ TIMEOUT: 消息发送成功, 但是服务器刷盘超时,消息已经进入 服务器队列,只有此时服务器宕机,消息才会丢失 ● FLUSH SLAVE TIMEOUT: 消息发送成功,但是服务器同步到Slave时超时, 消息已经进入服务器队列,只有此时服务器宕机,消息才会丢失 ● SLAVE NOT_ AVAILABLE: 消息发送成功, 但是此时slave不可用, 消息已经进入服务器队列,只有此时服务器宕机,消息才会丢失

● 如果状态是FLUSH DISK TIMEOUT或FLUSH SLAVE_ _TIMEOUT,并且Broker正好关闭 此时,可以丢弃这条消息,或者重发。但建议最好重发,由消费端去重

● Producer向Broker发送请求会等待响应,但如果达到最大等待时间,未得到响应,则客户端将抛出RemotingTimeoutException ● 默认等待时间是3秒,如果使用send(msg, timeout),则可以自己设定超时时间, 但超时时间不能设置太小,应为Borker需要一些时间来刷新磁盘或与从属设备同步 ● 如果该值超过syncFlushTimeout,则该值可能影响不大,因为Broker可能会在超时之前返回FLUSH SLAVE TIMEOUT或FLUSH SLAVE TIMEOUT的响应

  1. 对于消息不可丢失应用,务必要有消息重发机制 Producer的send方法本身支持内部重试: ● 至多重试3次 ● 如果发送失败,则轮转到下一-个Broker ● 这个方法的总耗时时间不超过sendMsgTimeout设置的值,默认10s 所以,如果本身向broker发送消息产生超时异常,就不会再做重试

以上策略仍然不能保证消息一定发送成功,为保证消息一定成功,建议将消息存储到db,由后台线程定时重试,保证消息一定到达Broker

2 Consumer

每个消息在业务层面的唯一标识码,要设置到keys字段,方便将来定位消息丢失问题

服务器会为每个消息创建索引(哈希索引),应用可以通过topic, key来查询这条消息内容,以及消息被谁消费

由于是哈希索引,请务必保证key尽可能唯一,这样可以避免潜在的哈希冲突

String orderld =“1250689524981";
message.setKeys(orderld); 

console客户端使GUI

  • mvn clean package -Dmaven.test.skip=true
    --server.port=8081 --rocketmq.config. namesrvAddr=192.168.1.17:9876 
  • 2.1 消费者组和订阅

    不同的消费群体可以独立地消费同样的主题,并且每个消费者都有自己的消费偏移量(offsets) 。

确保同一组中的每个消费者订阅相同的主题

2.2 消息***(MessageListener)

2.2.1 顺序 (Orderly)

消费者将锁定每个MessageQueue,以确保每个消息被一个按顺序使用。 这将导致性能损失

如果关心消息的顺序时,它就很有用了。不建议抛出异常,可以返回 ConsumeOrderlyStatus. SUSPEND CURRENT QUEUE A MOMENT代替

2.2.2 消费状态(Consume Status)

对于MessageListenerConcurrently,可以返回RECONSUME_ LATER告诉消费者,当前不能消费它并且希望以后重新消费。然后可以继续使用其他消息

对于MessageListenerOrderly, 如果关心顺序,就不能跳过消息,可以返回SUSPEND CURRENT QUEUE A MOMENT来告诉消费者等待片刻。

阻塞(Blocking)

不建议阻塞Listener,因为它会阻塞线程池,最终可能会停止消费程序

线程数

DefaultMQPushConsumer 消费者使用一个ThreadPoolExecutor来处理内部的消费,因此可以通过设 置更改它

从何处开始消费

● 当建立一个新的Consumer Group时,需要决定是否需要消费Broker中已经 存在的历史消息。 ● CONSUME_ FROM LAST OFFSET将忽略历史消息,并消费此后生成的任何 内容。 ● CONSUME FROM FIRST OFFSET将消耗Broker中存在的所有消息。还可以使用CONSUME FROM TIMESTAMP 来消费在指定的时间戳之后生成的消息。

重复(幂等性)

RocketMQ无法避免消息重复,如果业务对重复消费非常敏感,务必在业务层面做去重: ● 通过记录消息唯一键进行去重 ● 使用业务层面的状态机制去重

3 最佳实践之 NameServer

在Apache RocketMQ中,NameServer用于协调分布式系统的每个组件,主要通过管理主题路由信息来实现协调。

管理由两部分组成:

  1. Brokers定期更新保存在每个名称服务器中的元数据
  2. 名称服务器是为客户端提供最新的路由信息服务的,包括生产者、消费者和命令行客户端。

因此,在启动brokers和clients之前,我们需要告诉他们如何通过给他们提 供的一个名称服务器地址列表来访问名称服务器。

在Apache RocketMQ中,可以用四种方式完成。

3.1 编程方式

  • 对于brokers,我们可以在broker的配置文件中指定
    namesrvAddr=name-server-ip1:port;name-server-ip2:port 
  • 对于生产者和消费者,我们可以给他们提供姓名服务器地址列表如下:
    DefaultMQProducer producer = new DefaultMQProducer(" please_ rename_ unique_ group name");
    producer.setNamesrvAddr("name-server1-ip:port;name-server2-ip:port"); 
    DefaultMQPushConsumer consumer = new DefaultMQPushConsumer(" please_ rename_ unique_ _group_ name");
    consumer.setNamesrvAddr(" name-server1-ip:port;name-server2-ip:port");
  • 如果从shell中使用管理命令行,也可以这样指定:

    sh mqadmin command-name -n name-server-ip1:port;name-server-ip2:port -X OTHER-OPTION 
  • 一个简单的例子,在NameServer节点上查询集群信息:

    sh mqadmin -n localhost:9876 clusterList
  • 如果将管理工具集成到自己的项目中,可以这样
    DefaultMQAdminExt defaultMQAdminExt = new DefaultMQAdminExt(" please_ rename_ _unique_ group_ _name");
    defaultMQAdminExt.setNamesrvAddr("name-server1-ip:port;name-server2-ip:port");

3.2 Java参数

NameServer的地址列表也可以通过java参数rocketmq.namesrv.addr 在启动之前指定

3.3 环境变量

可以设置NAMESRV_ ADDR环境变量。如果设置了,Broker和clients将检 查并使用其值

3.4 HTTP端点(HTTP Endpoint)

如果没有使用前面提到的方法指定NameServer地址列表,Apache RocketMQ将每2分钟发送一次HTTP请求,以获取和更新NameServer地址列表,初始延迟10秒。

默认情况下,访问的HTTP地址是:

http://jmenv.tbsite.net:8080/rocketmq/nsaddr 

通过Java参数rocketmq.namesrv.domain,可以修改jmenv.tbsite.net 通过Java参数rocketmq.namesrv.domain.subgroup,可以修改nsaddr

3.5 优先级

编程方式> Java参数>环境变量> HTTP方式

4 JVM与Linux内核配置

4.1 JVM配置

推荐使用JDK 1.8版本,使用服务器编译器和8g堆。 设置相同的Xms和Xmx值,以防止JVM动态调整堆大小以获得更好的性能。

简单的JVM配置如下所示:

-server -Xms8g -Xmx8g -Xmn4g 

如果不关心Broker的启动时间,可以预先触摸Java堆,以确保在JVM初始化期间分配页是更好的选择。

-XX:+AlwaysPreTouch 
  • 禁用偏置锁定可能会减少JVM暂停:
    -XX: UseBiasedL ocking 
  • 对于垃圾回收,建议使用G1收集器:
    -XX:+UseG1GC -XX:G1HeapRegionSize= 16m -XX:G lReservePercent=25 -XX:InitiatingHeapOccupancyPercent=30 
    这些GC选项看起来有点激进,但事实证明它在生产环境中具有良好的性能。

-XX:MaxGCPauseMillis不要设置太小的值,否则JVM将使用一个小的新生代,这将导致非常频繁的新生代GC。

  • 推荐使用滚动GC日志文件:
    -XX:+UseGCLogFileRotation -Xx:NumberOfGCLogFiles=5 -XX:GCLogFileSize=30m 
  • 如果写入GC文件会增加***的延迟,请将重定向GC日志文件考虑在内存文件系统中:
    -Xloggc:/dev/shm/mq_ gc. _%p.log 

4.2 Linux内核配置

全部评论

相关推荐

点赞 评论 收藏
转发
点赞 8 评论
分享
牛客网
牛客企业服务