关注
一、MQ 可能出现的问题
1. 消息丢失
- 原因:网络故障、MQ 服务器故障、生产者未正确确认消息发送、消费者未正确确认消息接收等。
- 影响:导致关键业务数据丢失,影响系统的正常运行。
2. 消息重复
- 原因:网络波动导致消息重传、MQ 服务器故障恢复后重复投递等。
- 影响:可能导致业务处理重复,如重复下单、重复扣款等。
3. 消息积压
- 原因:生产者生产消息速度过快,消费者消费消息速度过慢;消费者故障导致无法消费消息等。
- 影响:占用大量存储资源,可能导致系统性能下降,甚至崩溃。
4. 队列堵塞
- 原因:大量消息同时涌入队列,超出队列处理能力;消费者处理消息过慢等。
- 影响:新的消息无法进入队列,影响业务的正常进行。
5. MQ 服务器故障
- 原因:硬件故障、软件故障、网络故障等。
- 影响:导致消息无法发送和接收,系统中断。
二、MQ 问题排查方法
1. 消息丢失排查
- 检查生产者代码,确认是否正确设置了消息确认机制。
- 查看 MQ 服务器的日志,看是否有消息发送失败的记录。
- 检查消费者代码,确认是否正确设置了消息确认机制,以及是否在处理消息过程中出现异常导致消息未被确认。
2. 消息重复排查
- 在消费者端增加去重机制,如使用数据库或缓存记录已处理的消息标识。
- 查看 MQ 服务器的日志,看是否有重复投递的记录。
3. 消息积压排查
- 查看 MQ 服务器的监控指标,如队列长度、消息入队和出队速度等,确定积压程度。
- 检查生产者代码,看是否存在生产消息速度过快的问题。
- 检查消费者代码,看是否存在消费消息速度过慢的问题,如是否有性能瓶颈、是否存在死锁等。
4. 队列堵塞排查
- 查看 MQ 服务器的监控指标,如队列长度、队列使用率等,确定堵塞程度。
- 检查消费者代码,看是否存在处理消息过慢的问题。
- 考虑增加消费者数量或优化消费者处理逻辑,提高消费速度。
5. MQ 服务器故障排查
- 查看 MQ 服务器的日志,确定故障原因。
- 检查硬件设备,如硬盘、内存、网络等,看是否有故障。
- 尝试重启 MQ 服务器,看是否能够恢复正常。如果无法恢复,考虑使用备份服务器或进行数据恢复。
查看原帖
1 评论
相关推荐
点赞 评论 收藏
分享
04-09 10:42
井冈山大学 嵌入式软件工程师 点赞 评论 收藏
分享
牛客热帖
更多
正在热议
更多
# 面试问题记录 #
19581次浏览 337人参与
# 硬件人你反向读研了吗 #
39868次浏览 608人参与
# 京东TGT #
27504次浏览 151人参与
# 硬件人秋招的第一个offer #
65650次浏览 1081人参与
# 滴滴工作体验 #
23337次浏览 123人参与
# 非技术岗投递进展 #
137547次浏览 1222人参与
# 材料进Fab厂真的劝退吗? #
36132次浏览 158人参与
# 不考虑转正,实习多久合适 #
24158次浏览 118人参与
# 机械求职避坑tips #
41106次浏览 355人参与
# 互联网回暖,腾讯要招5000+人! #
263526次浏览 4889人参与
# 面试经验谈 #
12657次浏览 190人参与
# 机械只有转码才有出路吗? #
125882次浏览 1590人参与
# 职场新人生存指南 #
332402次浏览 7135人参与
# 面试吐槽bot #
2536次浏览 31人参与
# 异地恋该为对方跳槽吗 #
23455次浏览 119人参与
# 硬件人更看重稳定还是高薪 #
38625次浏览 203人参与
# vivo求职进展汇总 #
208612次浏览 1341人参与
# 25届如何提前做秋招准备? #
163925次浏览 2451人参与
# 你遇到过哪些神仙同事 #
69433次浏览 623人参与
# 租房找室友 #
27605次浏览 144人参与
# 深信服求职进展汇总 #
188753次浏览 1694人参与