这是本人学习的总结,主要学习资料如下
- 马士兵教育
- rocketMq官方文档
目录
- 1、消息存储结构
- 1.1、CommitLog详解
- 1.1.1、CommitLog存储的优点
- 1.2、ConsumeQueue详解
- 1.3、Index详解
- 2、持久化文件
- 3、过期文件删除机制
- 3.1、判断过期文件
- 3.2、删除的时机
1、消息存储结构
消息在消息队列中的存储结构如下所示。这三个模块都是文件。默认放在${user.home}/store
之下。
- 首先是左边的
CommitLog
,不管是什么topic
,所有的消息都是放到这个集合之中。存储着消息的topic
,message
等消息的元数据。 - 右上角的是
Comsummequeue
,是逻辑消息队列,代表着一个topic
底下的一个queue
。里面顺序存放着属于这个queue
的所有消息。不过这是存放消息的地址和偏移量,消息的其他信息还需要到CommitLog
中读取。 Index
则是记录着所有消息的索引。RocketMQ
提供通过id
或Key
来快速查询到一个msg
。因为id
是由brokerId+offset
构成的,所以自然能从commitLog
中读取消息。Index
中则记录key
和offset
的映射,所以可以通过key
快速找到一个msg
。
1.1、CommitLog详解
CommitLog
采访者消息的所有元信息。每个CommitLog
都被本机上的所有queue
共享,与消息的topic
等无关。
消息的存储结构和Redis
的压缩列表类似。每个消息的前面存放一些元数据,后面放消息的具体内容。这样每个消息的长度是不固定的。
每个CommitLog
文件默认是1G。如果消息塞满了一个文件则会生成一个新的,并且令其初始偏移量在上一个文件的基础上加1073741824(1G = 1073741824byte)。
在写消息时,尽管有多个生产者会同时发送消息,但永远是一个一个地往CommitLog
中写消息。
1.1.1、CommitLog存储的优点
- CommitLog 顺序写 ,可以大大提高写入效率。
实际上,磁盘有时候会比你想象的快很多,有时候也比你想象的慢很多,关键在如何使用,使用得当,磁盘的速度完全可以匹配上网络的数据传输速度。目前的高性能磁盘,顺序写速度可以达到600MB/s ,超过了一般网卡的传输速度,这是磁盘比想象的快的地方 但是磁盘随机写的速度只有大概lOOKB/s,和顺序写的性能相差 6000 倍。 - 虽然是随机读,但是利用操作系统的 pagecache 机制,可以批量地从磁盘读取,作为 cache 存到内存中,加速后续的读取速度。
- 为了保证完全的顺序写,需要
ConsumeQueue
这个中间结构 ,因为ConsumeQueue
里只存偏移量信息,所以尺寸是有限的,在实际情况中,大部分的ConsumeQueue
能够被全部读入内存,所以这个中间结构的操作速度很快,可以认为是内存读取的速度。此外为了保证CommitLog
和ConsumeQueue
的一致性,CommitLog
里存储了Consume Queues
、Message Key
、Tag
等所有信息,即使ConsumeQueue
丢失,也可以通过CommitLog
完全恢复出来。
1.2、ConsumeQueue详解
ComsumeQueue
是一个逻辑队列,代表了一个topic
下的一个queue
。它里面只存储消息的索引,不存具体的信息,具体的消息信息要到CommitLog
中寻找。
下面是具体存储结构。
1.3、Index详解
RocketMQ
提供通过id
或Key
来快速查询到一个msg
。因为id
是由brokerId+offset
构成的,所以自然能从commitLog
中读取消息。Index
中则记录key
和offset
的映射,所以可以通过key
快速找到一个msg
。
2、持久化文件
RocketMQ
的持久化文件默认会放到${user.home}/store
目录下,也可以在broker.conf
中配置storePathRootDir
修改路径。
一般有下面这几个文件。
- commitlog: 消息存储的元数据
- config:运行期间的一些配置信息。
- consumerqueue:消息消费对了存储目录。
- index:消息索引文件存储目录。
- abort:如果存在该文件则表示
MQ
是非正常关闭的。 - checkPoint:文件检查点,存储着
commitlog
,consumerqueue
和index
文件最后一次刷盘时间戳。
3、过期文件删除机制
3.1、判断过期文件
RocketMQ
的持久化文件不会永远存在,每隔一段时间就会清理掉一部分。主要是删除CommitLog
和ConsumeQueue
这两个文件。
在RocketMQ
中,一段时间内没更新的文件就被视为过期文件,不管里面的消息是不是全都被消费了。
默认是42小时没有更新就删除,默认时间根据版本的不同而不同,这个也是可以在broker.config
中配置的,fileReserveTime
。
删除文件是由定时任务做的,默认10s扫描一次。
判断是否要删除过期文件的机制总共和下面这几个个参数有关
fileReserveTime
:单位小时,超过这个时间没更新的文件就是过期文件。destroyMapedFileIntervalForcibly
:当清理线程准备删除一个文件时,如果这个文件还被其他线程引用,取消这次删除操作并记录当前时间。destroyMapedFileIntervalForcibly
表示在一段时间内(单位是ms),会一直保留这个文件。超过这个时间以后,每次清理线程发现这个文件就会减少1000个对该文件的引用,直到引用数变成0,删除该文件。
3.2、删除的时机
默认是10秒一次扫描,但是有下面的特殊情况也会触发扫描。
deleteWhen
:将扫描时间固定成一天当中的某个时刻执行一次,比如凌晨4点。DiskSpaceCleanForciblyRatio
:默认值85。表示磁盘空间使用率达到85%以后,就会立刻启动过期文件删除机制。