Redis 6 中的多线程是如何实现的!?

25115db881f33191a9aa76c6ee97965f.gif

作者 | 张彦飞allen

来源 | 开发内功修炼

Redis 是一个高性能服务端的典范。它通过多路复用 epoll 来管理海量的用户连接,只使用一个线程来通过事件循环来处理所有用户请求,就可以达到每秒数万 QPS 的处理能力。下图是单线程版本 Redis 工作的核心原理图

13da482f3aefd7f0d570720c9d58b3c4.png

单线程的 Redis 虽然性能很高,但是却有两个问题。一个问题是没有办法充分发挥现代 CPU 的多核处理能力,一个实例只能使用一个核的能力。二是如果某个用户请求的处理过程卡住一段时间,会导致其它所有的请求都会出现超时的情况。所以,在线上的 redis 使用过程时是明确禁止使用 keys * 等长耗时的操作的。

那如何改进呢,思路和方向其实很明确。那就是和其它的主流程序一样引入多线程,用更多的线程来分担这些可能耗时的操作。事实上 Redis 也确实这么干了,在 6.0 以后的版本里,开始支持了多线程。我们今天就来领略一下 Redis 的多线程是如何实现的。

一、多线程 Redis 服务启动

首先获取多线程版本 Redis 的源码

# git clone https://github.com/redis/redis
# cd redis
# git checkout -b 6.2.0 6.2.0

默认情况下多线程是默认关闭的。如果想要启动多线程,需要在配置文件中做适当的修改。相关的配置项是 io-threads 和 io-threads-do-reads 两个。

#vi /usr/local/soft/redis6/conf/redis.conf 
io-threads 4 #启用的 io 线程数量
io-threads-do-reads yes #读请求也使用io线程

其中 io-threads 表示要启动的 io 线程的数量。io-threads-do-reads 表示是否在读阶段也使用 io 线程,默认是只在写阶段使用 io 线程的。

现在假设我们已经打开了如上两项多线程配置。带着这个假设,让我们进入到 Redis 的 main 入口函数。

//file: src/server.c
int main(int argc, char **argv) {......// 1.1 主线程初始化initServer();// 1.2 启动 io 线程InitServerLast();// 进入事件循环aeMain(server.el);
}

1.1 主线程初始化

在 initServer 这个函数内,Redis 主线程做了这么几件重要的事情。

fe914075f35553ff2a68a5a605f30081.png

  • 初始化读任务队列、写任务队列

  • 创建一个 epoll 对象

  • 对配置的监听端口进行 listen

  • 把 listen socket 让 epoll 给管理起来

//file: src/server.c
void initServer() {// 1 初始化 server 对象server.clients_pending_write = listCreate();server.clients_pending_read = listCreate();......// 2 初始化回调 events,创建 epollserver.el = aeCreateEventLoop(server.maxclients+CONFIG_FDSET_INCR);// 3 绑定监听服务端口listenToPort(server.port,server.ipfd,&server.ipfd_count);// 4 注册 accept 事件处理器for (j = 0; j < server.ipfd_count; j++) {aeCreateFileEvent(server.el, server.ipfd[j], AE_READABLE,acceptTcpHandler,NULL);}...
}

接下来我们分别来看。

初始化 server 对象

在 initServer 的一开头,先是对 server 的各种成员变量进行初始化。值得注意的是 clients_pending_write 和 clients_pending_read 这两个成员,它们分别是写任务队列和读任务队列。将来主线程产生的任务都会放在放在这两个任务队列里。

主线程会根据这两个任务队列来进行任务哈希散列,以将任务分配到多个线程中进行处理。

aeCreateEventLoop 处理

我们来看 aeCreateEventLoop 详细逻辑。它会初始化事件回调 event,并且创建了一个 epoll 对象出来。

//file:src/ae.c
aeEventLoop *aeCreateEventLoop(int setsize) {aeEventLoop *eventLoop;eventLoop = zmalloc(sizeof(*eventLoop);//将来的各种回调事件就都会存在这里eventLoop->events = zmalloc(sizeof(aeFileEvent)*setsize);......aeApiCreate(eventLoop);return eventLoop;
}

我们注意一下 eventLoop->events,将来在各种事件注册的时候都会保存到这个数组里。

//file:src/ae.h
typedef struct aeEventLoop {......aeFileEvent *events; /* Registered events */
}

具体创建 epoll 的过程在 ae_epoll.c 文件下的 aeApiCreate 中。在这里,真正调用了 epoll_create

//file:src/ae_epoll.c
static int aeApiCreate(aeEventLoop *eventLoop) {aeApiState *state = zmalloc(sizeof(aeApiState));state->epfd = epoll_create(1024); eventLoop->apidata = state;return 0;
}

绑定监听服务端口

我们再来看 Redis 中的 listen 过程,它在 listenToPort 函数中。调用链条很长,依次是 listenToPort => anetTcpServer => _anetTcpServer => anetListen。在 anetListen 中,就是简单的 bind 和 listen 的调用。

//file:src/anet.c
static int anetListen(......) {bind(s,sa,len);listen(s, backlog);......
}

注册事件回调函数

前面我们调用 aeCreateEventLoop 创建了 epoll,调用 listenToPort 进行了服务端口的 bind 和 listen。接着就调用的 aeCreateFileEvent 就是来注册一个 accept 事件处理器。

我们来看 aeCreateFileEvent 具体代码。

//file: src/ae.c
int aeCreateFileEvent(aeEventLoop *eventLoop, int fd, int mask,aeFileProc *proc, void *clientData)
{// 取出一个文件事件结构aeFileEvent *fe = &eventLoop->events[fd];// 监听指定 fd 的指定事件aeApiAddEvent(eventLoop, fd, mask);// 设置文件事件类型,以及事件的处理器fe->mask |= mask;if (mask & AE_READABLE) fe->rfileProc = proc;if (mask & AE_WRITABLE) fe->wfileProc = proc;// 私有数据fe->clientData = clientData;
}

函数 aeCreateFileEvent 一开始,从 eventLoop->events 获取了一个 aeFileEvent 对象。

接下来调用 aeApiAddEvent。这个函数其实就是对 epoll_ctl 的一个封装。主要就是实际执行 epoll_ctl EPOLL_CTL_ADD。

//file:src/ae_epoll.c
static int aeApiAddEvent(aeEventLoop *eventLoop, int fd, int mask) {// add or modint op = eventLoop->events[fd].mask == AE_NONE ?EPOLL_CTL_ADD : EPOLL_CTL_MOD;......// epoll_ctl 添加事件epoll_ctl(state->epfd,op,fd,&ee);return 0;
}

每一个 eventLoop->events 元素都指向一个 aeFileEvent 对象。在这个对象上,设置了三个关键东西

  • rfileProc:读事件回调

  • wfileProc:写事件回调

  • clientData:一些额外的扩展数据

将来 当 epoll_wait 发现某个 fd 上有事件发生的时候,这样 redis 首先根据 fd 到 eventLoop->events 中查找 aeFileEvent 对象,然后再看 rfileProc、wfileProc 就可以找到读、写回调处理函数。

回头看 initServer 调用 aeCreateFileEvent 时传参来看。

//file: src/server.c
void initServer() {......for (j = 0; j < server.ipfd_count; j++) {aeCreateFileEvent(server.el, server.ipfd[j], AE_READABLE,acceptTcpHandler,NULL);}
}

listen fd 对应的读回调函数 rfileProc 事实上就被设置成了 acceptTcpHandler,写回调没有设置,私有数据 client_data 也为 null。

1.2 io 线程启动

在主线程启动以后,会调用 InitServerLast => initThreadedIO 来创建多个 io 线程。

76ff6fa394444eccd5d0aef589015756.png

将来这些 IO 线程会配合主线程一起共同来处理所有的 read 和 write 任务。

0be2f695fcb10bf1d6263982785e47de.png

我们来看 InitServerLast 创建 IO 线程的过程。

//file:src/server.c
void InitServerLast() {initThreadedIO();......
}
//file:src/networking.c
void initThreadedIO(void) {//如果没开启多 io 线程配置就不创建了if (server.io_threads_num == 1) return;//开始 io 线程的创建for (int i = 0; i < server.io_threads_num; i++) {pthread_t tid;pthread_create(&tid,NULL,IOThreadMain,(void*)(long)i)io_threads[i] = tid;}
}

在 initThreadedIO 中调用 pthread_create 库函数创建线程,并且注册线程回调函数 IOThreadMain。

//file:src/networking.c
void *IOThreadMain(void *myid) {long id = (unsigned long)myid;while(1) {//循环等待任务for (int j = 0; j < 1000000; j++) {if (getIOPendingCount(id) != 0) break;}//允许主线程来关闭自己......//遍历当前线程等待队列里的请求 clientlistIter li;listNode *ln;listRewind(io_threads_list[id],&li);while((ln = listNext(&li))) {client *c = listNodeValue(ln);if (io_threads_op == IO_THREADS_OP_WRITE) {writeToClient(c,0);} else if (io_threads_op == IO_THREADS_OP_READ) {readQueryFromClient(c->conn);} else {serverPanic("io_threads_op value is unknown");}}listEmpty(io_threads_list[id]);}
}

是将当前线程等待队列 io_threads_list[id] 里所有的请求 client,依次取出处理。其中读操作通过 readQueryFromClient 处理, 写操作通过 writeToClient 处理。其中 io_threads_list[id] 中的任务是主线程分配过来的,后面我们将会看到。

二、主线程事件循环

接着我们进入到 Redis 最重要的 aeMain,这个函数就是一个死循环(Redis 不退出的话),不停地执行 aeProcessEvents 函数。

void aeMain(aeEventLoop *eventLoop) {eventLoop->stop = 0;while (!eventLoop->stop) {aeProcessEvents(eventLoop, AE_ALL_EVENTS|AE_CALL_BEFORE_SLEEP|AE_CALL_AFTER_SLEEP);}
}

其中 aeProcessEvents 就是所谓的事件分发器。它通过调用 epoll_wait 来发现所发生的各种事件,然后调用事先注册好的处理函数进行处理。

7faa364ce208d8e77cd9d643b633ef71.png

接着看 aeProcessEvents 函数。

//file:src/ae.c
int aeProcessEvents(aeEventLoop *eventLoop, int flags)
{// 2.3 事件循环处理3:epoll_wait 前进行读写任务队列处理if (eventLoop->beforesleep != NULL && flags & AE_CALL_BEFORE_SLEEP)eventLoop->beforesleep(eventLoop);//epoll_wait发现事件并进行处理numevents = aeApiPoll(eventLoop, tvp);// 从已就绪数组中获取事件aeFileEvent *fe = &eventLoop->events[eventLoop->fired[j].fd];//如果是读事件,并且有读回调函数//2.1 如果是 listen socket 读事件,则处理新连接请求//2.2 如果是客户连接socket 读事件,处理客户连接上的读请求fe->rfileProc()//如果是写事件,并且有写回调函数fe->wfileProc()......
}

其中 aeApiPoll 就是对 epoll_wait 的一个封装而已。

//file: src/ae_epoll.c
static int aeApiPoll(aeEventLoop *eventLoop, struct timeval *tvp) {// 等待事件aeApiState *state = eventLoop->apidata;epoll_wait(state->epfd,state->events,eventLoop->setsize,tvp ? (tvp->tv_sec*1000 + tvp->tv_usec/1000) : -1);...
}

aeProcessEvents 就是调用 epoll_wait 来发现事件。当发现有某个 fd 上事件发生以后,则调为其事先注册的事件处理器函数 rfileProc 和 wfileProc。

2.1 事件循环处理1:新连接到达

在 1.1 节中我们看到,主线程初始化的时候,将 listen socket 上的读事件处理函数注册成了 acceptTcpHandler。也就是说如果有新连接到达的时候,acceptTcpHandler 将会被执行到。

667d747a01400b9d189dac18d3de2431.png

在这个函数内,主要完成如下几件事情。

  • 调用 accept 接收连接

  • 创建一个 redisClient对象

  • 添加到 epoll

  • 注册读事件处理函数

接下来让我们进入 acceptTcpHandler 源码。

//file:src/networking.c
void acceptTcpHandler(aeEventLoop *el, int fd, void *privdata, int mask) {......cfd = anetTcpAccept(server.neterr, fd, cip, sizeof(cip), &cport);acceptCommonHandler(connCreateAcceptedSocket(cfd),0,cip);
}

其中 netTcpAccept 调用 accept 系统调用获取连接,就不展开了。我们看 acceptCommonHandler。

//file: src/networking.c
static void acceptCommonHandler(int fd, int flags) {// 创建客户端redisClient *c;if ((c = createClient(fd)) == NULL) {}
}client *createClient(connection *conn) {client *c = zmalloc(sizeof(client));// 为用户连接注册读事件处理器if (conn) {...connSetReadHandler(conn, readQueryFromClient);connSetPrivateData(conn, c);}selectDb(c,0);c->id = client_id;c->resp = 2;c->conn = conn;......
}

在上面的代码中,我们重点关注connSetReadHandler(conn, readQueryFromClient), 这一行是将这个新连接的读事件处理函数设置成了 readQueryFromClient。

2.2 事件循环处理2:用户命令请求到达

在上面我们看到了, Redis 把用户连接上的读请求处理函数设置成了 readQueryFromClient,这意味着当用户连接上有命令发送过来的时候,会进入 readQueryFromClient 开始执行。

在多线程版本的 readQueryFromClient 中,处理逻辑非常简单,仅仅只是将发生读时间的 client 放到了任务队列里而已。

a9962969f0fb0f6276ac45cbcfc48f66.png

来详细看 readQueryFromClient 代码。

//file:src/networking.c
void readQueryFromClient(connection *conn) {client *c = connGetPrivateData(conn);//如果启动 threaded I/O 的话,直接入队if (postponeClientRead(c)) return;//处理用户连接读请求......c->querybuf = sdsMakeRoomFor(c->querybuf, readlen);nread = connRead(c->conn, c->querybuf+qblen, readlen);processInputBuffer(c);
}

在 postponeClientRead 中判断,是不是开启了多 io 线程,如果开启了的话,那就将有请求数据到达的 client 直接放到读任务队列(server.clients_pending_read)中就算是完事。我们看下 postponeClientRead。

//file:src/networking.c
int postponeClientRead(client *c) {if (server.io_threads_active &&server.io_threads_do_reads &&!ProcessingEventsWhileBlocked &&!(c->flags & (CLIENT_MASTER|CLIENT_SLAVE|CLIENT_PENDING_READ))){c->flags |= CLIENT_PENDING_READ;listAddNodeHead(server.clients_pending_read,c);return 1;} else {return 0;}
}

listAddNodeHead 就是把这个 client 对象添加到 server.clients_pending_read 而已。

2.3 事件循环处理3:epoll_wait 前进行任务处理

在 aeProcessEvents 中假如 aeApiPoll(epoll_wait)中的事件都处理完了以后,则会进入下一次的循环再次进入 aeProcessEvents。

而这一次中 beforesleep 将会处理前面读事件处理函数添加的读任务队列了。

//file:src/ae.c
int aeProcessEvents(aeEventLoop *eventLoop, int flags)
{// 参见 2.4 事件循环处理3:epoll_wait 前进行任务处理if (eventLoop->beforesleep != NULL && flags & AE_CALL_BEFORE_SLEEP)eventLoop->beforesleep(eventLoop);//epoll_wait发现事件并进行处理numevents = aeApiPoll(eventLoop, tvp);......
}

在 beforeSleep 里会依次处理两个任务队列。先处理读任务队列,解析其中的请求,并处理之。然后将处理结果写到缓存中,同时写到写任务队列中。紧接着 beforeSleep 会进入写任务队列处理,会将处理结果写到 socket 里,进行真正的数据发送。

09955c6513b6003f37f6aac46510859b.png

我们来看 beforeSleep 的代码,这个函数中最重要的两个调用是 handleClientsWithPendingReadsUsingThreads(处理读任务队列),handleClientsWithPendingWritesUsingThreads(处理写任务队列)

//file:src/server.c
void beforeSleep(struct aeEventLoop *eventLoop) {//处理读任务队列handleClientsWithPendingReadsUsingThreads();//处理写任务队列handleClientsWithPendingWritesUsingThreads();......
}

值得注意的是,如果开启了多 io 线程的话,handleClientsWithPendingReadsUsingThreads 和 handleClientsWithPendingWritesUsingThreads 中将会是主线程、io 线程一起配合来处理的。所以我们单独分两个小节来阐述。

三、主线程 && io 线程处理读请求

在 handleClientsWithPendingReadsUsingThreads 中,主线程会遍历读任务队列 server.clients_pending_read,把其中的请求分配到每个 io 线程的处理队列 io_threads_list[target_id] 中。然后通知各个 io 线程开始处理。

e26700172072981b345a64103580fc0b.png

3.1 主线程分配任务

我们来看 handleClientsWithPendingReadsUsingThreads 详细代码。

//file:src/networking.c
//当开启了 reading + parsing 多线程 I/O 
//read handler 仅仅只是把 clients 推到读队列里
//而这个函数开始处理该任务队列
int handleClientsWithPendingReadsUsingThreads(void) {//访问读任务队列 server.clients_pending_readlistRewind(server.clients_pending_read,&li);//把每一个任务取出来//添加到指定线程的任务队列里 io_threads_list[target_id]while((ln = listNext(&li))) {client *c = listNodeValue(ln);int target_id = item_id % server.io_threads_num;listAddNodeTail(io_threads_list[target_id],c);item_id++;}//启动Worker线程,处理读请求io_threads_op = IO_THREADS_OP_READ;for (int j = 1; j < server.io_threads_num; j++) {int count = listLength(io_threads_list[j]);setIOPendingCount(j, count);}//主线程处理 0 号任务队列listRewind(io_threads_list[0],&li);while((ln = listNext(&li))) {//需要先干掉 CLIENT_PENDING_READ 标志//否则 readQueryFromClient 并不处理,而是入队client *c = listNodeValue(ln);readQueryFromClient(c->conn);}//主线程等待其它线程处理完毕while(1) {unsigned long pending = 0;for (int j = 1; j < server.io_threads_num; j++)pending += getIOPendingCount(j);if (pending == 0) break;}//再跑一遍任务队列,目的是处理输入while(listLength(server.clients_pending_read)) {......processInputBuffer(c);if (!(c->flags & CLIENT_PENDING_WRITE) && clientHasPendingReplies(c))clientInstallWriteHandler(c);}
}

在主线程中将任务分别放到了 io_threads_list 的第 0 到第 N 个元素里。并对 1 : N 号线程通过 setIOPendingCount 发消息,告诉他们起来处理。这时候 io 线程将会在 IOThreadMain 中收到消息并开始处理读任务。

//file:src/networking.c
void *IOThreadMain(void *myid) {while(1) {//遍历当前线程等待队列里的请求 clientlistRewind(io_threads_list[id],&li);while((ln = listNext(&li))) {client *c = listNodeValue(ln);if (io_threads_op == IO_THREADS_OP_WRITE) {writeToClient(c,0);} else if (io_threads_op == IO_THREADS_OP_READ) {readQueryFromClient(c->conn);} else {serverPanic("io_threads_op value is unknown");}}}
}

在 io 线程中,从自己的 io_threads_list[id] 中遍历获取待处理的 client。如果发现是读请求处理,则进入 readQueryFromClient 开始处理特定的 client。

而主线程在分配完 1 :N 任务队列让其它 io 线程处理后,自己则开始处理第 0 号任务池。同样是会进入到 readQueryFromClient 中来执行。

//file:src/networking.c
int handleClientsWithPendingReadsUsingThreads(void) {......//主线程处理 0 号任务队列listRewind(io_threads_list[0],&li);while((ln = listNext(&li))) {//需要先干掉 CLIENT_PENDING_READ 标志//否则 readQueryFromClient 并不处理,而是入队client *c = listNodeValue(ln);readQueryFromClient(c->conn);}......
}

所以无论是主线程还是 io 线程,处理客户端的读事件都是会进入 readQueryFromClient。我们来看其源码。

3.2 读请求处理

//file:src/networking.c
void readQueryFromClient(connection *conn) {//读取请求nread = connRead(c->conn, c->querybuf+qblen, readlen);//处理请求processInputBuffer(c);
}

在 connRead 中就是调用 read 将 socket 中的命令读取出来,就不展开看了。接着在 processInputBuffer 中将输入缓冲区中的数据解析成对应的命令。解析完命令后真正开始处理它。

//file:src/networking.c
void processInputBuffer(client *c) {while(c->qb_pos < sdslen(c->querybuf)) {//解析命令......//真正开始处理 commandprocessCommandAndResetClient(c);}
}

函数 processCommandAndResetClient 会调用 processCommand,查询命令并开始执行。执行的核心方法是 call 函数,我们直接看它。

//file:src/server.c
void call(client *c, int flags) {// 查找处理命令,struct redisCommand *real_cmd = c->cmd;// 调用命令处理函数c->cmd->proc(c);......
}

在 server.c 中定义了每一个命令对应的处理函数

//file:src/server.c
struct redisCommand redisCommandTable[] = {{"module",moduleCommand,-2,"as",0,NULL,0,0,0,0,0},{"get",getCommand,2,"rF",0,NULL,1,1,1,0,0},{"set",setCommand,-3,"wm",0,NULL,1,1,1,0,0},{"setnx",setnxCommand,3,"wmF",0,NULL,1,1,1,0,0},{"setex",setexCommand,4,"wm",0,NULL,1,1,1,0,0},......{"mget",mgetCommand,-2,"rF",0,NULL,1,-1,1,0,0},{"rpush",rpushCommand,-3,"wmF",0,NULL,1,1,1,0,0},{"lpush",lpushCommand,-3,"wmF",0,NULL,1,1,1,0,0},{"rpushx",rpushxCommand,-3,"wmF",0,NULL,1,1,1,0,0},......
}

对于 get 命令来说,其对应的命令处理函数就是 getCommand。也就是说当处理 GET 命令执行到c->cmd->proc 的时候会进入到 getCommand 函数中来。

//file: src/t_string.c
void getCommand(client *c) {getGenericCommand(c);
}
int getGenericCommand(client *c) {robj *o;if ((o = lookupKeyReadOrReply(c,c->argv[1],shared.null[c->resp])) == NULL)return C_OK;...addReplyBulk(c,o);return C_OK;
}

getGenericCommand 方法会调用 lookupKeyReadOrReply 来从内存中查找对应的 key值。如果找不到,则直接返回 C_OK;如果找到了,调用 addReplyBulk 方法将值添加到输出缓冲区中。

//file: src/networking.c
void addReplyBulk(client *c, robj *obj) {addReplyBulkLen(c,obj);addReply(c,obj);addReply(c,shared.crlf);
}

3.3 写处理结果到发送缓存区

其主体是调用 addReply 来设置回复数据。在 addReply 方法中做了两件事情:

  • prepareClientToWrite 判断是否需要返回数据,并且将当前 client 添加到等待写返回数据队列中。

  • 调用 _addReplyToBuffer 和 _addReplyObjectToList 方法将返回值写入到输出缓冲区中,等待写入 socekt

//file:src/networking.c
void addReply(client *c, robj *obj) {if (prepareClientToWrite(c) != C_OK) return;if (sdsEncodedObject(obj)) {if (_addReplyToBuffer(c,obj->ptr,sdslen(obj->ptr)) != C_OK)_addReplyStringToList(c,obj->ptr,sdslen(obj->ptr));} else {......        }
}

先来看 prepareClientToWrite 的详细实现,

//file: src/networking.c
int prepareClientToWrite(client *c) {......if (!clientHasPendingReplies(c) && !(c->flags & CLIENT_PENDING_READ))clientInstallWriteHandler(c);
}//file:src/networking.c
void clientInstallWriteHandler(client *c) {c->flags |= CLIENT_PENDING_WRITE;listAddNodeHead(server.clients_pending_write,c);
}

其中 server.clients_pending_write 就是我们说的任务队列,队列中的每一个元素都是有待写返回数据的 client 对象。在 prepareClientToWrite 函数中,把 client 添加到任务队列 server.clients_pending_write 里就算完事。

接下再来 _addReplyToBuffer,该方法是向固定缓存中写,如果写不下的话就继续调用 _addReplyStringToList 往链表里写。简单起见,我们只看 _addReplyToBuffer 的代码。

//file:src/networking.c
int _addReplyToBuffer(client *c, const char *s, size_t len) {......// 拷贝到 client 对象的 Response buffer 中memcpy(c->buf+c->bufpos,s,len);c->bufpos+=len;return C_OK;
}

要注意的是,本节的读请求处理过程是主线程和 io 线程在并行执行的。主线程在处理完后会等待其它的 io 线程处理。在所有的读请求都处理完后,主线程 beforeSleep 中对 handleClientsWithPendingReadsUsingThreads 的调用就结束了。

四、主线程 && io 线程配合处理写请求

当所有的读请求处理完后,handleClientsWithPendingReadsUsingThreads 会退出。主线程会紧接着进入 handleClientsWithPendingWritesUsingThreads 中来处理。

2b0a05bd801319007d754fbe9287db3d.png

//file:src/server.c
void beforeSleep(struct aeEventLoop *eventLoop) {//处理读任务队列handleClientsWithPendingReadsUsingThreads();//处理写任务队列handleClientsWithPendingWritesUsingThreads();......
}

4.1 主线程分配任务

//file:src/networking.c
int handleClientsWithPendingWritesUsingThreads(void) {//没有开启多线程的话,仍然是主线程自己写if (server.io_threads_num == 1 || stopThreadedIOIfNeeded()) {return handleClientsWithPendingWrites();}......//获取待写任务int processed = listLength(server.clients_pending_write);//在N个任务列表中分配该任务listIter li;listNode *ln;listRewind(server.clients_pending_write,&li);int item_id = 0;while((ln = listNext(&li))) {client *c = listNodeValue(ln);c->flags &= ~CLIENT_PENDING_WRITE;/* Remove clients from the list of pending writes since* they are going to be closed ASAP. */if (c->flags & CLIENT_CLOSE_ASAP) {listDelNode(server.clients_pending_write, ln);continue;}//hash的方式进行分配int target_id = item_id % server.io_threads_num;listAddNodeTail(io_threads_list[target_id],c);item_id++;}//告诉对应的线程该开始干活了io_threads_op = IO_THREADS_OP_WRITE;for (int j = 1; j < server.io_threads_num; j++) {int count = listLength(io_threads_list[j]);setIOPendingCount(j, count);}//主线程自己也会处理一些listRewind(io_threads_list[0],&li);while((ln = listNext(&li))) {client *c = listNodeValue(ln);writeToClient(c,0);}listEmpty(io_threads_list[0]);//循环等待其它线程结束处理while(1) {unsigned long pending = 0;for (int j = 1; j < server.io_threads_num; j++)pending += getIOPendingCount(j);if (pending == 0) break;}......
}

在 io 线程中收到消息后,开始遍历自己的任务队列 io_threads_list[id],并将其中的 client 挨个取出来开始处理。

//file:src/networking.c
void *IOThreadMain(void *myid) {while(1) {//遍历当前线程等待队列里的请求 clientlistRewind(io_threads_list[id],&li);while((ln = listNext(&li))) {client *c = listNodeValue(ln);if (io_threads_op == IO_THREADS_OP_WRITE) {writeToClient(c,0);} else if (io_threads_op == IO_THREADS_OP_READ) {readQueryFromClient(c->conn);} }listEmpty(io_threads_list[id]);}
}

4.2 写请求处理

由于这次任务队列里都是写请求,所以 io 线程会进入 writeToClient。而主线程在分配完任务以后,自己开始处理起了 io_threads_list[0],并也进入到 writeToClient。

//file:src/networking.c
int writeToClient(int fd, client *c, int handler_installed) {while(clientHasPendingReplies(c)) {// 先发送固定缓冲区if (c->bufpos > 0) {nwritten = write(fd,c->buf+c->sentlen,c->bufpos-c->sentlen);if (nwritten <= 0) break;......// 再发送回复链表中数据} else {o = listNodeValue(listFirst(c->reply));nwritten = write(fd, o->buf + c->sentlen, objlen - c->sentlen);......}}
}

writeToClient 中的主要逻辑就是调用 write 系统调用让内核帮其把数据发送出去即可。由于每个命令的处理结果大小是不固定的。所以 Redis 采用的做法用固定的 buf + 可变链表来储存结果字符串。这里自然发送的时候就需要分别对固定缓存区和链表来进行发送了。

当所有的写请求也处理完后,beforeSleep 就退出了。主线程将会再次调用 epoll_wait 来发现请求,进入下一轮的用户请求处理。

五、总结

//file: src/server.c
int main(int argc, char **argv) {......// 1.1 主线程初始化initServer();// 1.2 启动 io 线程InitServerLast();// 进入事件循环aeMain(server.el);
}

在 initServer 这个函数内,Redis 做了这么三件重要的事情。

  • 创建一个 epoll 对象

  • 对配置的监听端口进行 listen

  • 把 listen socket 让 epoll 给管理起来

在 initThreadedIO 中调用 pthread_create 库函数创建线程,并且注册线程回调函数 IOThreadMain。在 IOThreadMain 中等待其队列 io_threads_list[id] 产生请求,当有请求到达的时候取出 client,依次处理。其中读操作通过 readQueryFromClient 处理, 写操作通过 writeToClient 处理。

主线程在 aeMain 函数中,是一个无休止的循环,它是 Redis 中最重要的部分。它先是调用事件分发器发现事件。如果有新连接请求到达的时候,执行 accept 接收新连接,并为其注册事件处理函数。

当用户连接上有命令请求到达的时候,主线程在 read 处理函数中将其添加到读发送队列中。然后接着在 beforeSleep 中开启对读任务队列和写任务队列的处理。总体工作过程如下图所示。

69f75960437899893f094b5505d8368f.png

在这个处理过程中,对读任务队列和写任务队列的处理都是多线程并行进行的(前提是开篇我们开启了多 IO 线程并且也并发处理读)。

当读任务队列和写任务队列的都处理完的时候,主线程再一次调用 epoll_wait 去发现新的待处理事件,如此往复循环进行处理。

至此,多线程版本的 Redis 的工作原理就介绍完了。坦白讲,我觉得这种多线程模型实现的并不足够的好。

原因是主线程是在处理读、写任务队列的时候还要等待其它的 io 线程处理完才能进入下一步。假设这时有 10 个用户请求到达,其中 9 个处理耗时需要 1 ms,而另外一个命令需要 1 s。则这时主线程仍然会等待这个 io 线程处理 1s 结束后才能进入后面的处理。整个 Redis 服务还是被一个耗时的命令给 block 住了。

766ffce51c17a6bb941fa9483d6baa6d.gif

往期推荐

协程到底有什么用?6种I/O模式告诉你!

快速入门 Docker 的五种网络模式

Redis 内存满了怎么办?这样置才正确!

Kubernetes 弃用 Docker ,我们该怎么办?

26abcc69cf133dc643b7277ade10efe6.gif

点分享

fbfe39c1d45d479ce13b76c0f0dac8b1.gif

点收藏

553a65e72c9c19637d2a982c92732a2e.gif

点点赞

9391e827ef8ec3797b83af0b48ca53c9.gif

点在看

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/news/511690.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

如何构建流量无损的在线应用架构 | 专题开篇

简介&#xff1a;本篇是整个《如何构建流量无损的在线应用架构》系列的第一篇&#xff0c;这一系列共三篇&#xff0c;旨在使用最为朴素的语言将影响在线应用流量稳定性的技术问题做一个归类&#xff0c;这些问题的解决方案有的只是一些代码层面的细节&#xff0c;有的需要工具…

云原生时代的运维体系进化

简介&#xff1a;基于容器、Kubernetes 等云原生技术&#xff0c;提供的开放社区标准、不可变基础设施、声明式 API 会成为企业 CloudOps 的最佳实践&#xff0c;也将在这个基础上推进数据化、智能化体系建设&#xff0c;将运维复杂性进一步下沉&#xff0c;让企业可以聚焦于自…

企业如何从 0 到 1 构建整套全链路追踪体系

简介&#xff1a;本文将分享 ARMS 在全链路追踪领域的最佳实践&#xff0c;分享主要分为四部分。首先&#xff0c;是对分布式链路追踪的整体简介。其次&#xff0c;是对 ARMS 在分布式链路追踪领域的核心能力进行介绍。然后&#xff0c;介绍如何从 0 到 1 构建整套全链路追踪体…

React18 的 useEffect 新特性为什么被疯狂吐槽?

作者 | 零一来源 | 前端印象react18 已经出来一段时间了&#xff0c;create-react-app 默认安装的 React 版本也已经是 18&#xff0c;不知道有没有小伙伴发现自己有点看不懂 React 了&#xff1f;import { useEffect, useState } from reactfunction App () {const [data, set…

如何构建一个流量无损的在线应用架构 | 专题中篇

简介&#xff1a;本篇是整个《如何流量无损的在线应用架构》系列的第二篇&#xff0c;这一系列共三篇&#xff0c;旨在使用最为朴素的语言将影响在线应用流量稳定性的技术问题做一个归类&#xff0c;这些问题的解决方案有的只是一些代码层面的细节&#xff0c;有的需要工具进行…

一文读懂蓝绿发布、A/B 测试和金丝雀发布的优缺点

简介&#xff1a;目前&#xff0c;业界已经总结出了几种常见的服务发布策略来解决版本升级过程中带来的流量有损问题。本文首先会对这些普遍的发布策略进行简单的原理解析&#xff0c;最后结合阿里云的云原生网关对这些发布策略进行实践。 作者 | 扬少 背景 目前&#xff0c…

Kafka 到底有多高可靠?

作者 | 敖丙来源 | 敖丙什么叫可靠性&#xff1f;大家都知道&#xff0c;系统架构有三高&#xff1a;「高性能、高并发和高可用」&#xff0c;三者的重要性不言而喻。对于任意系统&#xff0c;想要同时满足三高都是一件非常困难的事情&#xff0c;大型业务系统或者传统中间件都…

阿里云张振尧:阿里云边缘云驱动5G时代行业新价值

简介&#xff1a;近日&#xff0c;以“5G融合通信趋势下的技术创新”为主题的2021中国增值电信及虚拟运营高峰论坛在北京召开&#xff0c;阿里云边缘云高级产品专家张振尧发表了《阿里云边缘云驱动5G时代行业新价值》主题演讲&#xff0c;分享了阿里云边缘云作为5G时代的新基础…

美的工业技术亮相2022汉诺威工业博览会,助力全球工业向数字化与可持续迈进

2022年5月31日&#xff0c;2022汉诺威工业博览会开幕并重启线下展览&#xff0c;美的工业技术以“科技驱动&#xff0c;拥抱高效、绿色、智能的工业未来”为主题&#xff0c;携旗下工业自动化品牌“高创”、 “合康新能”和“东菱”&#xff0c;以覆盖自动化、绿色能源领域的领…

hyengine - 面向移动端的高性能通用编译/解释引擎

简介&#xff1a;手机淘宝客户端在历史上接过多种多样的脚本引擎&#xff0c;用于支持的语言包括&#xff1a;js/python/wasm/lua&#xff0c;其中js引擎接过的就有&#xff1a;javascriptcore/duktape/v8/quickjs 等多个。众多的引擎会面临共同面临包大小及性能相关的问题&…

如何进行基于Anolis OS的企业级Java应用规模化实践?|龙蜥技术

简介&#xff1a;提供了724小时的专属钉钉或者电话支持&#xff0c;响应时间保证到在业务不可用情况下10分钟响应&#xff0c;业务一般的问题在一小时可以获得响应&#xff0c;主要城市可以两小时内得到到达现场的服务。 本文作者郁磊&#xff0c;是Java语言与虚拟机SIG负责人…

大数据的下一站 DataOps,智领云发布纯 K8s 云原生数据平台 BDOS Online

最近几年&#xff0c;业界对数据中台的追捧度像坐过山车从高点走低&#xff0c;但在数字化和业务创新驱动下&#xff0c;对数据管理与分析的热度在今年不降反升。 以往搭建一套 Hadoop 大数据平台&#xff0c;技术团队重点要搞定数据的采集、存储、处理和数仓的设计搭建等复杂动…

“全”事件触发:阿里云函数计算与事件总线产品完成全面深度集成

简介&#xff1a;目前&#xff0c;函数计算已具备接入EventBridge所有事件源的触发能力&#xff0c;实现触达阿里云全系产品服务的“最后一公里”。 作者&#xff1a;史明伟&#xff08;世如&#xff09;阿里云高级技术专家 随着云原生技术的普及和落地&#xff0c;企业在构建…

开源 Serverless 里程碑:Knative 1.0 来了

简介&#xff1a;近期Knative发布了1.0版本&#xff0c;达到了一个重要的里程碑。Knative自2018年7月首次发布以来, 版本不断的迭代发展&#xff0c;除了无数的错误修复、稳定性和性能增强之外&#xff0c;按时间顺序还进行了一些改进&#xff0c;下文将进行简单介绍。 作者&a…

勒索软件攻击层出不穷,企业如何做好数据保护?

近日&#xff0c;“搜狐员工遭遇工资补助诈骗”事件引起广泛热议&#xff1a;搜狐员工收到一封来自“搜狐财务部”名为《5月份员工工资补助通知》的邮件&#xff0c;员工按照邮件要求扫码&#xff0c;填写银行账号等信息后&#xff0c;大家并没有等到“补助”&#xff0c;并且工…

以一致的体验交付和管理云原生多集群应用

简介&#xff1a;本次文章将首先介绍云原生应用交付和管理的挑战&#xff0c;然后介绍这背后的 KubeVela 和 OCM 技术原理&#xff0c;最后是整体的最佳实践&#xff0c;以及一个完整的 Demo。 作者&#xff1a;冯泳&#xff0c;孙健波 大家好&#xff0c;很高兴能在 KubeCon…

阿里云低代码音视频工厂正式上线,为企业用户提供音视频开发最短路径

简介&#xff1a;阿里云低代码音视频工厂正式上线&#xff0c;极大程度降低音视频开发门槛&#xff0c;打破传统音视频开发壁垒&#xff0c;全新定义音视频应用开发。 1月5日&#xff0c;阿里云低代码音视频工厂正式上线&#xff0c;极大程度降低音视频开发门槛&#xff0c;打…

网络的现代化建设如何进行?详解 Aruba 平台重要特性

作者 | 宋慧 出品 | CSDN 云计算 5G 和 IoT 的快速发展&#xff0c;以及新商业环境的挑战下&#xff0c;网络也在进入新的发展阶段。 商业竞争变化&#xff0c;企业纷纷采取数字化转型以提升创新性和效率。另外&#xff0c;疫情之后&#xff0c;混合办公模式的普及和常态化后&…

阿里云刘强:无影云电脑构建云上安全办公室

简介&#xff1a;无影云电脑提供触手可及的算力&#xff0c;在云办公、外企办公、分支机构办公、软件开发、人力外包等场景构建云上安全办公室。 2021年12月21日&#xff0c;阿里云弹性计算年度峰会在上海正式举行&#xff0c;并通过全实景进行直播。峰会上&#xff0c;阿里云…

掘地三尺搞定 Redis 与 MySQL 数据一致性问题

‍作者 | 就是码哥呀来源 | 码哥字节Redis 拥有高性能的数据读写功能&#xff0c;被我们广泛用在缓存场景&#xff0c;一是能提高业务系统的性能&#xff0c;二是为数据库抵挡了高并发的流量请求。把 Redis 作为缓存组件&#xff0c;需要防止出现以下的一些问题&#xff0c;否则…