I/O复用之 epoll使用详解 Linux编程

epoll 是 Linux 内核提供的一种用于多路复用 I/O 事件通知的机制，专为高效处理大量并发连接而设计。它被广泛应用于网络服务器和高性能应用中，主要用于监控多个文件描述符（如套接字、管道、文件等）上的事件（可读、可写、异常等）。

相比 select 和 poll，epoll 提供了更好的性能，尤其在文件描述符数量非常大的情况下。epoll 的优势来自其对事件的高效管理和通知机制。

`epoll` 的核心特性

事件驱动：epoll 是事件驱动的多路复用技术，可以监控大量的 I/O 事件，并在事件发生时通知用户程序处理。
常量级性能（O(1)）：epoll 在监控大量文件描述符时，性能不会随着描述符的数量线性增长。相比之下，select 和 poll 需要遍历整个文件描述符集，因而性能会随着描述符数量增加而下降。
水平触发 (Level-Triggered, LT) 和边缘触发 (Edge-Triggered, ET)：
- 水平触发：默认模式，当文件描述符处于就绪状态时，每次调用 epoll_wait 都会返回该描述符。
- 边缘触发：当文件描述符从非就绪变为就绪状态时，仅在状态变化时通知一次。因此，必须将文件描述符设置为非阻塞模式，并在每次事件通知时一次性读取所有可用数据，否则会错过后续事件。
内核事件队列：epoll 会在内核中创建一个事件队列，用户程序可以通过 epoll_wait 从该队列获取已经就绪的事件。

`epoll` 的工作原理

epoll 的工作可以分为以下三个步骤：

创建 epoll 实例：通过 epoll_create1 创建一个 epoll 实例，该实例类似于一个容器，用于存储需要监控的文件描述符及其事件。
注册、修改或删除文件描述符：通过 epoll_ctl 将需要监控的文件描述符添加到 epoll 实例中，或者修改、删除现有的文件描述符。
等待事件：通过 epoll_wait 等待注册的文件描述符发生指定的事件，当有事件发生时，返回事件的文件描述符。

`epoll` 函数详细说明

1. `epoll_create1`

epoll_create1 用于创建一个 epoll 实例，并返回一个用于管理文件描述符的文件描述符。

函数原型：

int epoll_create1(int flags);

参数：

flags：用于指定创建时的行为。可取值为：
- 0：默认行为。
- EPOLL_CLOEXEC：设置 FD_CLOEXEC 标志，表示在 exec() 调用后自动关闭该 epoll 文件描述符。

返回值：

成功时返回一个 epoll 文件描述符（正整数）。
失败时返回 -1，并设置 errno 指明错误类型。

示例：

int epfd = epoll_create1(0); // 创建 epoll 实例
if (epfd == -1) {perror("epoll_create1 failed");exit(EXIT_FAILURE);
}

注意：

早期的 epoll_create 函数要求传入一个参数来表示监听的最大文件描述符数量，但该参数已经被忽略，推荐使用 epoll_create1 代替。
EPOLL_CLOEXEC 可以防止文件描述符在执行 fork() 和 exec() 时被意外继承。

2. `epoll_ctl`

epoll_ctl 是用于向 epoll 实例中添加、修改或删除文件描述符。它是 epoll 的核心控制函数。

函数原型：

int epoll_ctl(int epfd, int op, int fd, struct epoll_event *event);

参数：

epfd：通过 epoll_create1 返回的 epoll 文件描述符。
op：操作类型，表示是添加、修改还是删除文件描述符。可选值：
- EPOLL_CTL_ADD：将 fd 添加到 epoll 实例中，监控指定的事件。
- EPOLL_CTL_MOD：修改 fd 已注册的事件。
- EPOLL_CTL_DEL：从 epoll 实例中删除 fd。
fd：需要监控的文件描述符。
event：描述监控的事件。是 struct epoll_event 类型的指针：
```
struct epoll_event {uint32_t events;   // 要监控的事件类型（如 EPOLLIN、EPOLLOUT 等）epoll_data_t data; // 用户自定义的数据，可以是 fd 或指针
};
```
常见的事件类型包括：
- EPOLLIN：文件描述符可读。
- EPOLLOUT：文件描述符可写。
- EPOLLRDHUP：对端关闭连接。
- EPOLLERR：发生错误。
- EPOLLHUP：挂起事件。
- EPOLLET：边缘触发模式。

返回值：

成功时返回 0。
失败时返回 -1，并设置 errno 指明错误类型。

示例：

struct epoll_event ev;
ev.events = EPOLLIN | EPOLLET; // 监控可读事件，并启用边缘触发
ev.data.fd = sockfd;           // 用户数据，这里存储的是套接字文件描述符if (epoll_ctl(epfd, EPOLL_CTL_ADD, sockfd, &ev) == -1) {perror("epoll_ctl: sockfd");exit(EXIT_FAILURE);
}

注意：

边缘触发 vs 水平触发：默认是水平触发模式。如果需要边缘触发，需要在 events 中设置 EPOLLET。
非阻塞模式：当使用边缘触发模式时，推荐将文件描述符设置为非阻塞模式，以确保不会错过事件。

3. `epoll_wait`

epoll_wait 用于等待 epoll 实例中的文件描述符上发生事件。该函数会阻塞直到有事件发生或超时时间到。

函数原型：

int epoll_wait(int epfd, struct epoll_event *events, int maxevents, int timeout);

参数：

epfd：通过 epoll_create1 创建的 epoll 文件描述符。
events：指向 epoll_event 结构体的数组，用于返回已发生事件的文件描述符及事件类型。
maxevents：该数组的大小，表示最多返回多少个事件。
timeout：等待事件的超时时间（毫秒），可取值：
- 0：立即返回，不阻塞（可用于轮询）。
- -1：无限期阻塞，直到至少一个事件发生。
- 0：阻塞指定的毫秒数。

返回值：

成功时返回准备好的文件描述符的数量（正整数）。
超时时返回 0。
失败时返回 -1，并设置 errno。

示例：

struct epoll_event events[MAX_EVENTS];
int nfds = epoll_wait(epfd, events, MAX_EVENTS, -1); // -1 表示无限期等待
if (nfds == -1) {perror("epoll_wait failed");exit(EXIT_FAILURE);
}for (int i = 0; i < nfds; ++i) {if (events[i].events & EPOLLIN) {// 处理可读事件int fd = events[i].data.fd;char buf[1024];int n = read(fd, buf, sizeof(buf));if (n == -1) {perror("read error");close(fd);} else if (n == 0) {// 对端关闭close(fd);} else {// 处理读取到的数据printf("Read %d bytes from fd %d: %s\n", n, fd, buf);}}
}

注意：

返回的 events 数组中，包含的是已经触发事件的文件描述符和事件类型，使用 events[i].data.fd 访问文件描述符，events[i].events 访问事件类型。
超时机制：在高并发应用中，设置合适的超时时间可以确保程序在等待时不会无限期阻塞，或者可以结合 timeout = 0 实现非阻塞轮询。

`epoll` 使用流程

创建 epoll 实例：
```
int epfd = epoll_create1(0);
```

注册文件描述符：

struct epoll_event ev;
ev.events = EPOLLIN;  // 监控可读事件
ev.data.fd = sockfd;  // 需要监控的套接字文件描述符
epoll_ctl(epfd, EPOLL_CTL_ADD, sockfd, &ev);

等待事件：

struct epoll_event events[MAX_EVENTS];
int nfds = epoll_wait(epfd, events, MAX_EVENTS, -1);
for (int i = 0; i < nfds; i++) {if (events[i].events & EPOLLIN) {// 处理可读事件}
}

删除文件描述符并关闭 epoll 实例：

epoll_ctl(epfd, EPOLL_CTL_DEL, sockfd, NULL);
close(epfd);

`epoll` 使用示例

文件保存

将下面的 epoll 使用示例代码保存为 epoll_server.c：

#include <sys/epoll.h>
#include <unistd.h>
#include <stdio.h>
#include <stdlib.h>
#include <string.h>
#include <arpa/inet.h>
#include <errno.h>#define MAX_EVENTS 10
#define PORT 8080int main() {int server_fd, new_socket, epfd, nfds;struct sockaddr_in address;struct epoll_event ev, events[MAX_EVENTS];// 创建监听套接字server_fd = socket(AF_INET, SOCK_STREAM, 0);address.sin_family = AF_INET;address.sin_addr.s_addr = INADDR_ANY;address.sin_port = htons(PORT);bind(server_fd, (struct sockaddr *)&address, sizeof(address));listen(server_fd, 10);// 创建 epoll 实例epfd = epoll_create1(0);if (epfd == -1) {perror("epoll_create1");exit(EXIT_FAILURE);}// 注册监听套接字的可读事件ev.events = EPOLLIN;ev.data.fd = server_fd;if (epoll_ctl(epfd, EPOLL_CTL_ADD, server_fd, &ev) == -1) {perror("epoll_ctl: server_fd");exit(EXIT_FAILURE);}while (1) {// 等待事件发生nfds = epoll_wait(epfd, events, MAX_EVENTS, -1);if (nfds == -1) {perror("epoll_wait");exit(EXIT_FAILURE);}// 处理每个已发生的事件for (int i = 0; i < nfds; i++) {if (events[i].data.fd == server_fd) {// 新连接到来new_socket = accept(server_fd, NULL, NULL);ev.events = EPOLLIN;ev.data.fd = new_socket;epoll_ctl(epfd, EPOLL_CTL_ADD, new_socket, &ev);} else {// 处理客户端连接上的可读事件char buf[1024];int fd = events[i].data.fd;int bytes = read(fd, buf, sizeof(buf));if (bytes <= 0) {// 客户端断开连接close(fd);epoll_ctl(epfd, EPOLL_CTL_DEL, fd, NULL);} else {// 处理读取到的数据printf("Received data: %s\n", buf);}}}}close(server_fd);close(epfd);return 0;
}

编译

在终端中，使用 GCC 编译该程序：

gcc -o epoll_server epoll_server.c

2. 运行步骤

启动服务器

编译完成后，运行服务器程序：

./epoll_server

此时服务器将在 8080 端口监听客户端的连接。

运行客户端（使用 `telnet` 或 `nc`）

你可以使用 telnet 或 netcat (nc) 工具来连接服务器：

使用 telnet：
```
telnet localhost 8080
```
使用 nc：
```
nc localhost 8080
```

在成功连接到服务器后，你可以输入一些文本数据并按回车键，服务器会收到并显示发送的数据。

3. 预期输出结果

在服务器端的终端上，程序运行后将等待客户端连接和数据输入。当客户端连接并发送数据时，服务器会输出接收到的数据。

服务器端输出：

Received data: Hello from client 1
Received data: How are you?
Received data: Another message from client 1

客户端输出：

如果使用 telnet 或 nc，则会显示你输入的数据，如：

Hello from client 1
How are you?
Another message from client 1

4. 注意事项

如果多个客户端连接到服务器，epoll 会同时监控这些连接，并处理它们发送的数据。
服务器不会自动关闭，需要手动通过 Ctrl+C 终止。

`epoll` 与 `select`、`poll` 的对比

特性	`select`	`poll`	`epoll`
复杂度	O(n)	O(n)	O(1)
文件描述符限制	1024（默认）	无	无
性能	随文件描述符增多而下降	随文件描述符增多而下降	文件描述符数量无关
内存拷贝	每次调用都要将 fd 集合拷贝到内核	同上	初次注册后无需拷贝