以下内容源于网络资源的学习与整理,如有侵权请告知删除。
基于TCP通信的服务模式
服务端
socket函数,获取网络连接的文件描述符
bind函数,将服务器的端口、ip地址与socket函数创建的文件描述符绑定
listen函数,监听服务器的当前端口(其他端口不监听)
accept函数,阻塞以等待用户连接
客服端
socket函数,获取网络连接的文件描述符
connect函数,连接服务器
连接上之后:
send函数,客服端给服务器发送数据
recv函数,客服端接收服务器的回复
一、服务器端
socket()函数
函数原型
int socket(int af, int type, int protocol);
函数作用
此函数用来创建套接字,确定套接字的各种属性。函数返回一个isocket的文件描述符,是int类型的整数。
参数说明
(1)af
- af 表示IP地址类型,可取值为 AF_INET、AF_INET6。
- 其中AF_INET 表示 IPv4 地址,例如 127.0.0.1;AF_INET6 表示 IPv6 地址,如 1030::C9B4:FF12:48AA:1A2B。
(2)type
- type 表示数据传输方式,或者说套接字类型,可取值为 SOCK_STREAM 和 SOCK_DGRAM。
- SOCK_STREAM 表示流格式套接字(即面向连接的套接字);SOCK_DGRAM 表示数据报套接字(即无连接的套接字)。
(3)protocol
- protocol表示传输协议,常用的有 IPPROTO_TCP 和 IPPTOTO_UDP,分别表示 TCP 传输协议和 UDP 传输协议。
补充说明
(1)socket函数在<sys/socket.h> 头文件中,使用时要包含该文件。
(2)为什么需要protocol这个参数?
一般情况下指定 af 和 type 参数就可以创建套接字了,操作系统会自动推演出协议类型(此时protocol参数的值可以设置为0),除非有两种不同的协议支持同一种地址类型和数据传输类型,此时操作系统没办法自动推演,需要指定protocol这个参数。
比如使用IPv4地址而且使用 SOCK_STREAM 传输数据的协议只有 TCP,那么操作系统会自动推导出协议类型为TCP,那么调用socket()函数的方式有两种:(将protocol的值设为0,或者显式地设为 IPPROTO_TCP )
int tcp_socket = socket(AF_INET, SOCK_STREAM, 0);
int tcp_socket = socket(AF_INET, SOCK_STREAM, IPPROTO_TCP);
bind()函数
函数原型
int bind(int sock, struct sockaddr *addr, socklen_t addrlen);
函数作用
该函数将套接字与特定的 IP 地址和端口绑定起来。只有这样,流经该 IP 地址和端口的数据才能交给套接字处理。
参数说明
(1)sock 是使用socket()函数创建套接字时返回的文件描述符。
(2)addr 是指向(struct sockaddr 这个结构体类型所定义的)变量的指针。
(3)addrlen 是 struct sockaddr 这个结构体类型所定义的变量的大小,可由 sizeof() 计算得出。
代码分析
下面代码作用:将创建的套接字与IP地址 127.0.0.1、端口 1234 绑定
//创建套接字 int serv_sock = socket(AF_INET, SOCK_STREAM, IPPROTO_TCP);//创建sockaddr_in结构体变量 struct sockaddr_in serv_addr; memset(&serv_addr, 0, sizeof(serv_addr)); //每个字节都用0填充 serv_addr.sin_family = AF_INET; //使用IPv4地址 serv_addr.sin_addr.s_addr = inet_addr("127.0.0.1"); //具体的IP地址 serv_addr.sin_port = htons(1234); //端口//将套接字和IP、端口绑定 bind(serv_sock, (struct sockaddr*)&serv_addr, sizeof(serv_addr));//这里进行数据类型强制转化
(1) struct sockaddr_in 结构体
我们来看一下struct sockaddr_in 结构体的定义:
struct sockaddr_in{sa_family_t sin_family; //地址族(Address Family),也就是地址类型uint16_t sin_port; //16位的端口号struct in_addr sin_addr; //32位IP地址char sin_zero[8]; //不使用,一般用0填充 };
- sin_family 和 socket() 函数的第一个参数的含义相同,取值也保持一致。(不过它是unsigned short类型的,占两个字节,而socket() 函数的第一个参数是int类型的,占4个字节。)
- sin_prot 为端口号。uint16_t 的长度为两个字节,理论上端口号的取值范围为 0~65536,但是 0~1023 的端口一般由系统分配给特定的服务程序,例如 Web 服务的端口号为 80,FTP 服务的端口号为 21,所以我们的程序要尽量在 1024~65536 之间分配端口号。
- sin_addr 是 struct in_addr 结构体类型的变量。
- sin_zero[8] 是多余的8个字节,没有用,一般使用 memset() 函数填充为 0。
这里的 struct in_addr 结构体只包含一个成员,如下所示:
struct in_addr{in_addr_t s_addr; //32位的IP地址 };
in_addr_t 在头文件 <netinet/in.h> 中定义,它等价于 unsigned long,长度为4个字节。这说明 s_addr 是一个整数,而代码中定义的IP地址是字符串“127.0.0.1”,所以上面代码中使用 inet_addr() 函数进行转换。转后serv_addr.sin_addr.s_addr =16777343。
为什么要搞这么复杂,struct sockaddr_in结构体中嵌套struct in_addr结构体,而不用 sockaddr_in 的一个成员变量来直接指明IP地址呢?另外,socket() 函数的第一个参数已经指明了地址类型,为什么在 sockaddr_in 结构体中还要再说明一次呢?
这些繁琐的细节确实给初学者带来了一定的障碍,我想,这或许是历史原因吧,后面的接口总要兼容前面的代码。
(2)struct sockaddr 结构体
上述代码先创建 struct sockaddr_in 类型变量,然后在bind()函数中强制转换为 struct sockaddr 类型。为何不直接创建 struct sockaddr 类型变量呢?毕竟bind()函数第二个参数类型就是 struct sockaddr 类型的 。
我们看一下struct sockaddr 结构体的定义:
struct sockaddr{sa_family_t sin_family; //地址族(Address Family),也就是地址类型char sa_data[14]; //IP地址和端口号 };
下图是 struct sockaddr 与 struct sockaddr_in 的对比(括号中的数字表示所占用的字节数):
struct sockaddr 和 struct sockaddr_in 的长度相同,都是16字节,只是将IP地址和端口号合并到一起,用一个成员 sa_data 表示。要想给 sa_data 赋值,必须同时指明IP地址和端口号,例如”127.0.0.1:80“。遗憾的是,没有相关函数将这个字符串转换成需要的形式,也就很难给 sockaddr 类型的变量赋值,所以使用 sockaddr_in 来代替。这两个结构体的长度相同,强制转换类型时不会丢失字节,也没有多余的字节。
可以认为,struct sockaddr 是一种通用的结构体,可以用来保存多种类型的IP地址和端口号,但由于它使用不便,才针对不同的地址类型定义了不同的结构体,然后在使用的时候再强制类型转换。比如 struct sockaddr_in 是专门用来保存 IPv4 地址的结构体;而struct sockaddr_in6是专门用来保存 IPv6 地址的结构体,它的定义如下:struct sockaddr_in6 {sa_family_t sin6_family; //(2)地址类型,取值为AF_INET6in_port_t sin6_port; //(2)16位端口号uint32_t sin6_flowinfo; //(4)IPv6流信息struct in6_addr sin6_addr; //(4)具体的IPv6地址uint32_t sin6_scope_id; //(4)接口范围ID };
listen()函数
函数原型
int listen(int sock, int backlog); //Linux
函数作用
listen() 函数可以让套接字进入被动监听状态。
参数说明
(1)sock 是为需要进入监听状态的套接字。
(2)backlog 是请求队列的最大长度。
补充说明
(1)被动监听
指当没有客户端请求时,套接字处于“睡眠”状态,只有当接收到客户端请求时,套接字才会被“唤醒”来响应请求。
(2)请求队列
当套接字正在处理客户端请求时,如果有新的请求进来,套接字是没法处理的,只能把它放进缓冲区,待当前请求处理完毕后,再从缓冲区中读取出来处理。如果不断有新的请求进来,它们就按照先后顺序在缓冲区中排队,直到缓冲区满。这个缓冲区,就称为请求队列(Request Queue)。
缓冲区的长度(能存放多少个客户端请求)可以通过 listen() 函数的 backlog 参数指定,但究竟为多少并没有什么标准,可以根据你的需求来定,并发量小的话可以是10或者20。
如果将 backlog 的值设置为 SOMAXCONN,就由系统来决定请求队列长度,这个值一般比较大,可能是几百,或者更多。
当请求队列满时,就不再接收新的请求,对于 Linux,客户端会收到 ECONNREFUSED 错误,对于 Windows,客户端会收到 WSAECONNREFUSED 错误。
(3)注意
listen()函数只是让套接字处于监听状态,并没有接收请求。接收请求需要使用 accept() 函数。
accept()函数
函数原型
int accept(int sock, struct sockaddr *addr, socklen_t *addrlen); //Linux
函数作用
当套接字处于监听状态时,可以通过 accept() 函数来接收客户端请求。accept() 函数如果正确返回一个新的套接字的文件描述符,则表示服务器和客户端成功建立一个TCP连接。
参数说明
(1)sock 为服务器端套接字。
(2)addr 为 指向 struct sockaddr_in 结构体变量的指针。
(3)addrlen 是 addr 这个指针指向的变量所占空间大小,可由 sizeof() 求得。
补充说明
(1) 该函数的第一个参数 sock 是服务器端创建的套接字的文件描述符(我们把它叫做监听fd),而该函数的返回值是一个新的套接字的文件描述符(我们把它叫做连接fd)。编写代码的时候要特别注意:服务器端和客户端通信时,服务器端要使用连接fd,不再使用监听fd。
(2)addr 保存了客户端的IP地址和端口号。
(3)listen()函数只是让套接字进入监听状态,并没有真正接收客户端请求,listen() 后面的代码会继续执行,直到遇到 accept()函数。accept() 会阻塞程序执行(后面代码不能被执行),以等待客户端的连接。
二、客户端
connect()函数
函数原型
int connect(int sock, struct sockaddr *serv_addr, socklen_t addrlen); //Linux
函数作用
connect() 函数用来建立连接。
参数说明
各个参数的说明和 bind() 相同,不再赘述。
三、通用函数
write()函数、read函数
在 Linux 和 Windows 平台下,使用不同的函数发送和接收socket函数。因为Linux 不区分套接字文件和普通文件,使用 write() 可以向套接字中写入数据,使用 read() 可以从套接字中读取数据。而Windows 区分普通文件和套接字,并定义了专门的接收和发送的函数,即send() 函数和recv()函数。
(1)write() 函数
函数原型
ssize_t write(int fd, const void *buf, size_t nbytes);
函数作用
将缓冲区 buf 中的 nbytes 个字节写入文件 fd,成功则返回写入的字节数,失败则返回 -1。
参数说明
fd 为要写入的文件的描述符,buf 为要写入的数据的缓冲区地址,nbytes 为要写入的数据的字节数。
(2)read() 函数
函数原型
ssize_t read(int fd, void *buf, size_t nbytes);
函数作用
从 fd 文件中读取 nbytes 个字节并保存到缓冲区 buf,成功则返回读取到的字节数(但遇到文件结尾则返回0),失败则返回 -1。
参数说明
fd 为要读取的文件的描述符,buf 为要接收数据的缓冲区地址,nbytes 为要读取的数据的字节数。
size_t 是通过 typedef 声明的 unsigned int 类型。
htons()函数
函数模型
uint16_t htons(uint16_t hostshort)
函数作用
htons()函数用来将当前主机字节序转换为网络字节序(即转换成大端模式)。
代码示例
//创建sockaddr_in结构体变量 struct sockaddr_in serv_addr; memset(&serv_addr, 0, sizeof(serv_addr)); //每个字节都用0填充 serv_addr.sin_family = AF_INET; //使用IPv4地址 serv_addr.sin_addr.s_addr = inet_addr("127.0.0.1"); //具体的IP地址 serv_addr.sin_port = htons(1234); //端口号
补充说明
(1)网络字节序是大端模式,而x86架构的cpu一般是小端模式,所以需要进行转换。
(2)htons这字母组合中,h 代表主机字节序,n 代表网络字节序,s代表short,可以理解为“将 short 型数据从当前主机字节序转换为网络字节序”。
(3)通常,以s为后缀的函数中,s代表 2 个字节 short,因此用于端口号转换;以l为后缀的函数中,l代表 4 个字节的 long,因此用于 IP 地址转换。常见的网络字节转换函数如下。
- htons():host to network short,将 short 类型数据从主机字节序转换为网络字节序。
- ntohs():network to host short,将 short 类型数据从网络字节序转换为主机字节序。
- htonl():host to network long,将 long 类型数据从主机字节序转换为网络字节序。
- ntohl():network to host long,将 long 类型数据从网络字节序转换为主机字节序。
inet_addr()函数
函数原型
unsigned long inet_addr( const char *cp )
函数作用
inet_addr() 函数的作用是,将字符串形式的(即点分十进制形式的)IPv4地址(不能处理IPv6地址),转换成32位的长整型,同时还进行网络字节序转换。
代码示例
//创建sockaddr_in结构体变量 struct sockaddr_in serv_addr; memset(&serv_addr, 0, sizeof(serv_addr)); //每个字节都用0填充 serv_addr.sin_family = AF_INET; //使用IPv4地址 serv_addr.sin_addr.s_addr = inet_addr("127.0.0.1"); //具体的IP地址 serv_addr.sin_port = htons(1234); //端口号
#include<netinet/in.h> #icnldue<arpa/inet.h> #define IPADDR "192.168.1.102"int main(void) {int_addr_t addr = 0;addr = inet_addr(IPADDR);printf("addr = 0x%x\n",addr);return 0; }// 0x66 01 a8 c0 // 102 1 168 192
补充说明
(1)为 sockaddr_in 成员赋值时,需要显式地将主机字节序转换为网络字节序。而通过 write()/send() 发送数据时 TCP 协议会自动将数据转换为网络字节序,不需要再调用相应的函数。
(2)关于inet_addr()函数的内部代码是怎样的,这里不详细列出。有兴趣可以查阅手册。