UDP(User Datagram Protocol,用户数据报协议)和TCP(Transmission Control Protocol,传输控制协议)是互联网协议套件中最常用的两种传输层协议,它们负责在互联网中端到端地传输数据。尽管它们服务于相似的目的,即在网络中的两个进程间传输数据,但它们的工作方式、特性和应用场景有所不同。
Socket与网络传输
网络通信/传输底层依靠的就是socket。对于要进行通信的客户端、服务器双方而言,都需要创建一个 socket。在创建时可以指定使用的协议(TCP/UDP)。网络通信过程如下图所示:
在上面的过程中,涉及到以下函数:
-
int socket(int domain, int type, int protocol)
:用来创建一个套接字(或直接叫socket)。成功时,socket()
函数返回一个套接字描述符(一个非负整数),这个描述符后续用于引用这个套接字;失败时,返回-1
。参数:
- domain(协议域):
- 这个参数指定了套接字通信的网络协议族。常用的值包括:
AF_INET
:用于IPv4互联网协议通信。AF_INET6
:用于IPv6互联网协议通信。AF_UNIX
:用于同一台机器上的进程间通信(IPC)。
- 这个参数指定了套接字通信的网络协议族。常用的值包括:
- type(套接字类型):
- 指定套接字的通信类型,常见的类型有:
SOCK_STREAM
:提供面向连接的、可靠的、基于字节流的通信服务(通常使用TCP协议)。SOCK_DGRAM
:提供无连接的、不可靠的、基于数据报的通信服务(通常使用UDP协议)。- 其他类型还包括
SOCK_SEQPACKET
和SOCK_RAW
,但较为少见。
- 指定套接字的通信类型,常见的类型有:
- protocol(协议):
- 通常情况下,如果指定了正确的
domain
和type
,可以将此参数设置为0,让系统自动选择对应的默认协议。也可以指定特定的协议编号,如IPPROTO_TCP
或IPPROTO_UDP
。
- 通常情况下,如果指定了正确的
- domain(协议域):
-
int bind(int sockfd, const struct sockaddr *addr, socklen_t addrlen)
:用于将一个套接字(socket)与一个特定的网络地址(包括IP地址和端口号)关联起来,因为服务器需要在特定的IP地址和端口上监听来自客户端的连接请求。不显式调用bind()
(如客户端),操作系统会自动为套接字分配一个未使用的本地端口。bind()
成功时函数返回零,失败时返回-1
。参数:
- sockfd:
- 这是之前由
socket()
函数创建的套接字描述符,用来指定要绑定的套接字。
- 这是之前由
- addr:
- 是一个指向
sockaddr
结构体的指针,该结构体包含了要绑定的地址的信息,如IP地址和端口号。对于IPv4,实际使用的类型通常是struct sockaddr_in
;对于IPv6,则是struct sockaddr_in6
。这个结构体根据地址族(AF_INET
或AF_INET6
)的不同而有所不同。
- 是一个指向
- addrlen:
- 指定了
addr
所指向的地址结构体的大小,以字节为单位。这有助于函数确定如何解释addr
指针所指向的数据。
- 指定了
- sockfd:
-
int listen(int sockfd, int backlog)
:用于将一个套接字从非监听状态转变为监听状态,以便该套接字可以开始接收来自客户端的连接请求。成功返回0
,失败返回-1
。参数:
- sockfd:
- 这是由
socket()
函数返回的套接字描述符,表示之前创建并已绑定到特定地址的套接字。
- 这是由
- backlog:
- 指定内核应该为相应套接字排队的最大连接请求数量(与系统最大值也有关)。这个值限定了在服务器调用
accept()
函数之前,可以有多少个连接请求处于等待状态。(全连接队列,accpt
队列)
- 指定内核应该为相应套接字排队的最大连接请求数量(与系统最大值也有关)。这个值限定了在服务器调用
- sockfd:
-
int accept(int sockfd, struct sockaddr *addr, socklen_t *addrlen)
:从已完成连接队列(全连接队列)中接受一个客户端的连接请求,为这个新的连接创建一个独立的套接字描述符,并返回这个描述符,这个描述符专门用于与该客户端通信。如果队列为空,根据套接字的阻塞模式,该调用可能阻塞进程,直到有新的连接到达。- sockfd:
- 这是监听套接字的描述符,之前由
socket()
创建并通过bind()
绑定地址,再经过listen()
设置为监听状态。
- 这是监听套接字的描述符,之前由
- addr:
- 指向一个
sockaddr
结构体的指针,该结构体用于存储发起连接的客户端的地址信息(如IP地址和端口号)。
- 指向一个
- addrlen:
- 指向一个值,该值在调用前应设为
sizeof(struct sockaddr)
,用于告诉函数addr
缓冲区的大小。调用后,这个值会被更新为实际写入addr
的地址结构体的大小
- 指向一个值,该值在调用前应设为
- sockfd:
-
int connect(int sockfd, const struct sockaddr *serv_addr, socklen_t addrlen)
:这个函数允许客户端指定一个已经创建的套接字,并尝试与远程服务器上的特定地址和端口建立连接。在阻塞模式下,该调用会一直等待直到连接建立或超时/失败;在非阻塞模式下,调用立即返回,如果连接未立即建立,返回值会指示操作正在进行中。参数
- sockfd:
- 这是由
socket()
函数返回的套接字描述符,表示客户端打算用来发起连接的套接字。
- 这是由
- serv_addr:
- 是一个指向
sockaddr
结构体的指针,包含了服务器的地址信息,如IP地址和端口号。对于IPv4,使用的是struct sockaddr_in
结构;对于IPv6,则使用struct sockaddr_in6
。
- 是一个指向
- addrlen:
- 是一个整数值,表示
serv_addr
指向的地址结构体的大小,以字节为单位。
- 是一个整数值,表示
- sockfd:
-
int shutdown(int sockfd, int how)
:允许程序有选择性地关闭套接字的读取、写入或同时关闭读写功能,而不必立即关闭整个套接字。可以用于连接的优雅关闭。参数:
- sockfd:
- 这是之前通过
socket()
函数创建的套接字描述符,代表了需要操作的套接字连接。
- 这是之前通过
- how:
- 指定了关闭套接字的方式,可以是以下三个值之一:
SHUT_RD
(0):关闭连接的读取部分。调用后,不能再从该套接字读取数据,但仍然可以写入数据。SHUT_WR
(1):关闭连接的写入部分。调用后,不能再向该套接字写入数据,但仍然可以从该套接字读取数据。对于TCP套接字,称为半关闭(half-close)。当前在套接字发送缓冲区中的数据将被发送掉,后跟TCP的正常连接终止序列FIN
。SHUT_RDWR
(2):同时关闭读取和写入部分。调用后,既不能读也不能写,通常紧接着会调用close()
来完全关闭套接字。
- 指定了关闭套接字的方式,可以是以下三个值之一:
- sockfd:
-
int close(int sockfd)
:close()
会将该套接字文件描述符的引用计数-1
,当引用计数降至0时,内核会释放所有与该套接字相关的资源(包括内存和任何网络资源),会关闭套接字的所有数据传输方向。当引用计数仍大于零时,这个close调用不会引发TCP的四次挥手。(如父子进程中)。
-
int sendto(int sockfd, const void *buf, size_t len, int flags,const struct sockaddr *dest_addr, socklen_t addrlen)
:用于在无连接的套接字(如UDP套接字,SOCK_DGRAM类型)上发送数据报。此函数允许指定目标地址,使得数据可以直接发送到网络上的指定地址。它同样适用于已经通过connect()
函数关联了远程地址的面向连接的套接字(如TCP,SOCK_STREAM类型),但在这种情况下,dest_addr
和addrlen
参数会被忽略,sendto()
的行为等同于send()
函数。参数:
sockfd
:发送数据的套接字描述符。buf
:指向要发送数据的缓冲区的指针。len
:缓冲区中的数据长度,以字节为单位。flags
:控制消息发送的标志,例如MSG_DONTROUTE
、MSG_OOB
等,通常设为0。dest_addr
:指向一个struct sockaddr
结构的指针,该结构包含了目标地址的信息,如IP地址和端口号。addrlen
:dest_addr
结构的长度。
-
ssize_t recvfrom(int sockfd, void *buf, size_t len, int flags,struct sockaddr *src_addr, socklen_t *addrlen)
:recvfrom()
则广泛应用于无连接的套接字,特别是UDP套接字,但也适用于TCP套接字。对于UDP,由于每次数据报都可能来自不同的源,所以需要提供一个结构来存放发送方的地址信息。参数:
sockfd
:接收数据的套接字描述符。buf
:指向缓冲区的指针,用于存放接收到的数据。len
:缓冲区的大小,指明可以接收的最大数据量(字节)。flags
:可选标志,用于控制操作的行为,如MSG_PEEK
(查看数据但不移除缓冲区中的数据)、MSG_TRUNC
(用于原始套接字,允许数据包截断)等。通常情况下,这个参数可以设置为0。src_addr
:指向struct sockaddr
结构的指针,用于接收发送方的地址信息。在调用前,这个结构应当被初始化,调用后将填充发送方的地址信息。addrlen
:指向值-存储源地址结构大小的变量的指针,在调用前应初始化为sizeof(struct sockaddr_storage)
,调用后会更新为实际填写的地址结构大小。