1.TCP的客户端代码流程简述
这一章将为大家讲解Socket通信中客户端的实现过程,还是先上图,请大家了解客户端的步骤
可以看到,相比服务端,客户端的步骤简单的很多。事实上这种情况比较多,比如一个服务端会有多个客户端连接。
通过图片我们可以看到TCP客务端调用的函数依次是socket( )、connect( )、recv( )、send( )、closessocket( )
由于在服务端这章的讲解中我们提到了socket()、recv()、send()、closesocket()、WSAStartup()、WSACleanup()的函数,在客户端中同样需要这些函数,使用方式是一样的,因此这里不再赘述。
大家学习前面的函数后可直接在客户端中实现。
2.Socket编程之connect函数
这一节我们讲connect连接,这一步位于客户端的第二步,调用connect阻塞客户程序,传输层实体开始建立连接,当连接建立完成时,取消阻塞;
函数功能:
向服务端发起连接请求
头文件:
#include <winsock2.h>
函数原型:
int connect(int sockcd, const struct sockaddr *addr, int addrlen);
返回值类型:
整型
返回值:
成功返回0,失败返回-1。当客户端调用 connect()函数之后,发生以下情况之一才会返回(完成函数调用)
- 服务器端接收连接请求
- 发生断网的异常情况而终端连接请求
参数说明:
sockcd为客户端建立socket函数的返回值。
addr是一个sockaddr结构的指针,用于指定所要连接的服务器的地址(服务端的IP地址和端口号,要和服务端的实际IP地址以及绑定的端口一致才可以)。
addrlen为addr变量的大小,可由 sizeof()计算得出。
调用connect函数整体代码的实现:
accept()函数,其实是服务器端把连接请求信息记录到等待队列。因此connect()函数返回后并不进行数据交换。而是要等服务器端 accept 之后才能进行数据交换。、
这一步调用完成之后,就和服务端建立了通信,就可以使用send或recv相互发送和接收消息了
connect(sockcd,(sockaddr*)&seraddr,sizeof(seraddr));//需要注意的是,所谓的“接收连接”并不意味着服务器调用
3.Socket客户端完整参考代码
本代码用于和第二章服务端代码一致,监听12345端口,可以不断的发送消息,直至输入"quit"退出程序,完整参考代码如下:
#include <winsock2.h>
#include <stdio.h>
#pragma comment(lib,"ws2_32.lib")int main()
{int err;char SendBuf[100];WORD versionRequired;WSADATA wsaData;versionRequired=MAKEWORD(2,2);err=WSAStartup(versionRequired,&wsaData);//协议库的版本信息//通过WSACleanup的返回值来确定socket协议是否启动if (!err){printf("客户端套接字已经打开!\\n");}else{printf("客户端套接字打开失败!\\n");return -1;//结束}//注意socket这个函数,他三个参数定义了socket的所处的系统,socket的类型,以及一些其他信息SOCKET clientSocket=socket(AF_INET,SOCK_STREAM,0);//socket编程中,它定义了一个结构体SOCKADDR_IN来存计算机的一些信息,像socket的系统,//端口号,ip地址等信息,这里存储的是服务器端的计算机的信息SOCKADDR_IN clientsock_in;clientsock_in.sin_addr.S_un.S_addr=inet_addr("127.0.0.1");clientsock_in.sin_family=AF_INET;clientsock_in.sin_port=htons(12345);//前期定义了套接字,定义了服务器端的计算机的一些信息存储在clientsock_in中,//准备工作完成后,然后开始将这个套接字链接到远程的计算机//也就是第一次握手int r=connect(clientSocket,(SOCKADDR*)&clientsock_in,sizeof(SOCKADDR));//开始连接// printf("%d\\n",r);while(1){gets(SendBuf);if(strcmp(SendBuf,"quit")==0)break;send(clientSocket,SendBuf,strlen(SendBuf)+1,0);}closesocket(clientSocket);//关闭服务WSACleanup();return 0;
}
单独运行客户端,如下图效果:
若是连同前面的服务端一起测试,先运行服务端,再运行客户端,即可完成通信效果,效果图下:
从图中可以看到,客户端向服务端发送三条消息,服务端都已接收,并打印长度和消息信息,第四条信息退出,之后双方退出结束程序。
4.什么是字节序?大小端还有网络序和主机序?
1.字节序
字节序,又称端序或尾序,指的是多字节数据在内存中的存放顺序。学过C语言后,我们知道一个int型变量a是占用4个字节,假设它的起始地址也就是&a是0x10处,那么变量a的四个字节将会被存储在0x10、0x11、0x12和0x13这四个字节位置上。
但是当我们写好通信程序发送数据时候的时候,这个a变量通过TCP连接传输后收到的与发送的不一致,即有可能发过去的序列变成了0x12、0x13的值在前,0x10、0x11上的值在后,这样组成的四个字节的int类型值肯定就不一样了。
所以要引入大端和小端的概念。
2.大端和小端
计算机有两种储存数据的方式:大端字节序(Big Endian)和小端字节序(Little Endian)。
- 大端模式:是指数据的高字节保存在内存的低地址中,低字节保存在内存的高地址端
- 小端模式:是指数据的高字节保存在内存的高地址中,低字节保存在内存的低地址端。
以一个两字节short型变量0x0102的存储举例:
大端字节序:高位字节在前,低位字节在后,01|02,从左往右看着更习惯。
小端字节序:低位字节在前,高位字节在后,02|01,也存在这种存储顺序。
我们以0x12345678这个数字为例,它的大端模式和小端模式分别如下:
3.原因
计算机处理字节序的时候,不知道什么是高位字节,什么是低位字节。它只知道按顺序读取字节,先读第一个字节,再读第二个字节…
如果是大端字节序,先读到的就是高位字节,后读到的就是低位字节;小端字节序正好相反。
如果这样,那统一用符合我们人类读写习惯的大端序就好了呀,为何还要弄出个小端序了?
这是疑问计算机电路先处理低位字节,效率比较高,因为计算都是从低位开始的,所以计算机的内部处理都是小端字节序。
但是人类还是习惯读写大端字节序,所以除了计算机的内部处理,其他的场合几乎都是大端字节序,比如网络传输和文件储存。
4.网络序和主机序
明白了大小端之后,网络序和主机序也就好理解了,
- 网络字节序:TCP/IP各层协议将字节序定义为Big Endian,即大端模式,TCP/IP协议中使用的字节序是大端序。
- 主机字节序:整数在内存中存储的顺序,目前以Little Endian,即小端模式,比较普遍(不同的CPU有不同的字节序)。
C/C++语言编写的程序里数据存储顺序是跟编译平台所在的CPU相关的,而现在比较普遍的x86处理器是小端模式(Little Endian)。Java编写的程序则唯一采用Big Endian方式来存储数据。
所以,如果你的C/C++程序通过Socket将变量a = 0x12345678的首地址传递给了Java程序,由于Java采取Big Endian方式存取数据,很显然,本地数据没问题,传过去就变成0x78563412,这就出问题了。毕竟不是所有的客户端和服务端都是同一种语言、同一种CPU。因此转换的问题就来了
5.如何转换
为避免开头说到的网络通信中存在的问题,我们可以在传输数据之前和接收数据之后对数据进行相应处理,也就是主机序和网络序的转换。
C/C++提供了相应的函数接口,htons、htonl用于主机序转换到网络序,ntohl、ntohs用于网络序转换到主机序。
5.htos和htol函数
主机序转换到网络序
在网络传输过程中,一定会涉及到主机序和网络序的问题,即本机的存储和网络的传输是完全两套存储方式,我们保证不了目标主机的字节序是否和网络序一致,因此一定要考虑这个问题,这里介绍常用的两个函数htos和htol函数,使主机序转换到网络序
1.htos函数:
函数功能:
将主机无符号短整形数转换成网络,比如古人读12345的顺序是从右往左54321,而现代人读12345的顺序是从左往右读12345,htos函数就是完成类似的转换功能,举例说明如果把htons(16)输出你会看到得到的结果是4096,为什么呢?因为16的十六进制是0X0010,而4096的十六进制是0X1000。不同的存储方式,会导致高低位存储时顺序的不同,这就是即00 10和10 00 的存储不同的原因。
头文件:
#include <winsock2.h>
函数原型:
uint16_t htons(uint16_t hostlong);
返回值类型:
整型
返回值:
返回一个网络字节顺序的值
参数说明:
其中hostlong是主机字节顺序表达的16位数,htons中的h表示host意思是主机地址,to表示to意思是去往,转换为的意思,n表示net意思是网络,s表示signed long意思是无符号的短整型。
调用htos函数代码举例;
htos(5200);
2.htol函数
函数功能:
将一个32位数从主机字节顺序转换成网络字节顺序。
头文件:
#include <winsock2.h>
函数原型:
uint16_t htons(uint32_t hostlong);
返回值类型:
整型
返回值:
返回一个网络字节顺序的值
参数说明:
其中hostlong是主机字节顺序表达的32位数,htons中的h表示host意思是主机地址,to表示to意思是去往,转换为的意思,n表示net意思是网络,l 是 unsigned long表示32位长整数
调用htol函数代码举例;
htol( 0x403214);
6. ntohl和ntohs函数:网络序转换到主机序
有主机序转网络序,就有网络序转主机序,分别是ntohl和ntohs函数,接下来为大家讲解这两个函数。
1.ntohl函数
函数功能:
将一个无符号短整型数从网络字节顺序转换成主机字节顺序。这个函数与htons原理相同,不过是htos是主机序到网络序,而ntohs是网络序到主机序。
头文件:
#include <winsock2.h>
函数原型:
uint16_t ntohs(uint16_t netshort);
返回值类型:
整型
返回值:
返回一个主机字节顺序表达的数。
参数说明:
其中netshort一个以网络字节顺序表达的16位数,ntohs中的h表示host意思是主机地址,to表示to意思是去往,n表示net意思是网络,s表示signed long意思是无符号的短整型(32位的系统是2字节)。
调用ntohs函数代码举例;
ntohs(5200);
2.ntohl函数
函数功能:
将一个无符号长整型从网络字节顺序转换成主机字节顺序。这个函数与htonl原理相同,不过是htol是主机序到网络序,而ntohl是网络序到主机序。
头文件:
#include <winsock2.h>
函数原型:
uint16_t ntohs(uint16_t netlong);
返回值类型:
整型
返回值:
返回一个主机字节顺序表达的数。
参数说明:
其中netlong一个以网络字节顺序表达的32位数,ntohs中的h表示host意思是主机地址,to表示to意思是去往,n表示net意思是网络,s表示signed long意思是无符号的短整型(32位的系统是2字节)。
调用ntohl函数代码举例;
ntohl( 0x403214);
7. Sockaddr_in和Sockaddr的区别
sockaddr和sockaddr_in都是结构体,并且它们的功能都是用来处理网络通信的地址。网络中的地址主要有3个方面的属性:
-
地址类型,例如是互联网协议第四版(ipv4)和互联网协议第六版(ipv6)。
-
IP地址,主要有5类分别是
A类:(1.0.0.0-126.0.0.0),地址的网络号取值于1~126之间。一般用于大型网络。
B类:(128.0.0.0-191.255.0.0),地址的网络号取值于128~191之间。一般用于中等规模网络。
C类:(192.0.0.0-223.255.255.0),地址的网络号取值于192~223之间。一般用于小型网络。
D类:是多播地址,地址的网络号取值于224~239之间。一般用于多路广播用户 。
E类:是保留地址,地址的网络号取值于240~255之间。
-
端口,它就像门牌号一样,客户端可以通过ip地址找到对应的服务器端,但是服务器端有很多端口,每个应用程序对应一个端口号,通过类似门牌号的端口号,客户端才能真正的访问到该服务器。为了对端口进行区分,将每个端口进行了编号,这就是端口号,范围是0---65535。
用于存储参与(IP)Windows套接字通信的计算机上的一个internet协议(IP)地址。为了统一地址结构的表示方法 ,统一接口函数,使得不同的地址结构可以被bind()、connect()、recv()、send()等函数调用。但一般的编程中并不直接对此数据结构进行操作,而使用另一个与之等价的数据结构sockaddr_in。这是由于Microsoft TCP/IP套接字开发人员的工具箱仅支持internet地址字段,而实际填充字段的每一部分则遵循sockaddr_in数据结构,两者大小都是16字节,所以二者之间可以进行切换。
sockaddr_in中的in就表示internet也就是网络地址的意思,它弥补了sockaddr的缺陷,把port(端口号),和addr(目标地址)分开存储在两个变量中。
总结
二者长度一样,都是16个字节,即占用的内存大小是一致的,因此可以互相转化。二者是并列结构,指向sockaddr_in结构的指针也可以指向sockaddr。
sockaddr常用于bind、connect、recv、send等函数的参数,指明地址信息,是一种通用的套接字地址。
sockaddr_in 是internet环境下套接字的地址形式。所以在网络编程中我们会对sockaddr_in结构体进行操作,使用sockaddr_in来建立所需的信息,最后使用强制类型转化就可以了。一般先把sockaddr_in变量赋值后,强制类型转换后传入用sockaddr做参数的函数:sockaddr_in用于socket定义和赋值;sockaddr用于函数参数。