C指针深度解析

（1）指针的概念

指针是一种数据类型，而内存地址是这种数据类型具体的值（注意区分两者的概念）。先说一下什么是内存地址：假设CPU的寻址方式是以字节寻址的，即每一个字节对应一个地址编号（则机器字长、存储字长和数据字长都是字节的整数倍，所有的数据类型占据的空间大小都是字节的整数倍）。对于32位操作系统，地址码最长可达32位，则可以寻址的最大数目为： $2^{32}$ =4G，由于最小单位是字节，因此可寻址的最大内存为4GB。64位操作系统，则为 $2^{64}$ B。因此，在32位操作系统中，地址（指针值）是一个32位的二进制数：0~ $2^{32}$ -1，因此指针变量（地址值）在32位操作系统中占据的空间大小为4bytes（32位），由于地址值用32位二进制数表示不方便，因此用8位16进制数表示（0x00000000~0xFFFFFFFF）。指针变量跟其余任何变量一样，都是一个值，且都要占据地址空间。指针是指本身的地址值，与指针的地址不同（两者不一定相等）。指针：计算机内一块内存来存放另一块内存的地址（注意是首地址）。所以，对一个指针取地址，无非就是对一块内存取地址，跟对一个整数取地址，对一个浮点数取地址，对一个数组取地址，对一个函数取地址，没有任何区别：char c[5]="abc"; // 内存c的地址是：&c void f(int size, float length); // 内存f的地址是：&f int *p = &a; // 内存p的地址是：&p 一般情况下：字节占据1个字节，int为4个字节，指针跟操作系统位数相关。

int *p1； int **p2； int (*p3)[5]; int (**p4)[5]; int (*p5)[5][5]; p1~p5都是指针，p1为一级指针；p2为二重指针（二级指针或指针的指针），即p2所指的地址的内容依然是地址，而该地址所指的地址的内容为int类型；p3为指针，其类型为int (*)[5]，所指地址存储的内容为整型数组（5个元素）；p4为二级指针，其最终存储的内容为整型数组（5个元素）；p5为指针，其类型为int (*)[5][5]，所指地址存储的内容为整型二维数组（25个元素）。

指针的步长。每个指针都是有步长的，这与指针的计算有着密切关系。指针的步长就是指针（地址）所指的内容的大小（占据的字节数）。如 int *p，则p的步长为4bytes，p+1则是p地址的基础上移动4个bytes。int (*p3)[5]; p3的步长就是20bytes。

*与[ ]对指针的作用。*(p+i)是取出指针p+i所指向的内容，如*p1是取出的整形数值int；*p3是取出的整个一维数组（5个元素）。int a[6][7]； *a取出的是a[0]这个一维数组；*(a+1)取出的是a[1]这个一维数组；*a[0]取出的是a[0][0]。*(p+i)=p[i]，两者作用一样，即p[i]则是指将指针p移动i个步长后所指向的内容。

二级指针步长分析（二级指针的内存分布）。例如：int **p； p是一个地址，由于p地址的内容依然是地址，因此p指针的步长为指针的字节数（8个字节，以32位为例）。因此所有二级指针的步长都是一样的，都是8bytes。而*p依然是指针，即存储的内容为int数值，因此*p的步长为4bytes。因此，当用二级指针p来表示一个二维数组时，其每一个元素（int）在内存中的分布并不向二维数组int a[i][j]那样都是连续的，它们的分布不一样的。*p表示二维数组中的每一个元素a[i]（一维数组）的首地址，而p则是将所有*p作为一维数组的首地址。因此，在用指针p表示二维数组时，只有二维数组中的每一个元素（一位数组）内部分布是连续的，至于元素与元素之间的分布不一定是连续的，取决于*p与*(p+1)的值。综上，二级指针p与二维数组a之间不能相互传递参数，因为它们在内存中的分布是不一样的，否则会引发段错误（SIGSEGV）。如果p=a；则p的步长为8bytes，则*p或p[0]就会把数组a的前两个元素a[0][0]和a[0][1]合并在一起8个字节当成一个地址，紧接着*(*p)或p[0][0]就是前一个地址所指向的前4个bytes的内容，但是*p这个地址是用户未定义的，因此属于非法访问内存，因此会引发段错误。所以，一定要注意，两者之间不能直接传递参数。可以将二维数组重新用二级指针表示（后面会介绍方法），然后就可以用二级指针p来访问二维数组了，其访问方法为：p[i][j]或*(*(p+i)+j)，即：先将指针p移动i个步长取出地址值，然后再移动j个步长的地址的内容就是p[i][j]元素，对应的就是a[i][j]。

对于一维数组int a[10]；与int *p；p与a之间可以直接传递，因为内存分布一样，具体分析同前面。p=a，则*(p+i)=p[i]=a[i]。对于char *argv[10]； char **p; p与argv之间也可以直接传递数据，因为两者内存分布一样：*(p+i)=p[i]=argv[i]，都是char *类型的指针，它们存储的内容都是char，步长都为1bytes，因此都可以表示一个字符串，所以在命令行参数和环境变量中可以使用char **p二级指针来传递形参。

二维数组int b[i][j]；用二级指针int **p；来表示：int *a[i]；a[i]=b[i]；p=a；则有：*(p+i)=p[i]=a[i]，*(*(p+i)+j)=p[i][j]=a[i][j]=b[i][j]。因此，b与p之间要传递参数时，可以用a来搭桥。

（2）指针与数组的关系举例分析

探究数组名与指针的关系：将a[3][5]全部元素初始化为0

//ex1.c

#include <stdio.h>int main(void)
{int a[10]={0};int *p;p=a;printf("a[1]=%d, &p=%#x, p=%#x\n",p[1],&p,p);return 0;
}
[root@localhost 01_pthread_test]# ./ex1
a[1]=0, &p=0xff875cc4, p=0xff875cc8

//ex.c

#include <stdio.h>int main(void)
{int **p;int a[3][5]={0};p=a;printf("&a=%#x, a=%#x, a[0]=%#x, *a=%#x, a+1=%#x, a[0]+1=%#x, a[1]=%#x, &a[0][0]=%#x\n",&a, a,a[0],*a,a+1,a[0]+1,a[1],&a[0][0]);printf("*(&a[0][0])=%#x\n",*(&a[0][0]));printf("*(*a)=%#x\n",*(*a));printf("a=%#x\n",a);printf("&p=%#x, p=%#x, *p=%#x\n",&p,p,*p); printf("*(*p)=%d\n",*(*p));   //该句出现段错误return 0;
}
[root@localhost 01_pthread_test]# ./ex
&a=0xff83a4d0, a=0xff83a4d0, a[0]=0xff83a4d0, *a=0xff83a4d0, a+1=0xff83a4e4, a[0]+1=0xff83a4d4, a[1]=0xff83a4e4, &a[0][0]=0xff83a4d0
*(&a[0][0])=0
*(*a)=0
a=0xff83a4d0
&p=0xff83a50c, p=0xff83a4d0, *p=0
Segmentation fault (core dumped)

//ex2.c（二维数组用二级指针的另一种表示方法）

#include <stdio.h>
#include <stdlib.h>
#include <stddef.h>int main(void)
{int **p;int i, j;p=(int **)malloc( sizeof(int *)*3 );for(i=0;i<3;i++){p[i]=(int *)malloc( sizeof(int)*5 );}for(i=0;i<3;i++)for(j=0;j<5;j++){p[i][j]=3;}printf("p[2][3]=%d\n",p[2][3]);return 0;
}
[root@localhost 01_pthread_test]# ./ex2
p[2][3]=3

分析：

强调一点：数组名、函数名等类似的东西都不是指针！！！只是在使用的时候它们被隐式转换为了指针。一维数组：int a[10]; sizeof(a)中，a就没有转换为指针，a指的就是数组本身，sizeof(a)的结果为40（40bytes）。如果对a的操作中涉及元素的操作时，由于仅仅指出a系统并不清楚要具体取哪一个元素，因此直接返回给数组的首地址，即a被隐式转换为数组的第一个元素的地址&a[0]。二维数组：int a[10][9]；其本质就是一个一维数组（数组的数组），在内存中的分布是一维的，一行紧接着一行连续分布：即a[0][8]的后面紧接着就是a[1][0]。a[10][9]可以看成是a[0]、a[1]、······、a[9]这十个元素构成的数组，其中a[0]是二维数组的首元素；而a[0]、a[1]、······、a[9]这十个元素中每一个元素又是一个数组（类型为int [9]），即a[0]代表：a[0][0]~a[0][8]。因此在隐式转换时：a被隐式转换为二维数组第一个元素的首地址，即a=&a[0]，a的步长为36bytes，指向的是a[0]这个数组（这一行）；而a[0]如果进行隐式转换，则转换为a[0]这个一维数组的首地址，即&a[0][0]。注意，a与a[0]隐式转换后值是相等的，但是步长不一样，a[0]转换后，所指向的内容是a[0][0]，即int类型，因此步长为4bytes。因此a与a[0]的指针值虽然是相等的，但是步长不一样，即：a+1与a[0]+1不相等。a+1指向的是a[1][0]，a[0]+1指向的是a[0][1]。

在上面程序ex.c中。p、&a、a、a[0]、*a、a+1、a[0]+1、a[1]、&a[0][0]、*(&a[0][0])、*(*a)。p是一个二级指针，最终地址内容为int型数值；&a为int (*)[3][5]类型，即指向整个二维数组；a是整个数组，隐式转换为指向a[0]的指针，int (*)[5]类型；a[0]是一维数组，隐式转换为指向a[0][0]的指针，int *类型；*a经历了两次隐式转换，第一次a被转换，第二次*a被转换，最终为指向a[0][0]的指针，为int *类型；a+1，int (*)[5]类型；a[0]+1，int *类型；a[1]，int *类型；&a[0][0]，int *类型。根据上面程序输出结果可以判断。若p=a，则&p，int ***类型；p，int **类型；*p为int*内容；此时程序可以输出结果（不会发生错误），但是结果毫无意义。*(*p)则会发生段错误，因此*p地址的内容用户未定义，非法访问内存。

程序ex2.c描述了另一种方法将二级指针表示二维数组。