引言
详细讲解什么是结构体,结构体的运用,
详细介绍了结构体在内存中占几个字节的计算。
【热门考点】:结构体内存对齐
介绍了:结构体传参
一、什么是结构体?
结构是⼀些值的集合,这些值称为成员变量。结构的每个成员可以是不同类型的变量。
二、结构的声明
结构体原型:
struct tag
{member - list; //成员变量,可以有多个不同类型
}variable - list; //可以创建结构体变量
列如:描述一个学生:
struct Stu
{char name[20];//名字int age;//年龄char sex[5];//性别char id[20];//学号}; //分号不能丢
三、结构体变量的创建和初始化
1.按照结构体成员的顺序初始化
2.按照指定的顺序初始化
参考代码:
#include<stdio.h>struct Stu
{char name[20];//名字int age;//年龄char sex[5];//性别char id[20];//学号}; //分号不能丢int main()
{//按照结构体成员的顺序初始化struct Stu s = { "张三", 20, "男", "20230818001" };printf("name: %s\n", s.name);printf("age : %d\n", s.age);printf("sex : %s\n", s.sex);printf("id : %s\n", s.id);//按照指定的顺序初始化struct Stu s2 = {.age = 18, .name = "lisi", .id = "20230818002", .sex = "女"};printf("name: %s\n", s2.name);printf("age : %d\n", s2.age);printf("sex : %s\n", s2.sex);printf("id : %s\n", s2.id);return 0;
}
四、结构体的特殊声明
在声明结构的时候,可以不完全的声明。
如:
struct
{int a;char b;float c;
}x;
会发现没有结构体类型的名字,这时合法的,但是匿名的结构体类型,如果没有对结构体类型重命名的话,基本上只能使用一次。
如:
struct
{int a;char b;float c;
}x;struct
{int a;char b;float c;
}*p;
观察这段代码,结构体类型是一样的,两个结构在声明的时候省略掉了结构体标签(tag)。那么是不是可以这样呢?
p = &x
警告:
编译器会把上面的两个声明当成完全不同的两个类型,所以是非法的。
匿名的结构体类型,如果没有对结构体类型重命名的话,基本上只能使用⼀次。
五、结构的自引用
在结构中包含⼀个类型为该结构本身的成员是否可以呢?
比如,定义⼀个链表的节点:
struct Node
{int data;struct Node next;
};
上述代码正确吗?如果正确,那么sizeof(struct Node) 是多少?
仔细分析,其实是不行的,因为⼀个结构体中再包含⼀个同类型的结构体变量,这样结构体变量的大小就会无穷的大,是不合理的。
正确的自引用方式:
struct Node
{int data;struct Node* next;
};
注意注意:在结构体自引用使用的过程中,夹杂了 typedef 对匿名结构体类型重命名,也容易引入问题
如:
typedef struct
{int data;Node* next;
}Node;
这段代码是错误的,因为Node是对前面的匿名结构体类型的重命名产生的,但是在匿名结构体内部提前使用Node类型来创建成员变量,这是不行的。
解决方案如下:定义结构体不要使用匿名结构体了
typedef struct Node
{int data;struct Node* next;
}Node;
六、计算结构体的大小。
首先得掌握结构体的对齐规则:
1.对齐规则
1. 结构体的第一个成员对齐到和结构体变量起始位置偏移量为0的地址处
2.其他成员变量要对齐到某个数字(对齐数)的整数倍的地址处。
对齐数= 编译器默认的⼀个对齐数与该成员变量大小的较小值。
VS 中默认的值为 8
Linux中gcc没有默认对齐数,对齐数就是成员自身的大小。
3. 结构体总大小为最大对齐数(结构体中每个成员变量都有⼀个对齐数,所有对齐数中最⼤的)的整数倍。
4. 如果嵌套了结构体的情况,嵌套的结构体成员对齐到自己的成员中最大对齐数的整数倍处,结构体的整体大小就是所有最大对齐数(含嵌套结构体中成员的对齐数)的整数倍。
举几个例子(这里使用的是VS2022编译器):
代码一:
#include<stdio.h>
struct S1
{char c1; //1int i; //4char c2; //1
};int main()
{struct S1 s1;printf("%zd\n", sizeof(struct S1));return 0;
}
分析:S1
因为:“1. 结构体的第一个成员对齐到和结构体变量起始位置偏移量为0的地址处”
所以:char c1 占第一个字节
因为:
“2.其他成员变量要对齐到某个数字(对齐数)的整数倍的地址处。
对齐数= 编译器默认的⼀个对齐数与该成员变量大小的较⼩值。
VS 中默认的值为 8 ”
所以: int i 是4个字节,比 8 小,所以要对齐到4的整数倍,所以要从4位置开始存放(看上面的图,前面刚好4个字节),占4个字节。
char c2 是 1 个字节,比8小,所以要对齐到1的整数倍,所以接着从8位置开始存放就可以了。占一个字节。
因为:3. 结构体总大小为最大对齐数(结构体中每个成员变量都有⼀个对齐数,所有对齐数中最大的)的整数倍。
所以:在S1中最大对齐数是4,所以结构体的总大小为4的整数倍,8位置实际上是9个字节,因为下标是从0开始的,所以向下找,在11位置的时候,结构体的大小是12个字节,是4的整数倍。所以:结构体的大小是12个字节。
代码二:
struct S2
{char c1;//1char c2;//1int i;//4
};
int main()
{struct S2 s2;printf("%zd\n", sizeof(struct S2));return 0;
}
先自己画画草图,试着自己分析一下结构体占多少个字节。
分析S2 :
按照上面的对齐规则:
char c1 占从第一个字节开始存
char c2 是1 个字节,和8相比,比8小,所以要对齐到1的整数倍,所以存在1位置即可。
int i是4个字节,和8相比,比8小,所以要对齐到4的整数倍,所以从4位置开始存放。(看上面的图)
在S2中最大对齐数是4,所以结构体的总大小为4的整数倍,从 0 到 7 正好是4 的整数倍,所以: 结构体S2的大小为8个字节。
代码三:
struct S3
{double d;char c;int i;
};int main()
{struct S3 s3;printf("%zd\n", sizeof(struct S3));return 0;
}
还是:先自己画画草图,试着自己分析一下结构体占多少个字节。
分析 S3:
按照上面的对齐规则:
double d 从第一个字节开始存,占8个字节。
char c 是1 个字节,和8相比,比8小,所以要对齐到1的整数倍,所以存在8位置即可。
int i是4个字节,和8相比,比8小,所以要对齐到4的整数倍,所以从12位置开始存放。(前面是12个字节,正好是4的整数倍)
在S2中最大对齐数是4,所以结构体的总大小为4的整数倍,从 0 到 15 正好是4 的整数倍,所以: 结构体S3的大小为16个字节。
代码四(有结构体类型):
struct S4
{char c1;struct S3 s3; //嵌套的结构体成员double d;
};
int main()
{struct S4 s4;printf("%zd\n", sizeof(struct S4));return 0;
}
还是:先自己画画草图,试着自己分析一下结构体占多少个字节。
分析S4:
按照上面的对齐规则:
char c1 占从第一个字节开始存,占一个字节。
struct S3 s3 是16个字节 ,和 8 相比,比8大,所以要对齐到8的整数倍,从位置8开始存(前面从0 到 7是8个字节),占16 个字节。
double d 是8个字节,和 8 相比,一样大,所以要对齐到 8 的整数倍,位置24是8的整数倍(前面是24个字节),所以从24开始存,占8个字节
在S2中最大对齐数是8,所以结构体的总大小为8的整数倍,从 0 到 31 正好是 8 的整数倍,所以: 结构体S4的大小为32个字节。
2 为什么存在内存对齐?
大部分的参考资料都是这样说的:
1. 平台原因(移植原因): 不是所有的硬件平台都能访问任意地址上的任意数据的;
某些硬件平台只能在某些地址处取某些特定 类型的数据,否则抛出硬件异常。
2. 性能原因: 数据结构(尤其是栈)应该尽可能地在自然边界上对齐。原因在于,为了访问未对齐的内存,处理器需要作两次内存访问;而对齐的内存访问仅需要⼀次访问。假设⼀个处理器总是从内存中取8个字节,则地址必须是8的倍数。如果我们能保证将所有的 double 类型的数据的地址都对齐成8的倍数,那么就可以用⼀个内存操作来读或者写值了。否则,我们可能需要执行两次内存访问,因为对象可能被分放在两个8字节内存块中。
总体来说:结构体的内存对齐是拿空间来换取时间的做法。
那在设计结构体的时候,我们既要满足对齐,又要节省空间,如何做到:
让占用空间小的成员尽量集中在⼀起
例如:
struct S1
{char c1;int i;char c2;
};
struct S2
{char c1;char c2;int i;
};
S1 和 S2 类型的成员⼀模⼀样,但是 S1 和 S2 所占空间的大小有了一些区别。
3.修改默认对齐数
#pragma 这个预处理指令,可以改变编译器的默认对齐数。
#include <stdio.h> #pragma pack(1)//设置默认对⻬数为1 struct S {char c1;int i;char c2; }; #pragma pack()//取消设置的对⻬数,还原为默认int main() {//输出的结果是什么?printf("%d\n", sizeof(struct S));return 0; }
结构体在对齐方式不合适的时候,我们可以自己更改默认对齐数。
七、结构体传参
可以分为:结构体传参
结构体地址传参
struct S
{int data[1000];int num;};struct S s = { {1,2,3,4}, 1000 };//结构体传参
void print1(struct S s)
{printf("%d\n", s.num);
}//结构体地址传参
void print2(struct S* ps)
{printf("%d\n", ps->num);
}
int main()
{print1(s); //传结构体print2(&s); //传地址
return 0;
}
上面的 printf1和printf2 哪个好呢?
答案是:首选print2函数。
原因:
1.函数传参的时候,参数是需要压栈,会有时间和空间上的系统开销。 如果传递⼀个结构体对象的时候,结构体过大,参数压栈的的系统开销比较大,所以会导致性能的下降。
2.传递⼀个结构体对象的时候,会再拷贝一个结构体出来,不能对原来的结构体做修改,如:对结构体的初始化的时候,只能使用传地址调用。(看情况而定)
结论:结构体传参的时候,要传结构体的地址。