一.结构体
1.结构体
I.基本格式
struct tag
{member-list;
}variable-list;
II.结构体声明
struct PERSON // 结构体声明
{int age; // 声明成员类型long ss;float weight;char name[25];
} family_member; // 定义结构体变量family_member
III.结构体的特殊声明
在声明结构的时候,可以不完全的的声明
//匿名结构体类型
struct
{int a;char b;float c;}x;struct
{int a;char b;float c;
}a[20],*p;
上面的两个结构体在声明的时候省略结构体标签(tag)。
在上面代码基础上,下面代码合法吗?
p=&x;
警告:
编译器会把上面的两个声明当成完全不同的两个类型,所以是非法的。
匿名的结构体类型,如果没有对结构体类型重命名的话,基本上只能使用一次。
IV..结构体变量的创建和初始化
int main() {//按指定顺序初始化结构体变量family_member.weight = 68.5;family_member.ss = 1234567890;family_member.age = 30;strcpy(family_member.name, "John Doe");//按顺序初始化结构体变量struct PERSON family_member={"30,1234567890,68.5,"John Doe""};//和上面的初始化是一样的效果//打印结构体成员printf("Age: %d\n", family_member.age);printf("Social Security Number: %ld\n", family_member.ss);printf("Weight: %.2f\n", family_member.weight);printf("Name: %s\n", family_member.name);return 0;
}
VI.结构体成成员访问符
结构体成员访问依据变量的类型的不同,一般有两种访问方式,一种为直接访问,一种为间接访问。直接访问用于访问普通的的结构体变量,间接访问用于指向指向结构体变量的指针。直接访问用结构体变量名.成员名。间接访问使用(*结构体指针名).成员名或者使用结构体指针名->成员名。相同的成员名依靠不同的变量前缀区分。
直接访问:
#include <stdio.h>struct Person {char name[50];int age;
};int main() {struct Person person;// 设置成员的值strcpy(person.name, "John");person.age = 30;// 访问成员并打印输出printf("Name: %s\n", person.name);printf("Age: %d\n", person.age);return 0;
}
间接访问:
#include <stdio.h>struct Person {char name[50];int age;
};int main() {struct Person person;struct Person *ptr;ptr = &person;// 设置成员的值strcpy(ptr->name, "Alice");ptr->age = 25;// 访问成员并打印输出printf("Name: %s\n", ptr->name);printf("Age: %d\n", ptr->age);return 0;
}
2.结构体的自引用
在结构体中包含一个类型为该结构体本身的成员是否可以呢?
struct Node
{int data;struct Node next;//包含本身的结构体,会导致无限递归的定义
};
这种情况下,结构体变量的大小就会无穷的大,是不正确的写法
正确的自引用方式:
struct Node
{int data;struct Node*next;//指针的大小是确定的,具体取决于编译器
};
在对结构体自引用的时候,常常会用到typedef对匿名结构体的重命名,此处有一个可能会犯的错误:
typedef struct
{int data;Node*next;
}Node;
这是一个错误的示范,因为Node是对前面的匿名结构体类型的重命名产生的,但是在匿名结构体内部提前使用Node类型来创建成员变量,这是不行的。(其实按顺序来看很好理解,在创建next的前面并没有Node,编译器不知道Node是谁)。
解决方案就是:定义结构体的时候就不要使用匿名结构体
typedef struct Node
{int data;struct Node*next;//struct Node在前面已经声明好了
}Node;
3.结构体内存对齐
I.对齐规则:
- 结构体对的第一个第一个成员对齐到和结构体变量起始位置偏移量为0的地址处
- 其他成员变量要对齐到某个数字(对齐数)的整数倍的地址处
- 对齐数=编译器默认的第一个对齐数与该成员变量的大小的较小值
VS中,默认的值为8
Linux中gcc没有默认对齐数,对齐数就是成员自身的大小 - 结构体的总大小为最大对齐数(结构体中每个成员变量都有一个对齐数,所有对齐数中最大的)的整数倍
- 如果嵌套了结构体的情况,嵌套的结构体对齐到自己的成员中最大对齐数的整数倍处,结构体的整体大小就是所有最大对齐数(含嵌套结构体中成员的对齐数)的整数倍。
示例:
//练习1
struct S1
{char c1;int i;char c2;
};//练习2
struct S2
{char c1;char c2;int i;
};//练习3
struct S3
{double d;char c;int i;
};//练习4-结构体嵌套问题
struct S4
{char c1;struct S3 s3;double d;
};int main()
{printf("%zd\n", sizeof(struct S1));printf("%zd\n", sizeof(struct S2));printf("%zd\n", sizeof(struct S3));printf("%zd\n", sizeof(struct S4));return 0;
}
注:序号表示 相对于结构体起始位置的对齐数编号(序号高低表示内存从高地址->低地址)
II.为什么存在对齐?
参考部分资料:
- 平台原因(移植原因):不是所有硬件平台都能访问任意地址上的任意数据的;某些硬件平台只能在某些地址处取决于某些特定类型的数据,否则抛出硬件异常
- 性能原因:数据结构(尤其是栈)应该尽可能地自然边界上上对齐。原因在于,为了访问未对齐的内存,处理器需要两次内存访问;而对齐的内存访问仅需要一次访问。假设一个处理器总是从内存中取8个字节,则地址必须是8的倍数。如果我们能保证将所有double类型的数据的地址都对齐成8的倍数,那么就可以 用一个内存操作来读写或者写值。否则,可能需要执行两次内存访问,因为对象可能被分放在两个8字节内存块中。
总的来说:结构体的内存对齐是拿空间来换取时间的做法。
III.修改默认对齐数
#pragma这个预处理指令,可以改变编译器的默认对齐数
#include<stdio.h>#pragma pack(1)//设置默认对齐数为1
struct S
{char c1;int i; char c2;
};#pragma pack()//取消设置的对齐数int main
{printf("%d\n",sizeof(struct S));return 0;
}
4.结构体传参
struct S
{int data[1000];int num;
};
struct S s = { {1,2,3,4}, 1000 };
//结构体传参
void print1(struct S s)
{printf("%d\n", s.num);
}
//结构体地址传参
void print2(struct S* ps)
{printf("%d\n", ps->num);
}
int main()
{print1(s); //传结构体print2(&s); //传地址return 0;
}
上面函数print1和print2哪个好?
答案是print2函数
原因:
- 函数在传参的时候,参数需要压栈,会有时间和空间上的系统开销
- 如果传递一个结构体对象的时候,结构体过大,参数压栈的系统开销比较大,所以会导致性能的下降
结论:结构体传参时,要传结构体的地址
5.结构体实现位段
I.位段
位段的声明和结构体是类似的,有两个不同:
- 位段的成员必须是int、unsigned int或signed int,在C99中位段成员类型也可以选择其他类型
- 位段成员后面有一个冒号和数字
比如:
struct A
{int _a:2;int _b:5;int _c:10;int _d:30;
};
int main()
{printf("%zd", sizeof(struct A));return 0;
}
A就是一个位段类型,在计算位段类型的大小的时候,要注意存储的时候是以位为单位存储的,而不是以自己为单位,冒号后面的数字就是位的大小。
- _a(2位)+_B(5位)+_d(30位)=47位
一个字节8位,47个位占用6个字节,但是由于结构体中的成员变量位域长度不一定能完全整除字节数,因此实际上可能会多占用一些字节。在这种情况下,sizeof(struct A)的结果会是8,8个字节
II.位段的内存分配
- 位段的成员可以是int、unsigned int 、signed int或者是char等类型
- 位段的空间是按照需要以4个字节(int)或者1个字节(char)的方式来开辟的
- 位段涉及很多不确定因素,位段是不跨平台的,注重可移植的程序应该避免使用位段
//⼀个例⼦
struct S
{char a:3;char b:4;char c:5;char d:4;
};
struct S s = {0};
s.a = 10;
s.b = 12;
s.c = 3;
s.d = 4;
//空间是如何开辟的?
III.位段的跨平台问题
- int位段被当成有符号数还是无符号数是不确定的
- 位段中最大位的数目不能确定(16位机器最大16,32位机器最大32,写成27,在16位机器会出现问题)
- 位段中的成员在内存中从左向右分配,还是从右向左分配标准尚未定义
- 当一个结构包含两个位段,第二个位段成员比较大,无法容纳于第一个位段剩余的位时,是舍弃剩余的位还是利用,这是不确定的
总结: 跟结构体相比,位段可以达到相同的效果,并且可以很好的节省空间,但是有跨平台的问题存在
IV.位段的使用
下图是网络协议中,IP数据报的格式,其中很多属性只需要几个比特位就能描述,这里使用位段,能够实现想要的效果,也节省了空间,这样网络传输的数据报大小也会较小一些,对网络的畅通是有帮助的。
V.位段使用的注意事项
位段的几个成员共有同一个字节,这些成员的起始位置并不是某个字节的起始位置,那么这些位置处是没有地址的。内存中每个字节分配一个地址,一个字节内部的比特位是没有地址的。
所以不能对位段的成员使用&操作符,这样就不能使用scanf直接给位段的成员输入值,只能是先输入放在一个变量中,然后赋值给位段的成员。
二.联合体
1.联合体
像结构体一样,联合体也是由一个或者多个成员构成,这些成员可以不同类型
但是编译器只为最大的成员分配足够的内存空间。联合体的特点是所有成员共用同一块内存空间。因此联合体也叫:共用体
给联合体其中一个成员赋值,其它成员的值也跟着变化。
#include<stdio.h>
//联合类型的声明
union Un
{char c;int i;
};
int main()
{//联合变量的定义union Un un = { 0 };//计算连个变量的⼤⼩printf("%zd\n", sizeof(un));//最大的成员是int,所以结果是4return 0;
}
2.联合体的特点
联合体的成员是共用一块内存空间的,这样一个联合体的大小,至少是最大成员的大小(因为联合体至少得有能力保存最大的那个成员)。
#include <stdio.h>
//联合类型的声明
union Un
{char c;int i;
};
int main()
{//联合变量的定义union Un un = { 0 };// 下⾯输出的结果是⼀样的吗?printf("&(un.i)=%p\n", &(un.i));printf("&(un.c)=%p\n", &(un.c));printf("&un=%p\n", &un);un.i = 0x11223344;un.c = 0x55;printf("%x\n", un.i);return 0;
}
代码中输出的三个 地址一模一样,输出的i的第四个字节的内容被修改为55,下面是un的内存布局图:
相同成员的结构体和联合体对比
struct S
{char c;int i;
};
struct S s = { 0 };union Un
{char c;int i;
};
union Un un = { 0 };
3.联合体大小的计算
- 联合体的大小至少是最大成员的大小
- 当最大的成员不是最大对齐数的整数倍的时候就要对齐到最大对齐数的整数倍
union Un1
{char c[5];//5int i;//4,最少要为5,对齐到的整数倍-->8
};
union Un2
{short c[7];//14int i;//4,最少要为14,对齐到4的整数倍-->16
};
int main()
{printf("%zd\n", sizeof(union Un1));//8printf("%zd\n", sizeof(union Un2));//16return 0;
}
联合体判断大小端:
int check_sys()
{union{int i;char c;}un;un.i = 1;return un.c;//返回1是小端,返回0是大端
}
三.枚举
1.枚举类型
枚举顾名思义就是一 一列举
把可能得取值一 一列举。
比如:
一周的星期一到星期日是有限的七天,可以一 一列举、
月份由12个月,可以一 一列举
三原色,可以一 一列举
这些数据的表示就可以使用枚举
enum Day//星期
{Mon,Tues,Wed,Thur,Fri,Sat,Sun
};enum Color//颜色
{RED,GREEN,BLUE
};
上面定义的enum Day,enum Color都是枚举类型
{}中的内容都是有值的,默认从0开始,依次递增1,当然在声明枚举类型的时候也可以初始化
enum Color//颜色
{RED=2,GREEN=4,BLUE=8
};
2.枚举类型的优点
可以使用#define定义常量,为什么要用枚举?
枚举的优点:
- 增加代码的可读性和维护性
- 和#define定义的标识符比较,枚举有类型检查,更加严谨
- 便于调式,预处理阶段会删除#define定义的符号
- 使用方便,一次可以定义多个常量
- 枚举变量是遵循作用域规则的,枚举声明在函数内,只能在函数内使用
3.枚举类型的使用
enum Color//颜色
{RED=1,GREEN=2,BLUE=4
};enum Color clr=GREEN;//使用枚举常量给枚举变量赋值
在C语言中可以拿常数给枚举变量赋值,在c++中不可以