前言:我们在初学C语言的时候,总是避免不了一些数据类型的转换,例如int-->char,char-->int,如果我们仅仅只学习这些语法,而不去了解底层原理,对于这些输出的内容,我们可能会感觉到茫然,今天这篇就带你了解整数类型之间的转换
目录
一、整型数据在计算机中的存储形式
1、原码、反码、补码
2、大小端
(1)什么是大小端
(2)为什么有大小端
(3)相关笔试题
二、不同整数数据类型之间的转换
1、长整型转短整型
2、短整型转长整型
一、整型数据在计算机中的存储形式
1、原码、反码、补码
在计算机组成原理中,我们会学到计算机中整数的三种表现形式,即原码,反码,补码,而整型数据的存储是以补码形式进行存储的。
(1)原码:直接将二进制按照正负数的形式转换成二进制。
(2)反码:将原码的符号位不变,其他位依次按位取反。
(3)补码:反码+1。
那么,为什么要采用补码进行存储呢?因为使用补码,可以将符号位和数值域统一处理;同时,加法和减法也可以统一处理(CPU只有加法器)此外,补码与原码相互转换,其运算过是相同的,不需要额外的硬件电路。
对于正数的存储:原码=反码=补码
eg:int 35
35转为二进制:00000000 00000000 00000000 00100011
则在计算机中存的就是00000000 00000000 00000000 00100011
对于负数的存储:补码 <---- 反码+1 <---- 反码(原码取反) <---- 原码
eg:int -35
|-35| = 35(先取正数)转为二进制:00000000 00000000 00000000 00100011
取反:11111111 11111111 11111111 11011100
+1:11111111 11111111 11111111 11011101
则在计算机中存的就是11111111 11111111 11111111 11011101
当我们要读的时候就需要进行逆运算,即对计算机中存储的补码进行-1再取反。
2、大小端
(1)什么是大小端
大端(存储)模式:是指数据的低位保存在内存的高地址中,而数据的高位,保存在内存的低地址中。
小端(存储)模式:是指数据的低位保存在内存的低地址中,而数据的高位,,保存在内存的高地址中。
我们以1为例,用图来展示:
(2)为什么有大小端
为什么会有大小端模式之分呢?这是因为在计算机系统中,我们是以字节为单位的,每个地址单元都对应着一个字节,一个字节为8bit。但是在C语言中除了8 bit的char之外,还有16 bit的short型,32 bit的long型(要看具体的编译器),另外,对于位数大于8位的处理器,例如16位或者32位的处理器,由于寄存器宽度大于一个字节,那么必然存在着一个如何将多个字节安排的问题。因此就导致了大端存储模式和小端存储模式。
例如:一个 16bit 的 short 型 x ,在内存中的地址为 0x0010 , x 的值为 0x1122 ,那么 0x11 为高字节, 0x22 为低字节。对于大端模式,就将 0x11 放在低地址中,即 0x0010 中,0x22 放在高地址中,即 0x0011 中。小端模式,刚好相反。我们常用的 X86 结构是小端模式,而KEIL C51 则为大端模式。很多的ARM,DSP都为小端模式。有些ARM处理器还可以由硬件来选择是大端模式还是小端模式。
(3)相关笔试题
百度2015年系统工程师笔试题:请简述大端字节序和小端字节序的概念,设计一个小程序来判断当前机器的字节序。(10分)
我们用一个简单的数来测试,例如我们上面举的例子1
#include<stdio.h> int main() {int a = 1;char* p = (char*) & a;//取a的第一个bitif (1 == *p){printf("小端\n");//如果低地址为数据低位(也就是1),则为小端}else{printf("大端\n");//如果低地址为数据高位(也就是0),则为大端}return 0; }
二、不同整数数据类型之间的转换
1、长整型转短整型
我们常见的长转短有:int ---> char,int ---> short,short ---> char
对于长整型转短整型,很简单,我们采用低字节拷贝,高字节丢弃的原则就可以了,例如:
char a = 35;
首先,我们看这个语句,35默认是个int型数据,但是需要赋值给一个char类型的a,所以我们要用到长 ---> 短的原则。
35的补码:00000000 0000000 00000000 00100011
丢弃高字节,拷贝低字节,由于char类型是8个bit位,所以我们只需要拷贝低8位:
即 a(char):00100011
对于负数,也是一样的道理,例如:
char b = -35;
-35的补码:11111111 11111111 11111111 11011101
则a(char):11011101
2、短整型转长整型
我们常见的短转长有:char ---> int,short ---> int,short ---> char
对于短转长,我们分两种情况:
(1)如果短的是无符号,高位全部补0;
(2)如果短的是有符号,高位全部补符号位
前面补什么需要注意的是要看之前短的是有符号还是无符号!!!
我们通过下面这个例子来总结上面两种的使用,eg:
#include<stdio.h> int main() {char c = 250;//250为int型 int--->charchar d;d = c+8;//8位int型,c要和8相加,就要先转为int型printf("%d\n", c);// -6printf("%u\n", c);// 2^32-6printf("%d\n", d);// 2printf("%u\n", d);// 2 }
我们来分析这几个语句:
250的补码:00000000 00000000 00000000 11111010
根据上面的长转短:
c(char):11111010
c+8:其中8为int型,所以我们要先把c(char)转为int型,而c(char)是个有符号的整型,且最高位为1,所以前面补1
c+8(int):
11111111 11111111 11111111 11111010
+00000000 00000000 0000000 00001000
------------------------------------------------------------------
1 00000000 00000000 0000000 00000010 (超出bit位的1丢掉)
则c+8:00000000 00000000 0000000 00000010
d(char):00000010
解释printf("%d\n", c);
c(char):11111010
c为char类型,而%d是以整数形式输出,所以需要把c(char)转为int型再输出。
c(char) ----> int:
11111111 11111111 11111111 11111010
通过最高位,也就是符号位为1,可知这是一个负数,所以要通过逆运算来求原来的数据,通过-1再取反得:
11111111 11111111 11111111 11111001 <------- -1
00000000 00000000 00000000 00000110 <------- 取反
所以结果为-6(记得添上负号)。
解释printf("%u\n", c);
%u为无符号整型(即无符号int型)输出,通过上面我们知道,
c(char) ----> int:
11111111 11111111 11111111 11111010
把它看成无符号也就是忽略前面的符号位,直接作为原码输出。
输出结果:2^32 - 6
知识点:一个负整数和一个较大的正整数的补码形式(在计算机中的存储)是一样的。
eg:(-x)=(2^n-x),n表示用多少个bit来存储整数。
解释printf("%d\n", d);
解释printf("%u\n", d);
d(char):00000010
d(char) ----> int:
00000000 00000000 00000000 00000010
是个正数,原反补相同,无论是无符号还是有符号输出,都是直接作为原码输出,结果为2。
到这里,就是整型数据的介绍啦!通过这次学习,我相信大家一定可以更加深刻的理解了数据在内存中的存储,而理解了数据在内存中的存储形式,可以让我们对代码编写的质量有一定的提高,也能更加的细节!