字符编码
-
什么是计算机编码
计算机只能处理二进制的数据,其它的数据都要进行转换,但转换必须要有一套字符编码(是字符与二进制的一个对应关系)。常用的字符:a-z、0-9、其它的符号等,计算机也不能直接处理。
(字符编码类似于翻译的字典)
-
常用的计算机编码(字符集、字符编码)
ASCII编码:American Standard Code for Information Interchange美国信息交换标准代码
用1个字节(7位或8位二进制)来表示一个字符。比如:字母a,用二进制表示01100001
- ANSI编码:其它国家为了显示本国的语言,都对ASCII码进行了扩展,加入了本国的语言编码。
- ANSI编码都是用两个字节(16位二进制)来表示一个汉字。
- ANSI编码跟操作系统有直接关系,你安装什么操作系统,那你的ANSI编码就是相应的编码。
例如:我们安装的是中文操作系统,对应的默认编码GB2312。
- GB2312编码:对6763个常用汉字和682个全角字符进行了编码。GB2312编码用两个字节表示一个汉字,所以理论上最多可以表示2^16=65536个汉字。
- GBK编码:对GB2312进行了扩展,用于显示一些罕见的汉字。
- BIG5编码:繁体汉字编码
- JIS编码:日本文字编码