先行了解的知识:
1. 编码和解码
计算机内存储的信息都是二进制表示。
我们看到的英文,数字,汉字等在计算机内如何表示,那就需要编码
计算机内存储的信息需要解析出来,那就是解码
2.字符集与分类
- 什么是字符集?
- 一系列文字和符号,数字的总称(比如:a-z,A-Z,0-9,*&^%$#等)
- 分类:
- ASCII
- 控制字符或者通信字符,大小写字母,数字,特殊字符
- 127以下的叫做半角字符
- GBK(主要用于处理中文汉字)
- GB2312(主要用于处理中文汉字)
- ASCII里面的和汉字,罗马希腊字母
- Unicode
- 解决:跨语言,跨平台文本转换和处理的要求
- ASCII
3.代码点,编码字符集,字符编码
- 代码点:对字符集中的字符赋予一个编号(比如)
- 编码字符集:对字符集里面所有字符进行编号后的集合
- 字符编码:将字符对应的代码点转换成计算机内部可以识别的二进制规则
- ASCII
- 需要1个字节
- GBK
- UTF-8
- 字符长度1-4个不等,根据需要
- ASCII