计算机的字符与编码集

文章目录

  • 前言
  • 一、字符编码集的历史
    • 1.ASCII码
    • 2.Extended ASCII码
    • 3.字符编码集的国际化
  • 二、中文编码集


前言

今天给大家介绍计算机的字符与编码集,分为两部分:字符编码集的历史中文编码集


一、字符编码集的历史

这部分包含三个板块内容:ASCII码Extended ASCII码字符编码集的国际化

1.ASCII码

对于ASCII码,相信接触过编程的人应该都不陌生,它是我们平时常用的一种编码方式,如大小写字母、数字、符号等等都是属于ASCII码里面的。ASCII码特点如下:

  • 使用7个bits就可以完全表示ASCII码
  • 包含95个可打印字符
  • 33个不可打印字符(包括控制字符)

我们可以做个简单运算:33 + 95 = 128 = 2^7,接下来我们通过下表来完整了解ASCII码的所有字符:

在这里插入图片描述

从表中我们可以看出,前面的32个控制字符加上表中最后一个共是33个控制字符,其他的都是我们常见的可打印字符。二战时期,计算机最早诞生于美、英国家,所以在计算机发展的早期,ASCII码就已经能满足相关国家和科学家的使用。

但随着计算机发展及普及,ASCII码逐渐无法满足需求。主要表现在:ASCII码里面,很多应用或者国家中的符号都无法表示。如数学符号 “÷ ≠ ≥ ≈ π” 等等一些字符ASCII码都无法表示。

这时候就想到了第一次对ASCII码进行扩充,7bits => 8bits,使用8个比特位代替原来的7比特,那么原来的 127 个字符就可以扩充为 256 个字符了,也就是可拓展的ASCII码:Extended ASCII码

2.Extended ASCII码

如下表所示,为扩展的那部分ASCII码:
在这里插入图片描述

从中可以看到,包含了常见数学运算符、带音标的欧洲字符、其他常用符、表格符等。使用了这个可拓展的ASCII码极大的补充了原来ASCII码所不能展示的内容,使得计算机所能表达的内容越来越丰富。

虽然在这里面,可拓展的ASCII码补充了原有ASCII码所不能表达的内容。但是随着计算机的进一步发展,越来越多的国家加入了使用计算机的行列当中,那么这个时候,对于计算机的字符与编码集的要求也越来越高,我们就需要了解字符编码集的国际化了。

3.字符编码集的国际化

对于字符编码集的国际化,有着如下的背景:

  • 欧洲、中亚、东亚、拉丁美洲国家的语言多样性
  • 语言体系不一样,不以有限字符组合的语言(如拿中文和英文做比较,对于英文来说所有单词都是由26个字母组成。但是中文就不一样了,除了偏旁部首外,每个字都是独立的,可以再组成不同词汇,也就是不以有限字符为组合)
  • 中国、韩国、日本等的语言最为复杂

在这种情况下,字符编码集的国际化就尤为重要了。在这里面,我们主要是了解中国的字符编码集,接下来就来到第二个大板块。

二、中文编码集

对于中文编码集,首先要介绍的是 GB2312,该编码集是在1980年发明出来,也是我国最早发明的编码集。它的全称是《信息交换用汉字编码字符集-------基本集》,简称 GB2312(国标2312)。这个编码集一共收录了 7445 个字符,其中包括 6763 个汉字和 682 个其它符号。

虽然这个编码集有比较完备的字符表示,但是也有一定的问题:不符合国际标准。因此,在1995年就推出了更完善的编码集:GBK,全称是《汉字内码扩展规范》。该编码集向下兼容GB2312,向上支持国际ISO标准。而且收录了 21003 个汉字,支持全部中日韩汉字。

上面介绍的 GB2313 和 GBK 都是比较完备的编码集,但是不管怎么完备,都只是本地化的编码。也就是说,这个编码在中国使用是没有问题的,但如果跨国使用就有问题。什么意思呢?举个例子:比如我们开发了一个中文网站,这时候外国友人访问了这个网站,如果他们本地没有安装 GBK 或者 GB2312 编码的话,这个网页在他们电脑里面去显示的话就是乱码的。

所以这个时候,我们不仅要有本地化的编码,还要有一个全球的规范。这个规范就是:Unicode 字符集,Unicode又称为:统一码、万国码、单一码,也就是说 Unicode 可以表达全世界所有的语言。它定义了世界通用的符号集,使用 UTF-* 实现了编码(如UTF-8、UTF-16)。其中UTF-8是最为通用的全球编码方式,它以字节为单位对Unicode进行编码

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/news/104447.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

【通信系列 5 -- HTTPS 介绍】

文章目录 1.1 HTTPS链接网址1.1.1 HTTPS 产生背景1.1.2 HTTPS工作内容1.1.3 SSL/TLS1.1.4 TLS 的命名规范1.1.5 TLS 加密算法1.1.6 分组模式1.1.7 摘要算法1.1.8 非对称加密1.1.9 CA认证 1.2 openssl1.2.1 RSA 签名验签 1.1 HTTPS链接网址 HTTP 是一种 超文本传输协议(Hyperte…

DOCKER本地仓库

概述 随着docker的应用越来越多,安装部署越来越方便,批量自动化的镜像生成和发布都需要docker仓库的本地化应用。 试用了docker的本地仓库功能,简单易上手,记录下来以备后用。 环境 centos:CentOS release 7.0 (F…

CANoe创建仿真工程

CANoe创建仿真工程 写在前面仿真工程的创建创建工程添加CAN数据库添加系统变量创建面板创建网络节点为节点添加代码工程运行测试总结 写在前面 Canoe的安装不是特别方便,我是参加了松勤的培训课程,不仅需要安装软件还需要安装驱动,刚刚学习的…

[程序人生]常用的Linux命令简称与全称

常用的Linux命令简称与全称 引言 学习Linux系统操作的时候,那些命令很难记,让人头大。 本文给出Linux系统中常用的命令简称与全称。 正文 以下是常用的Linux命令简称与全称: pwd (print working directory):显示当前工作目录的…

【PWN · 栈迁移】[CISCN 2019东南]PWN2

一道非常典型、适合用作学习栈迁移的题目。 前言 当存在栈溢出但是溢出字符数并不多的情况下,可以尝试在别处构造rop链,通过栈迁移到目标内存区域,执行rop链。这里不讲栈迁移原理,仅是对题目的分析,适合对栈迁移有初步…

【stm32】外部中断接口函数

1、外部中断回调函数 2、外部中断通用处理函数

React闭包

声明 本文将深入探讨React与闭包之间的关系。 我们将首先介绍React和闭包的基本概念,然后详细解释React组件中如何使用闭包来处理状态和作用域的问题。 通过本文的阅读,你将对React中闭包的概念有更深入的理解,并能够在开发React应用时更好地…

MySQL InnoDB存储引擎的缓冲池和内存性能优化

MySQL数据库的InnoDB存储引擎详细记录了其缓冲池(Buffer Pool)和内存(Memory)的统计信息,这些信息在分析数据库性能和进行优化时非常重要。这些信息可以通过语句以下查询获取。 SHOW ENGINE INNODB STATUS; 本文将对这些统计信息进行介绍,并给出优化建…

eventfd

1. #include <sys/eventfd.h> int eventfd(unsigned int initval, int flags); //创建eventfd 参数含义&#xff1a; initval&#xff1a;创建eventfd时它所对应的64位计数器的初始值&#xff1b; flags&#xff1a;eventfd文件描述符的标志&#xff0c;可由三种选项组…

WPF中的多重绑定

MultiBinding 将会给后端传回一个数组, 其顺序为绑定的顺序. 例如: <DataGridMargin"10"AutoGenerateColumns"False"ItemsSource"{Binding Stu}"><DataGrid.Columns><DataGridTextColumn Binding"{Binding Id}" Header…

bash一行输入,多行回显demo脚本

效果图&#xff1a; 脚本&#xff1a; #!/bin/bash # 定义一个变量&#xff0c;用来存储输入的内容 input"" # 定义一个变量&#xff0c;用来存储输入的字符 char""# 为了让read能读到空格键 IFS_store$IFS IFS# 提示内容&#xff0c;在while循环中也有&a…

three.js入门 —— 实现第一个3D案例

前言&#xff1a; three.js入门&#xff0c;根据文档实现第一个3D案例 效果图&#xff1a; 代码实现&#xff1a; const scene new THREE.Scene();//创建一个长方体几何对象Geometryconst geometry new THREE.BoxGeometry(100, 100, 100);//创建一个网络基础材质的材质对象…

机器人革命:脑洞大开的前沿机器人技术!

原创 | 文 BFT机器人 01 由生物启发的多模式移动形态机器人 在一个不断运动的世界中&#xff0c;一种新开发的名为M4&#xff08;多模式移动形态机器人&#xff09;的机器人展示了在包括滚动、飞行和行走在内的八种不同运动模式之间切换的能力。这款机器人由加州理工学院自主…

Eclipse中常用的操作单词

Eclipse中常用的操作单词 Existing Project into Workspace 现有的工程引入工作空间(加载工程) File 文件 New 新建 Project 工程 Folder 文件夹 Import 引入(加载&导入) Run As 运行 Applicatio…

Java系列之:深入理解设计模式

Java系列之:深入理解设计模式 一、设计模式相关技术文章二、设计原则三、设计模式概念四、设计模式的分类五、创建性模式六、创建性模式-工厂方法模式七、创建性模式-抽象工厂模式八、创建性模式-构建器模式九、面向对象设计-结构性模式十、结构性模式-适配器模式十一、结构性…

SOLIDWORKS® 2024 新功能 - 3D CAD

1、 先前版本的兼容性 • 利用您订阅的 SOLIDWORKS&#xff0c;可将您的 SOLIDWORKS 设计作品保存为旧版本&#xff0c;与使用旧版本 SOLIDWORKS 的供应商无缝协作。 • 可将零件、装配体和工程图保存为新版本前两年之内的SOLIDWORKS 版本。 优点&#xff1a; 即使其他用户正…

conda 创建虚拟环境

1.为什么要创建虚拟环境 我们在做开发或者跑论文实验可能会同时进行多个任务&#xff0c;这些任务可能会依赖于不同的python环境&#xff0c;比如有的用到3.6有的用到3.7&#xff0c;这时我们创建不同版本的python&#xff0c;放到虚拟环境中给不同的任务分别提供其所需要的版本…

腾讯云短信服务申请, api测试,发送含字母短信

参考&#xff1a;https://blog.csdn.net/weixin_49001740/article/details/125236893 另外补充&#xff1a;申请的模板中含有”验证码“ 的字&#xff0c; 模板变量 {1} 会被限制&#xff0c;只能发送0-6位的纯数字内容&#xff0c; 如果要发送带有字母的内容&#xff0c;就不要…

Git相关知识(1)

目录 1.初识Git 1.基础知识 2.centos中下载 2.基本操作 1.创建本地仓库 2.配置本地仓库 3.版本库、工作区、暂存区 4.添加文件 5.add和commit对git文件的作用 6.修改文件 7.版本回退 8.撤销修改 9.删除文件 3.分支操作 1.HEAD与分支 2.创建分支 3.删除分支 …

灿芯股份将上会:计划募资6亿元,董事长、总经理均为外籍

10月11日&#xff0c;上海证券交易所披露的信息显示&#xff0c;灿芯半导体&#xff08;上海&#xff09;股份有限公司&#xff08;下称“灿芯股份”&#xff09;将于10月18日接受上市审核委员会审议会议的现场审议。目前&#xff0c;该公司已递交了招股书&#xff08;上会稿&a…