Unicode字符以及UTF-8

  • 前提基础知识
    计算机内部,所有信息最终都是一个二进制值。每一个二进制位(bit)有0和1两种状态,因此八个二进制位就可以组合出256种状态,这被称为一个字节(byte)。也就是说,一个字节一共可以用来表示256种不同的状态,每一个状态对应一个符号,就是256个符号,从00000000到11111111。

1.概念

1.1 Unicode

  • 定义:
    Unicode是一个字符集标准,它定义了每个字符的唯一编号,包括了世界上几乎所有的字符。
  • 示例:
拉丁字母:A(Unicode编码:U+0041)
汉字:中(Unicode编码:U+4E2D)
表情符号:😊(Unicode编码:U+1F60A)
每个Unicode字符都有一个独一无二的编号,称为“码点”。这个编号通常用“U+”后跟一串十六进制数表示。例如,拉丁字母“A”的Unicode码点是U+0041。通过这种方式,Unicode能够支持超过100,000个不同的字符。
  • 结论:
    拿“汉字:中(Unicode编码:U+4E2D)”举例。
汉字“中”是一个Unicode字符。
而U+4E2D是汉字“中”的Unicode编码(码点)。

1.2 UTF-8

Unicode 是字符集,它定义了一套字符和对应的码点。
UTF-8 是字符编码,是一种针对Unicode的编码方案。它定义了如何将这些字符(码点)转换为字节序列(电脑存储和处理数据的基本单位)。
它使用一到四个字节来表示每个Unicode码点,使得它非常有效率,尤其是对于常用的拉丁字符(如英文),这些字符只需要一个字节就可以表示。

2.二者之间的关系

  • UTF-8和GBK都是Unicode的实现方式,而Unicode是一个字符集标准,它定义了每个字符的唯一编号,包括了世界上几乎所有的字符。

  • UTF-8和GBK的区别在于编码方式不同。UTF-8采用变长编码,可以表示Unicode字符集中的任意字符,而且对于英文字符采用1个字节编码,对于汉字采用3个字节编码。GBK采用双字节编码,只能表示汉字和部分符号,对于英文字符采用1个字节编码。

  • UTF-8和GBK的兼容性不同。UTF-8兼容ASCII编码,因为ASCII编码是UTF-8的子集,而GBK不兼容ASCII编码,因为GBK编码中没有ASCII编码中的字符。

  • Unicode是一种字符集标准,不是编码方式。Unicode定义了每个字符的唯一编号,但是没有规定如何将这些编号转换为计算机可以识别的二进制数据。因此,UTF-8、GBK等编码方式都是Unicode的实现方式。

总的来说,UTF-8是一种通用的编码方式,可以表示Unicode字符集中的任意字符,而且兼容ASCII编码。GBK是一种中文编码方式,只能表示汉字和部分符号,不兼容ASCII编码。Unicode是一个字符集标准,定义了每个字符的唯一编号,但是没有规定如何将这些编号转换为计算机可以识别的二进制数据。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/news/583970.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

Go 语言如何读取 excel 测试数据,简单易学

📢专注于分享软件测试干货内容,欢迎点赞 👍 收藏 ⭐留言 📝 如有错误敬请指正!📢交流讨论:欢迎加入我们一起学习!📢资源分享:耗时200小时精选的「软件测试」资…

算法基础day2

前缀和 #include <iostream> using namespace std; const int N100010; int n,m; int a[N],s[N]; int main() {scanf("%d%d",&n,&m);for(int i1;i<n;i) scanf("%d",&a[i]);for(int i1;i<n;i) s[i]s[i-1]a[i];while(m--){int l,r;s…

Gooxi亮相2023中国数据与存储峰会展示最新存储解决方案

今日&#xff0c;以“数智创新&#xff0c;AI未来”为主题的2023 中国数据与存储峰会在北京顺利举行&#xff0c;Gooxi受邀参与并展示了最新存储服务器产品&#xff0c;搭配最新处理器平台&#xff0c;能够广泛应用在人工智能、数据分析、云端计算、数据存储和高性能计算等领域…

兔子目标检测数据集VOC格式3900张

兔子是一类可爱的哺乳动物&#xff0c;拥有圆润的脸庞和长长的耳朵&#xff0c;身体轻盈柔软。它们通常是以温和和友善的形象出现在人们的视野中&#xff0c;因此常常成为童话故事和卡通形象中的角色。 兔子是草食性动物&#xff0c;主要以各种草本植物为食&#xff0c;包括草…

python查找mongo中符合条件的json记录

一、需求&#xff1a; 之前有次需要临时查找mongo中存储的json串&#xff0c;符合特定条件的记录&#xff1b; 举个例子&#xff0c;mongo中记录如下图&#xff1a; 其中每条存储的数据大概为&#xff1a; [{"createUser": "Zxtech","paramName&qu…

NFC与ZigBee技术在智慧农业物联网监测系统中的应用

近年来&#xff0c;我国农业物联网技术飞速发展&#xff0c;基于物联网技术的智能农业监测系统有望得到较大规模的推广应用。但传统的物联网农业监测系统其网络结构层次单一&#xff0c;多采用基于有线或无线结构的节点-上位机数据采集模式&#xff0c;节点数据访问模式缺乏灵活…

融资融券业务

基本业务名词 标的证券&#xff1a;允许融资买入的证券、融券卖出的证券。业务系统中分别设立融资标的证券池和融券标的证券池。标的证券在交易所定期公布的范围内由券商进一步选择。 担保证券&#xff1a;监管部门&#xff08;交易所等&#xff09;公布的有资格作为融资融券…

【Leetcode 39】组合总和 —— 回溯法

39. 组合总和 给你一个无重复元素的整数数组candidates和一个目标整数target &#xff0c;找出candidates中可以使数字和为目标数target的 所有不同组合&#xff0c;并以列表形式返回。你可以按**任意顺序 **返回这些组合。 candidates中的同一个数字可以 无限制重复被选取 。…

『CV学习笔记』NVIDIA GPU监控工具nvidia-smi/gpustat/nvtop/nvitop

NVIDIA GPU监控工具nvidia-smi/gpustat/nvtop/nvitop 文章目录 一. nvidia-smi(最有名,没有之一🤚🤚)二. gpustat(彩色并简约的显示🤚🤚🤚🤚)三. nvtop(完整的信息,需root权限apt安装,不是非常方便🤚🤚🤚)1. 交互式设置窗口2. 保存首选项3. 特定发行版的安…

喜讯丨智安网络实力上榜《嘶吼2023中国网络安全产业势能榜》

近日&#xff0c;嘶吼安全产业研究院正式发布《嘶吼2023中国网络安全产业势能榜》。智安网络凭借在网络安全行业领先的产品实力、专业的安全服务水平及多年累积的行业经验&#xff0c;从300余家厂商中脱颖而出&#xff0c;成为《中国网络安全产业势能榜》互联网行业势能厂商。 …

【Kotlin】Kotlin的stream流编程浅析

Kotlin是一门由JetBrains公司开发的静态类型JVM语言&#xff0c;其可以与Java无缝集成。与Java相比&#xff0c;Kotlin的语法更简洁、更具表达性&#xff0c;而且提供了更多的特性&#xff0c;比如&#xff0c;高阶函数、操作符重载、字符串模板。今天要浅析的stream流操作就来…

ACM32F403/F433 12 位多通道国产芯片,支持 MPU 存储保护功能,应用于工业控制,智能家居等产品中

ACM32F403/F433 芯片的内核基于 ARMv8-M 架构&#xff0c;支持 Cortex-M33 和 Cortex-M4F 指令集。芯片内核 支持一整套DSP指令用于数字信号处理&#xff0c;支持单精度FPU处理浮点数据&#xff0c;同时还支持Memory Protection Unit &#xff08;MPU&#xff09;用于提升应用的…

27、商城系统(九):ElasticSearch的安装,基本查询,高级查询,聚合

目录 一、基本概念 二、docker安装es,kibana 三、基本查询 1.查看es节点信息

mac node基本操作

1 查看所有版本 npm view node versions输出 2 查看已经安装的版本 n list3 安装指定版本 sudo -E n 16.0.04 切换版本 sudo n 16.0.05 查看版本 node -v

HTML+CSS+JS网页设计期末课程大作业 web课程设计 web前端开发 网页规划与设计

HTMLCSSJS网页设计期末课程大作业 web前端开发技术 web课程设计 网页规划与设计 &#x1f4a5; 文章目录一、&#x1f6a9; 网站描述二、&#x1f38c; 网站介绍三、&#x1f3f4; 网站类型A 个人博客主题B 人物明星主题C 旅游主题D 游戏主题E 动漫主题F 美食主题G 校园主题H 企…

C2 CompilerThread11引起的CPU较高分析以及C2编译原理

1、触发机制和流程 CodeCache 深入了解_code cache-CSDN博客 这次我们来学习深入解析java虚拟机&#xff1a;C2编译器&#xff0c;编译流程吧-腾讯云开发者社区-腾讯云 2、JVM解释器和编译器 ​​​​​​j「JVM 编译优化」即时编译器_openjdk runtime environment (temuri…

K8S Helm安装RocketMQ standalone单机版,配置外网地址注册到nameserver中方便本地开发

K8S Helm安装RocketMQ standalone单机版&#xff0c;配置外网地址注册到nameserver中方便本地开发 helm地址 rocketmq 3.0.2 sir5kong/rocketmq helm repo add rocketmq https://helm-charts.itboon.top/rocketmq helm pull rocketmq/rocketmq tar -xvf rocketmq-3.0.2.t…

vue项目移动端点击图片放大预览(可拖拽,放大)

1.下载依赖 npm install vue-photo-preview -S 2.引入 main.js 中全局引入 import preview from vue-photo-preview import vue-photo-preview/dist/skin.css Vue.use(preview) 3. 应用 给图片加上 preview"0" 分组 <img preview"0" style"…

【XR806开发板试用】XR806串口驱动CM32M对小厨宝的控制实验

一.说明 非常感谢基于安谋科技STAR-MC1的全志XR806 Wi-FiBLE开源鸿蒙开发板试用活动,并获得开发板试用。 XR806是全志科技旗下子公司广州芯之联研发设计的一款支持WiFi和BLE的高集成度无线MCU芯片&#xff0c;支持OpenHarmony minisystem和FreeRTOS&#xff0c;具有集成度高、…

用通俗易懂的方式讲解大模型:基于 LangChain 和 ChatGLM2 打造自有知识库问答系统

随着人工智能技术的迅猛发展&#xff0c;问答机器人在多个领域中展示了广泛的应用潜力。在这个信息爆炸的时代&#xff0c;许多领域都面临着海量的知识和信息&#xff0c;人们往往需要耗费大量的时间和精力来搜索和获取他们所需的信息。 在这种情况下&#xff0c;垂直领域的 A…