【C++】了解一下编码

个人主页 : zxctscl
如有转载请先通知

文章目录

  • 1. 前言
  • 2. ASCII编码
  • 3. unicode
  • 4. GBK
  • 5. 类型转换

1. 前言

看到string里面还有Template instantiations:
在这里插入图片描述
string其实是basic_string<char>,它还是一个模板。
在这里插入图片描述
再看看wstring:
在这里插入图片描述
来看看什么是wchar_t?
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述
来看看一个字符在不同编码下的大小:

char ch1;wchar_t ch2;char16_t ch3;char32_t ch4;cout << sizeof(ch1) << endl;cout << sizeof(ch2) << endl;cout << sizeof(ch3) << endl;cout << sizeof(ch4) << endl;

在这里插入图片描述
编码就是文字在计算机的存储和表示。

2. ASCII编码

在之前C语言就经常用到ASCII编码:
ASCII (American Standard Code for Information Interchange):美国信息交换标准代码是基于拉丁字母的一套电脑编码系统,主要用于显示现代英语和其他西欧语言。它是最通用的信息交换标准,并等同于国际标准 ISO/IEC 646。ASCII第一次以规范标准的类型发表是在1967年,最后一次更新则是在1986年,到目前为止共定义了128个字符

在计算机的内存和硬盘里面不可能存字母,它存的只有0和1。

那么一段英文文字,那么怎么存储到计算机中呢?
交换映射,看看ASCII表
在这里插入图片描述

用8个bit就可以表达2^8个值,无符号就是0-255,有符号就是-128-127。

举个例子:
a在内存中存的是ASCII码值是97,也就是16*6+1
在这里插入图片描述
而要在显示器上面显示a时,又会去查97对应的是哪个字符,找到后显示出来:
在这里插入图片描述

ASCII码值就是那些符号对应的二进制和十进制的值。
所以编码表是符号和这些值映射的表。

像下面给的是整形98,但类型是char,它要查ASCII码,对应的就是b:
在这里插入图片描述

3. unicode

但ASCII不能表示中文,想要把中文存在计算机上面,一个字节不够表达中文,那么要怎么表达呢?

统一码(Unicode),也叫万国码、单一码,由统一码联盟开发,是计算机科学领域里的一项业界标准,包括字符集、编码方案等。
统一码是为了解决传统的字符编码方案的局限而产生的,它为每种语言中的每个字符设定了统一并且唯一的二进制编码,以满足跨语言、跨平台进行文本转换、处理的要求。

在这种语言环境下,不会再有语言的编码冲突,在同屏下,可以显示任何语言的内容,这就是统一码的最大好处。就是将世界上所有的文字用2个字节统一进行编码。那样,像这样统一编码,2个字节就已经足够容纳世界上所有语言的大部分文字了。
在这里插入图片描述

在统一码中,汉字“字”对应的数字是23383。在统一码中,我们有很多方式将数字23383表示成程序中的数据,包括:UTF-8、UTF-16、UTF-32。UTF是“UCS Transformation Format”的缩写,可以翻译成统一码字符集转换格式,即怎样将统一码定义的数字转换成程序数据。
在这里插入图片描述
像string就适合UTF-8。
在这里插入图片描述

在这里插入图片描述

在这里插入图片描述
UTF-16
UTF-16编码以16位无符号整数为单位。我们把统一码编码记作U。编码规则如下:
如果U<0x10000,U的UTF-16编码就是U对应的16位无符号整数

为了将一个WORD的UTF-16编码与两个WORD的UTF-16编码区分开来,统一码编码的设计者将0xD800-0xDFFF保留下来,并称为代理区(Surrogate):
D800-DB7F ║ High Surrogates ║ 高位替代
DB80-DBFF ║ High Private Use Surrogates ║ 高位专用替代
DC00-DFFF ║ Low Surrogates ║ 低位替代

这个适合UTF-16:
在这里插入图片描述

在这里插入图片描述

这个适合UTF-32:
在这里插入图片描述

常用的是UTF-8,它能兼容ASCII。

有时候没有初始化时候就会出现这样:

在这里插入图片描述

4. GBK

GBK全称《汉字内码扩展规范》(GBK即“国标”、“扩展”汉语拼音的第一个字母,英文名称:Chinese Internal Code Specification) ,中华人民共和国全国信息技术标准化技术委员会1995年12月1日制订,国家技术监督局标准化司、电子工业部科技与质量监督司1995年12月15日联合以技监标函1995 229号文件的形式,将它确定为技术规范指导性文件。2000年已被GB18030-2000《信息交换用 汉字编码字符集 基本集的扩充》国家强制标准替代。 2005年GB18030-2005发布,替代了GB18030-2000。

在这里插入图片描述

5. 类型转换

把其他类型转换成string类型就用to_string
在这里插入图片描述
举个例子:

    int i = 1234;double d = 11.22;string s1 = to_string(i);string s2 = to_string(d);

在这里插入图片描述
在这里插入图片描述
stoi把字符串转其他类型。
在这里插入图片描述
举个例子:

string s3("45.55");
double d3 = stod(s3);

在这里插入图片描述

有问题请指出,大家一起进步!!!

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/news/751600.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

Linux中的文件类型

一、Linux系统如何区分文件类型&#xff1f; Linux系统中不以文件后缀名来区分文件类型&#xff0c;而是通过文件属性中第一列来区分 &#xff08;Linux系统不以文件后缀名区分文件类型&#xff0c;但是不代表Linux系统不使用文件后缀名&#xff0c;LInux系统中的许多工具例如…

Linux 自带的耳机拔插检测驱动

Linux 自带的耳机拔插检测驱动是混在声卡驱动中&#xff0c;耳机拔插状态通过 input 子系统上报。 kernel-5.15/sound/soc/generic/simple-card-utils.c 571 int asoc_simple_init_jack(struct snd_soc_card *card, 572 struct asoc_simple_jack *sjack, 573 in…

C#按下enter键时keydown无响应的问题

KeyPreview已经设置为true了之后&#xff0c;按下enter键keydown不响应&#xff0c;但会根据系统默认的响应方法&#xff08;重复按下焦点所在button键&#xff09;做出响应。 解决方法&#xff1a; 在Form类中添加函数&#xff1a; protected override bool ProcessDialogKe…

AWTK 开源串口屏的配置文件

配置文件 每个 HMI 应用程序都需要一个配置文件&#xff0c;用于配置 HMI 的基本信息、服务、持久化、告警信息、历史数据等。 文件位置 design/default/data/settings.json基本配置 name - 名称&#xff08;必须配置&#xff0c;只能用字母、数字、下划线&#xff09; se…

如果网络不好 如何下载huggingface上的模型

很多朋友网络不太好&#xff0c;有时候上不了huggingface这样的国外网站&#xff1b; 或者网络流量不太够&#xff0c;想要下载一些stable diffusion模型&#xff0c;或者其他人工智能的大模型的时候&#xff0c;看到动辄几个G的模型文件&#xff0c;不太舍得下载&#xff1b;…

5 张图带你了解分布式事务 Saga 模式中的状态机

大家好&#xff0c;我是君哥。 状态机在我们的工作中应用非常广泛&#xff0c;今天聊一聊分布式事务中间件 Seata 中 Saga 模式的状态机。 1 状态机简介 状态机是一个数学模型&#xff0c;它将工作中的运行状态和流转规则抽象出来&#xff0c;可以协调相关信号来完成预先设定…

Pycharm安装阿里云通义码灵插件图文教程

前提&#xff1a;必须安装pycharm&#xff0c;可以访问 pycharm下载链接打开页面下载 点击下载后&#xff0c;将下载文件打开&#xff0c;然后无脑安装&#xff0c;安装好后继续看。 然后就安装好了&#xff0c;然后关闭安装&#xff0c;然后打开pycharm即可。 &#x1f680;…

【XML】xml转Freemind思维导图

通过以下代码可以将xml转换为Freemind软件的思维导图&#xff0c;方便查看各数据结构该代码运行需要安装lxml库 pip install lxml使用方式示例 python xml2mm.py *.xml *.mm转化完成示例&#xff0c;使用Freemind软件打开&#xff0c;该软件在ubuntu的软件商店中即可下载pyth…

如何在idea中配置tomcat服务器,然后部署一个项目

文章目录 前言第一步 先新建一个空项目第二步 添加框架支持第三步 添加配置及如何部署最后一步 运行及检查有没有问题总结 前言 本章学习的是在idea中配置tomcat服务器&#xff0c;然后部署一个项目 如果没有下载Tomcat服务器的可以在上一个博客观看下载及手动部署&#xff0c;…

es6有哪些新特性?

ES6&#xff08;ECMAScript 2015&#xff09;引入了许多新特性&#xff0c;使 JavaScript 更加现代化、强大和易用。以下是一些 ES6 的主要新特性&#xff1a; let 和 const 声明&#xff1a;引入了 let 和 const 关键字用于声明变量&#xff0c;let声明的变量具有块级作用域&a…

Ubuntu系统中尚未安装NVIDIA驱动程序

当执行命令&#xff1a; nvidia-smi提示 Command nvidia-smi not found, but can be installed with:apt install nvidia-340 # version 340.108-0ubuntu5.20.04.2, or apt install nvidia-utils-390 # version 390.157-0ubuntu0.20.04.1 apt install nvidia-utils-450-ser…

【通信原理笔记】【二】随机信号分析——2.2 平稳随机过程

文章目录 前言一、平稳随机过程1.1 广义平稳过程1.2 遍历性 二、两个随机过程之间的关系2.1 联合平稳2.2 随机过程的相关关系2.2.1 随机变量的不相关2.2.2 随机过程的不相关 总结 前言 我们学习了随机信号以及随机信号的相关函数与功率谱的计算方法&#xff0c;但是这种计算还…

如何利用图像识别算法检测人是否打领带

使用图像识别算法来检测图像中的人是否打了领带&#xff0c;可以分为几个步骤来进行&#xff1a; 图像收集与预处理&#xff1a; 收集大量包含人的图像数据&#xff0c;其中一些图像中人打了领带&#xff0c;另一些则没有。对这些图像进行预处理&#xff0c;如大小归一化、灰度…

【Python进阶】关于argparse库的使用:便捷参数读取,解析,编写

文章目录 1 实例化参数类&#xff0c;增加参数2 解析命令行参数3 处理参数4 综合示例 在Python中&#xff0c; parser包通常指的是 argparse模块&#xff0c;它是Python标准库中的一部分&#xff0c;用于解析命令行参数。 argparse模块使得编写命令行接口变得更加简单和灵活…

线程常用方法

一常用方法第一组 1.setName 设置线程名称&#xff0c;使之与参数name相同&#xff1b; 2.getName 返回该线程的名字&#xff1b; 3.start 使该线程开始执行&#xff0c;java虚拟机底层调用该线程的statr0方法&#xff1b; 4.run …

前端学习之css伪元素选择器

伪元素选择器 &#xff08;注释是对各个内容的解释与理解&#xff09; <!DOCTYPE html> <html lang"en"> <head><meta charset"UTF-8"><title>伪元素选择器</title><!-- 双冒号开头一般都称为伪元素&#xff0c;…

C#在企业级应用软件开发中的实践深度探讨

C#在企业级应用软件开发中的实践深度探讨 一、引言 企业级应用软件通常要求高度的稳定性、安全性、可扩展性以及复杂的业务逻辑处理能力。C#作为.NET平台上的主流语言&#xff0c;配合现代化的开发框架和工具&#xff0c;为构建此类软件提供了强大的支持。本文将深入剖析使用C#…

代码随想录算法训练营day24 | 回溯算法理论基础、77.组合

目录 回溯算法定义回溯法的效率回溯法解决的问题回溯算法模板 组合思路解题方法复杂度Code 总结 回溯算法 定义 回溯法也叫做回溯搜索法&#xff0c;它是一种搜索的方式。 回溯是递归的副产品&#xff0c;只要有递归就会有回溯。 回溯函数也就是递归函数&#xff0c;指的都…

面向对象编程第三式: 多态 (Java篇)

本篇会加入个人的所谓‘鱼式疯言’ ❤️❤️❤️鱼式疯言:❤️❤️❤️此疯言非彼疯言 而是理解过并总结出来通俗易懂的大白话, 小编会尽可能的在每个概念后插入鱼式疯言,帮助大家理解的. &#x1f92d;&#x1f92d;&#x1f92d;可能说的不是那么严谨.但小编初心是能让更多人…

(三)OpenOFDM符号对齐

符号对齐 模块&#xff1a;sync_long.v输入&#xff1a;I (16), Q (16), phase_offset (32), short_gi (1)输出&#xff1a;long_preamble_detected (1), fft_re (16), fft_im (16) 检测到数据包后&#xff0c;下一步是精确确定每个 OFDM 符号的起始位置。在802.11中&#xf…