Qt 4.8.7 + MSVC 中文乱码问题深入分析

此问题很常见,然而网上关于此问题的分析大多不够深刻,甚至有错误;加之Qt5又更改了一些编码策略,而很多文章并未提及版本问题,或是就算提了,读者也不重视。这些因素很容易让读者产生误导。今日我彻底研究透了这个问题,在此记录。

环境:Qt 4.8.7, Qt Creator 4.2.2, MSVC 2015

Qt 4.8.7 + MSVC 的中文乱码问题,实际上有两层原因。

第一层:MSVC 不识别无 BOM 的 UTF-8

Qt Creator 默认源代码文件编码是无BOM的UTF-8,而MSVC编译器会误认为这是本地多字节字符集(MBCS)编码(对于简中地区,即GBK,代码页936)。

解决方法1(推荐):Qt Creator选项—文本编辑器—文件编码—UTF8 BOM——如果编码是UTF8则添加—确定。
解决方法2:Qt Creator选项—文本编辑器—文件编码—默认编码—GBK—确定。

注意:修改以上两种方法提及的设置后,Qt Creator并不会自动修改已保存的文件的编码或BOM。我们需要修改一下含中文的文件,重新Ctrl+S保存,这样才能将这些设置应用于这些文件。

第二层:QString 构造函数默认假定的文本编码不正确

我们代码中的字符串,特别是用于测试这个乱码问题的字符串,一般都是C样式的,即用一对双引号包围的const char []类型字符串字面量,如 "Hello World" 。然而 Qt 里很多函数的参数要求的字符串类型都是 QString,我们填入这种C样式字符串时就会有个隐式转换,转为QString类型,其实也就是QString这个构造函数在帮我们转换:

explicit QString::QString(const char* ch)

 然而const char*类型只表明了这个字符串是多字节字符集,却没指明是哪一种,他可能是GBK, UTF-8等等,甚至可能是跟咱这边八竿子打不着的西欧语言字符集Latin-1(ISO-8859-1)。不加声明的话,MSVC默认我们的字符串字面量是本地多字节字符集(MBCS),即GBK编码,如下图左侧“标题title”文本所示情况。而如果在这种C样式字符串的引号前加上“u8”二字,则MSVC就会认为此字符串是UTF-8编码,如下图右侧“文本text”文本所示情况。

 MSVC在我们有或没有声明的情况下判断出了此字符串的编码后,对此字符串进行编码,也就是将它们转换为二进制的字节数据,传给QString的构造函数。

注意:
①即使在上一层问题的解决中,我们选择了保留UTF-8,加上BOM供MSVC识别,以上所述MSVC对C样式字符串的编码的解析方式仍然成立。他不会因为你的源码文件是UTF-8编码,就将其中的这种字符串优先视为UTF-8。所以上一层问题你选择了哪种解决方法对这一层问题是没有影响的。
②“u8”标记只是给MSVC编译器的提示,MSVC处理后,不管是加了u8还是没加,一律变成const char[]这样的字节数组。也就是说,有没有u8,QString的构造函数是不知道的,看不见的。他只知道传进来了一个const char* 类型。

传给QString的构造函数后,QString要解码这些二进制数据,也就是将它们映射到可显示(我们能看懂)的字符上。由于这些数据不能体现编码,他就要猜。咱当然希望他猜是GBK啦,但是事与愿违,Qt库毕竟不是中国人写的。他默认猜成西欧语言字符集Latin-1(如图)!这就会导致我们在代码里写了些汉字,却显示出一堆拉丁字母甚至音标。这也是为何在没有QString参与的情况下只解决第一层问题就好了,例如控制台窗口的std::cout,而在需要把const char*转换成QString时就又会出问题。

那么解决思路已经很明显了。要么修改它的设置,让他猜成GBK(或UTF-8),要么明明白白的告诉他我们的字符串是啥编码(使用 QString::fromXXX 函数)。

解决方法1(推荐):在 QApplication 对象创建前将“C样式字符串的编码(CodecForCStrings)”设为UTF-8,并在每个含中文的字符串字面量的前导引号前加上u8二字(如QString str(u8"这是中文");)。设置“C样式字符串的编码”的方法是:在程序的入口点(main函数)中最开始的位置加上图中这句代码(别忘了加头文件):

QTextCodec::setCodecForCStrings(QTextCodec::codecForName("UTF-8"));

解决方法2: 跟方法1一样修改“C样式字符串的编码”,但设为本地多字节字符集(MBCS,一般是GBK),代码中的字符串字面量不加“u8”(如QString str("这是中文");)。具体方法和上条类似,不再赘述,但main函数中加的那句代码改为:

QTextCodec::setCodecForCStrings(QTextCodec::codecForLocale());

解决方法3: 在每个字符串字面量的前导引号前加上u8,并用 QString::fromUtf8() 包裹,如图:

解决方法4:字符串字面量的前导引号前不加u8,并用 QString::fromLocal8Bit() 包裹,如图:


依次解决以上两层问题后,中文就不再乱码了。再次强调,本文只针对 Qt 4.8.7 + MSVC2015 环境提供问题原理和解决方案,Qt5就不一样了,说不定微软也会在未来的MSVC中添加对无BOM的UTF-8文件的识别。那时,问题的解决将简单很多。

szx0427 作于 2024/07/17

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/pingmian/48461.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

Python并发编程:多线程和多进程

多线程(Threading) 多线程允许程序同时执行多个线程。在Python中,由于GIL的存在,多线程并不能真正地实现并行计算(即同时执行多个线程),但在I/O密集型任务中,多线程仍然可以提高效率…

【TORCH】获取第一个batch数值的几种方法

文章目录 使用 enumerate() 函数遍历 dataloader使用next() 使用 enumerate() 函数遍历 dataloader 在 PyTorch 中,使用 enumerate() 函数遍历 dataloader 可以同时提供 batch 的索引和内容。如果你只想获取第一个 batch,可以结合使用 enumerate() 和一…

MCU常见相关术语缩写说明

AAI Auto Address Increment 地址自增模式 AHB Advanced High Performance Bus 高级高性能总线 APB Advanced Peripheral Bus 高级外设总线 CKGEN Clock Generator …

html5——CSS背景属性设置

目录 背景颜色 background-color 背景图像 背景定位 背景样式简写 背景尺寸 ​编辑渐变属性 背景颜色 background-color 背景图像 background-image background-image:url(图片路径); 背景重复方式: background-repeat 属性: repeat&#…

Qt中在pro中实现一些宏定义

在pro文件中利用 DEFINES 定义一些宏定义供工程整体使用。(和在cpp/h文件文件中定义使用有点类似)可以利用pro的中的宏定义实现一些全局的判断 pro中实现 #自定义一个变量 DEFINES "PI\"3.1415926\"" #自定义宏 DEFINES "T…

Perl并发编程秘籍:线程间通信的艺术

Perl并发编程秘籍:线程间通信的艺术 在现代软件开发中,多线程编程已成为一种常见的技术,用于提高应用程序的并发性和响应性。在Perl中,线程间的通信是实现并发任务的关键环节。本文将深入探讨Perl中线程间通信的各种机制&#xf…

rust 构建自己的库和模块

构建自己的库和模块 rust 构建自己的库和模块生成测试代码目录生成自己的库生成简单库在库中增加模块直接修改 lib.rs 文件添加新的模块文件将两个功能函数拆分成两个文件使用 mod 关键字Tipsrust 构建自己的库和模块 生成测试代码目录 通过命令行生成测试代码,其实就是一个…

Apache Flink 任务提交模式

Flink 任务提交模式 Flink可以基于多种模式部署:基于Standalone 部署模式,基于Yarn部署模式,基于Kubernetes部署模式以上不同集群部署模式下提交Flink任务会涉及申请资源,各角色交互过程,不同模式申请资源涉及到的角色…

Meta KDD Cup 2024 CRAG: Comphrehensive RAG Benchmark参赛指南(写了一半跑去改大论文了所以没正式参赛)

诸神缄默不语-个人CSDN博文目录 因为比赛过程正好和我毕业答辩的时间段高度重合,所以我……最后其实还是相当于没有成功参赛。 呃反正现在已经咕咕咕了,就把当时写了一半(一小半)的参赛指南发一下吧。 官网:AIcrowd …

揭秘Odoo OWL的魔法:reactive vs useState

想象一下,你正在构建一个复杂的Odoo模块,比如一个实时库存管理系统。突然,你意识到需要在多个组件之间同步数据,还要确保UI能够实时响应后台的变化。这时,OWL框架的响应式系统就像是你的得力助手,而reactive和useState则是其中的两大法宝。让我们一起深入探索这两个强大工…

Java-Lambda

1 Lambda表达式 lambda表达式可以理解为对匿名内部类的一种简化 , 但是本质是有区别的 面向对象思想 : 强调的是用对象去完成某些功能 函数式编程思想 : 强调的是结果 , 而不是怎么去做 1 函数式接口 只有一个抽象方法需要重写的接口,函数式接口。函数式接口是允…

规范:Redis规范

在公司项目中,redis属于高频使用,在使用中,我们遇到了各种各样的redis问题,于是针对自身情况梳理了一个redis使用规范。 一、键名设计 1、key名设计 1. 禁止包含特殊字符(比如空格、换行、单双引号以及其他转义字符) 2. 建议以…

2024信息创新与安全技术比赛规程及任务书

2024信息创新与安全技术比赛规程任务书 模块一:信创操作系统应用任务一:系统安装任务二:系统基本操作,以下操作都在Client-1进行。任务三:软件管理 模块二:办公软件技术应用任务一:文档编辑任务…

【栈和队列】算法题 ---- 力扣

通过前面栈和队列的学习,现在来看这些算法题目 一、有效的括号 本题让判断括号是否有效 第一眼看可能没一点思路,但仔细分析一下; 我们学习过栈数据结构,知道栈先进后出的原则,那我们就可以使用啊;把题目的…

MaxSite CMS v180 文件上传漏洞(CVE-2022-25411)

前言 CVE-2022-25411 是一个影响 Maxsite CMS v180 的远程代码执行漏洞。攻击者可以通过上传一个特制的 PHP 文件来利用这个漏洞,从而在受影响的系统上执行任意代码。 漏洞描述 该漏洞存在于 Maxsite CMS v180 的文件上传功能中。漏洞利用主要通过允许上传带有危…

Vue3 完美实现深拷贝

文章目录 一、问题背景二、安装lodash三、Vue3实现完美深拷贝四、非外部库非完美的实现深拷贝 一、问题背景 在复制表单之后,对表单进行修改,发现所有表单的值都同时改变,分析:表单没有进行深拷贝,而是引用的其它表单…

嵌入式人工智能(10-基于树莓派4B的DS1302实时时钟RTC)

1、实时时钟(Real Time Clock) RTC,全称为实时时钟(Real Time Clock),是一种能够提供实时时间信息的电子设备。RTC通常包括一个计时器和一个能够记录日期和时间的电池。它可以独立于主控芯片工作&#xff…

[AT_past202107_c] 入力チェック 题解

题目传送门 \color{orangered}\text{题目传送门} 题目传送门 题意很清楚,我们直接讲做法。 为了更好的进行判断,我们将 s , l , r s,l,r s,l,r 均定义为 string 类型的。 判断: 如果 s s s 的第一位是 0 且 s s s 的长度大于 1 1 1 &a…

Java----简单的洗牌算法

1.创建单张牌 一张牌需要有花色和数字,并且我们需要将一张牌的信息显示出来 public class Card {public String rank;//数字public String suit;//花色public String toString(){//显示花色的方法return String.format("[%s %s]",suit,rank);} }定义一个…

LeetCode 71, 86, 117

文章目录 71. 简化路径题目链接标签思路代码 86. 分隔链表题目链接标签思路分隔链表构建多个链表合并链表 代码 117. 填充每个节点的下一个右侧节点指针 II题目链接标签法一:层序遍历思路代码 法二:链表思路代码 71. 简化路径 题目链接 71. 简化路径 …