合肥网站建设百姓网/公司网站建设哪个好

合肥网站建设百姓网,公司网站建设哪个好,免费网站建设软件大全,短剧个人主页简介模板总目录 前言 在C#编程中,处理字符串和字节数组之间的转换是一个常见的任务。System.Text.Encoding类及其派生类提供了丰富的功能,帮助开发者实现不同字符编码之间的转换。本文将详细讲解System.Text.Encoding类的使用方法,包括常用编码的介绍…

总目录


前言

在C#编程中,处理字符串和字节数组之间的转换是一个常见的任务。System.Text.Encoding类及其派生类提供了丰富的功能,帮助开发者实现不同字符编码之间的转换。本文将详细讲解System.Text.Encoding类的使用方法,包括常用编码的介绍、编码和解码的基本操作、以及一些高级用法。


一、基础概念

1. 什么是字符编码?

字符编码是将字符(如字母、数字、符号等)转换为字节序列的规则。不同的字符编码标准(如ASCII、UTF-8、UTF-16等)定义了不同的映射规则。在计算机中,字符编码用于存储、传输和显示文本数据。

2. 常见的字符编码

常见的字符编码包括:

  • ASCII:美国信息交换标准代码,使用 7 位二进制数表示 128 个字符。
    • 特点:固定 1 字节,仅支持 0x00-0x7F(英文字符)。
    • 适用场景:纯英文文本。
    • 注意:若包含非 ASCII 字符(如中文),会替换为 ? 或抛出异常
  • UTF-8:一种变长的字符编码,可以表示 Unicode 中的所有字符,兼容 ASCII。
    • 特点:可变长度编码,1-4 字节表示一个字符,兼容 ASCII。
    • 适用场景:国际化文本、网页、网络传输(HTTP/JSON)。
  • Unicode:一种定长的字符编码,使用 2 个字节表示一个字符。
    • 特点:固定 2 字节(小端序或大端序),支持基本 Unicode 字符。
    • 适用场景:内存中存储(如 .NET 的 string 类型)。
  • GB2312/GBK/GB18030:中文编码(需通过 Encoding.GetEncoding 获取)。

3. 编码与解码

  • 编码(Encoding):将 Unicode 字符转换为字节序列的过程。
  • 解码(Decoding):将字节序列转换回 Unicode 字符的过程。
  • 由于计算机只认识0或1的二进制数据,而这些数据让人类阅读很有难度的。此时人 和 计算机沟通就需要一个翻译。
  • 可以 将ASCII UTF-8等编码规则 视作 一本人类 与 计算机 之间 沟通的翻译字典,Encoding类充当 翻译 的角色。
    • 编码:就是将 人类的语言 通过翻译字典 翻译成计算机能看懂的指令
    • 解码:就是将计算机的信息 通过翻译字典 翻译成人类可以看懂的语言

4. System.Text.Encoding 类概述

System.Text.Encoding类是.NET框架中用于处理字符编码的基类(核心类)。它提供了将字符串转换为字节数组(编码)和将字节数组转换为字符串(解码)的方法。Encoding类本身是抽象的,不能直接实例化,但提供了多个派生类,每个派生类对应一种特定的字符编码。

5. Encoding 类核心功能

  • 支持多种编码格式(如 UTF-8、ASCII、Unicode 等)。
  • 实现字符串与字节数组的双向转换。
  • 兼容跨平台和多语言场景。

3. 常用方法与属性

1)核心方法

方法名作用
GetBytes(string)将字符串转换为字节数组(编码过程)。
GetString(byte[])将字节数组转换为字符串(解码过程)。
Convert(Encoding, Encoding, byte[])将字节数组从一种编码转换为另一种编码
(如 UTF-8 转 UTF-16)。

2)静态属性

属性名对应编码类型及代码页适用场景
Encoding.ASCIIASCII 编码(代码页 20127)仅支持英文字符(0x00-0x7F)。
Encoding.UTF8UTF-8 编码(代码页 65001)国际化文本(支持所有 Unicode 字符)。
Encoding.UnicodeUTF-16 小端序(代码页 1200)内部存储(如 .NET 的 char 类型)。
Encoding.UTF32UTF-32 小端序(代码页 12000)高精度编码(占用更多内存)。
Encoding.Default当前系统默认 ANSI 编码(如 GBK、CP1252)兼容性场景(可能因系统而异)。

3)常用字符编码类

以下是一些常用的字符编码类及其对应的编码标准:

字符编码类对应的编码标准
ASCIIEncoding对应ASCII编码,支持7位字符。
UTF7Encoding对应UTF-7编码,一种基于7位的Unicode编码。
UTF8Encoding对应UTF-8编码,广泛用于互联网的多字节Unicode编码。
UnicodeEncoding对应UTF-16编码,使用两个字节表示大多数字符。
ASCIIEncoding对应ASCII编码,支持7位字符。

二、使用

1. 获取编码实例

using System.Text;// 获取 UTF-8 编码实例
Encoding utf8Encoding = Encoding.UTF8;// 获取 ASCII 编码实例
Encoding asciiEncoding = Encoding.ASCII;// 获取 Unicode 编码实例
Encoding unicodeEncoding = Encoding.Unicode;// 通过GetEncoding 获取 GB2312 编码实例
Encoding gb2312 = Encoding.GetEncoding("GB2312");// 获取 GBK 编码(代码页 936)
Encoding gbk = Encoding.GetEncoding(936);// 列出所有支持的编码
foreach (EncodingInfo ei in Encoding.GetEncodings())
{Console.WriteLine($"名称: {ei.Name}, 描述: {ei.DisplayName}");
}

2. 获取编码信息

static void Main(string[] args)
{// 获取 UTF-8 编码实例Encoding utf8Encoding = Encoding.UTF8;          Console.WriteLine(utf8Encoding.HeaderName);     //输出:utf-8Console.WriteLine(utf8Encoding.EncodingName);   //输出:Unicode (UTF-8)Console.WriteLine(utf8Encoding.BodyName);       //输出:utf-8Console.WriteLine(utf8Encoding.WebName);        //输出:utf-8// 获取编码的代码页标识符Console.WriteLine(utf8Encoding.CodePage);       //输出:65001
}

3. 编码和解码操作

注意:若使用 Encoding.Default(系统默认编码,如中文环境下的 GB2312),可能导致跨平台乱码,推荐显式指定编码。

1)编码:将字符串转换为字节数组

internal class Program
{static void Main(string[] args){string text = "Hello, World!";// 使用UTF-8编码byte[] utf8Bytes = Encoding.UTF8.GetBytes(text);// 使用UTF-16编码byte[] utf16Bytes = Encoding.Unicode.GetBytes(text);// 使用ASCII编码byte[] asciiBytes = Encoding.ASCII.GetBytes(text);Console.WriteLine("UTF-8 Encoded Bytes: " + BitConverter.ToString(utf8Bytes));Console.WriteLine("UTF-16 Encoded Bytes: " + BitConverter.ToString(utf16Bytes));Console.WriteLine("ASCII Encoded Bytes: " + BitConverter.ToString(asciiBytes));}
}

输出:

UTF-8 Encoded Bytes: 48-65-6C-6C-6F-2C-20-57-6F-72-6C-64-21
UTF-16 Encoded Bytes: 48-00-65-00-6C-00-6C-00-6F-00-2C-00-20-00-57-00-6F-00-72-00-6C-00-64-00-21-00
ASCII Encoded Bytes: 48-65-6C-6C-6F-2C-20-57-6F-72-6C-64-21

2)解码:将字节数组转换为字符串

// 使用 UTF-8 解码
string decodedTextUTF8 = utf8Encoding.GetString(utf8Bytes);	//输出:Hello, World!// 使用 ASCII 解码
string decodedTextASCII = asciiEncoding.GetString(asciiBytes);//输出:Hello, World!// 使用 Unicode 解码
string decodedTextUnicode = unicodeEncoding.GetString(unicodeBytes);//输出:Hello, World!

4. 编码转换操作

有时候,我们需要将一个编码的字节数组转换为另一个编码的字节数组。这可以通过Encoding.Convert(源编码,目标编码,源字节数组)方法实现:

using System;
using System.Text;
class Program
{static void Main(){string originalText = "Hello, World!";// 将字符串编码为UTF-8Encoding utf8 = Encoding.UTF8;byte[] utf8Bytes = utf8.GetBytes(originalText);Encoding utf16 = Encoding.Unicode;// 将UTF-8编码的字节数组转换为UTF-16byte[] utf16Bytes = Encoding.Convert(utf8, utf16, utf8Bytes);// 解码UTF-16字节数组string convertedText = utf16.GetString(utf16Bytes);Console.WriteLine("Converted Text: " + convertedText);}
}

8. 实际应用示例

1)示例1:编码和解码

以下是一个完整的示例,展示如何在 C# 中使用 System.Text.Encoding 类进行文本编码和解码操作。

using System;
using System.Text;namespace EncodingExample
{class Program{static void Main(string[] args){string text = "Hello, World! 你好,世界!";// 获取不同的编码实例Encoding utf8Encoding = Encoding.UTF8;Encoding asciiEncoding = Encoding.ASCII;Encoding unicodeEncoding = Encoding.Unicode;// 将字符串编码为字节数组byte[] utf8Bytes = utf8Encoding.GetBytes(text);byte[] asciiBytes = asciiEncoding.GetBytes(text);byte[] unicodeBytes = unicodeEncoding.GetBytes(text);// 输出字节数组Console.WriteLine("UTF-8 编码字节数组:");foreach (byte b in utf8Bytes){Console.Write(b + " ");}Console.WriteLine();Console.WriteLine("ASCII 编码字节数组:");foreach (byte b in asciiBytes){Console.Write(b + " ");}Console.WriteLine();Console.WriteLine("Unicode 编码字节数组:");foreach (byte b in unicodeBytes){Console.Write(b + " ");}Console.WriteLine();// 将字节数组解码为字符串string decodedTextUTF8 = utf8Encoding.GetString(utf8Bytes);string decodedTextASCII = asciiEncoding.GetString(asciiBytes);string decodedTextUnicode = unicodeEncoding.GetString(unicodeBytes);// 输出解码后的字符串Console.WriteLine("UTF-8 解码字符串: " + decodedTextUTF8);Console.WriteLine("ASCII 解码字符串: " + decodedTextASCII);Console.WriteLine("Unicode 解码字符串: " + decodedTextUnicode);}}
}

2)示例2:编码转换

using System;
using System.Text;public class EncodingDemo 
{public static void Main() {// 示例:UTF-8 转 GBKstring text = "编码转换测试";Encoding utf8 = Encoding.UTF8;Encoding gbk = Encoding.GetEncoding("GBK");byte[] utfBytes = utf8.GetBytes(text);byte[] gbkBytes = Encoding.Convert(utf8, gbk, utfBytes);string decodedText = gbk.GetString(gbkBytes);Console.WriteLine($"解码结果:{decodedText}");}
}

三、高级用法

1. 实现自定义编码

虽然.NET提供了多种内置编码,但有时我们可能需要自定义编码。这可以通过继承Encoding类并重写其方法来实现。

2. 文件编码处理

读取文件时自动检测编码(需结合 BOM 判断):

public static Encoding DetectFileEncoding(string path) 
{byte[] bom = new byte[4];using (var file = new FileStream(path, FileMode.Open)) {file.Read(bom, 0, 4);}if (bom[0] == 0xEF && bom[1] == 0xBB && bom[2] == 0xBF) return Encoding.UTF8;if (bom[0] == 0xFF && bom[1] == 0xFE) return Encoding.Unicode;return Encoding.Default; // 无 BOM 时回退到默认编码
}

3. 网络通信编码

发送数据前统一编码格式(推荐 UTF-8):

// 发送端
string message = "传输数据";
byte[] buffer = Encoding.UTF8.GetBytes(message);
socket.Send(buffer);// 接收端
byte[] buffer = new byte[1024];
int bytesRead = socket.Receive(buffer);
string received = Encoding.UTF8.GetString(buffer, 0, bytesRead);

四、注意事项

1. 编码选择

在实际应用中,应根据具体需求选择合适的编码方式。例如,处理中文文本时,UTF-8 是一个不错的选择。

2. 编码兼容性

读写文本时使用相同的编码(如 UTF-8)。

在进行编码和解码操作时,必须确保使用相同的编码方式,否则可能会导致数据丢失或乱码。

internal class Program
{static void Main(string[] args){string text = "Hello, 张三! ";// 使用UTF-8编码byte[] utf8Bytes = Encoding.UTF8.GetBytes(text);// 但是使用 ASCII 解码,会导致乱码string decodedTextUTF8 = Encoding.ASCII.GetString(utf8Bytes);Console.WriteLine($"{decodedTextUTF8}");    //输出:Hello, ??????!}
}

3. 性能考虑

不同的编码方式在性能上可能会有所不同,应根据实际情况进行优化。

4. 跨平台开发

  • Encoding.Default 依赖系统区域设置(如 Windows 中的 GBK 或 CP1252),可能导致跨平台问题。避免使用 Encoding.Default,推荐统一使用 UTF-8 (国际化、兼容性最佳)。
  • 在 Linux/macOS 中,路径分隔符和编码默认值可能与 Windows 不同。

5. 处理旧系统的代码页编码

  • 使用 CodePagesEncodingProvider(需引用 System.Text.Encoding.CodePages 包):
    EncodingProvider provider = CodePagesEncodingProvider.Instance;
    Encoding.RegisterProvider(provider);
    Encoding gbk = Encoding.GetEncoding("GBK"); // 现在可访问 GBK
    

结语

回到目录页:C#/.NET 知识汇总、C# 上位机知识汇总
希望以上内容可以帮助到大家,如文中有不对之处,还请批评指正。


参考资料:

  • 微软官方文档:Encoding 类

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/news/899162.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

Kafka 4.0 发布:KRaft 替代 Zookeeper、新一代重平衡协议、点对点消息模型、移除旧协议 API

KRaft 全面替代 ZooKeeper Apache Kafka 4.0 是一个重要的里程碑,标志着第一个完全无需 Apache ZooKeeper 运行的主要版本。 通过默认运行在 KRaft 模式下,Kafka 简化了部署和管理,消除了维护单独 ZooKeeper 集群的复杂性。 这一变化显著降…

SFT实验报告

大模型微调实验报告* 实验目标 梳理大模型微调方法,评估各种基座和微调方法的实验效果。 基础模型 \1.Llama \2.Qwen \3.Chatglm4 \4. 微调策略 LoRA系列 低秩适配(LoRA)的核心思想是冻结原始参数,通过低秩分解引入可训…

LLM - R1 强化学习 DRPO 策略优化 DAPO 与 Dr. GRPO 算法 教程

欢迎关注我的CSDN:https://spike.blog.csdn.net/ 本文地址:https://spike.blog.csdn.net/article/details/146533892 在强化学习算法中,DAPO (Decoupled Clip and Dynamic Sampling Policy Optimization),通过解耦裁剪和动态采样策…

Mybatis_plus

前言 Mybatis_plus 是在 mybatis 的基础上进行了增强,在 MyBatis 的基础上只做增强不做改变,为简化开发、提高效率而生。本文章只做简单的使用介绍,更加详细的内容大家可以参考官网。 下面是mybatis_plus 官网地址: mybatis_plu…

idea 没有 add framework support(添加框架支持)选项

在 IntelliJ IDEA 2023 中,若需通过设置手动添加 “添加框架支持” 菜单项,可按照以下步骤操作: 手动添加 “添加框架支持” 菜单项 打开设置 点击顶部菜单栏的 File(文件) -> Settings(设置&#xff09…

再探带权并查集

典型例题 Acwing 权值 故名思义,在带权并查集中,我们需要让每个节点携带一个**“权值”**。 那么这个权值应该是什么呢?其实答案就在并查集当中。 由于在并查集当中我们可以在 O ( 1 ) O(1) O(1) 时间内找到一个节点的根节点,那…

本地部署Stable Diffusion生成爆火的AI图片

直接上代码 Mapping("/send") Post public Object send(Body String promptBody) { JSONObject postSend new JSONObject(); System.out.println(promptBody); JSONObject body JSONObject.parseObject(promptBody); List<S…

边缘计算 vs. 云计算,谁才是工业物联网的未来?

前言 在物联网&#xff08;IoT&#xff09;飞速发展的今天&#xff0c;边缘计算正在彻底改变数据的处理、存储和分析方式。传统的IoT设备数据通常需要发送到云端进行处理&#xff0c;但随着设备数量的激增&#xff0c;这种模式在延迟、带宽和安全性方面暴露出诸多局限。边缘计…

dell 台式机 电脑 纽扣电池 如何取下?

dell 台式机 电脑 纽扣电池 如何取下&#xff1f; 戴尔-optiplex-3060-塔式机-服务手册

NFC 智能门锁全栈解决方案:移动端、服务器、Web 管理平台

目录 一、系统整体架构 二、移动端 APP 开发 2.1 开发环境与基础准备 2.2 主要功能模块 2.3 示例代码&#xff08;Android/Kotlin 简化示例&#xff09; 三、后台服务开发 3.1 环境准备 3.2 主要功能 3.3 示例代码&#xff08;Node.js Express 简化示例&#xff09; …

【AI】MAC版本本地Stable Diffusion web ui安装

文章目录 前言环境依赖homebrewpython3下载stable-diffusion-webui webui模型准备模型网站 中文页面设置提示词转汉语转英文controlnet安装controlnet模型下载 结尾 前言 目前&#xff0c;市面上已经出现了很多用Ai 绘图制作的作品&#xff0c;用于自媒体或者商业等。例如表情…

Linux 云服务器开放端口

首先找到你买服务器的官网&#xff0c;我这里是阿里云 点击这里的控制台 这里先点手动添加&#xff0c;再看自己是UDP还是TCP协议&#xff0c;找到对应的协议&#xff0c;目的就填你想开放的端口&#xff0c;源填所有IP/4 0.0.0.0 添加备注点击保存就开放好了。

[unity 点击事件] 区域响应点击事件,排除子节点区域,Raycast Target 应用

当我打开一个二级弹窗后&#xff0c;希望可以通过点击弹窗以外的区域来关闭该弹窗。一开始我是在弹窗主节点上挂载了一个 button 组件&#xff0c;该 button 注册的点击事件中关闭该弹窗。在子节点&#xff08;一个背景图&#xff09;的image组件上启用 Raycast Target 选项&am…

表的约束及代码练习

一.表的约束 查看表&#xff1a;mysql> select * from t_hero; 1.设置t_hero的主键为t_id alter table t_hero add primary key(t_id); 2.设置t_hero t_id属性非空 alter table t_hero modify t_id int not null;3.设置name属性为非空非重复 alter table t_hero modify…

Linux笔记---动静态库(使用篇)

目录 1. 库的概念 2. 静态库&#xff08;Static Libraries&#xff09; 2.1 静态库的制作 2.2 静态库的使用 2.2.1 显式指定库文件及头文件路径 2.2.2 将库文件安装到系统目录 2.2.3 将头文件安装到系统目录 3. 动态库 3.1 动态库的制作 3.2 动态库的使用 3.2.1 显式…

Java并发编程2(锁-Sychronized)

目录 认识Java对象头 sychronized锁原理 基本概念 工作原理 1.作用在方法上 2.作用在代码块上 工作机制 JVM优化锁 Monitor锁 wait/notify park/unpark 线程状态转换案例 死锁 概念 死锁发生的必要条件 哲学家问题 活锁 饥饿 概念 饥饿的原因 Reentrant…

现阶段高校的人工智能方案培训如何?

人工智能在未来肯定是核心发展力&#xff0c;核心竞争力&#xff0c;也是国家重点扶持的对象&#xff0c;但我还是不看好高校的人工智能方向&#xff0c;只是怕有些同学对市场前景盲目乐观&#xff0c;就轻易上车了。 你要是985以上的高校&#xff0c;可以考虑选择人工智能&…

JavaScript中的继承有哪些方式?各有什么优缺点

在 JavaScript 中&#xff0c;继承主要通过原型链实现&#xff0c;常见的继承方式有以下几种&#xff0c;每种方式都有其优缺点&#xff1a; 1. 原型链继承 1. 实现方式&#xff1a;将子类的原型对象指向父类的实例。 function Parent() {} function Child() {} Child.protot…

深入理解指针(3)(C语言版)

文章目录 前言 一、字符指针变量二、数组指针变量2.1 数组指针变量是什么2.2 数组指针变量怎么初始化2.2.1 静态初始化2.2.2 动态初始化 三、二维数组传参的本质四、函数指针变量4.1 函数指针变量的创建4.2 函数指针变量的使用4.3 typedef关键字4.4拓展 五、函数指针数组六、转…

csp信奥赛C++常用的数学函数详解

csp信奥赛C常用的数学函数详解 在信息学奥林匹克竞赛&#xff08;信奥赛&#xff09;中&#xff0c;C 的 <cmath> 头文件提供了丰富的数学函数&#xff0c;用于高效处理数学运算。以下是常用系统数学函数的详细讲解及汇总表格。 绝对值函数 int abs(int x)&#xff1a;返…