Java编码

Java编码问题

  1. Unicode与码点

所谓Unicode就是全世界的字符字典,也就是把字符给一个编号,这个编码就是码点。比如
在这里插入图片描述
2. 编码
由于这种分配的编码无论从占用空间角度,还是读取速度,以及逻辑划分角度,都不是完善。所以出现了计算机编码,就是把每一个字符分配一个二进制的数字来表示。比如采用hafman编码,这种可以大大的节省存储空间,现代的压缩逻辑有的就是这样。

  • 采用utf-8编码,是一种边长编码,就是不同的字符占用的字节数目是不同的,一般来说ascii码占用1个字节,中文字符占用三个字节,还有特殊字符占用4个字节等等。
  • 采用utf-16编码,一般每一个字符都占用两个字节,但是对于字符串来说,会存在字节顺序标记(Byte Order Mark,BOM)。BOM是一个特殊的Unicode字符(U+FEFF),用于指示文本的字节顺序(大端或小端),占用两个字节。所以一般会在总字符字节长度上在加上2。
  1. 对应的实验如下
package com.inspur;import java.io.UnsupportedEncodingException;
import java.nio.charset.StandardCharsets;
import java.util.List;
import java.util.stream.Collectors;/*** @author: Zekun Fu* @date: 2023/9/30 20:43* @Description:*/
public class Main5 {public static void main(String[] s) throws UnsupportedEncodingException {// 10 然后一个结尾字符'/0'String str = "Hello, 世界! 所有字符都是一样的";System.out.println(str.length());// 获取字符串的UTF-16字节数组byte[] utf16Bytes = str.getBytes(StandardCharsets.UTF_16);System.out.println(utf16Bytes.length);int len = 0;// 遍历字节数组,计算每个字符所占用的字节数for (char c : str.toCharArray()) {String t = ("" + c);len = t.getBytes(StandardCharsets.UTF_16).length;System.out.println("字符: " + t  + ", 字节数: " + len);}// 遍历字符串的每个码点for (int i = 0; i < str.length(); i++) {int codePoint = str.codePointAt(i);System.out.println("\"" + str.charAt(i) + "\"的码点:" + codePoint);}}
}
  1. 结果
    在这里插入图片描述

在这里插入图片描述

在这里插入图片描述

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/news/92935.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

【Java-LangChain:面向开发者的提示工程-7】文本扩展

第七章 文本扩展 扩展是将短文本&#xff08;例如一组说明或主题列表&#xff09;输入到大型语言模型中&#xff0c;让模型生成更长的文本&#xff08;例如基于某个主题的电子邮件或论文&#xff09;。这种应用是一把双刃剑&#xff0c;好处例如将大型语言模型用作头脑风暴的伙…

了解”变分下界“

“变分下界”&#xff1a;在变分推断中&#xff0c;我们试图找到一个近似概率分布q(x)来逼近真实的概率分布p(x)。变分下界是一种用于评估近似概率分布质量的指标&#xff0c;通常用来求解最优的近似分布。它的计算涉及到对概率分布的积分或期望的估计

分布式搜索引擎es-3

文章目录 数据聚合聚合的种类RestAPI实现聚合 自动补全自定义拼音分词器自动补全查询案例&#xff1a;实现酒店搜索框自动补全自动补全的javaAPI实现搜索框自动补全 口述自动补全数据同步集群集群的分布式存储集群分布式查询集群故障转移 数据聚合 什么是聚合&#xff1f; 聚合…

【面试经典150 | 矩阵】旋转图像

文章目录 写在前面Tag题目来源题目解读解题思路方法一&#xff1a;原地旋转方法二&#xff1a;翻转代替旋转 写在最后 写在前面 本专栏专注于分析与讲解【面试经典150】算法&#xff0c;两到三天更新一篇文章&#xff0c;欢迎催更…… 专栏内容以分析题目为主&#xff0c;并附带…

【Cesium创造属于你的地球】相机系统

相机系统里面有setView&#xff0c;flyTo&#xff0c;lookAt&#xff0c;viewBoundingsphere这几种方法&#xff0c;以下是相关的使用方法&#xff0c;学起来&#xff01;&#xff01;&#xff01; setView 该方法可以直接切换相机视口&#xff0c;从而不需要通过一个飞入的效…

ruoyi-启动

1 springboot 版本 git 地址 ruoyi-vue-pro: &#x1f525; 官方推荐 &#x1f525; RuoYi-Vue 全新 Pro 版本&#xff0c;优化重构所有功能。基于 Spring Boot MyBatis Plus Vue & Element 实现的后台管理系统 微信小程序&#xff0c;支持 RBAC 动态权限、数据权限…

深度学习(1)---卷积神经网络(CNN)

文章目录 一、发展历史1.1 CNN简要说明1.2 猫的视觉实验1.3 新认知机1.4 LeNet-51.5 AlexNet 二、卷积层2.1 图像识别特点2.2 卷积运算2.3 卷积核2.4 填充和步长2.5 卷积计算公式2.6 多通道卷积 三、池化层 一、发展历史 1.1 CNN简要说明 1. 卷积神经网络&#xff08;Convolut…

基于SSM的公司项目管理系统设计与实现

末尾获取源码 开发语言&#xff1a;Java Java开发工具&#xff1a;JDK1.8 后端框架&#xff1a;SSM 前端&#xff1a;采用JSP技术开发 数据库&#xff1a;MySQL5.7和Navicat管理工具结合 服务器&#xff1a;Tomcat8.5 开发软件&#xff1a;IDEA / Eclipse 是否Maven项目&#x…

元素显示和背景调试

什么是元素显示模式 如<div>自己占一行。比如一行可以放多个<span> HTML可以分成块元素和行内元素 常见的块元素为<h1><p><div><ul><ol><li>之中<div>是最典型的块元素 < div>独自一行&#xff0c;可以设置宽和…

如何完美控制控制台输出

1 前言 正常情况下&#xff0c;我们在控制台程序中只关注程序的输入和输出&#xff0c;而不在意输出的格式、光标位置等。 因此&#xff0c;当我们想要完美控制程序的输入输出时&#xff0c;就必须要使用系统提供的操作接口&#xff0c;来实现我们的目标。 由于linux平台的控制…

ABC322刷题记

ABC322刷题记 T1.A A - First ABC 2。 妥妥的简单题…… 用find函数做就行。&#xff08;如果不存在那个子串就返回-1&#xff0c;否则返回第一次出现位置&#xff09; 注意题目中编号是从1开始的。 时间复杂度&#xff1a;O(log(n))。find函数有一定代价&#xff0c;我记…

Qt 信号和槽执行线程问题

Qt 信号和槽执行线程问题 1.QObject的thread() 函数 在Qt中QObject有一个thread() 的函数。这就说明&#xff0c;每一个QOject对象都有所属的线程。 注意&#xff1a; QThread也是一个QObject的子类&#xff0c;也有自己所在的线程每个QObject存在父子关系&#xff0c;存在…

【Java-LangChain:面向开发者的提示工程-6】文本转换

第六章 文本转换 LLM非常擅长将输入转换成不同的格式&#xff0c;典型应用包括多语种文本翻译、拼写及语法纠正、语气调整、格式转换等。 本章节将介绍如何使用编程的方式&#xff0c;调用API接口来实现“文本转换”功能。 环境配置 参考第二章的 环境配置小节内容即可。 文…

java复习回顾

文章目录 0 开发工具1. 对象和类、三大特性2. 成员/实例变量和实例变量&#xff08;this关键字&#xff09;3. 方法重载overload4. 构造方法和this关键字5. 继承6. 访问修饰符7. 方法重写8. 继承下的构造执行9. 多态9.1 向上转型9.2 向下转型9.3 多态的应用 0 开发工具 Maven是…

Acwing 907. 区间覆盖

Acwing 907. 区间覆盖 知识点题目描述思路讲解代码展示 知识点 贪心 题目描述 思路讲解 代码展示 #include <iostream> #include <algorithm>using namespace std;const int N 100010;int n;struct Range {int l, r;bool operator < (const Range &W) …

分页前后端完整代码

一、后端代码 User实体类要继承PageVo package com.like.entity;import com.baomidou.mybatisplus.annotation.IdType; import com.baomidou.mybatisplus.annotation.TableId; import com.baomidou.mybatisplus.annotation.TableName; import com.like.common.PageVo; import…

借助ChatGPT的神奇力量,解锁AI无限可能!

&#x1f680;欢迎来到本文&#x1f680; &#x1f349;个人简介&#xff1a;陈童学哦&#xff0c;目前学习C/C、算法、Python、Java等方向&#xff0c;一个正在慢慢前行的普通人。 &#x1f3c0;系列专栏&#xff1a;陈童学的日记 &#x1f4a1;其他专栏&#xff1a;CSTL&…

计算机毕业设计 基于SSM的宿舍管理系统的设计与实现 Java实战项目 附源码+文档+视频讲解

博主介绍&#xff1a;✌从事软件开发10年之余&#xff0c;专注于Java技术领域、Python人工智能及数据挖掘、小程序项目开发和Android项目开发等。CSDN、掘金、华为云、InfoQ、阿里云等平台优质作者✌ &#x1f345;文末获取源码联系&#x1f345; &#x1f447;&#x1f3fb; 精…

时间序列-AR模型与MA模型的原理与实现

文章目录 1 自回归模型AR Model1.1 自回归模型 vs 多元线性回归模型1.1.1 线性回归1.1.2 AR(1)模型1.1.3 AR(p)模型 1.2 AR建模问题 2 移动平均模型 MA Model2.1 MA模型的数学表示2.1.1 MA(1)模型2.2.2 MA(q)模型 2.2 MA建模问题 ARIMA模型是AR模型&#xff08;自回归模型&…

使用 Python 给 PDF 添加目录书签

0、库的选择——pypdf 原因&#xff1a;Python Version Support Python 3.11 3.10 3.9 3.8 3.7 3.6 2.7 pypdf>3.0 YES YES YES YES YES YES PyPDF2>2.0 YES YES YES YES YES YES PyPDF2 1.20.0 - 1.28.4 YES YES YES YES YES YES P…