Java String源码剖析+面试题整理

由于字符串操作是计算机程序中最常见的操作之一,在面试中也是经常出现。本文从基本用法出发逐步深入剖析String的结构和性质,并结合面试题来帮助理解。

String基本用法

在Java中String的创建可以直接像基本类型一样定义,也可以new一个

String s1 = "Hello World";
String s2 = new String("Hello World");

String可以通过+实现合并

String s = "Hello";
s += "World";

String包装方法

为了方便操作,String包装了一堆操作,大多可以看名字直接使用

public boolean isEmpty()//判断字符串是否为空
public int length() //获取字符串长度
public String substring(int beginIndex) //取子字符串
public String substring(int beginIndex, int endIndex) //取子字符串
public int indexOf(int ch)//查找字符,返回第一个找到的索引位置,没找到返回-1
public int indexOf(String str)//查找子串,返回第一个找到的索引位置,没找到返回-1
public int lastIndexOf(int ch)//从后面查找字符
public int lastIndexOf(String str)//从后面查找子字符串
public boolean contains(CharSequence s)//判断字符串中是否包含指定的字符序列
public boolean startsWith(String prefix) //判断字符串是否以给定子字符串开头
public boolean endsWith(String suffix) //判断字符串是否以给定子字符串结尾
public boolean equals(Object anObject) //与其他字符串比较,看内容是否相同
public boolean equalsIgnoreCase(String anotherString)//忽略大小写比较是否相同
public int compareTo(String anotherString) //比较字符串大小
public int compareToIgnoreCase(String str) //忽略大小写比较
public String toUpperCase()//所有字符转换为大写字符,返回新字符串,原字符串不变
public String toLowerCase()//所有字符转换为小写字符,返回新字符串,原字符串不变
public String concat(String str) //字符串连接,返回当前字符串和参数字符串合并结果
public String replace(char oldChar, char newChar) //字符串替换,替换单个字符
public String replace(CharSequence target, CharSequence replacement)//字符串替换,替换字符序列,返回新字符串,原字符串不变
public String trim()//删掉开头和结尾的空格,返回新字符串,原字符串不变
public String[] split(String regex)//分隔字符串,返回分隔后的子字符串数组

String内部结构

String类内部用一个字符数组表示字符串,实例变量定义为:

private final char value[];

String有两个使用字符数组的构造方法,会根据参数新创建一个数组,并复制内容,而不会直接用参数中的字符数组。

public String(char value[])
public String(char value[], int offset, int count)

可以看出String底层是由字符数组实现,并结合构造方法实现常用方法:

length()方法返回的是这个数组的长度

indexOf()方法查找字符或子字符串时是在这个数组中进行查找

substring()方法是根据参数,调用构造方法String(char value[], int offset, int count)新建了一
个字符串

String不可变性

与包装类类似,String类也是不可变类,即对象一旦创建,就没有办法修改了。根据上面的源码,String类也声明为了final,不能被继承,内部char数组value也是final的,保存字符串的数组被 final 修饰且为私有的,并且String 类没有提供/暴露修改这个字符串的方法。String 类被 final 修饰导致其不能被继承,进而避免了子类破坏 String 不可变。

String类中提供了很多看似修改的方法,其实是通过创建新的String对象来实现的,原来的String对象不会被修改。比如,concat()方法的代码,通过Arrays.copyOf方法创建了一块新的字符数组,复制原内容,然后通过new创建了一个新的String。

public String concat(String str) {int otherLen = str.length();if(otherLen == 0) {return this;}int len = value.length;char buf[] = Arrays.copyOf(value, len + otherLen);str.getChars(buf, len);return new String(buf, true);
}

与包装类类似,定义为不可变类,程序可以更为简单、安全、容易理解。但如果频繁修改字符串,而每次修改都新建一个字符串,那么性能太低,这时,应该考虑Java中的另两个类StringBuilder和StringBuffer。

字符串常量

Java中的字符串常量是非常特殊的,除了可以直接赋值给String变量外,它自己就像一个String类型的对象,可以直接调用String的各种方法。

System.out.println("a".length());

实际上,这些常量就是String类型的对象,在内存中,它们被放在一个共享的地方,这个地方称为字符串常量池,它保存所有的常量字符串,每个常量只会保存一份,被所有使用者共享。当通过常量的形式使用一个字符串的时候,使用的就是常量池中的那个对应的String类型的对象。

所以下面的代码会输出true,因为是同一个对象。

String namel = "a";
String name2 = "a";
System.out.println(name1==name2);

需要注意的是,如果不是通过常量直接赋值,而是通过new创建,==就不会返回true了

String namel = new String("a");
String name2 = new String("a");
System.out.println(namel==name2);

这是因为String类中以String为参数的构造方法代码如下,hash是String类中另一个实例变量,表示缓存的hashCode值。

public String(String original) {this.value = original.value;this.hash = original.hash;
}

hash变量缓存了hashCode方法的值,也就是说,第一次调用hashCode方法的时候,会把结果保存在hash这个变量中,以后再调用就直接返回保存的值。

public int hashCode() {int h = hash;if(h == 0 && value.length > 0) {char val[] = value;for(int i = 0; i < value.length; i++) {h = 31 * h + val[i];}hash = h; }return h; 
}

如果缓存的hash不为0,就直接返回了,否则根据字符数组中的内容计算hash,计算方法是:
s[0]*31^(n-1)+ s[1]*31^(n-2)+ ...+ s[n-1]。使用这个式子,可以让hash值与每个字符的值有关,也与每个字符的位置有关,位置i(i>=1)的因素通过31的(n-i)次方表示。使用31大致是因为两个原因:一方面可以产生更分散的散列,即不同字符串hash值也一般不同;另一方面计算效率比较高,31*h与32*h-h即(h<<5)-h等价,可以用更高效率的移位和减法操作代替乘法操作。

从下图可以看出,通过new创建name1和name2指向两个不同的String对象,只是这两个对象内部的value值指向相同的char数组。所以name1!=name2,但是name1.equals(name2)的值是true。

String的八股考点

string为什么要设计成不可变类

在Java中将 String设计成不可变的是综合考虑到各种因素的结果。主要的原因主要有以下三点:
(1)字符串常量池的需要:字符串常量池是Java堆内存中一个特殊的存储区域,当创建一个String对象时,假如此字符串值已经存在于常量池中,则不会创建一个新的对象,而是引用已经存在的对象;
(2)允许 String对象缓存 HashCode: Java中String对象的哈希码被频繁地使用,比如在HashMap等容器中。字符串不变性保证了 hash码的唯一性,因此可以放心地进行缓存。这也是一种性能优化手段,意味着不必每次都去计算新的哈希码;
(3)String被许多的 Java类(库)用来当做参数,例如:网络连接地址URL、文件路径path、还有反射机制所需要的 String参数等,假若 String不是固定不变的,将会引起各种安全隐患。

String s1 = new String("abc");这行代码创建了几个对象

如果字符串常量池中不存在字符串对象“abc”的引用,那么它会在堆上创建两个字符串对象,其中一个字符串对象的引用会被保存在字符串常量池中。

如果字符串常量池中已存在字符串对象“abc”的引用,则只会在堆中创建 1 个字符串对象“abc”。

String a = new String("aa") + "bb";这行代码创建了多少个对象

共创建了3-4个String对象,假设常量池中没有对象“aa”,第一个是常量池中的对象“aa”,如果常量池中没有就创建并添加进常量池中。第二个是new出来的以“aa”为初始值创建的 String对象,第三个“bb”同“aa”,第四个是通过“+”拼接前两个对象,创建出的新String对象。

String的equals() 和 Object的equals() 有何区别

String 中的 equals 方法是被重写过的,比较的是 String 字符串的值是否相等。 Object 的 equals 方法是比较的对象的内存地址。

String对象最多可以存放多少个字符

String在源码中使用 char[]来维护字符序列的,而char[]的长度是 int类型,所以理论上 String的长度最大为2^31-1,占用空间大约为4GB,不过根据实际JVM的堆内存限制,编译时,String长度最多可以是2的16次方减2,运行时长度最多可以是2的31次方减1,意思是可以在编译时定义一些短的字符串,运行时可以进行拼接,长一点也可以。

string常量池放在哪

Java 8以前被放在永久代中,Java 8及以后被放在方法区的元数据 metadata中。

String str = "i" 和 String str = new String("i")有什么区别

不一样,因为内存的分配方式不一样。String str =“i”的方式,Java虚拟机会将其分配到常量池中;而String str = new String(“i")则会被分到堆内存中。

public class StringTest {public static void main(String[] args) {String strl = "abc";String str2 = "abc";String str3 = new String("abc");String str4 = new String("abc");System.out.println(str1 == str2); // trueSystem.out.println(str1 == str3); // falseSystem.out.println(str3 = str4); // falseSystem.out.println(str3.equals(str4)); // true

在执行String str1=“abc”的时候,JVM会首先检查字符串常量池中是否已经存在该字符串对象,如果已经存在,那么就不会再创建了,直接返回该字符串在字符串常量池中的内存地址;如果该字符串还不存在字符串常量池中,那么就会在字符串常量池中创建该字符串对象,然后再返回。所以在执行Stringstr2=“abc”的时候,因为字符串常量池中已经存在“abc”字符串对象了,就不会在字符串常量池中再次创建了,所以栈内存中str1和str2的内存地址都是指向“abc”在字符串常量池中的位置,所以str1=str2 的运行结果为 true。

而在执行 String str3 = new String(“abc")的时候,JVM会首先检查字符串常量池中是否已经存在“abc”字符串,如果已经存在,则不会在字符串常量池中再创建了;如果不存在,则就会在字符串常量池中创建“abc”字符串对象,然后再到堆内存中再创建一份字符串对象,把字符串常量池中的“abc”字符串内容拷贝到内存中的字符串对象中,然后返回堆内存中该字符串的内存地址,即栈内存中存储的地址是堆内存中对象的内存地址。String str4 = newString(“abc”)是在堆内存中又创建了一个对象,所以 str3 == str4运行的结果是 false。

String修改的实现原理

当用String类型来对字符串进行修改时,其实现方法是首先创建一个StringBuilder,其次调用
StringBuilder的 append()方法,最后调用StringBuilder 的 toString()方法把结果返回。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/news/681157.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

【JAVA WEB】JavaScript-条件语句

目录 条件语句 if……else语句 三元表达式 switch 数组 创建数组 获取数组元素 新增数组元素 1.通过修改 length 新增 2.通过下标新增 3. 使用push进行追加元素 删除数组中的元素 调试 条件语句 if……else语句 示例&#xff1a; <script> let numprompt(&…

洛谷 P1678 烦恼的高考志愿 (Java)

洛谷 P1678 烦恼的高考志愿 (Java) 传送门&#xff1a;P1678 烦恼的高考志愿 题目&#xff1a; 烦恼的高考志愿 题目背景 计算机竞赛小组的神牛 V 神终于结束了高考&#xff0c;然而作为班长的他还不能闲下来&#xff0c;班主任老 t 给了他一个艰巨的任务&#xff1a;帮同学…

[ai笔记5] 个人AI资讯助手实战

欢迎来到文思源想的ai空间&#xff0c;这是技术老兵重学ai以及成长思考的第5篇分享&#xff0c;也是把ai场景化应用的第一篇实操内容&#xff01; 既然要充分学习和了解ai&#xff0c;自然少不了要时常看看ai相关资讯&#xff0c;所以今天特地用字节的“扣子”做了一个ai的资讯…

Java中抽象类和接口的区别

抽象类和接口都是 Java 中多态的常见使用方式. 都需要重点掌握. 同时又要认清两者的区别(重要!!! 常见面试题)。 核心区别: 抽象类中可以包含普通方法和普通字段, 这样的普通方法和字段可以被子类直接使用(不必重写而重写抽象方法), 而接口中不能包含普通方法&#xff08;接口…

宿舍|学生宿舍管理小程序|基于微信小程序的学生宿舍管理系统设计与实现(源码+数据库+文档)

学生宿舍管理小程序目录 目录 基于微信小程序的学生宿舍管理系统设计与实现 一、前言 二、系统功能设计 三、系统实现 1、管理员模块的实现 &#xff08;1&#xff09;学生信息管理 &#xff08;2&#xff09;公告信息管理 &#xff08;3&#xff09;宿舍信息管理 &am…

Windows 安装Redis

Windows下安装Redis详细的操作流程和案例&#xff1a; 下载Redis&#xff1a; 访问Redis官方网站&#xff08;https://redis.io/&#xff09;。在"Download"页面中选择适合你操作系统的稳定版本并下载。 解压Redis安装包&#xff1a; 找到下载的Redis安装包文件&…

CentOS7集群安装JDK1.8

准备工作 1、提前安装三台虚拟机&#xff0c;可以参考:https://mp.csdn.net/mp_blog/creation/editor/136010108 2、三台虚拟机分别配置免密登录&#xff0c;参考&#xff1a;https://blog.csdn.net/LSW_JAVADP/article/details/121757927 安装 JDK 一、官网下载对应JDK 自…

mlxtend,一个非常好用的 Python 库!

前言 Python 的 MLxtend&#xff08;Machine Learning Extensions&#xff09;库是一个强大的工具&#xff0c;为机器学习实验提供了一系列功能强大的扩展和工具。本文将深入探讨 MLxtend 库的核心功能、用法以及如何在机器学习项目中充分发挥其优势。 目录 前言 什么是 MLx…

华为问界M9:全方位自动驾驶技术解决方案

华为问界M9的自动驾驶技术采用了多种方法来提高驾驶的便利性和安全性。以下是一些关键技术&#xff1a; 智能感知系统&#xff1a;问界M9配备了先进的传感器&#xff0c;包括高清摄像头、毫米波雷达、超声波雷达等&#xff0c;这些传感器可以实时监测车辆周围的环境&#xff0…

【在Linux世界中追寻伟大的One Piece】Linux是从哪里来的?又是怎么发展的?基本指令你知道哪些?

目录 1 -> Linux背景 1.1 -> Linux发展史 1.1.1 -> UNIX发展历史 1.1.2 -> Linux发展历史 1.2 -> 开源 1.3 -> 官网 1.4 -> 企业应用现状 1.5 -> 发行版本 1.6 -> OS概念&#xff0c;定位 2 -> Linux下基本指令 2.1 -> Is指令 2…

高效的工作学习方法

1.康奈尔笔记法 在这里插入图片描述 2. 5W2H法 3. 鱼骨图分析法 4.麦肯锡7步分析法 5.使用TODOLIST 6.使用计划模板&#xff08;年月周&#xff09; 7. 高效的学习方法 成年人的学习特点&#xff1a; 快速了解一个领域方法 沉浸式学习方法&#xff1a; 沉浸学习的判据&am…

23种设计模式之抽象工厂模式

目录 什么是抽象工厂模式 基本结构 基本实现步骤 实现代码&#xff08;有注释&#xff09; 应用场景 简单工厂、工厂方法、抽象工厂的区别 什么是抽象工厂模式 抽象工厂模式也是一种创建型设计模式&#xff0c;提供了一系列相关或相互依赖对象的接口&#xff0c;而无需…

微信小程序的图片色彩分析,解决画布网络图片报错问题,窃取网络图片的主色调

1、安装 Mini App Color Thief 包 包括下载包&#xff0c;简单使用都有&#xff0c;之前写了&#xff0c;这里就不写了 网址&#xff1a;微信小程序的图片色彩分析&#xff0c;窃取主色调&#xff0c;调色板-CSDN博客 2、 问题和解决方案 问题&#xff1a;由于我们的窃取图片的…

【C++】:map和set的封装

朋友们、伙计们&#xff0c;我们又见面了&#xff0c;本期来给大家解读一下set和map的封装&#xff0c;如果看完之后对你有一定的启发&#xff0c;那么请留下你的三连&#xff0c;祝大家心想事成&#xff01; C 语 言 专 栏&#xff1a;C语言&#xff1a;从入门到精通 数据结构…

【QT+QGIS跨平台编译】之三十八:【GDAL+Qt跨平台编译】(一套代码、一套框架,跨平台编译)

文章目录 一、gdal介绍二、文件下载三、文件分析四、pro文件五、编译实践一、gdal介绍 GDAL(Geospatial Data Abstraction Library)是一个用于读取、写入和处理地理空间数据的开源库。它支持多种栅格和矢量地理空间数据格式,包括常见的GeoTIFF、Shapefile、NetCDF、HDF5等,…

《Java 简易速速上手小册》第9章:Java 开发工具和框架 (2024 最新版)

文章目录 9.1 Maven 和 Gradle - 构建与依赖管理的神兵利器9.1.1 基础知识9.1.2 重点案例&#xff1a;使用 Maven 构建 Spring Boot 应用9.1.3 拓展案例 1&#xff1a;使用 Gradle 构建多模块项目9.1.4 拓展案例 2&#xff1a;利用 Gradle Wrapper 确保构建的一致性 9.2 Spring…

制作韦恩图常用软件或网站

韦恩图是一种用于可视化集合之间的关系的图表类型&#xff0c;通常用于显示集合之间的重叠和共同部分。以下是几种常用的制作韦恩图的软件或网站&#xff1a; Microsoft PowerPoint&#xff1a;虽然 PowerPoint 并不是专门用于制作韦恩图的软件&#xff0c;但它具有丰富的图表和…

专业130+总分420+厦门大学847信号与系统考研经验厦大信息系统与通信工程,真题,大纲,参考书。

今年很幸运被厦门大学录取&#xff0c;考研专业课847信号与系统130&#xff0c;数二130&#xff0c;总分420&#xff0c;回头看这将近一年的复习&#xff0c;还是有不少经验和大家分享&#xff0c;希望对大家复习有帮助。专业课&#xff1a; 厦门大学847信号与系统在全国各高校…

【doghead】bifrost的player 版本 windows构建

worker 直接用cmake 构建windows版本看起来也是可以的。我这里尝试用windows 添加文件的方式构建大神都是cmake直接windows构建的 可以参考 mediasoup-sfu-cpp 工程试试ouxianghui大神的vs2022构建bat脚本 D:\XTRANS\soup\mediasoup-server-sfu-ouxianghui-cpp\vc2022 Could No…

C++实现二分查找

目录 例1 例2 例3 例4 例5 例6 例1 704. 二分查找 注意&#xff1a; ①left < right,这里的号是最后一次通过下标mid来判断 ②在偶数的时候mid&#xff0c;左右无所谓&#xff0c;因为left和right都有1&#xff1b; 参考代码 class Solution { public:int search…