go基础09-Go语言的字符串类型

字符串类型是现代编程语言中最常使用的数据类型之一。在Go语言的先祖之一C语言当中,字符串类型并没有被显式定义,而是以字符串字面值常量或以’\0’结尾的字符类型(char)数组来呈现的:

#define GOAUTHERS "Robert Griesemer, Rob Pike, and Ken Thompson"
const char * s = "hello world"
char s[] = "hello gopher"

这给C程序员在使用字符串时带来一些问题,诸如:

● 类型安全性差;

● 字符串操作要时时刻刻考虑结尾的’\0’;

● 字符串数据可变(主要指以字符数组形式定义的字符串类型);

● 获取字符串长度代价大(O(n)的时间复杂度);

● 未内置对非ASCII字符(如中文字符)的处理。

Go语言修复了C语言的这一“缺陷”,内置了string类型,统一了对字符串的抽象。

Go语言的字符串类型

在Go语言中,无论是字符串常量、字符串变量还是代码中出现的字符串字面量,它们的类型都被统一设置为string:

const (s = "string constant"
)
func main() {var s1 string = "string variable"fmt.Printf("%T\n", s) // stringfmt.Printf("%T\n", s1) // stringfmt.Printf("%T\n", "temporary string literal") // string
}

Go的string类型设计充分吸取了C语言字符串设计的经验教训,并结合了其他主流语言在字符串类型设计上的最佳实践,最终呈现的string类型具有如下功能特点

(1)string类型的数据是不可变的

一旦声明了一个string类型的标识符,无论是常量还是变量,该标识符所指代的数据在整个程序的生命周期内便无法更改。下面尝试修改一下string数据,看看能得到怎样的结果。

我们先来看第一种方法:

func main() {
// 原始字符串var s string = "hello"fmt.Println("original string:", s)// 切片化后试图改变原字符串sl := []byte(s)sl[0] = 't'fmt.Println("slice:", string(sl))fmt.Println("after reslice, the original string is:", 	string(s))
}

该程序的运行结果如下:


original string: hello
slice: tello
after reslice, the original string is: hello

在上面的例子中,我们试图将string转换为一个切片并通过该切片对其内容进行修改,但结果事与愿违。对string进行切片化后,Go编译器会为切片变量重新分配底层存储而不是共用string的底层存储,因此对切片的修改并未对原string的数据产生任何影响。

我们再来试试通过更为“暴力”一些的手段对string的数据发起“攻击”:

func main() {
// 原始string
var s string = "hello"
fmt.Println("original string:", s)
// 试图通过unsafe指针改变原始string
modifyString(&s)
fmt.Println(s)}func modifyString(s *string) {// 取出第一个8字节的值p := (*uintptr)(unsafe.Pointer(s))// 获取底层数组的地址var array *[5]byte = (*[5]byte)(unsafe.Pointer(*p))var len *int = (*int)(unsafe.Pointer(uintptr(unsafe.Pointer(s)) + unsafe.Sizeof((*uintptr)(nil))))for i := 0; i < (*len); i++ {fmt.Printf("%p => %c\n", &((*array)[i]), (*array)[i])p1 := &((*array)[i])v := (*p1)(*p1) = v + 1 //try to change the character}
}

我们试图通过unsafe指针指向string在运行时内部表示结构(具体参考本条后面的讲解)中的数据存储块的地址,然后通过指针修改那块内存中存储的数据。

运行这段程序得到下面的结果:

original string: hello
0x10d1b9d => h
unexpected fault address 0x10d1b9d
fatal error: fault
[signal SIGBUS: bus error code=0x2 addr=0x10d1b9d pc=0x109b079]

我们看到,对string的底层的数据存储区仅能进行只读操作,一旦试图修改那块区域的数据,便会得到SIGBUS的运行时错误,对string数据的“篡改攻击”再次以失败告终。

2)零值可用

Go string类型支持“零值可用”的理念。Go字符串无须像C语言中那样考虑结尾’\0’字符,因此其零值为"",长度为0。

var s string
fmt.Println(s) // s = ""
fmt.Println(len(s)) // 0

3)获取长度的时间复杂度是O(1)级别

Go string类型数据是不可变的,因此一旦有了初值,那块数据就不会改变,其长度也不会改变。Go将这个长度作为一个字段存储在运行时的string类型的内部表示结构中(后文有说明)。这样获取string长度的操作,即len(s)实际上就是读取存储在运行时中的那个长度值,这是一个代价极低的O(1)操作。

4)支持通过+/+=操作符进行字符串连接

对开发者而言,通过+/+=操作符进行的字符串连接是体验最好的字符串连接操作,Go语言支持这种操作:

s := "Rob Pike, "
s = s + "Robert Griesemer, "
s += " Ken Thompson"
fmt.Println(s) // Rob Pike, Robert Griesemer, Ken Thompson

5)支持各种比较关系操作符:==、!= 、>=、<=、>和<

func main() {// ==s1 := "世界和平"s2 := "世界" + "和平"fmt.Println(s1 == s2) // true// !=s1 = "Go"s2 = "C"fmt.Println(s1 != s2) // true// < 和 <=s1 = "12345"s2 = "23456"fmt.Println(s1 < s2) // truefmt.Println(s1 <= s2) // true// > 和 >=s1 = "12345"s2 = "123"fmt.Println(s1 > s2) // truefmt.Println(s1 >= s2) // true
}

由于Go string是不可变的,因此如果两个字符串的长度不相同,那么无须比较具体字符串数据即可断定两个字符串是不同的。如果长度相同,则要进一步判断数据指针是否指向同一块底层存储数据。如果相同,则两个字符串是等价的;如果不同,则还需进一步比对实际的数据内容。

6)对非ASCII字符提供原生支持

Go语言源文件默认采用的Unicode字符集。Unicode字符集是目前市面上最流行的字符集,几乎囊括了所有主流非ASCII字符(包括中文字符)。Go字符串的每个字符都是一个Unicode字符,并且这些Unicode字符是以UTF-8编码格式存储在内存当中的。

我们来看一个例子:

func main() {// 中文字符 Unicode码点 UTF8编码// 中 U+4E2D E4B8AD// 国 U+56FD E59BBD// 欢 U+6B22 E6ACA2// 迎 U+8FCE E8BF8E// 您 U+60A8 E682A8s := "中国欢迎您"rs := []rune(s)sl := []byte(s)for i, v := range rs {var utf8Bytes []bytefor j := i * 3; j < (i+1)*3; j++ {utf8Bytes = append(utf8Bytes, sl[j])}fmt.Printf("%s => %X => %X\n", string(v), v, utf8Bytes)
}
}

我们看到字符串变量s中存储的文本是“中国欢迎您”五个汉字字符(非ASCII字符范畴),这里输出了每个中文字符对应的Unicode码点(Code Point,见输出结果的第二列),一个rune对应一个码点。UTF-8编码是Unicode码点的一种字符编码形式,是最常用的一种编码格式,也是Go默认的字符编码格式。我们还可以使用其他字符编码格式来映射Unicode码点,比如UTF-16等。

在UTF-8中,大多数中文字符都使用三字节表示。[]byte(s)的转型让我们获得了s底层存储的“复制品”,从而得到每个汉字字符对应的UTF-8编码字节(见输出结果的第三列)。

=> 4E2D => E4B8AD
国 => 56FD => E59BBD
欢 => 6B22 => E6ACA2
迎 => 8FCE => E8BF8E
您 => 60A8 => E682A8

7)原生支持多行字符串

Go语言直接提供了通过反引号构造“所见即所得”的多行字符串的方法:

const s = `好雨知时节,当春乃发生。随风潜入夜,润物细无声。野径云俱黑,江船火独明。晓看红湿处,花重锦官城。`
func main() {fmt.Println(s)
}

运行结果:

好雨知时节,当春乃发生。
随风潜入夜,润物细无声。
野径云俱黑,江船火独明。
晓看红湿处,花重锦官城。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/news/71879.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

vue3 defineProps 函数

在 vue2 中我们使用选项中的 props 来接受父组件传递过来的数据&#xff1b;那在 vue3 的 setup 中&#xff0c;我们使用 defineProps 来定义父组件传递过来的数据 1、defineProps 支持的类型有&#xff1a;String、Number、Boolean、Object、Array、Function&#xff0c;除此之…

2023-09-07 C++命名空间的一些陷阱

老林的C语言新课, 想快速入门点此 <C 语言编程核心突破> C命名空间的一些陷阱 前言一、命名空间是什么&#xff1f;(InsCode AI 创作助手)二、命名空间全局污染总结 前言 最近看到个问题, 就是在命名空间中声明一个变量 ( int rand 0 ), 用using namespace将这个命名空…

方向介绍:基于深度学习的轨迹预测

方向介绍&#xff1a;基于深度学习的轨迹预测 文章目录 方向介绍&#xff1a;基于深度学习的轨迹预测问题定义典型方法挑战未来展望参考 基于深度学习的轨迹预测是一种利用神经网络模型来预测移动物体的未来位置和运动状态的技术。这种技术在许多领域都有重要的应用&#xff0c…

常见数据库介绍对比之SQL关系型数据库

1.关系型数据库介绍 关系型数据库是一种基于关系模型的数据库&#xff0c;它使用表格来组织和存储数据。下面是一些常见的关系型数据库&#xff1a; 1.1. MySQL MySQL是一种开源的关系型数据库管理系统&#xff08;RDBMS&#xff09;&#xff0c;广泛用于Web应用程序和企业级…

Nosql数据库服务之redis

Nosql数据库服务之redis 一图详解DB的分支产品 Nosql数据库介绍 是一种非关系型数据库服务&#xff0c;它能解决常规数据库的并发能力&#xff0c;比如传统的数据库的IO与性能的瓶颈&#xff0c;同样它是关系型数据库的一个补充&#xff0c;有着比较好的高效率与高性能。 专…

AlexNet 06

一、发展 1989年&#xff0c;Yann LeCun提出了一种用反向传导进行更新的卷积神经网络&#xff0c;称为LeNet。 1998年&#xff0c;Yann LeCun提出了一种用反向传导进行更新的卷积神经网络&#xff0c;称为LeNet-5 AlexNet&#xff0c;VGG&#xff0c;GoogleNet&#xff0c;R…

计算机网络常见端口号

端口号标识了一个主机上进行通信的不同的应用程序。比如网站服务器80端口一般都是开启的&#xff0c;等你来连接。 端口划分&#xff1a; &#xff08;1&#xff09;常用端口&#xff0c;公共端口&#xff08;保留给公共服务所使用&#xff09;&#xff0c;端口号为0-1023之间…

三色标记整理

在并发标记过程中&#xff0c;因为标记期间应用线程还在继续跑&#xff0c;多标漏标的情况有可能发生 把Gcroot可达性分析遍历分析对象过程中遇到的对象&#xff0c;按照知否访问过来标记三种颜色 黑色&#xff1a;表示这个对象已经被垃圾收集器访问过&#xff0c;且所有的引用…

小鹏汽车在滴滴上眺望远方

监制 | 何玺 排版 | 叶媛 小鹏汽车越来越有看头了。 前不久&#xff0c;小鹏汽车宣布与滴滴出行达成战略合作&#xff0c;将采用股票增发形式&#xff0c;收购滴滴旗下的智能电动汽车项目。 预计到2024年&#xff0c;小鹏汽车将依托这次收购的技术和资产&#xff0c;向市场推…

运维监控系统PIGOSS BSM 业务监控 大屏展现解析

“业务大屏”是 PIGOSS BSM&#xff08;IT运维监控工具&#xff09;的特色功能之一&#xff0c;旨在提供综合而直观的业务监控视图。该功能主要由三个组成部分构成&#xff1a;业务健康度雷达图、业务状态矩阵和多趋势对比图。 下面将对每个部分进行详细介绍&#xff1a; 业务健…

支持向量机

一、支持向量机 1. 基本概念 1&#xff09;什么是支持向量机 支持向量机&#xff08;Support Vector Machines&#xff09;是一种二分类模型&#xff0c;在机器学习、计算机视觉、数据挖掘中广泛应用&#xff0c;主要用于解决数据分类问题&#xff0c;它的目的是寻找一个超平…

CDN+GitHub搭建图床

前期搭建博客的时候&#xff0c;老是遇到图片无法加载、加载出错等等问题&#xff0c;很是烦恼。于是想搭建一个图床&#xff0c;进行个人博客图片的存储、显示使用。 ​ 利用GitHubjsDelivrPicGo搭建免费图床&#xff0c;CDN图床就是这么朴实无华&#xff0c;是基于免费CDN与免…

敏感信息防泄漏:透明加密与通信内容安全策略深度解析

随着信息技术的迅猛发展&#xff0c;计算机和网络已经成为了我们日常生活中不可或缺的工具&#xff0c;用于办公、通信和协作。尽管这些信息系统提高了工作效率&#xff0c;但也引发了一系列与信息安全相关的问题&#xff0c;例如如何有效地保护存储在这些系统中的关键数据&…

实训七:存储过程与触发器 - 存储过程、函数与触发器

存储过程、函数与触发器 第1关&#xff1a;创建存储过程任务描述相关知识存储过程的定义存储过程的创建和查询存储过程的查询和删除 编程要求测试说明参考代码 第2关&#xff1a;创建函数-count_credit任务描述相关知识自定义函数的定义自定义函数的创建 编程要求测试说明参考代…

【C++漂流记】函数的高级应用——函数默认参数、占位参数、重载

函数的高级应用&#xff0c;侧重介绍函数的默认参数、函数的占位参数、函数重载定义解释及使用。 文章目录 一、函数的默认参数二、函数的占位参数三、函数重载函数重载的注意事项 一、函数的默认参数 函数默认参数是指在函数声明时为参数提供一个默认值&#xff0c;这样在调…

算法通关村第十三关——溢出问题处理模板

前言 溢出问题是面试当中输出涉及到数字的一个需要特别注意的地方&#xff0c;典型的题目有三个&#xff1a;数字反转&#xff0c;将字符串转成数字和回文数。 1.整数反转 力扣7题&#xff0c;给你一个 32 位的有符号整数 x &#xff0c;返回将 x 中的数字部分反转后的结果。…

ORACLE 11.2.0.4 RAC Cluster not starting cssd with Cannot get GPnP profile

最近&#xff0c;处理一次oracle 11.2.0.4 rac cluster由于cssd无法启动&#xff0c;导致集群一个节点的CRS集群无法正常启动的故障。原本&#xff0c;计划变更是从ASM剔除磁盘&#xff0c;解除存储到数据库服务器的映射&#xff1b;磁盘已经成功从ASM剔除&#xff0c;也已经成…

数据库误修改后的数据恢复

一不小心将数据库数据修改了&#xff0c;而且回滚无效&#xff0c;于是去尝试各种方法恢复数据 查询到修改时间点之前的数据 恢复数据 恢复数据库被修改数据的流程及代码&#xff0c;这里被修改的表是AUTH_USER,实际应用填写对应表名。 -- 通过时间恢复删除且已提交的数据-- 1…

uni-app rich-text组件富文本图片展示不全问题

背景&#xff1a;phpfastadmin富文本插件上传富文本内容到数据库&#xff0c;uni-app渲染富文本内容。这里后端不需要特殊处理。uni-app的rich-text组件展示图片跑板。直接贴代码。 <template><view><title-bar title"会员动态" back backcolor"…

解释区块链技术的应用场景和优势

概述 区块链技术是一种分布式数据库技术&#xff0c;用于存储和传输数字资产&#xff08;如加密货币&#xff09;的信息。它通过将交易记录分散保存到节点网络中的多个节点上&#xff0c;从而保证了数据的安全性和透明度。区块链技术的核心是基于密码学技术的算法&#xff0c;…