go关于string与[]byte再学深一点

目标:充分理解string与[]bytes零拷贝转换的实现

先回顾下string与[]byte的基本知识

1. string与[]byte的数据结构

reflect包中关于字符串的数据结构

// StringHeader is the runtime representation of a string.type StringHeader struct {Data uintptrLen int}

Data指向的是某个数组的首地址

len代表数组的长度。

uintptr是一种特殊指针,下文会具体介绍

说明

  • string是一个8位的byte的集合,通常代表utf-8文本(但不一定都是)
  • string可以为empty但不能是nil
  • string的值是不能改变的(因为底层是数组)

reflect包中关于[]bytes的数据结构

type SliceHeader struct {Data uintptrLen intCap int}

Data指向的就是byte数组

[]byte是一个指向byte类型数组的slice

可以看到stringStruct与slice区别是cap,说明[]bytes的值是可变的,因为底层是切片。而string的值是不能改变的(因为底层是数组)

2. 基本数据结构的空间大小以及内存对齐

bl := truefmt.Println("size of bool:", unsafe.Sizeof(bl))// 1i := 10fmt.Println("size of int:", unsafe.Sizeof(i)) // 8i32 := int32(10)fmt.Println("size of int32:", unsafe.Sizeof(i32)) // 4i64 := int64(10)fmt.Println("size of int64:", unsafe.Sizeof(i64)) // 8str := "xxx"fmt.Println("size of str:", unsafe.Sizeof(str)) // 16type xstruct struct {a boolb int32c string}xx := xstruct{true, 10, "hello"}fmt.Println("size of xx.a:", unsafe.Sizeof(xx.a)) // 1fmt.Println("size of xx.b:", unsafe.Sizeof(xx.b)) // 4fmt.Println("size of xx.c:", unsafe.Sizeof(xx.c)) // 16fmt.Println("size of xx:", unsafe.Sizeof(xx)) // 不是1+4+16=21,而是24,为什么呢?由于字节对齐// xx.a为一个字节,而实际存储时会占用一个"对齐系数"也就是8字节(对于64位机器,"对齐系数"是8字节);// xx.b为四个字节,所以1+4=5,放一个对齐系数(8字节),其余剩余部分用0补充// xx.c为16个字节,刚好放满2个对齐系数(16字节)。所以8+16=24字节

从代码中总结常见类型变量占用空间:

bool占1个字节

int32占4个字节

int与int64 占4字节(64位机器)

string占16个字节,其中包含2部分,第一部分unsafe.pointer占8字节,第二部分len int占8字节

struct结构体占用的空间,计算时需要考虑字节对齐,字节对齐的好处是减少cpu访问memory的此次,cpu读取memory最小单位是一个字长(8字节),从而提供访问内存性能。(具体细节请问google)

3. unsafe.pointer与uintptr

string与[]byte结构的定义出现了uintptr,并且unsafe.pointer通常用于类型转换,下面具体介绍2中指针类型。

  • unsafe.pointer与uintptr都是指针,但又不是普通指针,经查阅指针分为三种类型,分别有:

1. *类型: 这是最常用的指针,名叫普通指针类型,用于传递对象地址,不能进行指针运算。

2. unsafe.Pointer:通用指针类型,用于转换不同类型的指针,不能进行指针运算,不能读取内存存储的值(必须转换到某一类型的普通指针)。

3. uintptr:用于指针运算. 本质是存储 `指针地址` 的int类型

  • unsafe.Pointer类型有四个重要描述:

(1)任何类型的指针都可以被转化为Pointer

(2)Pointer可以被转化为任何类型的指针

(3)uintptr可以被转化为Pointer

(4)Pointer可以被转化为uintptr

简而言之,unsafe.Pointer可以实现指针类型的转换,uintptr用于指针计算

下面看看Pointer的内部结构:

type Pointer *ArbitraryType// ArbitraryType is here for the purposes of documentation only and is not actually// part of the unsafe package. It represents the type of an arbitrary Go expression.type ArbitraryType int

ArbitraryType是int的一个别名,在Go中对ArbitraryType赋予特殊的意义。代表一个任意Go表达式类型。

  • unsafe.Pointer的使用示例:
value1 := int32(10)value2 := int64(12)p := &value1fmt.Println(reflect.TypeOf(p)) // *int32fmt.Println(*p) // 10//p = &value2 // 错误。 无法将p指向&value2地址,因为p是*int32类型,&value2是*ini64类型unsPtr := unsafe.Pointer(&value2) // 将*int64先转换为unsafe.Pointer类型指针,此时unsPtr指向&value2(也就是value2的地址)p = (*int32)(unsPtr) //转换为*int32指针类型fmt.Println(reflect.TypeOf(p)) // *int32fmt.Println(*p) // 11
  • uintptr的使用示例
type student struct {name stringage uint8}s := student{name: "tom", // string类型,16字节age: 18, // int8类型,1字节}uptr := (uintptr)(unsafe.Pointer(&s)) // uptr指向结构体的首地址uptr = uptr + 16 // uptr移动16字节,指向age的地址age := *(*int8)(unsafe.Pointer(uptr)) // 转换为*int8类型的指针fmt.Printf("age=%d\n", age) // 18

  • 对uinitptr与unsafe.Pointer有简单了解后,再看结构体内存对齐示例
type student struct {name stringage uint8city string}s := student{name: "tom", // string类型,16字节age: 18, // int8类型,1字节; 需要做内存对齐,独占一个字长,本身占一个字节,其余7个字节填充city: "shenzhen", // string类型,16字节}

结构体的内存空间占用情况:

代码验证结构体占用空间的总大小,以及每个成员占用空间大小:

// 结构体占用空间fmt.Println("size of s:", unsafe.Sizeof(s)) // 40// 计算变量的地址fmt.Printf("address of s.name: %p\n", &s.name) // 0xc00008c030--->转换为十进制824634294320fmt.Printf("address of s.age: %p\n", &s.age) // 0xc00008c040--->转换为十进制824634294336fmt.Printf("address of s.city: %p\n", &s.city) // 0xc00008c048--->转换为十进制824634294344// 打印内部变量的相对字符串首地址的偏移量fmt.Printf("offset of s.age:%d\n", unsafe.Offsetof(s.name)) // 0fmt.Printf("offset of s.age:%d\n", unsafe.Offsetof(s.age)) // 16fmt.Printf("offset of s.age:%d\n", unsafe.Offsetof(s.city)) // 24,计算方法是24=16+8

下面我们把s字符串再进一步“打开”,探索一下字符串内部

先将s字符串转换为*reflect.StringHeader, 并查看字符串内部Data,Len的值


x := (*reflect.StringHeader)(unsafe.Pointer(&s)) // 转换为*reflect.StringHeaderfmt.Printf("x.Data: %v\n", x.Data) // 17603737,这就是Data变量保存的具体值,其实是一个内存地址fmt.Println("type of x.Data:", reflect.TypeOf(x.Data)) // uintptrfmt.Printf("&x.Data: %p\n", &x.Data) // 0xc000100030fmt.Printf("x.Len: %v\n", x.Len) // 3, 字符串"tom"的长度fmt.Printf("&x.Len: %p\n", &x.Len) // 0xc000100038, 说明38-30=8,表示x.Data占8个字节

  • 使用uintptr,计算出x.city的地址,再获取改地址的值
uptr := (uintptr)(unsafe.Pointer(&s)) // uptr指向结构体的首地址uptr = uptr + 16 + 8 // uptr移动16+8字节,指向address的地址city := *(*string)(unsafe.Pointer(uptr)) // 转换为*string类型的指针,再用*获取改地址的值,也就是x.city的值fmt.Printf("city=%s\n", city) // shenzhen

4.string与[]bytes零拷贝的实现

最后,有了基础知识后,我们再看看string与[]bytes零拷贝的实现

string转换为[]byte

// 内存零拷贝方式类型转换
func stringtobyte(s string) []byte {// &s转换为*reflect.StringHeadervar sptr *reflect.StringHeadersptr = (*reflect.StringHeader)(unsafe.Pointer(&s))var b []byte// &b转换为*reflect.SliceHeaderbptr := (*reflect.SliceHeader)(unsafe.Pointer(&b))// 填充*reflect.SliceHeader内的Data,Len,Capbptr.Data = sptr.Databptr.Len = sptr.Lenbptr.Cap = sptr.Lenreturn b
}

为了编译理解,将转换过去用图示表示

[]byte转换为string

// 内存零拷贝方式类型转换
func bytetostring(b []byte) string {var bptr *reflect.SliceHeaderbptr = (*reflect.SliceHeader)(unsafe.Pointer(&b))var s stringsptr := (*reflect.StringHeader)(unsafe.Pointer(&s))sptr.Data = bptr.Datasptr.Len = bptr.Lenreturn s
}

// 转换方法二

// 转换方法二
func String2Bytes(s string) []byte {sh := (*[2]uintptr)(unsafe.Pointer(&s))bh := [3]uintptr{sh[0], sh[1], sh[1]}return *(*[]byte)(unsafe.Pointer(&bh))
}func String2Bytes2(s string) []byte {// &s转换为unsafe.Pointer类型的指针,再转换为指向定长为2的uintptr数组的指针sh := (*[3]uintptr)(unsafe.Pointer(&s))// sh是一个指针,不能直接转换为*[]byte的指针,先转换为unsafe.Pointer,再转换为*[]byte指针;最后*取出指针指向的内容return *(*[]byte)(unsafe.Pointer(sh))
}

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/diannao/48490.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

ClickHouse 入门(一)【基本特点、数据类型与表引擎】

前言 今天开始学习 ClickHouse ,一种 OLAP 数据库,实时数仓中用到的比较多; 1、ClickHouse 入门 ClickHouse 是俄罗斯的 Yandex(搜索引擎公司)在 2016 年开源的列式存储数据库(HBase 也是列式存储&#xf…

某宝同款度盘不限速后台系统源码

简介: 某宝同款度盘不限速后台系统源码,验证已被我去除,两个后端系统,账号和卡密系统 第一步安装宝塔,部署卡密系统,需要环境php7.4 把源码丢进去,设置php7.4,和伪静态为thinkphp…

山东济南十大杰出人物起名大师颜廷利:影响世界的思想家哲学家教育家

在宇宙的广袤舞台上,各类智者以他们独特的方式揭示着世界的奥秘。数学家们在无尽的符号与公式中穿梭,像探索者般解锁着自然界的深层逻辑。考古学家们则跋涉于古老的土地,用他们的双手拂去岁月的尘埃,让沉睡的历史重见天日。 二十一…

spss是什么软件?spss有什么用

spss是什么软件? SPSS是一款数据统计、分析软件,它由IBM公司出品,这款软件平台提供了文本分析、大量的机器学习算法、数据分析模型、高级统计分析功能等,软件易学且功能非常强大,可以使用SPSS制作图表,例如…

汽车免拆诊断案例 | 2017 款林肯大陆车发动机偶尔无法起动

故障现象 一辆2017款林肯大陆车,搭载2.0T发动机,累计行驶里程约为7.5万km。车主进厂反映,有时按下起动按钮,起动机不工作,发动机无法起动,组合仪表点亮正常;多次按下起动按钮,发动机…

(21)起落架/可伸缩相机支架

文章目录 前言 1 连接到自动驾驶仪 2 通过任务规划器设置 3 其他参数 4 参数说明 前言 Copter 和 Plane 支持可伸缩的起落架/相机支架,由伺服机制激活(如 Hobby King 出售的用于copters 的这些)。齿轮/支架可以手动缩回或用一个辅助开关…

【 DHT11 温湿度传感器】使用STC89C51读取发送到串口、通过时序图编写C语言

文章目录 DHT11 温湿度传感器概述接线数据传送通讯过程时序图检测模块是否存在 代码实现总结对tmp tmp << 1;的理解对sendByte(datas[0]/10 0x30);的理解 DHT11 温湿度传感器 使用80C51单片机通过读取HDT11温湿度传感的数据&#xff0c;发送到串口。 通过时序图编写相应…

微信小程序数组绑定使用案例(一)

微信小程序数组绑定案例&#xff0c;修改数组中的值 1.Wxml 代码 <view class"list"><view class"item {{item.ischeck?active:}}" wx:for"{{list}}"><view class"title">{{item.name}} <text>({{item.id}…

Redis7(二)Redis持久化双雄

持久化之RDB RDB的持久化方式是在指定时间间隔&#xff0c;执行数据集的时间点快照。也就是在指定的时间间隔将内存中的数据集快照写入磁盘&#xff0c;也就是Snapshot内存快照&#xff0c;它恢复时再将硬盘快照文件直接读回到内存里面。 RDB保存的是dump.rdb文件。 自动触发…

昇思25天学习打卡营第25天|MindNLP ChatGLM-6B StreamChat

配置环节 %%capture captured_output !pip uninstall mindspore -y !pip install -i https://pypi.mirrors.ustc.edu.cn/simple mindspore2.2.14 !pip install mindnlp !pip install mdtex2html配置国内镜像 !export HF_ENDPOINThttps://hf-mirror.com下载与加载模型 from m…

【计算机视觉】siamfc论文复现实现目标追踪

什么是目标跟踪 使用视频序列第一帧的图像(包括bounding box的位置)&#xff0c;来找出目标出现在后序帧位置的一种方法。 什么是孪生网络结构 孪生网络结构其思想是将一个训练样本(已知类别)和一个测试样本(未知类别)输入到两个CNN(这两个CNN往往是权值共享的)中&#xff0…

代码解读:Diffusion Models中的长宽桶技术(Aspect Ratio Bucketing)

Diffusion Models专栏文章汇总&#xff1a;入门与实战 前言&#xff1a;自从SDXL提出了长宽桶技术之后&#xff0c;彻底解决了不同长宽比的图像输入问题&#xff0c;现在已经成为训练扩散模型必选的方案。这篇博客从代码详细解读如何在模型训练的时候运用长宽桶技术(Aspect Rat…

【机器学习】-- SVM核函数(超详细解读)

支持向量机&#xff08;SVM&#xff09;中的核函数是支持向量机能够处理非线性问题并在高维空间中学习复杂决策边界的关键。核函数在SVM中扮演着将输入特征映射到更高维空间的角色&#xff0c;使得原始特征空间中的非线性问题在高维空间中变得线性可分。 一、SVM是什么&#x…

时间卷积网络(TCN):序列建模的强大工具(附Pytorch网络模型代码)

这里写目录标题 1. 引言2. TCN的核心特性2.1 序列建模任务描述2.2 因果卷积2.3 扩张卷积2.4 残差连接 3. TCN的网络结构4. TCN vs RNN5. TCN的应用TCN的实现 1. 引言 引用自&#xff1a;Bai S, Kolter J Z, Koltun V. An empirical evaluation of generic convolutional and re…

Linux系统之部署扫雷小游戏(三)

Linux系统之部署扫雷小游戏(三) 一、小游戏介绍1.1 小游戏简介1.2 项目预览二、本次实践介绍2.1 本地环境规划2.2 本次实践介绍三、检查本地环境3.1 检查系统版本3.2 检查系统内核版本3.3 检查软件源四、安装Apache24.1 安装Apache2软件4.2 启动apache2服务4.3 查看apache2服…

大厂生产解决方案:泳道隔离机制

更多大厂面试内容可见 -> http://11come.cn 大厂生产解决方案&#xff1a;泳道隔离机制 背景 在公司中&#xff0c;由于项目多、开发人员多&#xff0c;一般会有多套测试环境&#xff08;可以理解为多个服务器&#xff09;&#xff0c;同一套服务会在多套测试环境中都部署…

如何解决微服务下引起的 分布式事务问题

一、什么是分布式事务&#xff1f; 虽然叫分布式事务&#xff0c;但不是一定是分布式部署的服务之间才会产生分布式事务。不是在同一个服务或同一个数据库架构下&#xff0c;产生的事务&#xff0c;也就是分布式事务。 跨数据源的分布式事务 跨服务的分布式事务 二、解决方…

配置服务器

参考博客 1. https://blog.csdn.net/qq_31278903/article/details/83146031 2. https://blog.csdn.net/u014374826/article/details/134093409 3. https://blog.csdn.net/weixin_42728126/article/details/88887350 4. https://blog.csdn.net/Dreamhai/article/details/109…

javac详解 idea maven内部编译原理 自制编译器

起因 不知道大家在开发中&#xff0c;有没有过下面这些疑问。有的话&#xff0c;今天就一次解答清楚。 如何使用javac命令编译一个项目&#xff1f;java或者javac的一些参数到底有什么用&#xff1f;idea或者maven是如何编译java项目的&#xff1f;&#xff08;你可能猜测底层…

【一刷《剑指Offer》】面试题 47:不用加减乘除做加法

力扣对应题目链接&#xff1a;LCR 190. 加密运算 - 力扣&#xff08;LeetCode&#xff09; 牛客对应题目链接&#xff1a;不用加减乘除做加法_牛客题霸_牛客网 (nowcoder.com) 一、《剑指Offer》对应内容 二、分析题目 sumdataA⊕dataB 非进位和&#xff1a;异或运…