数据结构杂谈(七)——串

文章目录

  • 7 串
    • 7.1 基本知识
      • 7.1.1 串的定义
        • :rose:定义
        • :rose:各种概念
        • :rose:字符串和线性表的区别
      • 7.1.2 串的抽象类型数据定义
      • 7.1.3 串的比较
        • :rose:原理
    • 7.2 串的存储结构
      • :rose:7.2.1串的顺序存储
      • :rose:7.2.2 串的链式存储
    • 7.3 基本操作
      • :rose:7.3.1 返回子串操作
      • :rose:7.3.2 比较操作
      • :rose:7.3.3 定位操作

7 串

7.1 基本知识

7.1.1 串的定义

🌹定义

串,即字符串(String)。字符串是由零个或多个字符组成有限序列,一般即为S = ‘a1a2...ana_1a_2...a_na1a2...an’(n>=0)

对定义的补充

在上面这个定义的叙述中,S是串名,单引号括起来的字符序列是串的值;aia_iai可以是字母、数字或其他字符;串中字符的个数n称为串的长度。n = 0时串被称为空串(用∅表示)。

字符串不一定是要用单引号括起,在Java和C中用的是双引号,而在python中双引号和单引号皆可。

🌹各种概念

我们用T = "I love you everyday"来举例。

概念说明示例
子串串中任意个连续的字符组成的子序列'love’是T的子串
主串包含子串的串T是’love’的主串
字符在主串的位置字符在串中的序号I在T中的位置是1
子串在主串中的位置子串的第一个字符在主串中的位置'love’在T中的位置是3
空串字符串没有东西‘’
空格串字符串全是空格’ '为含有三个空格的空格串

需要注意的点:

  • 空串和空格串不一样,空格串的空格也算是串中的元素
  • 位置和索引不一样,是从1开始而非0开始

🌹字符串和线性表的区别

串是一种特殊的线性表,数据元素之间呈现线性关系。为何说他特殊?因为对于线性表来说,其数据元素可以是任何数据类型,但是对于串来说,其数据元素只能是字符集(如中文字符、英文字符、数字字符、标点字符等)。

并且,对于串的基本操作,我们都是对子串作为操作对象。

串比较明显的应用例子是网站搜索引擎,通常我们都是要搜索子串才能出现全部的字符串,而不是搜索首字母就能出来整个字符串。

7.1.2 串的抽象类型数据定义

ADT 串(string)
Data
串中元素仅由一个字符组成,相邻元素具有前驱和后继关系
Operation
StrAssign(T,*chars):生成一个其值等于字符串常量chars的串T。
StrCopy(T,S):串S存在,由串S复制得串T。
ClearString(S):串S存在,将串清空。
StringEmpty(S):若串为空,则返回true,否则返回false。
StrLength(S):返回S的元素个数,即串S的长度。
StrCompare(S,T):若S>T,返回>0,S=T,返回=0,S<T,返回<0.
Concat(T,S1,S2):用T返回由S1和S2联接而成的新串。
SubString(Sub,S,pos,len):串S存在,1<=pos<=Strlength(S),且0<=len<=Strlength(S)-pos+1.用Sub返回串S的第pos个字符起长度为len的子串。
Index(S,T,pos):串S和T存在,T是非空串,1<=pos<=Strlength(S).若主串S中存在和串T值相同的字串,则返回它在主串S中第pos个字符之后第一次出现的位置,否则返回0
Replace(S,T,V):串S,T和V存在,T是非空串。用V替换主串S中出现的所有与T相等的不重叠的子串。
StrInsert(S,pos,T):串S和T存在,1<=pos<=Strlength(S)+1.在串S的第pos个字符之前插入串T。
SteDelete(S,pos,len):串S存在,1<=pos<=StrLength(s)-len+1.从串S中删除第pos个字符起长度为len的子串。

7.1.3 串的比较

🌹原理

对于串的比较来说,其先比元素再比大小。

  • 如’abandon’和’aboard’。对于前两个字母ab都相同,对于第三个字母abandon为a而aboard为o,又a的ASCII比o小,故’abandon’<‘aborad’
  • 如’abstract’和’abstraction’。对于前几个字母来说都一样,但是后者显然更长,故’abstract’<‘abstraction’
  • 两个串如果相等,必须内容完全相同。这里指的内容也包括空格
  • 当然,比对英文是用ASCII字符集,如果是中文则是用Unicode字符集
  • 采用不同的编码方式编码,字节大小不同。对于考研来说,每个字符默认1B

7.2 串的存储结构

回顾前面的链表、栈、队列,关于静态的存储我们都是采用数组,这里我们也不例外。

🌹7.2.1串的顺序存储

静态数组实现(定长顺序存储)

#define MAXLEN 255
typedef struct SString 
{char ch[MAXLEN];int length;
}SString;

动态数组存储(堆分配存储)

#define MAXLEN 255
typedef struct HString
{char* ch;//按串场分配存储区,ch指向串的基地址int length;//串的长度
}HString;void StrAssign() 
{HString S;S.ch = new char[MAXLEN * sizeof(char)];S.length = 0;
}

有的书上并不喜欢另外定义length,而是使用数组的0号位索引用于存放length,这样做的好处是length可以不用另外去申请空间,并且还可以使得索引和位序刚好相同,满足代码的自然性。

image-20220407150309306

这种方案也有缺陷。这样方式头位置是char类型,却放了int变量进去,这样就会导致int的取值只能在0-255之间。为此,我们做了以下的改进:

image-20220407150611916

🌹7.2.2 串的链式存储

由于链式存储中,我们需要有一个指针来固定串的起始位置,对于32为计算机来说,指针大小为4个字节,而char字符只占1个字节,这种情况就会导致指针耗费的空间比存储的数据还多,存储密度低。如下所示:

typedef struct StringNode 
{char ch;struct StringNode* next;
}StringNode,*String;

image-20220407151345685

我们可以改进这种情况,即一个结点中存储多个char。

typedef struct StringNode 
{char ch[4];struct StringNode* next;
}StringNode,*String;

image-20220407151618540

7.3 基本操作

🌹7.3.1 返回子串操作

SubString(&Sub,S,pos,len):求子串。用Sub返回串S的第pos个字符起长度为len的子串。

//返回子串操作
bool SubString(SString& Sub, SString S, int pos, int len) 
{//子串范围越界if (pos + len - 1 > S.length)return false;for (int i = pos; i < pos + len; i++)Sub.ch[i - pos + 1] = S.ch[i];Sub.length = len;return true;
}

🌹7.3.2 比较操作

StrCompare(S,T):比较操作。若S>T,则返回值>0;若S=T,则返回值=0,若S<T,则返回<0

//比较操作
int StrCompare(SString S, SString T) 
{//比较操作for (int i = 1; i < S.length && i <= T.length; i++) {if (S.ch[i] != T.ch[i])return S.ch[i] - T.ch[i];}//扫描过的所有字符都相同,则长度长的串更大return S.length - T.length;
}

🌹7.3.3 定位操作

Index(S,T):定位操作。若主串S中存在于串T值相同的子串,则返回它在主串S中第一次出现的位置,否则函数值为0。

//定位操作
int Index(SString S, SString T) 
{int i = 1, n = StrLength(S), m = StrLength(T);SString sub; //由于暂存子串while (i <= n - m + 1) {SubString(sub, S, i, m);if (StrCompare(sub, T) != 0)++i;elsereturn i;}return 0;
}

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/news/398563.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

牛刀小试Oracle之ORACLE 11GR2 RAC安装配置--检测GI软件是否正常(三)

1. 切换至grid用户[rootZracnode1 ~]# su - grid2.查看CRS状态(目前Oracle11GR2官方文档&#xff0c;不建议用如下命令检测了&#xff0c;等我有时间在整理补充)[gridZracnode1 ~]$ crs_stat -tName Type Target State Host ---------------…

PHP十六个魔术方法

PHP中把以两个下划线__开头的方法称为魔术方法(Magic methods)&#xff0c;这些方法在PHP中充当了举足轻重的作用。 魔术方法包括&#xff1a; __construct()&#xff0c;类的构造函数__destruct()&#xff0c;类的析构函数__call()&#xff0c;在对象中调用一个不可访问方法时…

Linux实现的IEEE 802.q VLAN

本文转载自&#xff1a; http://blog.chinaunix.net/uid-20786208-id-4291059.html Technorati 标签: Linux VLAN--------------------------我是快乐的分割线-------------------------------------------------- 第一部分&#xff1a;VLAN的核心概念 说起IEEE 802.1q&#xf…

C++从0到1的入门级教学(十二)——运算符重载

文章目录12 运算符重载12.1 加法运算符重载12.2 左移运算符重载12.2.1 演示与说明12.2.2 常见的友元使用&#xff1a;重载>>运算符12.3 递增运算符重载12.4 赋值运算符重载12.5 关系运算符重载12.6 函数调用运算符重载12 运算符重载 在本讲中&#xff0c;我们会设计到一…

IntelliJ IDEA 显示行号方法

为何N多人问这问题&#xff0c;设置方法如下&#xff1a;File->Settings->Editor->General->Appearence->Show Line Number

python项目构建工具zc.buildout

转载&#xff1a;http://blog.csdn.net/u011630575/article/details/52940099 buildout简介 Buildout 是一个基于Python的构建工具, Buildout 主要是为了解决两个问题: 中心化的应用组装和部署重复的从Python软件发布中组装项目通过一个配置文件 buildout.cfg , 可以从多个部分…

C++从0到1的入门级教学(十三)——继承

文章目录13 继承13.1 继承的基本语法13.2 继承方式13.3 继承的对象模型13.4 继承中构造和析构顺序13.5 继承同名成员处理方式13.6 继承同名静态成员处理方式13.7 多继承语法13.8 菱形继承13 继承 继承是面向对象三大特性之一。有些类和类之间存在特殊的关系&#xff0c;如下图…

书评 – 程序员经典读物(1)

早几天&#xff0c;笼统地就经典感慨了一番&#xff0c;接着来个逐一点评&#xff0c;算是有始有终了。经典是用来阅读而非膜拜的道理&#xff0c;自然是明白的&#xff0c;虽然我是属于比较推崇经典那一类的。阅读大致就是一个和作者交流的过程&#xff0c;有兴致时无妨感慨点…

ubuntu安装环境软件全文档

1,安装apace2: sudo apt-get install apache2 2谷歌浏览器的安装&#xff1a;sudo apt-get install chromium-browser-dbg 3&#xff0c;国际版QQ下载&#xff1a;http://pan.baidu.com/s/1nt1Nu6P 根据自己的安装的32位或者是64位来下载。 安装的时候按照文件顺序安装就好了…

线性代数(二)

2 解线性方程组 1 Ax b的列图像实质是A的列向量有各种线性组合&#xff0c;b为其中的一种组合结果。 2 Ax b可以写为Axx1a1...xnanbAx x_1a_1...x_na_n bAxx1​a1​...xn​an​b&#xff0c;其中a1,a2...ana_1,a_2...a_na1​,a2​...an​为A中的列向量。 3 当Ax 0时&#…

xor方程组消元 UVA 11542 Square

题目传送门 题意&#xff1a;给n个数&#xff0c;选择一些数字乘积为平方数的选择方案数。训练指南题目。 分析&#xff1a;每一个数字分解质因数。比如4&#xff0c; 6&#xff0c; 10&#xff0c; 15&#xff0c;, , , , 令&#xff0c;表示选择第i个数字&#xff0c;那么&am…

从汇编去分析线程安全

首先要知道什么是线程安全&#xff1f; 当多个线程访问某个类时&#xff0c;不管运行环境采用何种调度方式或者这些线程将如何交替执行&#xff0c;并且在主调代码中不需要任何额外的同步或协同&#xff0c;这个类都能表现出正确的行为&#xff0c;那么就称这个类是线程安全的。…

前端面试问题汇总

面试技术问题&#xff1a; Null 与 undefined区别&#xff1f;l NULL的类型是object&#xff1b;undefined的类型是undefined类型&#xff0c;一个变量如果没有初始化的话就是undefined。 l null 表示此处数值为空&#xff0c;undefined表示此处应该有值&#xff0c;但是确…

深度学习修炼(八)——经典卷积网络

文章目录8 经典卷积网络8.1 LeNet模型8.2 Alexnet8.3 VGG8.4 ResNet8.5 感受野8 经典卷积网络 在前面一讲&#xff0c;我们谈论了关于卷积神经网络的诸多细节。综合来讲&#xff0c;卷积神经网络就是含卷积层的网络。在本讲中&#xff0c;我们将会根据卷积神经网络发展的历史&…

Lua语法基础(1)---简介、基本数据类型、表达式

我觉得我已经陷入了一个坑内。因为&#xff0c;安装了Lua和SublimeText3编辑器之后&#xff0c;怎么使自己编写的lua代码在untiy内运行起来&#xff0c;是个我完全不了解的机制。先放一放吧。首先&#xff0c;来回顾一下Lua的语法基础。 第一 起点 在Lua中具有一个Chunks的概念…

视觉中的经典图像特征小结(一): 颜色直方图, HOG, LBP

[普兒原创, 如有错误和纰漏欢迎指正. 更新中...] 1. 颜色直方图 颜色空间在本质上是定义在某种坐标系统下的子空间&#xff0c;空间中的每一个坐标表示一种不同的颜色。颜色空间的目的在于给出某种颜色标准&#xff0c;使得不同的设备和用途都能对颜色有一致的描述。这里主要介…

C++从0到1的入门级教学(七)——指针

文章目录7 指针7.1 指针的基本概念7.2 指针变量的定义和使用7.3 指针所占内存空间7.4 空指针7.5 野指针7.6 void*指针7.7 指向指针的指针7.8 const修饰指针7.9 指针和数组7.10 指针和函数7 指针 指针是指向另外一种类型的符合类型&#xff0c;和引用类似&#xff0c;指针也实现…

urllib库的使用

#使用urllib库&#xff0c;将langlang2017全站网页请求并保存 #1、引入模块 from urllib import request from urllib import error#2、操作 #&#xff08;1&#xff09;创建url base_url "http://www.langlang2017.com/route.html"try:# &#xff08;2&#xff09;…

一个显示日期的工具类

一个显示日期的工具类 .h文件 #import <Foundation/Foundation.h>interface TimeUtil : NSObject (NSString*)getTimeStr1:(long long)time;(NSString*) getTimeStrStyle1:(long long)time;(NSString*)getTimeStr1Short:(long long)time;(NSString*) getTimeStrStyle2:(l…

【leetcode】Median of Two Sorted Arrays

题目简述&#xff1a; There are two sorted arrays A and B of size m and n respectively. Find the median of the two sorted arrays. The overall run time complexity should be O(log (mn)). 解题思路&#xff1a; 这本身是个很简单的题目&#xff0c;但是题目要求他的复…