【数据结构】串的定义;存储结构;基本操作的实现

 欢迎光~临~^_^

目录

知识树 

1、串的定义

2、串的存储结构

2.1顺序存储

静态存储

动态存储

2.2链式存储 

2.3串的堆分配存储表示

3、串的基本操作

3.1求子串

3.2比较操作

3.3定位操作 

4、C语言实现串的基本操作 


知识树 

 

 

1、串的定义

        串是由零个或多个字符组成的有限序列。在计算机科学中,常用串来表示文本、代码或数据。串是程序设计中重要的基本数据类型之一,常用于字符串匹配、文本处理和密码学等领域。

        子串是指在一个字符串中取出一段连续的字符所得到的字符串。例如,在字符串 "hello world" 中,"hello"、"world"、"lo"、"l"、"rld" 都是它的子串。

        空串指的是没有任何字符的字符串,表示为 ""(两个引号之间没有任何字符)。而空格串指的是只包含空格字符的字符串,例如 " "。虽然两者在形式上都是字符串,但含义不同。

2、串的存储结构

2.1顺序存储

静态存储

        串的静态存储指的是在程序运行时在固定的内存地址上分配空间来存储串。在静态存储中,串的长度是固定的,不能动态地改变。通常,在编写程序时,我们可以使用字符数组来存储字符串,这样可以方便地对字符串进行操作和访问。

例如,在C语言中,可以通过以下方式来定义一个静态的字符串:

char str[] = "hello world";

        这里,str是一个字符数组,被初始化为字符串"hello world"。在编译时,系统会为str分配一个固定的内存空间,用来存储这个字符串。在程序运行时,我们可以通过str来访问和修改这个字符串。需要注意的是,这个字符串的长度是固定的,即为11(包括字符串末尾的'\0'字符)。如果我们需要动态地改变字符串的长度,就需要使用动态存储方式,如堆内存或栈内存。

动态存储

        串的动态存储一般采用字符数组或链表进行实现。

1.字符数组

字符数组是串的静态存储方式,但可以通过动态分配内存来实现动态存储。具体实现方法为:

(1)定义一个字符指针变量,用于指向动态分配的字符数组。

(2)根据实际需要确定串的最大长度,调用C语言中的动态内存分配函数malloc()申请空间。

(3)将申请到的空间赋值给字符指针变量。

(4)通过scanf()gets()等函数向分配的空间中读入字符。

(5)使用完后,需要释放已分配的内存空间,以便于其他程序使用。

示例代码:

#include <stdio.h>
#include <stdlib.h>int main()
{char* str;int len;printf("Input the length of the string:");scanf("%d", &len);str = (char*)malloc(len * sizeof(char));if (!str){printf("Memory allocation failed!\n");return 0;}printf("Input the string:");scanf("%s", str);printf("The string you input is:%s\n", str);free(str);return 0;
}

2.链表 

链表是动态存储的一种常见方式,可以在运行时动态增加或删除节点。对于串的存储,链表的每个节点都可以存储一个字符。链表的实现方法如下:

(1)定义一个节点结构体,包含一个字符变量和一个指向下一个节点的指针变量。

(2)定义一个头指针变量,用于指向链表的第一个节点。

(3)通过调用C语言的动态内存分配函数malloc()申请一个节点,并将节点的指针挂在链表的末尾。

(4)向新申请的节点中存入要存储的字符。

(5)通过指针操作,可以在链表中进行插入、删除、修改等操作。

(6)使用完链表后,需要释放每个节点占用的内存空间。

示例代码:

#include <stdio.h>
#include <stdlib.h>typedef struct node {char data;struct node* next;
}Node;int main()
{Node* head = NULL;Node* tail = NULL;char c;printf("Input the string:");while ((c = getchar()) != '\n'){Node* p = (Node*)malloc(sizeof(Node));p->data = c;p->next = NULL;if (head == NULL){head = p;tail = p;}else{tail->next = p;tail = tail->next;}}printf("The string you input is:");Node* p = head;while (p){printf("%c", p->data);p = p->next;}p = head;while (p){Node* t = p;p = p->next;free(t);}return 0;
}

2.2链式存储 

        链式存储方式是通过链表来存储串的每个字符。每个结点存储一个或多个字符,同时包括一个指向下一个结点的指针。链式存储的结构体如下所示:

typedef struct StringNode {char data[MAXSIZE]; // 存储字符数组int length; // 存储当前结点存储的字符个数struct StringNode *next; // 指向下一个结点的指针
} StringNode, *String;

        其中 MAXSIZE 是存储字符数组的最大长度,length 表示当前结点存储的字符个数。一个完整的链表存储了整个串,其中头结点不存储数据,只作为链表的链头,串的实际数据从第二个结点开始存储。

        需要注意的是,链式存储的串的空间是动态分配的,因此可以根据具体的需求动态调整存储空间。但是,链式存储的串在访问任意一个字符时需要遍历整个链表,因此在时间复杂度上可能会存在一定的问题。

2.3串的堆分配存储表示

可以使用动态内存分配来实现堆分配存储表示。具体实现方法如下:

  1. 使用malloc函数分配一块连续的内存空间,该空间位于堆区;
  2. 将需要存储的串拷贝到该内存空间中;
  3. 返回指向该内存空间的指针,作为串的堆分配存储表示。

例如,以下代码演示了如何使用动态内存分配来实现堆分配存储表示的字符串拷贝操作:

#include <stdio.h>  
#include <stdlib.h>  
#include <string.h> char* copy_string(char* str) {  int len = strlen(str);  char* new_str = (char*)malloc(len + 1); // 分配内存空间  strcpy(new_str, str); // 拷贝字符串到新的内存空间中  return new_str; // 返回指针  
}  int main() {  char* str = "Hello, world!";  char* new_str = copy_string(str); // 使用动态内存分配实现堆分配存储表示  printf("%s\n", new_str);  free(new_str); // 释放内存空间  return 0;  
}  

        在该代码中,copy_string函数使用malloc函数分配了一块内存空间,将传入的字符串拷贝到该空间中,并返回指向该空间的指针。在main函数中,调用copy_string函数将字符串"Hello, world!"拷贝到堆中,并输出该字符串。最后,使用free函数释放动态分配的内存空间,避免内存泄漏。

 

3、串的基本操作

3.1求子串

下面是C语言实现求串的子串的代码,其中包括了两种常见的方法:

方法一:暴力枚举

#include <stdio.h>
#include <string.h>int substr(char* str, char* sub) {int i, j, k;int len1 = strlen(str);int len2 = strlen(sub);for (i = 0; i <= len1 - len2; i++) {k = i;for (j = 0; j < len2; j++) {if (str[k] == sub[j]) {k++;} else {break;}}if (j == len2) {return i;}}return -1;
}int main() {char str[] = "hello world";char sub[] = "world";int index = substr(str, sub);if (index < 0) {printf("不存在子串");} else {printf("子串在主串中的位置是:%d", index);}return 0;
}

方法二:KMP算法(重重重难难难点)

#include <stdio.h>
#include <string.h>void getNext(char* t, int* next) {int i = 0, j = -1;int len = strlen(t);next[0] = -1;while (i < len - 1) {if (j == -1 || t[i] == t[j]) {i++;j++;next[i] = j;} else {j = next[j];}}
}int kmp(char* s, char* t, int* next) {int i = 0, j = 0;int len1 = strlen(s);int len2 = strlen(t);while (i < len1 && j < len2) {if (j == -1 || s[i] == t[j]) {i++;j++;} else {j = next[j];}}if (j == len2) {return i - j;} else {return -1;}
}int main() {char str[] = "hello world";char sub[] = "world";int next[strlen(sub)];getNext(sub, next);int index = kmp(str, sub, next);if (index < 0) {printf("不存在子串");} else {printf("子串在主串中的位置是:%d", index);}return 0;
}

        两种方法的时间复杂度都是O(nm),其中n为主串的长度,m为子串的长度。但是在不同的情况下,它们的效率会有所不同,暴力枚举适用于简单的匹配问题,而KMP算法适用于较复杂的匹配问题。

3.2比较操作

#include <stdio.h>
#include <string.h>int main()
{char str1[50], str2[50];int result;printf("Enter string 1: ");scanf("%s", str1);printf("Enter string 2: ");scanf("%s", str2);result = strcmp(str1, str2);if(result < 0){printf("String 1 is less than string 2\n");}else if(result > 0){printf("String 1 is greater than string 2\n");}else{printf("Both strings are equal\n");}return 0;
}

        在上面的程序中,我们首先定义了两个字符串变量 str1 和 str2,然后使用 scanf 函数分别从用户输入中读取这两个字符串。接下来,我们使用 strcmp 函数对两个字符串进行比较,并将比较结果赋值给 result 变量。最后,我们使用 if-else 语句来判断 result 的值,根据比较结果输出相应的信息。

  strcmp 函数用于比较两个字符串的大小,当第一个字符串小于第二个字符串时返回一个负值,当第一个字符串大于第二个字符串时返回一个正值,当两个字符串相等时返回 0。因此,在上面的程序中,我们使用 if-else 语句对三种情况进行了判断。

3.3定位操作 

在字符串操作中,最基本的操作是定位一个子串,即在一个给定的串中找到一个子串的位置。

常见的定位子串的操作包括:

  1. 暴力匹配算法:从主串的第一个字符开始与子串逐个字符比较。如果出现不匹配的字符,则从下一个字符开始重新比较。时间复杂度为$O(mn)$,其中m是子串的长度,n是主串的长度。

  2. KMP算法:KMP算法是一种改进的暴力匹配算法,在匹配过程中根据已匹配的字符数目和子串本身的结构,跳过一些无需匹配的字符,从而提高匹配效率。时间复杂度为$O(m+n)$,其中m是子串的长度,n是主串的长度。

  3. Boyer-Moore算法:BM算法是一种基于字符比较跳跃的算法,可以在最坏情况下只需要比较n/m次,从而提高匹配效率。时间复杂度为$O(m+n)$,其中m是子串的长度,n是主串的长度。

  4. Rabin-Karp算法:RK算法利用哈希值来比较子串和主串,从而提高匹配效率。时间复杂度为$O(mn)$,但在实际应用中,通常能够达到较高的效率。

以上算法中,KMP算法和Boyer-Moore算法是比较常用的定位子串的算法。

4、C语言实现串的基本操作 

        在下面的程序中,我们用 get_length 函数求字符串长度,用 assign_string 函数进行字符串赋值,用 compare_string 函数比较两个字符串大小,用 concat_string 函数进行串连接,用 sub_string 函数求子串,用 replace_string 函数替换字符串中的某一部分,以及用 find_string 函数进行定位操作。

#include <stdio.h>
#include <stdlib.h>
#include <string.h>#define MAX_LEN 100// 求字符串长度
int get_length(char* str){int count = 0;while(str[count] != '\0'){count++;}return count;
}// 字符串赋值
void assign_string(char* str1, char* str2){int len = get_length(str2);for(int i = 0; i < len; i++){str1[i] = str2[i];}str1[len] = '\0';
}// 比较两个字符串大小
int compare_string(char* str1, char* str2){int len1 = get_length(str1);int len2 = get_length(str2);int len = len1 < len2 ? len1 : len2;for(int i = 0; i < len; i++){if(str1[i] != str2[i]){return str1[i] - str2[i];}}return len1 - len2;
}// 串连接
void concat_string(char* str1, char* str2){int len1 = get_length(str1);int len2 = get_length(str2);for(int i = 0; i < len2; i++){str1[len1+i] = str2[i];}str1[len1+len2] = '\0';
}// 求子串
void sub_string(char* str1, char* substr, int start, int len){int len1 = get_length(str1);if(start < 0 || start > len1 || len <= 0){substr[0] = '\0'; // 空串return;}if(start + len > len1){len = len1 - start;}for(int i = 0; i < len; i++){substr[i] = str1[start+i];}substr[len] = '\0';
}// 替换
void replace_string(char* str1, char* old_str, char* new_str){int len1 = get_length(str1);int len_old = get_length(old_str);int len_new = get_length(new_str);int i, j, k;for(i = 0; i < len1; i++){if(str1[i] == old_str[0]){for(j = 1; j < len_old; j++){if(str1[i+j] != old_str[j]){break;}}if(j == len_old){break;}}}if(i < len1){if(len_old == len_new){for(k = 0; k < len_new; k++){str1[i+k] = new_str[k];}}else if(len_old < len_new){int delta = len_new - len_old;for(k = len1-1; k >= i+len_old; k--){str1[k+delta] = str1[k];}for(k = 0; k < len_new; k++){str1[i+k] = new_str[k];}str1[len1+delta] = '\0';}else{int delta = len_old - len_new;for(k = i+len_old; k <= len1; k++){str1[k-delta] = str1[k];}for(k = 0; k < len_new; k++){str1[i+k] = new_str[k];}}}
}// 定位算法
int find_string(char* str1, char* str2){int len1 = get_length(str1);int len2 = get_length(str2);int i, j;for(i = 0; i <= len1-len2; i++){for(j = 0; j < len2; j++){if(str1[i+j] != str2[j]){break;}}if(j == len2){return i; // 返回第一次出现的位置}}return -1; // 没有找到
}int main(){char str1[MAX_LEN], str2[MAX_LEN], substr[MAX_LEN], old_str[MAX_LEN], new_str[MAX_LEN];int start, len, pos;printf("Enter string 1: ");scanf("%s", str1);printf("Enter string 2: ");scanf("%s", str2);printf("String 1 length is %d\n", get_length(str1));assign_string(str1, str2);printf("String 1 after assign string 2: %s\n", str1);printf("Compare string 1 and string 2: %d\n", compare_string(str1, str2));concat_string(str1, str2);printf("String 1 after concat string 2: %s\n", str1);printf("Enter start index and length for substring: ");scanf("%d%d", &start, &len);sub_string(str1, substr, start, len);printf("Substring: %s\n", substr);printf("Enter string to be replaced: ");scanf("%s", old_str);printf("Enter replacement string: ");scanf("%s", new_str);replace_string(str1, old_str, new_str);printf("String 1 after replace operation: %s\n", str1);printf("Enter string to be searched: ");scanf("%s", str2);pos = find_string(str1, str2);if(pos == -1){printf("Entered string not found in string 1.\n");}else{printf("Entered string found at position %d in string 1.\n", pos);}return 0;
}

 🤞❤️🤞❤️🤞❤️串基本的知识点总结就到这里啦,如果对博文还满意的话,劳烦各位看官动动“发财的小手”留下您对博文的赞和对博主的关注吧🤞❤️🤞❤️🤞❤️

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/news/78908.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

记录一次IDEA非法字符‘\ufeff‘报错

✅作者简介&#xff1a;大家好&#xff0c;我是Leo&#xff0c;热爱Java后端开发者&#xff0c;一个想要与大家共同进步的男人&#x1f609;&#x1f609; &#x1f34e;个人主页&#xff1a;Leo的博客 &#x1f49e;当前专栏&#xff1a; 报错以及Bug ✨特色专栏&#xff1a; …

JavaScript与jQuery(下篇)

JavaScript与jQuery笔记&#xff08;下篇&#xff09; 一、获取jquery二、jquery选择器三、jquery事件四、jquery操作Dom元素————————创作不易&#xff0c;如觉不错&#xff0c;随手点赞&#xff0c;关注&#xff0c;收藏(*&#xffe3;︶&#xffe3;)&#xff0c;谢…

Golang Gorm 创建HOOK

创建的时候&#xff0c;在插入数据之前&#xff0c;想要做一些事情。钩子函数比较简单&#xff0c;就是实现before create的一个方法。 package mainimport ("gorm.io/driver/mysql""gorm.io/gorm" )type Student struct {ID int64Name string gorm:&q…

UDP通信

UDP通信 1、UDP2、UDP通信流程 1、UDP /* udp传输层协议&#xff0c;和tcp是一样的 特点:面向无连接的&#xff0c;不安全的&#xff0c;报式传输协议1&#xff0e;无连接:ldp通信的时候不需要connect1) 通信不需要建立连接2) 如果想给对方发送数据&#xff0c;只需要指定对方…

CRC(循环冗余校验码的校验方法)

5个关键点&#xff1a; 1.信息码&#xff1a;即给出要校验的二进制码 2.生成多项式&#xff1a;一般多项式会给&#xff0c;从最高位的指数位数就可以得到有几个校验码&#xff1b;如果没给多项式&#xff0c;肯定会给个多项式二进制码&#xff0c;根据它来推就行&#xff08;…

华为GaussDB数据库

Gauss数据库初识_高斯数据库_ygpGoogle的博客-CSDN博客 Redhat 7.6安装GaussDB_100_1.0.1详细攻略_gaussdb_100_1.0.1-database-redhat-64bit.tar.gz dow_博德1999的博客-CSDN博客 https://www.ngui.cc/el/3381579.html?actiononClick 初识GaussDB——GaussDB的发展历程、部…

Java基础(二十四):MySQL

文章目录 一、数据库&#xff08;创建、显示、删除、备份、恢复&#xff09;二、MySQL常用数据类型2.1 数值型&#xff08;整数&#xff09;2.2 数值型&#xff08;二进制bit&#xff09;2.3 数值型&#xff08;小数&#xff09;2.4 字符型2.5 日期类型 三、表结构的操作四、表…

软件设计师-UML基础教程

场景 针对UML1.5各种模型图的构成和功能进行说明。 UML概述 UML简介 UML (Unified Modeling Language)为面向对象软件设计提供统一的、标准的、可视化的建模语言。 适用于描述以用例为驱动&#xff0c;以体系结构为中心的软件设计的全过程。 UML的定义包括UML语义和UML表…

【CVPR2021】MVDNet论文阅读分析与总结

Challenge&#xff1a; 现有的目标检测器主要融合激光雷达和相机&#xff0c;通常提供丰富和冗余的视觉信息 利用最先进的成像雷达&#xff0c;其分辨率比RadarNet和LiRaNet中使用的分辨率要细得多&#xff0c;提出了一种有效的深度后期融合方法来结合雷达和激光雷达信号。 MV…

输电线路故障诊断(Python代码,逻辑回归、决策树、随机森林、XGBoost和支持向量机五种不同方法诊断)

效果视频&#xff1a;输电线路故障诊断&#xff08;Python代码&#xff0c;逻辑回归、决策树、随机森林、XGBoost和支持向量机五种不同方法诊断&#xff09;_哔哩哔哩_bilibili 1.数据 仿真平台 仿真模型分别获取单相接地故障、两相接地故障、两相间短路故障、三相接地故障、…

2023年浦东新区数字化安全风险智慧管控技能比武初赛-技能题一

目录 二、技能题 2.1 MD5===MD5 三、业*&&&务**&&联&&&*&&系 二、技能题 2.1 MD5===MD5

线性代数的本质(九)——二次型与合同

文章目录 二次型与合同二次型与标准型二次型的分类度量矩阵与合同 二次型与合同 二次型与标准型 Grant&#xff1a;二次型研究的是二次曲面在不同基下的坐标变换 由解析几何的知识&#xff0c;我们了解到二次函数的一次项和常数项只是对函数图像进行平移&#xff0c;并不会改变…

day40 设计模式、jdk8新特性

一、代理模式 为其他对象提供一种代理控制此对象的访问 若一个对象不适合直接引用另一个对象&#xff0c; 代理对象在客户端和目标对象之间起到中介作用 组成&#xff1a; 抽象角色&#xff1a;通过接口 抽象类 真实角色实现了哪些方法 代理角色&#xff1a;实现抽象角色…

k8s集群中部署服务之部署描述文件准备

微服务部署描述文件Deploy.yaml 一、各微服务创建部署描述文件 1.1 mall-auth-server --- apiVersion: apps/v1 kind: Deployment metadata:name: mall-auth-servernamespace: sangomalllabels:app: mall-auth-server spec:replicas: 1selector:matchLabels:app: mall-auth-s…

Python用若干列的数据多条件筛选、去除Excel数据并批量绘制直方图

本文介绍基于Python&#xff0c;读取Excel数据&#xff0c;以一列数据的值为标准&#xff0c;对这一列数据处于指定范围的所有行&#xff0c;再用其他几列数据数值&#xff0c;加以筛选与剔除&#xff1b;同时&#xff0c;对筛选与剔除前、后的数据分别绘制若干直方图&#xff…

设置伙伴(buddy)-给窗口控件增加快捷键

在官方教程或者很多qt程序中经常看到能使用全键盘操作软件&#xff0c;那么QT creator也支持了这一特性&#xff0c;就是使用设置伙伴来实现的。 我们可以在设计界面按照如下几步实现&#xff1a; 先放置label 再放置一个lineEdit控件。 这个时候我们就可以开始伙伴绑定的步骤…

JVM 虚拟机 ----> Java 类加载机制

文章目录 JVM 虚拟机 ----> Java 类加载机制一、概述二、类的生命周期1、类加载过程&#xff08;Loading&#xff09;&#xff08;1&#xff09;加载&#xff08;2&#xff09;验证&#xff08;3&#xff09;准备&#xff08;4&#xff09;解析&#xff08;5&#xff09;初始…

Spring Boot - Junit4 / Junit5 / Spring Boot / IDEA 关系梳理

文章目录 PreJunit4 / Junit5 / Spring Boot / IDEAIDEA版本Spring-Boot-Older-Release-NotesSpringBootTest 起源 & Spring-Boot-1.4-Release-Notes2.0.0.RELEASE ----- 2.0.9.RELEASE2.1.0.RELEASE ----- 2.1.18.RELEASE2.2.0.RELEASE ~ 2.2.13.RELEASE2.3.0.RELEASE ~ 2…

Docker概念通讲

目录 什么是Docker&#xff1f; Docker的应用场景有哪些&#xff1f; Docker的优点有哪些&#xff1f; Docker与虚拟机的区别是什么&#xff1f; Docker的三大核心是什么&#xff1f; 如何快速安装Docker&#xff1f; 如何修改Docker的存储位置&#xff1f; Docker镜像常…

ARM Linux DIY(十一)板子名称、开机 logo、LCD 控制台、console 免登录、命令提示符、文件系统大小

文章目录 前言板子名称uboot Modelkernel 欢迎词、主机名 开机 logoLCD 控制台console 免登录命令提示符文件系统大小 前言 经过前面十篇文章的介绍&#xff0c;硬件部分调试基本完毕&#xff0c;接下来的文章开始介绍软件的个性化开发。 板子名称 uboot Model 既然是自己的…