基于BF算法和KMP算法的病毒感染检测

案例引入:

实验任务:

代码实现:

注意:我以项目的形式编写此代码,编译环境为VS2022,代码移植可能会导致错误

mystring.h:存放结构体以及函数声明

#define _CRT_SECURE_NO_WARNINGS
#pragma once
#include<stdio.h>
#include<stdlib.h>
#include<assert.h>
#include<stdbool.h>
#include<string.h>#define MAXSIZE 1024 
typedef struct string
{char str[MAXSIZE];int curSize;
}string;//给定一个字符串,创建一个顺序表
string* createString(const char* str);//遍历串
void traverseString(string* pstr);//在给定串中插入,
void insertString(string* pstr, char* str, int pos);//区间删除
void deleteString(string* pstr, int start, int end);//是否为空
bool isEmpty(string* pstr);//当前个数
int lenString(string* pstr);//匹配算法
int bfString(string* mainStr, string* subStr);
void nextArray(string* pstr, int* next);
int kmpString(string* mainStr, string* subStr);//病毒检测实现
void virusDetection(void);
void getCirculation(string* pstr);

mystring.c:书写相关的代码实现

#include "mystring.h"//给定一个字符串,创建一个顺序表
string* createString(const char* str)
{//创建内存string* pstr = (string*)calloc(1, sizeof(string));assert(pstr);//初始化int count = 0;//拷贝字符串while (str[count]!= '\0'){pstr->str[count] = str[count];count++;}//最后的\0pstr->str[count] = str[count];//记录长度pstr->curSize = count;return pstr;
}//遍历串
void traverseString(string* pstr)
{for (int i = 0; i < pstr->curSize; i++){printf("%c", pstr->str[i]);}printf("\n");
}//在给定串中的指定位置插入,这里的位置是数组的下标
void insertString(string* pstr, const char* str, int pos)
{int len = strlen(str);//判断序号的有效性if (pos > MAXSIZE || pos < 0){printf("无效位置\n");return;}//判断是否溢出if (len + pstr->curSize > MAXSIZE){printf("数据溢出,无法插入\n");return;}//如果插入位置在字符串 \0的后面//那么选择直接将该字符串与原串相连接if (pos > pstr->curSize){for (int i = 0; i < len; i++){pstr->str[pstr->curSize++] = str[i];}}//一般情况:pos在串的内部else{//将pos之后的串向后挪len个位置for (int i = pstr->curSize; i >= pos; i--){//这里画图理解pstr->str[len + i] = pstr->str[i];}//插入新的元素for (int i = 0; i < len; i++){pstr->str[pos + i] = str[i];pstr->curSize++;}}
}//区间的删除,给出区间(数组下标)
void deleteString(string* pstr, int start, int end)
{if (pstr->curSize == 0){printf("空字符串\n");return;}//注:这里对于区间的合法性判断可以找反面//区间的合法性初步判断if (start > MAXSIZE || end > MAXSIZE || start < 0 || end < 0){printf("无效区间\n");return;}//区间合法性再次判断if (start > pstr->curSize){printf("无效区间\n");return;}//如果右区间超过字符串长度,那么将其赋值为字符串长度-1if (end > pstr->curSize - 1){end = pstr->curSize - 1;}//计算删除的元素个数int len = end - start + 1;//开始删除,这里是数组的伪删除for (int i = start, j = end+1; j < pstr->curSize; i++, j++){pstr->str[i] = pstr->str[j];}pstr->curSize -= len;pstr->str[pstr->curSize] = '\0';
}
//是否为空
bool isEmpty(string* pstr)
{return pstr->curSize == 0;
}//当前个数
int lenString(string* pstr)
{return pstr->curSize;
}//BF算法(Brute force暴力匹配)
int bfString(string* mainStr, string* subStr)
{//参数说明://index:记录开始比较的起始位置//i,j分别遍历主串和字串,判断是否相等int index, i, j;i = j = index = 0;//长度合法性if (mainStr->curSize < subStr->curSize){printf("长度错误\n");}while (index < mainStr->curSize){//如果第一个字符相同,那么一直向后比较if (mainStr->str[index] == subStr->str[j]){//开始比较过程i = index;while (j < subStr->curSize){if (mainStr->str[i] == subStr->str[j]){i++;j++;}//有一个字符不相等,则退出循环,将j置为0是为了开始下一次匹配else{j = 0;break;}}//如果j!=0,那么说明字串每一个字符都可以匹配,所以直接返回index即可if (j != 0){return index;}//反之说明没有匹配到,index继续向后index++;}//如果第一个字符不相同,则不会开启匹配过程else{index++;}}//如果上面没有return,那么就说明没有找到,则返回-1return -1;
}//kmp算法
//求解next数组(处理第i个不匹配时,如何开始下一次匹配的问题)
void nextArray(string* subStr, int* next)
{//i在后面走,j在前面走int i, j;i = 0, j = -1;//将第0个置为-1next[0] = -1;//求最大的公共前缀和后缀串长度while (i < subStr->curSize){if (j == -1 || subStr->str[i] == subStr->str[j]){i++;j++;next[i] = j;}else{//重置j的值j = next[j];}}
}//开始匹配(移位过程)
int kmpString(string* mainStr, string* subStr)
{//先判断长度的合法性if (mainStr->curSize < subStr->curSize){printf("长度错误\n");return -1;}//创建i,j分别遍历主串和子串int i, j;i = j = 0;//根据元素个数动态申请内存//这里为何要加1呢?多申请一个(因为上面i++之后对next进行了赋值,导致数组下标溢出)int *next=(int*)malloc(subStr->curSize*sizeof(int)+1);//获取next数组nextArray(subStr,next);//开始匹配操作while (i < mainStr->curSize && j < subStr->curSize){if (j == -1 || mainStr->str[i] == subStr->str[j]){i++;j++;}else{j = next[j];}//结束判断if (j == subStr->curSize){return i - j;}}//free(next);return -1;
}//样本数量
#define sampleSize 50
//病毒DNA最大长度
#define virusMaxSize 20
//人的DNA最大长度
#define peopleMaxSize 500//注:在结构体声明中,定义了MAXSIZE为char的最大长度,这里的病毒和人DNA不得超过MAXSIZE//将字符串第一个字符移动到最后一个
void getCirculation(string* pstr)
{//先保存第一个字符char temp = pstr->str[0];//后续的字符都整体向前移动for (int i = 1; i < pstr->curSize; i++){pstr->str[i - 1] = pstr->str[i];}//将最后一个字符改为第一个字符pstr->str[pstr->curSize - 1] = temp;
}void virusDetection(void)
{//定义两个指针数组来分别来接受病毒的DNA和人的DNA序列string* virus[sampleSize];string* people[sampleSize];//count用来记录输入的样本数量,以便于后续处理int count = 0;for (int i = 0;; i++){//读取数据char virus_temp[virusMaxSize];char people_temp[peopleMaxSize];scanf("%s %s", virus_temp, people_temp);count++;//创建结构体virus[i] = createString(virus_temp);people[i] = createString(people_temp);//清楚缓存区字符while (getchar() != '\n');//设置结束条件if (!strcmp(virus[i]->str, "0") && !strcmp(people[i]->str, "0")){break;}}//最后的0不算是样本count--;//数据读取完成后开始检测/*由于病毒的DNA是环状的,这里选择创建一个新的数组,将环状的DNA变为顺序的*///这里数组大小为病毒序列长度,因为是环状的,可以自己尝试找找规律,会得到virusMaxSize个不同的序列for (int i = 0; i < count; i++){//赋值变量int flag = -1;//virus->curSize是病毒实际的长度//此步骤是获取一个病毒DNA的所有顺序DNA序列for (int j = 0; j < virus[i]->curSize; j++){//循环一次,得到一个不同的序列getCirculation(virus[i]);//查找一次(这里也可以用bf算法)int end = kmpString(people[i], virus[i]);//如果查到了,那么说明已经感染,则进行下一个样本的比较if (end != -1){printf("YES\n");flag = 1;break;}}//判断是否 一个样本中,查找完对应的所有的病毒序列,还没有查到if (flag == -1){printf("NO\n");}}
}

最后就是测试了,创建test.c用于函数测试

#include"mystring.h"int main()
{virusDetection();return 0;
}

输入样例:

abbab abbabaab

baa cacdveabacsd

abe def

0 0

输出:

代码中的难点在于kmp算法的实现,建议阅读《大话数据结构》,再看B站的视频加深理解,一个讲的很好的视频:BV1jb411V78H

如有错误,请在评论区指正,谢谢!!

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/pingmian/13236.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

在电脑本地运行llama3-8b模型

文章目录 流程我的案例api调用llama.cpp 流程 ollama支持可运行的模型,图片这里只是一部分而已,只需要下载下面的软件和模型文件,即可直接运行,而无需配置其他 模型文件下载地址 https://ollama.com/library 支持的部分模型,实际上更多,这里只是显示部分 登陆ollama官网 htt…

cpu卡片详解(FM1208)

​ 目录 ​1. 引言 1.1 FM1208 CPU卡芯片 2. FM1208 CPU卡芯片概述 2.1 FM1208及其在智能卡中的作用 2.2 FM1208功能框图 3.FM1208的技术规格 4.FM1208工作流程 5.&#xff26;&#xff2d;1208文件结构 6.FM1208与其他智能卡技术的比较 7.FM1208安全特性 7.1 DES/…

解决kali Linux2024无法获取动态IPv4地址(DHCP)解决方案

用root用户启动终端 进入根目录&#xff0c;选择配置文件 cd到根目录下/../etc/network找到interfaces文件 编辑interfaces文件 vi interfaces&#xff0c;编辑interfaces文件 输入如下命令 打开虚拟网络编辑器 选择虚拟机选项卡&#xff0c;编辑&#xff0c;打开虚拟网络编…

C语言笔记17

指针4 1.数组与指针笔试题型 //1.一维数组 int main1() {int a[] = { 1,2,3,4 };printf("%d\n", sizeof(a)); //16 特例: sizeof(数组名) 表示数组的空间大小printf("%d\n", sizeof(a + 0)); //第一个元素地址: 4(32位系统)/8(64位系统)printf(&q…

广西壮族自治区工程系列生态环境行业技术资格评审条件

广西壮族自治区工程系列生态环境行业技术资格评审条件评审文件链接广西壮族自治区人力资源和社会保障厅网站评审工作的通知关于开展2023年度工程系列生态环境行业职称评审工作的通知 - 职称评审 - 广西壮族自治区生态环境厅网站类别基本条件业绩成果论文、著作条件工程师一、获…

织梦dedecms企业网站模板安装教程

很多新手在拿到织梦模板后不知道如何安装&#xff0c;所以&#xff0c;云部落(Yunbuluo.Net)资源网专门整理了一份图文版织梦模板通用安装教程&#xff0c;希望对大家有所帮助。 第一步&#xff1a; 将域名解析绑定好之后&#xff0c;上传下载的模板至您的WEB根目录中&#xf…

JavaScript与数据库MongoDB的梦幻联动:打造高效的数据驱动应用-【代码示例】

JavaScript与数据库MongoDB的梦幻联动&#xff1a;打造高效的数据驱动应用【代码示例】 一、基本概念与作用1. JavaScript2. MongoDB 二、JavaScript与MongoDB的联动1. 环境准备2. 连接到MongoDB3. 定义数据模型4. 数据操作插入数据查询数据更新数据删除数据 三、性能与安全考虑…

【再探】设计模式—桥接模式、组合模式及享元模式

结构型设计模式描述了对象与类之间的关系。适配器模式及装饰器模式主要用于接口适配及功能增强&#xff0c;而桥接模式模式则是为了减少类的数量&#xff0c;组合模式让部分与容器能被客户端统一对待处理&#xff0c;享元模式则是用于节约系统内存&#xff0c;提高系统性能。 …

机器学习之sklearn基础教程(第五篇:特征选择和降维)

机器学习之sklearn基础教程&#xff08;第五篇&#xff1a;特征选择和降维&#xff09; 1. 特征选择 特征选择是从原始特征集中选择对任务有用的特征的过程。选择正确的特征可以提高模型的性能、减少训练时间和复杂度&#xff0c;并帮助我们更好地理解数据。 以下是几种常见的…

52. UE5 RPG 应用自定义FGameplayEffectContext到项目

在前面一篇文章中&#xff0c;我们创建了自定义的FGameplayEffectContext结构体&#xff0c;用于存储所需的内容。在自定义的结构体内&#xff0c;我们主要是为了增加暴击和格挡两个参数&#xff0c;用于后面的UI显示给玩家&#xff0c;让玩家知道当前触发的状态。并且我们还对…

分布式与一致性协议之PBFT算法(一)

PBFT算法 概述 前面提到了拜占庭将军问题之后&#xff0c;有人可能会感到困惑:口信消息型拜占庭问题直接在实际项目中是如何落地的呢&#xff1f;事实上&#xff0c;它很难在实际项目中落地&#xff0c;因为口信消息型拜占庭问题之解是一个非常理论化的算法&#xff0c;没有与…

区块链数据集(一)Xblock

一、Transaction Datasets Ethereum On-chain Data [Dataset] 2021-10TransactionData/Code AvailableEthereum Introduction: This is the dataset of paper “XBlock-ETH: Extracting and Exploring Blockchain Data From Ethereum”. Data / Code Paper CiteDownloads: …

【Python大数据】PySpark

CSDN不支持多个资源绑定&#xff0c;另外两个数据文件下载&#xff1a; 订单数据-json.zip search-log.zip Apache Spark是用于大规模数据(large-scala data)处理的统一(unified)分析引擎 简单来说&#xff0c;Spark是一款分布式的计算框架&#xff0c;用于调度成百上千的服…

openFeign 调用后 返回 出现 application/json 错误

项目场景&#xff1a; 远程调用时返回json格式错误 项目场景&#xff1a;从分页插件式改换为原生分页的时候 通过openFeign调用时发现了问题 问题描述 不需要openFeign 调用的时候 返回的数据和格式是对 通过openFeign 调用后返回 出现 application/json 错误 &#xff1a; …

5万字带你一文看懂自动驾驶之高精度地图前世今生

在讲解高精度地图之前&#xff0c;我们先把定位这个事情弄清楚&#xff0c;想明白&#xff0c;后面的事情就会清晰很多&#xff0c;自古哲学里面讨论的人生终极问题&#xff0c;无非就三个&#xff0c;我是谁&#xff0c;我从哪里来&#xff0c;我要去哪里&#xff0c;这里的位…

构建智慧设施管理平台:数字化引领未来建筑行业发展

随着城市化进程的不断推进和建筑行业的持续发展&#xff0c;智慧设施管理平台的重要性日益凸显。在这一背景下&#xff0c;构建智慧设施管理平台成为推动建筑行业数字化转型的关键举措。本文将深入探讨智慧设施管理平台的构建与优势&#xff0c;助力建筑企业把握数字化转型的主…

头歌实践教学平台——Python程序设计之语言基础

1.1 四则运算(project) 整数四则运算 """ 试编程实现分两行输入两个非零整数&#xff0c;并在4 行中按顺序输出两个数的加、减、乘、除的计算结果。 要求输出与如下示例格式相同&#xff0c;符号前后各有一个空格。 """#输入整数变量a和b&#x…

7-139 有趣的括号

括号()的组合千奇百怪,Drizzle 想知道各种组合的括号可以是否合法 合法要求:每个同类型的左括号必须有与之对应的同类的右括号以正确的顺序闭合 要求: 输入:输入一个括号字符串 输出:输出是否合法,是则True,否则False 示例: 输入: (){}[]输出: True范围: 对于 1…

html+js光标操作

光标设置id为username的字段 window.addEventListener("load", function() {document.getElementById("username").focus(); }); 光标在username的时候点击enter回车键的时候光标移动到id为password的input里面 document.getElementById("username…

【从零开始学架构 架构基础】二 架构设计的复杂度来源:高性能复杂度来源

架构设计的复杂度来源其实就是架构设计要解决的问题&#xff0c;主要有如下几个&#xff1a;高性能、高可用、可扩展、低成本、安全、规模。复杂度的关键&#xff0c;就是新旧技术之间不是完全的替代关系&#xff0c;有交叉&#xff0c;有各自的特点&#xff0c;所以才需要具体…