论文阅读——Intrusion detection systems using longshort‑term memory (LSTM)

一.基本信息

论文名称:Intrusion detection systems using longshort‑term memory (LSTM)

中文翻译:基于长短期记忆(LSTM)的入侵检测系统

DOI:10.1186/s40537-021-00448-4

作者:FatimaEzzahra Laghrissi1* , Samira Douzi2*, Khadija Douzi1* and Badr Hssina1*

发表年份:2021年

发表期刊:《Journal Of Big Data》

中科院分区:计算机科学2区

JCR分区:Q1

影响因子:IF(5):12.4

二.论文阅读

1.研究背景

1.网络威胁日益严重,入侵检测技术越来越关键。

2.目前许多入侵检测系统基于机器学习模型,但是经典的机器学习模型无法解决实时性问题。

3.深度学习模型在入侵检测方面的应用有所增加

2.主要贡献

在KDD99数据集上,对三个模型(即LSTM,LSTM-PCA,LSTM-MI)进行二分类和多分类的测试

3.研究过程 

A.数据集的阐述:

      1.  KDD99 dataset:53个特征;4个攻击大类;
      2. 存在的问题:攻击记录的数量远远大于正常记录

B.数据预处理:

        二分类将标签分为两种类别:正常和攻击;接着 随机抽样来缓解数据集存在的问题
        多分类分成 三类 :正常攻击,拒绝服务攻击和R2L类别中的所有其他攻击

C.数据降维 

PCA方法:
        原数据的特征是53个,用PCA方法降维, 主成分1,2 或者 主成分1,2,3 即可描述重要特征(后面实验对比了2个主成分和3个主成分的效果)

----------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------

MI方法:
        1.定义: 互信息(Mutual Information )是一种用来计算两个变量之间统计依赖性的方法,这里的两个变量是“特征”与“目标值/标签”, 某个特征的互信息分数越高,说明该特征对标签结果的影响更大

        2.本实验的设置:

本实验的选择: 本实验分别用了4号特征和其余10个特

D.数据集的划分 

60%的预处理后的数据作为训练集;20%作为验证集;20%作为测试集

E.分类模型的设置

①分类模型:LSTM
②内部结构和参数设置:
        ▶整体模型及参数:

        

        ▶LSTM的结构:

4.研究结果 

性能评价指标1:准确度,召回率,精确度,F1分数

结果:

对于二分类和多分类来比较:二分类的效果好

对于三种模型来比较:LSMT-PCA效果最好

对于具体模型来说:

        LSTM-PCA:在选择两个主成分时效果更好

        LSTM-MI:选择4号特征比选择10个特征效果好

--------------------------------------------------------------------------------------------------------------------------

性能评价指标2:处理时间 

结果:

二分类比多分类快;LSTM-MI比其他模型快;添加更多的特征会增加处理时间

--------------------------------------------------------------------------------------------------------------------------

LSTM-PCA的最终评价:

        ①在 准确率和敏感度上超越其他模型。

        ②使用更少的特征 实现了 高效性能 ,适合 大规模实时环境
        ③模型具有通用性、高效性,在入侵检测系统中的潜在实用价值

5.总结

作者提出的 LSTM 模型能够有效区分正常网络流量和攻击流量。除此之外,模型结合主成分分析(PCA)和互信息作为降维方法。实验结果表明,基于 PCA 的模型(特别是使用2个主成分)在二分类和多分类任务中都表现最好,准确率分别达到 99.44% 和 99.39%。模型的准确性和敏感性优于其他比较方法,且使用少量特征(2个)使得模型训练更加高效,占用更少资源。

6.未来展望

研究LSTM的多种变体,以及其他神经网络算法和其他特征选择算法。

7.整个论文的思维导图

!!!声明!!!

这篇文章仅用于本人的学术学习,侵权即删,转载或学习请标明原论文的信息,正确引用!

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/web/60205.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

大数据挖掘期末复习

大数据挖掘 数据挖掘 数据挖掘定义 技术层面: 数据挖掘就是从大量的、不完全的、有噪声的、模糊的、随机的实际应用数据中,提取隐含在其中、人们事先不知道的、但又潜在有用的信息的过程。 数据准备环节 数据选择 质量分析 数据预处理 数据仓库 …

搭建es环境

centos7搭建elasticsearch环境 首先考虑使用 Docker 来安装 Elasticsearch、Kibana 和 Logstash。在安装过程中,可能会遇到一些问题,但通过适当的方法可以解决。 docker pull docker.elastic.co/elasticsearch/elasticsearch:8.14.3 首先创建一个网络&a…

k8s 学习笔记之 k8s 存储管理

文章目录 概述卷卷的常用类型emptyDir边车容器 HostPathnfsPV/PVC静态供给 PV 和 PVC创建静态 PV创建 pvc创建 pod 应用 pvc 动态供给 PV 和 PVC创建 StorageClass创建 pvc创建 pod 使用 pvc PV 的生命周期 内置存储对象ConfigMapSecret 配置文件自动重新加载方案**1. 应用内动…

等精度频率计的设计

目录 主控电路设计 频率测量与计算电路设计 顶层电路设计 功能扩展及应用 频率测量的三种方法 等精度频率计通过控制闸门信号与被测信号同步,消除了直接测频法中的计数误差,因而在被测信号频率范围内测量精度基本上是恒定的。 本节以设计能够测量信号…

Matlab使用深度网络设计器为迁移学习准备网络

迁移学习通过对预训练网络进行微调,使深度学习模型能在少量数据下快速适应新任务,类似于“举一反三”,而不需要从头训练。本文使用matlab自带的深度网络设计器,可以便捷地修改预训练网络进行迁移学习,通过对预训练网络…

基于yolov8、yolov5的电塔缺陷检测识别系统(含UI界面、训练好的模型、Python代码、数据集)

摘要:电塔缺陷检测在电力设备巡检、运行维护和故障预防中起着至关重要的作用,不仅能帮助相关部门实时监测电塔运行状态,还为智能化检测系统提供了可靠的数据支撑。本文介绍了一款基于YOLOv8、YOLOv5等深度学习框架的电塔缺陷检测模型&#xf…

蒙特卡洛模拟 详解

蒙特卡洛模拟详解 蒙特卡洛模拟(Monte Carlo Simulation) 是一种利用随机抽样和统计计算来模拟复杂系统或过程的方法。它尤其适用于分析不确定性、复杂数学问题以及概率分布模型。 蒙特卡洛模拟的基本原理 蒙特卡洛模拟的核心思想是通过 重复随机采样 …

代理商培训新策略:内部知识库的高效运用

在竞争激烈的市场环境中,代理商作为企业与终端消费者之间的关键纽带,其专业能力和服务质量直接影响着企业的市场表现和品牌形象。因此,如何对代理商进行高效、系统的培训,以提升其业务能力和服务水平,成为企业亟需解决…

C++手写PCD文件

前言 一般pcd读写只需要调pcl库接口,直接用pcl的结构写就好了 这里是不依赖pcl库的写入方法 主要是开头写一个header 注意字段大小,类型不要写错     结构定义 写入点需要与header中定义一致 这里用的RoboSense的结构写demo 加了个1字节对齐 stru…

Spring 框架中哪些接口可以创建对象

Spring 框架中哪些接口可以创建对象 在 Spring 框架中,向 IOC 容器中添加 Bean 主要有以下几种接口和方式。Spring 提供了不同的手段来实现对象的创建和管理,涵盖了不同的需求和场景。以下是几种常用的接口和方式: 1. BeanFactory 接口 Be…

uniapp 相关的swiper的一些注意事项

先推荐一个一个对标pc端swiper的uniapp版本 zebra-swiper 缺点是自定义分页器不是很好处理 不知道怎么弄 优点:可以进行高度自适应 &#xff08;这个uniapp原生swiper没有 只能动态修改 采用js 或者只有几种固定高度时采用变量修改&#xff09; <swiperref"lifeMiddle…

ARM中ZI-data段和RW-data段

ARM中ZI-data段和RW-data段 1、只定义全局变量&#xff0c;不使用&#xff0c;不占用内存空间2、 定义并初始化全局变量为0 占用ZI-Data区域3、定义并初始化全局变量非0 占用RW-Data区域4、增加的是一个int8的数据为什么&#xff0c;size增加不是15、定义的全局变量为0&#xf…

jmeter--CSV数据文件设置--请求体设置变量

目录 一、示例 1、准备组织列表的TXT文件&#xff0c;如下&#xff1a; 2、添加 CSV数据文件设置 &#xff0c;如下&#xff1a; 3、接口请求体设置变量&#xff0c;如下&#xff1a; 二、CSV数据文件设置 1、CSV Data Set Config 配置选项说明 2、示例 CSV 文件内容 3、…

golang实现TCP服务器与客户端的断线自动重连功能

1.服务端 2.客户端 生成服务端口程序: 生成客户端程序: 测试断线重连: 初始连接成功

ssm148基于Spring MVC框架的在线电影评价系统设计与实现+jsp(论文+源码)_kaic

毕 业 设 计&#xff08;论 文&#xff09; 题目&#xff1a;在线电影评价系统设计与实现 摘 要 现代经济快节奏发展以及不断完善升级的信息化技术&#xff0c;让传统数据信息的管理升级为软件存储&#xff0c;归纳&#xff0c;集中处理数据信息的管理方式。本在线电影评价系…

DAY1 网络编程(TCP客户端服务器)

作业&#xff1a; TCP客户端服务器。 server服务器代码&#xff1a; #include <myhead.h> #define IP "192.168.110.52" #define PORT 8886 #define BACKLOG 20 int main(int argc, const char *argv[]) {int oldfdsocket(AF_INET,SOCK_STREAM,0);//IPV4通信…

基于arduino 用ESP8266获取实时MAX30102 血氧数据动态曲线显示在网页上

基于arduino 用ESP8266获取实时MAX30102 血氧数据动态曲线显示在网页上 原理&#xff1a; ESP8266获取MAX30102 血氧数据&#xff08;R,IR,G的值&#xff09;发送到路由器局域网内&#xff0c;局域网内的手机电脑&#xff0c;访问ESP的ip地址&#xff0c;获取实时的血氧数据动…

OpenCV DNN

OpenCV DNN 和 PyTorch 都是常用的深度学习框架&#xff0c;但它们的定位、使用场景和功能有所不同。让我们来对比一下这两个工具&#xff1a; 1. 框架和功能 OpenCV DNN&#xff1a;OpenCV DNN 模块主要用于加载和运行已经训练好的深度学习模型&#xff0c;支持多种深度学习…

vue3:scss引用

原文查看&#xff1a;https://mp.weixin.qq.com/s?__bizMzg3NTAzMzAxNA&mid2247484356&idx2&sn44b127cd394e217b9e3c4eccafdc0aa9&chksmcec6fb1df9b1720b7bd0ca0b321bf8a995fc8cba233deb703512560cbe451cfb1f05cdf129f6&token1776233257&langzh_CN#rd…

在使用 TypeORM 的项目中,如果不希望查询返回 password 字段,可以通过以下几种方式实现

在使用 TypeORM 的项目中&#xff0c;如果不希望查询返回 password 字段&#xff0c;可以通过以下几种方式实现&#xff1a; 1. 使用 Exclude 装饰器&#xff08;推荐&#xff09; 通过 class-transformer 的 Exclude 装饰器隐藏字段&#xff0c;使得返回的对象在序列化时不会…