顶会新宠!KAN-LSTM完美融合新方案

2024深度学习发论文&模型涨点之——KAN+LSTM

KAN-LSTM混合预测模型是一种结合了自注意力机制(KAN, Key-attention network)和长短时记忆网络(LSTM)的深度学习模型,主要用于序列数据的预测任务,如时间序列分析、自然语言处理等。

KAN-LSTM混合模型的优势在于,KAN提供了全局视角,而LSTM则专注于捕捉局部序列中的有用信息,两者的结合能够提升模型对序列数据的理解和预测能力。通过将KAN的输出作为LSTM的输入,模型能够更有效地整合全局上下文信息和局部细节,从而提高预测的准确性和可靠性。

因为KAN是新提出的模型,这个方向现在也不是很卷,是个很好的发文方向。

我整理了一些KAN+LSTM【论文+代码】合集,需要的同学公人人人号【AI创新工场】自取。

论文精选

论文1:

Core Temperature Estimation of Lithium-Ion Batteries Using Long Short-Term Memory (LSTM) Network and Kolmogorov-Arnold Network (KAN)

利用长短期记忆(LSTM)网络和Kolmogorov-Arnold网络(KAN)估算锂离子电池的核心温度

方法

  • LSTM网络:提出了使用基本操作参数(如电压、电流和环境温度)来估算锂离子电池的表面和核心温度的LSTM网络架构。

  • KAN网络:介绍了一种基于数据驱动的深度学习方法KAN,用于估算锂离子电池的核心和表面温度,而不依赖于表面温度作为神经网络的反馈。

图片

创新点

  • KAN网络的引入:通过KAN网络,能够在不需要物理表面温度传感器的情况下,准确预测电池的内部和表面温度,降低了电池管理系统(BMS)的成本和线路复杂性。

  • 性能提升:实验验证显示KAN在估算核心温度时误差为0.5°C,计算成本为2.9ms至3.2ms,相较于传统方法在计算效率和准确性上都有显著提升。

  • 适应性和准确性:KAN模型不仅能够适应操作条件的变化,保持电池整个生命周期内的准确性,而且计算成本保持在可接受的范围内,适合于车载BMS和基于云的数字孪生BMS使用。

图片

论文2:

Deep state space recurrent neural networks for time series forecasting

深度状态空间递归神经网络用于时间序列预测

方法

  • 状态空间模型与RNN结合:提出了将计量经济学状态空间模型的原理与递归神经网络(RNN)的动态能力相结合的新型神经网络框架。

  • LSTM、GRU和TKAN:提出了使用长短期记忆(LSTM)、门控残差单元(GRU)和时间Kolmogorov-Arnold网络(TKAN)的状态空间模型。

图片

创新点

  • TKAN网络的提出:TKAN网络在Kolmogorov-Arnold网络(KAN)和LSTM的启发下展现出有希望的结果,特别是在时间序列预测方面。

  • 状态切换模型:通过引入隐藏的状态切换机制,模型能够根据某些可观察的协变量随时间变化的转换概率,增强了对市场不同状态(如牛市或熊市)的适应性和预测能力。

  • 性能提升:TKAN在模拟实验中展现出比LSTM和GRU更优越的性能,特别是在处理复杂非线性关系时,尽管计算复杂度和时间较高,但其预测能力和灵活性的提高是显著的

图片

论文3:

Model Comparisons: XNet Outperforms KAN

模型比较:XNet优于KAN

方法

  • XNet算法:探索了一种新型算法XNet,该算法采用复值柯西积分公式,提供了超越传统多层感知器(MLPs)和Kolmogorov-Arnold网络(KANs)的优越网络架构。

  • 柯西激活函数:XNet利用柯西核作为基函数,与KAN使用的B样条基函数形成对比。

图片

创新点

  • 函数逼近能力提升:XNet在处理Heaviside步函数和复杂高维场景时展现出比KAN更优越的性能,尤其在局部数据段的逼近上,XNet的均方误差(MSE)比KAN小1000倍。

  • 物理信息神经网络(PINN)中的优越性:在Poisson方程的基准测试中,XNet在物理信息神经网络(PINN)框架内的效率和准确性显著超过MLP和KAN。

  • 时间序列预测的创新:通过在LSTM架构中用XNet替换传统的前馈神经网络(FNN),引入了XLSTM模型,在时间序列预测实验中,XLSTM在准确性和可靠性方面一致超越了传统的LSTM模型。

图片

论文4:

TKAN: Temporal Kolmogorov-Arnold Networks

TKAN:时序Kolmogorov-Arnold网络

方法

  • 时序Kolmogorov-Arnold网络(TKAN):提出了一种新的神经网络架构,结合了Kolmogorov-Arnold网络(KAN)和长短期记忆网络(LSTM)。

  • 循环Kolmogorov-Arnold网络(RKAN)层:在TKAN中嵌入了记忆管理,以保持短期记忆。

  • 门控机制:通过门控机制管理信息流,决定哪些信息应该被保留或遗忘。

  • B-Spline曲线:使用B-Spline曲线作为1D函数的参数化表示,以学习KAN层中的激活函数。

图片

创新点

  • 结合KAN和LSTM:TKAN结合了KAN和LSTM的优点,提升了多步时间序列预测的准确性和效率,特别是在处理复杂序列模式方面。

  • RKAN层:通过在每个层中嵌入记忆管理,RKAN层能够存储与时间上下文相关的信息,并在处理过程中被网络访问,使网络能够显式学习和利用过去的信息。

  • 性能提升:在多步预测任务中,TKAN相比于传统的LSTM和GRU模型表现出更好的性能,例如在15步预测中,TKAN的R-squared值比GRU高出至少25%,显示出在长期预测中的优势。

  • 模型稳定性:TKAN在多次实验中显示出更好的稳定性,与GRU和LSTM相比,TKAN的性能变化较小,表明其在不同实验间的权重校准更为稳定。

图片

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/news/889138.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

CondaError: Run ‘conda init‘ before ‘conda activate‘

rootautodl-container-543e4aa3a7-e596c47a:~# conda activate python37 CondaError: Run ‘conda init’ before ‘conda activate’ conda 激活虚拟环境的时候报错,提示需要进行初始化,但是初始化之后仍然不生效。 1、初始化 conda init2、重新加载环…

Java_实例变量和局部变量及this关键字详解

最近得看看Java,想学一学Flink实时的东西了,当然Scala语法也有这样的规定,简单看一下这两个吧,都比较容易忽视 实例变量和局部变量 实例变量和局部变量是常见的两种变量类型,区别 作用域: 实例变量:实例变…

代理模式的理解和实践

代理模式(Proxy Pattern)是一种结构型设计模式,它允许你为其他对象提供一种代理以控制对这个对象的访问。代理对象在客户端和目标对象之间起到中介的作用,客户端通过代理对象间接地访问目标对象。通过这种方式,代理模式…

Autoformer: 一种基于自动相关机制的时序预测新架构

论文题目: Autoformer:Decomposition Transformers with Auto-Correlation for Long-Term Series Forecasting 论文地址:https://openreview.net/pdf?idI55UqU-M11y 今天给大家介绍一篇时序预测领域的重要算法——Autoformer,由李华等人于2020年提出&am…

2024-12月js逆向案例-sensor-data之vmp字段之akamai_2/3.0-(下)

目录 一、初始插桩二、长串的由来三、短串的由来2024-12月akamai_2.0-sensor-data之cookie反爬分析详细教程(上)2024-12月akamai_2.0-sensor-data之cookie反爬分析详细教程(中)一、初始插桩 1、其实就是研究dFT的由来,解混淆得到如下**var dFT = ‘’‘concat’‘concat’…

GAMES101:现代计算机图形学-笔记-10

今天来聊一些基本的概念:相机,棱镜与光场。 众所周知,成像的方法有两种:合成与捕获。 像我们之前所学的内容如光栅化,如光线追踪,本质上都是合成图像的方法,他们只是在计算机中模拟来成像。 那…

深信服ATRUST与锐捷交换机端口链路聚合的配置

深信服ATRUST业务口原来只配置使用一个电口,近期出现流量达到800-900M接近端口的极限带宽。由于设备没有万光口,于是只好用2个光口来配置链接聚合。 下需附上深信服ATRST端口配置的截图,由于深信服ATRUST与锐捷交换机端口只共同支持源mac目的…

华为HarmonyOS NEXT 原生应用开发:页面路由、页面和组件生命周期函数

页面路由、组件生命周期 一、路由的基本使用 1. 如何新建页面 直接右键新建Page。【这个是最直接最常用的】新建普通ets文件,然后通过配置变成页面。 【该方法是遇到这种情况的解决方案】 2. 路由 - 页面之间的跳转 使用 **router.pushUrl({}&#xff…

Vulhub:Log4j[漏洞复现]

CVE-2017-5645(Log4j反序列化) 启动靶场环境 docker-compose up -d 靶机IPV4地址 ifconfig | grep eth0 -A 5 ┌──(root㉿kali)-[/home/kali/Desktop/temp] └─# ifconfig | grep eth0 -A 5 eth0: flags4163<UP,BROADCAST,RUNNING,MULTICAST> mtu 1500 in…

电子商务人工智能指南 4/6 - 内容理解

介绍 81% 的零售业高管表示&#xff0c; AI 至少在其组织中发挥了中等至完全的作用。然而&#xff0c;78% 的受访零售业高管表示&#xff0c;很难跟上不断发展的 AI 格局。 近年来&#xff0c;电子商务团队加快了适应新客户偏好和创造卓越数字购物体验的需求。采用 AI 不再是一…

`yarn list --pattern element-ui` 是一个 Yarn 命令,用于列出项目中符合指定模式(`element-ui`)的依赖包信息

文章目录 命令解析&#xff1a;功能说明&#xff1a;示例输出&#xff1a;使用场景&#xff1a; yarn list --pattern element-ui 是一个 Yarn 命令&#xff0c;用于列出项目中符合指定模式&#xff08; element-ui&#xff09;的依赖包信息。 命令解析&#xff1a; yarn list…

播放器秒开优化

开篇 先说结论&#xff1a; 字节跳动就曾给出过一份数据&#xff1a;对一部分型号的 Android 手机&#xff0c;播放首帧时长从平均 170ms 优化到 100ms&#xff0c;带来了 0.6% 左右的用户播放时长提升。 衡量指标&#xff1a; 播放秒开率&#xff0c;指的是播放器开始初始…

docker nginx 部署vue 实例

1.安装docker https://blog.csdn.net/apgk1/article/details/144354588 2. 安装nginx docker 安装 nginx-CSDN博客 3. 复制 nginx-test 实例的一些文件到宿主机中&#xff0c;目前已 /home/jznh/路径演示 3.1 在/home/jznh/ 创建 conf html logs 三个文件夹&#xff0c;…

技术人员需要成为的八边形战士

那天偶然看到一个标题&#xff1a;脾气好&#xff0c;技术佳&#xff0c;哪个程序员这么宝藏&#xff1f;我没有点进去看内容&#xff0c;但是心里在琢磨一件事&#xff1a;10年前这种宝藏程序员很难得&#xff0c;现在的市场&#xff0c;恐怕不够。恐怕市场在找的都是下面技能…

VLDB 2024 | 时空数据(Spatial-temporal)论文总结

VLDB 2024于2024年8月26号-8月30号在中国广州举行。 本文总结了VLDB 2024有关时空数据&#xff08;time series data&#xff09;的相关论文&#xff0c;主要包含如有疏漏&#xff0c;欢迎大家补充。 &#x1f31f;【紧跟前沿】“时空探索之旅”与你一起探索时空奥秘&#xf…

【推荐算法】单目标精排模型——FiBiNET

key word: 学术论文 Motivation&#xff1a; 传统的Embedding&MLP算法是通过内积和Hadamard product实现特征交互的&#xff0c;这篇文章的作者提出了采用SENET实现动态学习特征的重要性&#xff1b;作者认为简单的内积和Hadamard product无法有效对稀疏特征进行特征交互&a…

Windows中将springboot项目运行到docker的容器中

0&#xff0c;先打包好项目&#xff0c;再启动docker 1&#xff0c;在Java项目根目录下创建一个名为Dockerfile的文件&#xff08;没有扩展名&#xff09;&#xff0c;并添加以下内容。 # 使用OpenJDK的基础镜像 FROM openjdk:8-jdk-alpine# 设置工作目录 WORKDIR /app# 将项…

GB28181系列一:GB28181协议介绍

我的音视频/流媒体开源项目(github) GB28181系列目录 目录 一、GB28181协议介绍 二、GB28181交互流程 1、注册 2、观看视频 3、控制 4、SDP 5、媒体保活&#xff1a; 6、RTP 7、SIP URL 一、GB28181协议介绍 GB28181使用SIP协议&#xff0c;SIP协议参考我的SIP系列&a…

【C++指南】类和对象(七):友元

&#x1f493; 博客主页&#xff1a;倔强的石头的CSDN主页 &#x1f4dd;Gitee主页&#xff1a;倔强的石头的gitee主页 ⏩ 文章专栏&#xff1a;《C指南》 期待您的关注 目录 引言 &#x1f343;友元的介绍 &#x1f343;友元函数 &#x1f343;友元类 &#x1f343;相关…

【leetcode】替换后的最长重复字符、将字符串翻转到单调递增

1.替换后的最长重复字符 示例如下&#xff1a; 下面我们来分析一下一个例子&#xff0c;其中K 2 暴力枚举 这里的字符串s是仅由大写字母组成&#xff0c;首先我们尝试用暴力解法的思路来想一下这道题&#xff0c;通过从第一个字符开始进行枚举&#xff0c;如果出现了条件判断…