用于高频交易预测的最优输出LSTM

用于高频交易预测的最优输出LSTM

J.P.Morgan的python教程

Content

本文提出了一种改进的长短期记忆(LSTM)单元,称为最优输出LSTM(OPTM-LSTM),用于实时选择最佳门或状态作为最终输出。这种单元采用浅层拓扑结构,具有最小的回顾期,并且支持在线训练。通过在美国和北欧股票的限价单簿(LOB)中进行测试,证明了OPTM-LSTM在高频交易预测任务中的有效性,特别是在预测LOB中间价格方面,相较于其他循环神经网络,它具有更低的预测误差。

第一章:引言(Introduction)

高频交易(HFT)在美国股票市场交易活动中占比超过50%。HFT过程中,信号和交易在几纳秒内分析和执行,这种速度要求为参与者提供了利用其基础设施和专业技术知识的机会。文章中提到了限价单簿(LOB)的概念,这是HFT活动的一种形式,其中流动性提供者和流动性接受者形成订单流动动态。文章还涉及了快速订单流动信息分析的重要性,特别是预测限价单簿的下一个中间价格,这是实验协议的主要目标。预测下一个中间价格等同于在线或逐刻预测,这在数据规模消化和时间不规则性检查方面是一个挑战。这些挑战可以通过特定类型的神经网络(NN)适当处理,特别是循环神经网络(RNN)家族中的长短期记忆神经网络(LSTM)。LSTM在多个领域,包括金融和算法交易中,已经显示出良好的预测能力。文中还提到了HFT LOB数据集的研究需要模型能够解析所有相关信息而无处理延迟。此外,文章讨论了构建实时在线机器学习实验协议的挑战,不仅仅是工程目标(即LOB的中间价格预测),还包括开发适合基于较少训练周期的短期训练的动态调整的NN。

第二章:相关工作(Related Work)

LSTM网络已被用于预测中间价格的变动,并在预测能力方面表现优异。此外,通过引入注意力机制,LSTM的预测性能得到了进一步提升。还有研究将LSTM与注意力机制结合,用于预测股票价格的跳跃。LSTM还被用于市场做市策略的实施。LSTM单元的架构基于一系列预定义的操作,这些操作基于对内部计算顺序、门/状态数量和单元输出信息的假设。文中提到了一些研究,这些研究根据信息流调整LSTM内部门的顺序,但这些方法存在一些限制,例如调整或消除RNN门并不直接与最终预测目标相关联。此外,文中还提到了一些简化的LSTM单元结构,以及对LSTM单元中最重要的门进行修改的建议。还有一些研究提出了更轻量级的RNN单元。文中还提到了LSTM网络的更复杂变体,例如peephole LSTM和双向LSTM,这些变体在预测开盘、最高、最低和收盘股票价格方面有效。LSTM还被用作混合模型,与CNN结合用于股票价格预测。尽管这些模型在预测方面表现出色,但它们在处理高速信息流时不够灵活,因为LSTM单元在训练和学习期间保持静态,并且与预测任务脱节。

第三章:提出的方法(Proposed Method)

高频交易限价单簿(LOB)的行为特征是股票库存的快速变化,这直接影响股票价格。为了有效应对这种动态变化,提出的长短期记忆(LSTM)网络需要能够迅速识别这些变化并提供优化的建议或信息。

图片

文章提出了一种自适应的LSTM单元架构,称为OPTM-LSTM单元,它与现有的RNN单元在两个关键方面有所不同:首先,LSTM单元的门和状态被视为特征,并通过内部特征重要性机制来衡量它们处理在线信息流的能力;其次,该机制作为一个非预测性监督回归问题,依赖于代表当前已知LOB中间价格的标签。

图片

OPTM-LSTM单元的核心思想是改进LSTM单元的原始机制,通过在线评估内部门和状态的重要性来重新排列和选择LSTM单元的最终输出。这一过程涉及到一个内部的非预测性监督回归问题,该问题与主要的预测目标(即预测下一个中间价格)相似但不相同。

OPTM-LSTM单元的工作机制基于两个关键组件:简单的优化方法(遵循梯度下降学习算法)和非预测性监督回归问题。这两个组件在LSTM单元内部结合,优化结果随后传递给下一个LSTM单元。

在结构上,OPTM-LSTM单元包含与原始LSTM单元相同数量的门和状态,以及相同数量的输出。不同之处在于,在生成两个输出张量(即时间t的隐藏和细胞状态)之前,会进行一个基于内部非预测性监督回归的特征重要性计算。

特征存储库(Feature Repo)是一个包含六个内部门和状态的集合,基于梯度下降学习算法更新的梯度权重这些组件结合在一起,通过计算每个内部门或状态的平均重要性来确定哪个状态或门是最重要的特征。

图片

此外,文章还提供了在线梯度下降算法的描述,以及对OPTM-LSTM单元的时间和空间复杂性的分析。这包括前向传播和反向传播(BPTT)的复杂性分析。

图片

LSTM架构的主要优势在于包括保留信息和延迟梯度消失或爆炸的问题。文章还提到了通过实验方法观察到的LSTM单元内部状态和门的行为特征,这些观察结果支持了开发OPTM-LSTM单元的决策。

第四章:实验(Experiments)

实验部分旨在验证OPTM-LSTM单元在高频交易(HFT)预测任务中的性能。实验的目标是预测限价单簿(LOB)的下一个中间价格,这是一个在线回归预测任务,不依赖于时间信息,而是依赖于每个交易事件的最新信息。

数据集和实验协议:

  • 实验使用了包括美国和北欧的高流动性和低流动性股票的数据集,数据遵循ITCH协议,确保了市场数据的超低延迟。

  • 数据集涵盖了2015年的前两个月的两支美国股票和2010年的两支北欧股票的交易数据。

  • 实验采用了渐进式训练方法,训练集包含高达2000万次交易事件,测试集则使用了1000次交易事件。

性能评估:

  • 性能通过均方误差(MSE)来评估,这是衡量预测准确性的常用指标。

  • 实验结果基于原始数据和两种不同的数据归一化方法:最小-最大归一化(MinMax)和Z分数标准化(Zscore)。

实验设置:

  • 实验比较了OPTM-LSTM单元与其他几种循环神经网络(RNN)结构,包括标准LSTM、带有注意力机制的LSTM、双向LSTM、GRU以及LSTM和CNN的混合模型。

  • 还包括了两个基线模型:一个基于LOB数据输入的朴素回归器和一个基于中间价格的持续性算法。

训练和测试:

  • 训练过程采用了在线学习的方法,其中模型在每个交易事件后立即更新。

  • 测试过程则是在训练集之后立即进行,以评估模型对新数据的预测能力。

结果:

  • OPTM-LSTM在多个数据集上展示了较低的MSE分数,表明其在预测任务中的优越性能。

  • 与其他RNN模型相比,OPTM-LSTM在不同的数据大小和归一化设置下均表现出更好的稳定性和预测准确性。

图片

图片

局限性和未来研究方向:

  • 尽管OPTM-LSTM在实验中表现出色,但研究的局限性在于所使用的股票数量有限,且交易时间范围受限。

  • 未来的研究可以探索更广泛的股票样本和更长的交易时间范围,以及将OPTM-LSTM应用于其他在线预测任务的可能性。

第五章:总结和未来研究方向(Conclusion and Future Research)

本文总结了OPTM-LSTM单元在高频交易(HFT)预测任务中的优势,包括其在多个数据集上实现的低预测误差和快速适应市场变化的能力,并指出了研究的局限性,如股票样本数量和交易时间范围的限制,同时提出了未来研究的方向,例如将OPTM-LSTM应用于其他在线预测任务,以及进一步优化模型以处理更广泛的市场数据和交易场景。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/pingmian/55183.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

MongoDB mongoose 的 save、insert 和 create 方法的比较

目录 save 方法 insert 方法 create 方法 使用会话和事务 总结 在本文中,我们将介绍 MongoDB 中使用 mongoose 操作 数据库时的三种常见方法:save、insert 和 create。这些方法可以用于将数据存储到 MongoDB 数据库中,并且在一定程度上具…

Study-Oracle-10-ORALCE19C-RAC集群搭建(一)

一、硬件信息及配套软件 1、硬件设置 RAC集群虚拟机:CPU:2C、内存:10G、操作系统:50G Openfile数据存储:200G (10G*2) 2、网络设置 主机名公有地址私有地址VIP共享存储(SAN)rac1192.168.49.13110.10.10.20192.168.49.141192.168.49.130rac2192.168.49.13210.10.10.3…

Python、PyTorch与cuda的版本对应表

常见的Python和PyTorch版本对应关系。 PyTorch版本对应的PythonPyTorch1.0Python 2.7,3.5,3.6,3.7PyTorch1.1Python 2.7,3.5,3.6,3.7PyTorch1.2Python 2.7,3.5,3.6,3.7P…

基于深度学习的不遗忘训练

基于深度学习的不遗忘训练(也称为抗遗忘训练或持久性学习)是针对模型在学习新任务时可能会忘记已学习内容的一种解决方案。该方法旨在使深度学习模型在不断接收新信息的同时,保持对旧知识的记忆。以下是这一领域的主要内容和方法:…

深度学习中的卷积神经网络

在深度学习的世界中,卷积神经网络(Convolutional Neural Networks,简称CNN)是一种重要的模型。它特别适用于处理具有网格状拓扑结构的数据,如图像和视频。本文将深入探讨CNN的工作原理,以及如何利用它们来处…

python logging包的用法

Python的logging模块是一个功能强大且灵活的日志记录工具,用于在程序中输出运行时的信息、警告、错误等。它能够帮助开发者跟踪代码的执行过程、调试问题,并记录运行中的重要事件。 1. 基本用法 import logging# 设置日志的基本配置 logging.basicConf…

C++继承的默认方式到底是public还是private?

先说结论,C继承的默认方式: 1、对于类(class)来说默认是private 2、对于结构体(struct)来说默认是public [ACCESS] 的默认值 类继承的基本语法: class Rectangle: [ACCESS] Polygon { /* … */ } 冒号(:)后的[ACCES…

github命令行管理工具推荐

GitHub 管理工具推荐 背景 在使用 GitHub 管理仓库时,需要在 Web 端创建远程仓库,在本地创建本地仓库,然后再用 git remote add origin url 进行关联。这个过程相对繁琐,而且还有优化的空间。如果频繁创建仓库,就更能…

Paddlets时间序列集成模型回测实战:MLPRegressor、NHiTSModel与RNNBlockRegressor

好的,我们继续深入理解代码的每个部分。以下是每个主要模块的详细解释: 1. 导入模块和库 import json import os import glob import pandas as pd from tqdm import tqdm from paddlets.datasets import TSDataset from paddlets.transform import StandardScaler from pa…

WaterCloud:一套基于.NET 8.0 + LayUI的快速开发框架,完全开源免费!

前言 今天大姚给大家分享一套基于.NET 8.0 LayUI的快速开发框架,项目完全开源、免费(MIT License)且开箱即用:WaterCloud。 可完全实现二次开发让开发更多关注业务逻辑。既能快速提高开发效率,帮助公司节省人力成本&…

HTML+CSS 基础第三季课堂笔记

一、CSS基础概念 CSS有两个重要的概念,分别是样式和布局 CSS的样式分为两种,一种是文字的样式,一种是盒模型的样式 CSS的另一个重要的特性就是辅助页面布局,完成HTML不能完成的功能,比如并排显示,比如精…

国内访问OpenAI API

最近在学习LLM。绕不过去的肯定要学习OpenAI。 国内想直接使用官方API十分麻烦。就到处查资料及网友的分享。发现了这个代理可以在国内很方便的使用OpenAI API。 代理的地址如下: https://referer.shadowai.xyz/r/1014150 经过一段实际体验下来,这个…

JAVA全球互联同城速达国际版同城跑腿快递代取帮买帮送一体化服务系统源码

全球互联,便捷生活新篇章! 🌟 开篇:跨越国界的即时服务革命 在这个快节奏的时代,你是否也曾为忙碌的生活而烦恼?购物、取件、送物……这些日常琐事似乎总在不经意间占据了我们宝贵的时间。但现在&#xf…

expressjs 中的mysql.createConnection,execute 怎么使用

在 Express.js 应用中使用 MySQL 数据库,你通常会使用 mysql 或 mysql2 这样的库来创建和管理数据库连接,并执行查询。然而,mysql.createConnection 并不直接提供 execute 方法。相反,你可以使用 query 方法来执行 SQL 语句。 以…

论文的研究工具有什么?推荐5款AI论文写作网站

在当今的学术研究和写作领域,AI工具已经成为不可或缺的助手。这些工具不仅能够提高写作效率,还能帮助研究者生成高质量的论文。以下是一些值得推荐的AI论文写作工具: 千笔-AIPassPaper 千笔-AIPassPaper是一款基于深度学习和自然语言处理技…

51单片机学习第六课---B站UP主江协科技

DS18B20 1、基本知识讲解 2、DS18B20读取温度值 main.c #include<regx52.h> #include"delay.h" #include"LCD1602.h" #include"key.h" #include"DS18B20.h"float T; void main () {LCD_Init();LCD_ShowString(1,1,"temp…

64 注意力机制_by《李沐:动手学深度学习v2》pytorch版

系列文章目录 文章目录 系列文章目录注意力机制&#xff08;或叫注意力池化&#xff09;[**生成数据集**]平均汇聚非参数注意力汇聚[**带参数注意力汇聚**]批量矩阵乘法定义模型训练 小结练习 注意力机制&#xff08;或叫注意力池化&#xff09; 卷积、全连接、池化层都只考虑…

Mac制作Linux操作系统启动盘

前期准备 一个 Mac 电脑 一个 U 盘&#xff08;8GB 以上&#xff09; 下载好 Linux 系统镜像&#xff08;iso 文件&#xff09; 具体步骤 挂载 U 盘 解挂 U 盘 写系统镜像到 U 盘 完成 一、挂载 U 盘 首先插入 U 盘&#xff0c;打开终端输入下面的命令查看 U 盘是否已经 m…

HarmonyOS NEXT:实现电影列表功能展示界面

时至今日HarmonyOS NEXT早已发布运行了&#xff0c;等其正式推出并大规模商用后&#xff0c;HarmonyOS的历史使命就完成并将退出历史舞台&#xff0c;为用户提供丰富的应用选择。但是Harmony NEXT是在HarmonyOS基础上剔除安卓&#xff08;AOSP&#xff09;后的产品&#xff0c;…

自动驾驶系列—自动驾驶MCU架构全方位解析:从单核到多核的选型指南与应用实例

&#x1f31f;&#x1f31f; 欢迎来到我的技术小筑&#xff0c;一个专为技术探索者打造的交流空间。在这里&#xff0c;我们不仅分享代码的智慧&#xff0c;还探讨技术的深度与广度。无论您是资深开发者还是技术新手&#xff0c;这里都有一片属于您的天空。让我们在知识的海洋中…