保序回归与金融时序数据

保序回归在回归问题中的作用是通过拟合一个单调递增或递减的函数,来保持数据点的相对顺序特性。

一、保序回归的作用

主要用于以下情况:

1. 有序数据:当输入数据具有特定的顺序关系时,保序回归可以帮助保持这种顺序关系。例如,时间序列数据、评级数据或排序数据等。

2. 无噪声数据:如果数据中存在噪声,即一些离群点或错误标记的数据点,保序回归可能会受到这些异常值的干扰。因此,保序回归更适用于相对干净且有序的数据。

3. 数据平滑:保序回归可以用于平滑数据,消除数据中的波动和噪声,以获得更加稳定的趋势。

4. 非线性关系:当数据中存在非线性的关系时,保序回归可以更好地捕捉这种非线性关系,而不受线性回归的限制。

import pandas as pd
import numpy as np
import matplotlib.pyplot as plt
from sklearn.isotonic import IsotonicRegression# 构造示例数据
X = np.array([1, 2, 3, 4, 5])  # 自变量
y = np.array([2, 3, 1, 5, 4])  # 因变量# 创建并训练保序回归模型
model = IsotonicRegression()
model.fit(X, y)# 预测新的数据点
new_X = np.array([5, 6, 5.5])
predicted_y = model.predict(new_X)# 输出预测结果
print(predicted_y)

二、保序回归处理金融股票时序数据并可视化

data = {}
data['close'] = pd.read_pickle('close.pkl')['stock_1'].iloc[-500:]
data['open'] = pd.read_pickle('open.pkl')['stock_1'].iloc[-500:]n = len(data['close'])
X = np.array(data['open'].values)
y = data['close'].valuesfrom sklearn.isotonic import IsotonicRegressionir=IsotonicRegression()
y_ir=ir.fit_transform(X,y)plt.figure(figsize=(15,6))
plt.plot(X,y,'r.',markersize=12)
plt.plot(X,y_ir,'g.-',markersize=12)
plt.legend(('Data','Isotonic Fit'))
plt.title("Isotonic Regression")
plt.show()

三、一个小例子

  1. 收集了股票价格和动量因子的历史数据,其中 stock_prices 是股票价格的时间序列数据,momentum_factors 是相应的动量因子数据,target 是标记股票涨跌的目标变量。

  2. 创建一个 IsotonicRegression 对象 model,并使用 fit 方法拟合模型,将动量因子作为自变量,目标变量作为因变量进行训练。

  3. 定义了新的动量因子 new_momentum_factors,并使用 predict 方法对其进行预测,得到相应的股票涨跌预测结果 predicted_target。

# 收集股票价格和动量因子的历史数据
stock_prices = np.array([100, 110, 120, 130, 120, 110, 100])
momentum_factors = np.array([0.5, 0.7, 0.9, 1.2, 0.8, 0.6, 0.4])
target = np.array([1, 1, 1, -1, -1, -1, -1])  # 标记股票涨跌,1为涨,-1为跌# 创建并拟合保序回归模型
model = IsotonicRegression()
model.fit(momentum_factors, target)# 预测新的动量因子对应的股票涨跌
new_momentum_factors = np.array([0.5, 0.4, 0.7])
predicted_target = model.predict(new_momentum_factors)# 输出预测结果
print(predicted_target)

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/news/112480.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

计算机加减乘除的本质

只应用位运算实现加减乘除是程序员的基本修养,这里应用通俗易懂的python实现加减乘除,其他语言同理。 应对python无限制扩展位数的方法 # 限制变量为32位 def int32(value):return -(value & 0x80000000) | (value & 0x7FFFFFFF)加法,本位进位…

机器学习 | 基于随机森林的可解释性机器学习

可解释性机器学习在当今数据驱动的决策系统中扮演着重要的角色。随着人工智能技术的快速发展,越来越多的应用场景需要了解和解释模型的决策过程,以提高透明度、可信度和可接受性。乳腺癌作为一种常见的恶性肿瘤,早期诊断对于治疗和预后具有重要意义。 然而,乳腺癌早期诊断…

认识系统服务

daemon与service 达成某个服务(service)需要一个守护进程(daemon)在后台运行。 实现 ssh 服务,需要 sshd 这个守护进程实现 mysql 服务,需要 mysqld 这个守护进程实现 cron 服务,需要 crond 这…

HttpServlet源码分析及HttpServletRequest接口

2023.10.20 HttpServlet HttpServlet类是专门为HTTP协议准备的。比GenericServlet更加适合HTTP协议下的开发。 http包下都有哪些类和接口呢?(jakarta.servlet.http.*) jakarta.servlet.http.HttpServlet (HTTP协议专用的Servlet…

电源模块测试用例科普:如何调整电压调整率?ATECLOUD-POWER测试系统能否测试?

电压调整率可以控制电压水平,确保设备正常工作,并且可以减少电能浪费,是开关电源测试的其中一个测试项目。那么要如何测试电压调整率呢?测试条件是什么呢? 什么是电压调整率? 电压调整率是指变压器某个绕组的空载电压和指定负载和功率因数…

【SA8295P 源码分析 (四)】35 - QNX侧 Marvell 88Q5152 Phy_Switch 导通实录(硬核)

【SA8295P 源码分析】35 - QNX侧 Marvell 88Q5152 Phy_Switch 导通实录(硬核) 一、硬件原理分析二、88Q5152 芯片读写时序分析2.1 Clause 22 读、写寄存器配置(配置 Port 5 采用C22条款)2.1.1 88Q5152 P5 端口配置2.2 Clause 45 读寄存器时序(配置 Port 1、Port 2 采用C45…

软考系列(系统架构师)- 2019年系统架构师软考案例分析考点

试题一 软件架构(架构风格、质量属性) 【问题1】(13分) 针对用户级别与折扣规则管理功能的架构设计问题,李工建议采用面向对象的架构风格,而王工则建议采用基于规则的架构风格。请指出该系统更适合采用哪种…

三网话费余额查询的API系统 基于thinkphp6.0框架

本套系统是用thinkphp6.0框架开发的,PHP需大于8.2,系统支持用户中心在线查询和通过API接口对接发起查询,用户余额充值是对接usdt接口,源码全开源,支持懂技术的人二次开发~搭建教程1、源码上传后,吧运行目录…

字符串Hash学习笔记

哈希算法 哈希算法是通过一个哈希函数 H H H,将一种数据(包括字符串、较大的数等)转化为能够用变量表示或是直接就可作为数组下标的数。 哈希值 通过哈希函数转化的得到的数值。可以通过哈希值实现快速查找和匹配。 简介 寻找长度为 n n…

【TES600】青翼科技基于XC7K325T与TMS320C6678的通用信号处理平台

板卡概述 TES600是一款基于FPGA+DSP协同处理架构的通用高性能实时信号处理平台,该平台采用1片TI的KeyStone系列多核浮点/定点DSP TMS320C6678作为主处理单元,采用1片Xilinx的Kintex-7系列FPGA XC7K325T作为协处理单元,具有1个FMC…

斜率优化dp

f i min ⁡ ( a j − j i ) f_i\min(a_j - j \times i) fi​min(aj​−ji) 考虑变成点对 ( j , a j ) (j,a_j) (j,aj​),则 f i Y j − X j i f_iY_j-X_ji fi​Yj​−Xj​i 令 i k , f i b ik, f_ib ik,fi​b,得 b Y j − X j k bY_j-X_jk b…

甄知科技张礼军:数智化转型助企业破茧成蝶!

数智化浪潮滚滚向前,正席卷各行各业,带领企业从数字化时代跨入数智化时代。可什么是数智化?如何实现数智化转型?已经成为横亘在无数企业面前的大难题! 事实上,数智化是数字化、AI和业务三个要素的交集&…

4.9 多协议标记交换MPLS

思维导图: 前言: **4.9 多协议标记交换MPLS笔记** 1. **定义与背景**: - MPLS (多协议标记交换) 是一种由 IETF 开发的新协议。 - “多协议”意味着 MPLS 的上层可以使用多种协议。 - 该协议综合了多家公司的技术,如 C…

【MySQL系列】- Select查询SQL执行过程详解

【MySQL系列】- Select查询SQL执行过程详解 文章目录 【MySQL系列】- Select查询SQL执行过程详解一、SQL查询语句的执行过程二、SQL执行过程详解2.1. 连接器2.2. 查询缓存2.3. 分析器2.4. 优化器2.5. 执行器 三、undo log 和 redo log作⽤3.1. redo log (重做日志&a…

Java Web 33道面试题汇总

更多面试合集在:https://javaxiaobear.cn 1、http 的长连接和短连接? HTTP 协议有 HTTP/1.0 版本和 HTTP/1.1 版本。HTTP1.1 默认保持长连接(HTTP persistent connection,也翻译为持久连接),数据传输完成了保持 TCP 连接不断开(不发 RST 包、不四次握手),等待在同域名…

基于Linux的驱动开发:内核模块传参、内核到处符号表、字符设备驱动

内核模块传参 内核模块: int a , b; 安装内核模块时:insmod demo.ko a 100 b 10; 1.内核模块传参的意义 在安装内核模块时给内核模块中的变量进行数值传递,这样可以让我们的内核模块向上兼容更为复杂的应用程序,向下适配多种硬件…

2022年亚太杯APMCM数学建模大赛C题全球变暖与否全过程文档及程序

2022年亚太杯APMCM数学建模大赛 C题 全球变暖与否 原题再现: 加拿大的49.6C创造了地球北纬50以上地区的气温新纪录,一周内数百人死于高温;美国加利福尼亚州死亡谷是54.4C,这是有史以来地球上记录的最高温度;科威特53…

JVM内存模型概述

这里主要分为五大块,分别是:本地方法栈、方法区、java堆、程序计数器和java栈。其中重点是方法区、java堆和java栈。 下面就把各个区域的性质总结一下:(说明,下面的只是结论,没有详细的对各个内存块进行详细…

运维监控Zabbix部署

目录 运维监控Zabbix部署 1. 简介 2. 安装 ​编辑 2.1 安装前准备 - Mysql 2.2 安装Zabbix Server 和 Zabbix Agent 2.2.1 安装Zabbix yum库 2.2.2 安装Zabbix Server、前端、Agent 2.2.3 初始化Mysql数据库 2.2.4 为Zabbix Server配置数据库 2.2.5 配置Zab…

react中在js文件里定义的变量,如何在less文件里去使用该变量

在 React 中,如果在 JS 文件中定义了变量,可以使用 CSS Modules 的方式将变量导出到 LESS 文件中。 以下是示例代码: // index.js import React from react; import styles from ./styles.module.less;const color red;function App() {re…