《如何制作类mnist的金融数据集》——1.数据集制作思路

1.数据集制作思路(生成用于拟合金融趋势图像的分段线性函数)

       那么如何去制作这样的一个类minist的金融趋势曲线数据集呢?

       还是如上图所示,为了使类别平均分布,因此可以选取三种“buy”的曲线、三种“sell”的曲线以及三种“no”的曲线来作为新数据集的基本数据类别。那么buy类别的曲线可以选取上图中的第14、12、19个图像,并将其主标签类别设为0、1、2;那么sell类别的曲线可以选取上图中的第2、5、7个图像,并将其主标签类别设为3、4、5;那么no类别的曲线可以选取上图中的第4、15、18个图像,并将其主标签类别设为6、7、8。

       选好标签后,就是考虑如何去拟合它们。我们发现选取的这些图片都各有千秋。比如第2个表示“sell”的图,其实可以直接用y=-kx进行拟合,只是调整它的斜率(k>0)即可。第12、25张图也同理。而像第4张图,它其实可以用两段分段线性函数去拟合(当然你也可以去使用多段线性函数去拟合它,我这里为了偷懒就说两段吧。而且还有一个原因就是无论你是两段还是更多段,在你把它转为28*28的像素图片后其实里面的细节不太容易看出来,所以我觉得两段就行。)如下图所示,前一段可以用y=±kx表示,而后一段可以使用y=kx(k>0)表示,分别随机调整它们的斜率就能生成无数种类似图片。第1、3、4、5、6、7、9、11、14、15、16、19、20、23、24张图也同理。而剩下没有提到的图片我认为可以使用三段线性函数去进行拟合,因为以17举例,它包括了一段降、一段升和一段降的趋势,也主要是这三种趋势会提示网络不进行买卖的操作。

       有了上面的思路后就好说了,以生成第14张图为例,直接上代码,下面这段代码不光把第14张图的曲线拟合出来了,还对生成的图像进行了黑底白线的处理。且生成的图像的两段的斜率是随机的,从而保证能够生成若干张图片来形成数据集。

import matplotlib.pyplot as plt
import numpy as np
import randomt1 = np.arange(-4, 0, 0.01)#分段函数的定义域与精度
t2 = np.arange(0, 2, 0.01)# print(random.randint(pre_data0,99))
y1_list = []  # 记录函数值
y2_list = []  # 记录函数值
number = 50
def y(t1,t2):t1 = t1 * random.uniform(1,5) # t1 * 随机的斜率kt2 = t2 * random.uniform(1,5)for i in t1:y1_list.append(i)for j in t2:y2_list.append(-j)num=6000 #需要制造的数据量
for j in range(num):y1_list = []y2_list = []y(t1, t2)#调整画布背景颜色为黑色ax = plt.axes().set_facecolor('black')#根据函数画出来的曲线是白色,并且稍粗一些plt.plot(t1, y1_list, linewidth = 3.0, color='white')plt.plot(t2, y2_list, linewidth = 3.0, color='white')#去横纵坐标ax = plt.subplot()ax.set_xticks([])ax.set_yticks([])#去图片边框plt.subplots_adjust(top=1, bottom=0, right=1, left=0, hspace=0, wspace=0)plt.margins(0, 0)#用于放大缩小图像plt.xlim(-5, 3)  # 坐标轴范围plt.ylim(-8, 1)plt.savefig('./pre_data0/{}_0.jpg'.format(j+1))plt.show()

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/news/626421.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

汽车研发测试大全

车研发中需要做的试验,这些试验都是保证我们的车能安全、稳定、可靠行驶的必要条件。主要包含以下内容: 一、整车试验项目 1.1整车可靠性试验 1.2 NVH试验 1.3 HVAC试验 1.4 EMC试验 1.5 化学分析试验 1.6 整车道路性能试验 二、零部件试验项目 …

什么是NTFS格式文件系统?Tuxera NTFS for Mac2024下载步骤

一般磁盘格式分为:FAT、FAT32、NTFS,这几种格式目前是我们最常遇到的文件系统格式,其中现在遇到最多的就是NTFS格式,为更好地了解这类文件系统格式,小编今天专门介绍一下什么是NTFS格式文件系统以及它的特点和局限性。…

git提交文本或者word到git教程,git创建仓库时候自带

简易的命令行入门教程: Git 全局设置: git config --global user.name “XX” git config --global user.email “XXXqq.com” 创建 git 仓库: mkdir test cd test git init touch README.md git add README.md git commit -m “first commit” git remote add origin https:…

eclipse ADT安装及abap cds模版创建

文章目录 1.前提2.安装3.创建cds模版 abap cds 常用语法 https://blog.csdn.net/weixin_49198221/article/details/135531478?spm1001.2014.3001.5501 1.前提 需要了解版本关系: **1.eclipse:**2023-06 (4.28), 2023-09 (4.29), 2023-12 (4.30) 2.Windows: ​ 1.Windows …

基本BGP配置试验 :配置 IBGP 和 EBGP

一、预习: BGP:Border Gateway Protocol 没有精妙的算法,但能承载大量的路由,它不生产路由,它是路由的搬运工 使用TCP做为传输层协议,端口号179,使用触发式路由更新 1. BGP路由…

LiveGBS流媒体平台GB/T28181功能-基础配置接入控制白名单黑名单配置控制设备安全接入设备单独配置接入密码

LiveGBS基础配置接入控制白名单黑名单配置控制设备安全接入设备单独配置接入密码 1、白名单配置应用场景2、接入控制2.1、白名单2.2、黑名单 3、搭建GB28181视频直播平台 1、白名单配置应用场景 LiveGBS国标流媒体服务,支持白名单配置。 可在设备注册前&#xff0…

SV-8004VP 网络对讲求助话筒,4个自定义按键

SV-8004VP网络对讲求助话筒,4个自定义按键 SV-8004VP是一款4按键求助对讲话筒,具有10/100M以太网接口,支持G.711音频编解码,其接收SIP网络的音频数据,实时解码播放,还配置了麦克风输入和扬声器输出。 SV-…

红日靶场2 指免杀360 个人学习记录

360安全卫士,有一说一,确实很强,这几天研究的MSF利用java反序列化的漏洞是无法利用的,其他方法也瘦小甚微 前几天在研究用 用免杀工具 go-shellcode-loader-main免杀工具对我们生成的木马进行加密 本来是用csa4.0黑客工具生成了…

中国互联网的早期形态

1 大约是从 1991 年开始,国内开始了第一个 BBS 站——北京长城站,经过长时间发展,直到 1995 年,随着计算机及其外设的大幅降价,BBS 才逐渐被部分人们所认识。少数玩 BBS 站的“极客”站长, 基于个人关系&am…

伪装目标检测模型论文阅读之:Zoom in and out

论文链接:https://arxiv.org/abs/2203.02688 代码;https://github.com/lartpang/zoomnet 1.摘要 最近提出的遮挡对象检测(COD)试图分割视觉上与其周围环境融合的对象,这在现实场景中是非常复杂和困难的。除了与它们的背景具有高…

第二证券:旅游股大涨 “预热”春节黄金周

在淄博烧烤热、哈尔滨冰雪热火爆出圈后,希望能接住文旅下一波“泼天富贵”的各地文旅局各出奇招并“卷”出新高度,被各地网友谈论“杀疯了”。 其间,A股游览概念股迎来一波集体上涨,成为不少出资者的重视热点,而行将到…

模拟日光AR汽车HUD的光学特性太阳光模拟器

AR HUD 的光学特性 几何光学可描述物体、透镜和成像之间的关系。将物体放在透镜及其焦点之间将会形成放大且离实际物体有一定距离的虚像[4]。这便是 HUD 生成虚像的方法。源物体(在这里是散射屏或 TFT 面板)在 HUD 反光镜光学系统的焦距内。这使相应虚像…

test0116测试

欢迎关注博主 Mindtechnist 或加入【Linux C/C/Python社区】一起探讨和分享Linux C/C/Python/Shell编程、机器人技术、机器学习、机器视觉、嵌入式AI相关领域的知识和技术。 磁盘满的本质分析 专栏:《Linux从小白到大神》 | 系统学习Linux开发、VIM/GCC/GDB/Make工具…

网络安全ctf比赛/学习资源整理,【解题工具、比赛时间、解题思路、实战靶场、学习路线】推荐收藏!

对于想学习或者参加CTF比赛的朋友来说,CTF工具、练习靶场必不可少,今天给大家分享自己收藏的CTF资源,希望能对各位有所帮助。 CTF在线工具 首先给大家推荐我自己常用的3个CTF在线工具网站,内容齐全,收藏备用。 1、C…

Androidmanifest文件加固和对抗

前言 恶意软件为了不让我们很容易反编译一个apk,会对androidmanifest文件进行魔改加固,本文探索androidmanifest加固的常见手法以及对抗方法。这里提供一个恶意样本的androidmanifest.xml文件,我们学完之后可以动手实践。 1、Androidmanife…

2. goLand安装及外配置参数通用用法

目录 概述测试代码解决外配置参数结束 概述 选择版本安装 go 安装的版本 1.go安装及相关配置 goLand 对于 习惯 idea 系列使用的人,还是很友好的。 测试代码 package mainimport ("flag""fmt""os" )func main() {name : flag.St…

Jenkins之pipeline

安装插件 Pipeline Pipeline: Stage View Plugin 创建任务 配置 demo 开始实践 拉取git仓库代码 checkout scmGit(branches: [[name: */main]], extensions: [], userRemoteConfigs: [[url: http://178.119.30.133:8929/root/mytest.git]])通过SonarQube做质量检测 sh …

RabbitMQ交换机(2)-Direct

1.Direct 直连(路由)交换机,生产者将消息发送到交换机,并指定消息的Routing Key(路由键)。交换机会将Routing Key与队列绑定进行匹配,如果匹配成功,则将该消息路由到对应的队列中。如果没有匹配成功,该消息…

Python不同数据对象的空值校验

更多Python学习内容:ipengtao.com 空值校验在数据处理和应用程序开发中是一个非常重要的任务。Python提供了多种方式来检查不同数据对象(如字符串、列表、字典、集合等)是否为空或包含空值。本文将详细介绍Python中对不同数据对象进行空值校验…

Android 捕获native异常

11.使用google官方提供的breakpad 地址:Android 捕获native异常 https://github.com/google/breakpad 2.编译breakpad的so文件 2.1设置需要编译的架构 3.编译完,在build\intermediates\cmake\debug\obj目录下获取对应架构的so包 4.编译一个错误的so包…