【量化课程】08_1.机器学习量化策略基础实战

文章目录

    • 1. 常用机器学习模型
      • 1.1 回归模型
      • 1.2 分类模型
        • 1.2.1 SVC介绍
        • 1.2.2 SVC在量化策略中的应用
    • 2. 机器学习量化策略实现的基本步骤
    • 3. 策略实现

1. 常用机器学习模型

1.1 回归模型

  • 线性回归
  • 多层感知器回归
  • 自适应提升树回归
  • 随机森林回归

1.2 分类模型

  • 线性分类
  • 支持向量机
  • XGBoost分类
  • K近邻分类

1.2.1 SVC介绍

SVC(Support Vector Classifier)是一种在机器学习中常用的分类算法,它基于支持向量机(Support Vector Machine)算法。SVC通过寻找最佳的超平面来实现分类任务,在数据平面上进行线性或非线性的划分。

1.2.2 SVC在量化策略中的应用

在量化策略中,SVC(Support Vector Classifier)可以用于股票预测和交易决策。以下是SVC在量化策略中的应用步骤:

  • 数据准备:首先,需要准备训练数据和测试数据。训练数据包括历史股票价格和相关特征,以及对应的标签(例如涨跌幅度)。测试数据包括最新的股票价格和特征,用于进行预测。

  • 特征工程:根据历史股票数据,使用技术指标或其他特征工程方法构建特征。这些特征可能包括移动平均线、波动性指标、成交量等。

  • 数据预处理:将训练数据和测试数据进行标准化,使其均值为0,方差为1。这可以提高分类算法的性能。

  • 训练模型:使用训练数据训练SVC模型。在训练过程中,SVC将学习股票的价格模式和特征之间的关系。

  • 模型预测:使用训练好的SVC模型对测试数据进行预测。根据预测结果,判断股票是涨还是跌。

  • 交易决策:根据预测结果进行交易决策。例如,如果SVC预测股票会涨,可以选择买入;如果SVC预测股票会跌,可以选择卖出或不做操作。

  • 交易执行:根据交易决策执行相应的交易操作。这可能涉及到下单、调整仓位等操作。

  • 盈亏评估:根据交易结果评估策略的盈亏情况。可以计算交易收益、回撤等指标,进行策略的优化和调整。

需要注意的是,SVC作为机器学习算法,对数据的准备和特征工程至关重要。合理选择特征和调整参数可以显著影响SVC的预测性能。此外,量化策略中还需要考虑交易成本、风险管理和市场流动性等因素,以构建更加完整和可靠的策略。

2. 机器学习量化策略实现的基本步骤

  1. 加载数据
  2. 标注数据
  3. 特征工程,分割训练集和测试集
  4. 选择机器学习模型并配置适当的参数
  5. 训练模型
  6. 利用模型数据样本之外的数据进行回测
  7. 对回测结果进行可视化

3. 策略实现

本部分将介绍如何在BigQuant实现一个基于支持向量机模型的选股策略

from biglearning.api import M
from biglearning.api import tools as T
from bigdatasource.api import DataSource
from biglearning.module2.common.data import Outputs
from zipline.finance.commission import PerOrder# 对训练数据和测试数据进行标准化处理
def m6_run_bigquant_run(input_1, input_2, input_3):train_df = input_1.read()features = input_2.read()feature_min = train_df[features].quantile(0.005)feature_max = train_df[features].quantile(0.995)train_df[features] = train_df[features].clip(feature_min,feature_max,axis=1) data_1 = DataSource.write_df(train_df)test_df = input_3.read()test_df[features] = test_df[features].clip(feature_min,feature_max,axis=1)data_2 = DataSource.write_df(test_df)return Outputs(data_1=data_1, data_2=data_2, data_3=None)# 后处理函数
def m6_post_run_bigquant_run(outputs):return outputs# 处理每个交易日的数据
def m4_handle_data_bigquant_run(context, data):context.extension['index'] += 1if  context.extension['index'] % context.rebalance_days != 0:return date = data.current_dt.strftime('%Y-%m-%d')cur_data = context.indicator_data[context.indicator_data['date'] == date]cur_data = cur_data[cur_data['pred_label'] == 1.0]stock_to_buy =  list(cur_data.sort_values('instrument',ascending=False).instrument)[:context.stock_num]if date == '2017-02-06':print(date, len(stock_to_buy), stock_to_buy)# 获取当前持仓股票stock_hold_now = [equity.symbol for equity in context.portfolio.positions]# 需要保留的股票no_need_to_sell = [i for i in stock_hold_now if i in stock_to_buy]# 需要卖出的股票stock_to_sell = [i for i in stock_hold_now if i not in no_need_to_sell]for stock in stock_to_sell:if data.can_trade(context.symbol(stock)):context.order_target_percent(context.symbol(stock), 0)if len(stock_to_buy) == 0:returnweight =  1 / len(stock_to_buy)for stock in stock_to_buy:if data.can_trade(context.symbol(stock)):context.order_target_percent(context.symbol(stock), weight)# 准备工作
def m4_prepare_bigquant_run(context):pass# 初始化策略
def m4_initialize_bigquant_run(context):context.indicator_data = context.options['data'].read_df()context.set_commission(PerOrder(buy_cost=0.0003, sell_cost=0.0013, min_cost=5))context.rebalance_days = 5context.stock_num = 50if 'index' not in context.extension:context.extension['index'] = 0# 开盘前处理函数
def m4_before_trading_start_bigquant_run(context, data):pass# 获取2020年至2021年股票数据
m1 = M.instruments.v2(start_date='2020-01-01',end_date='2021-01-01',market='CN_STOCK_A',instrument_list='',max_count=0
)# 使用高级自动标注器获取标签
m2 = M.advanced_auto_labeler.v2(instruments=m1.data,label_expr="""shift(close, -5) / shift(open, -1)-1
rank(label)
where(label>=0.95,1,0)""",start_date='',end_date='',benchmark='000300.SHA',drop_na_label=False,cast_label_int=False
)# 输入特征
m3 = M.input_features.v1(features="""(close_0-mean(close_0,12))/mean(close_0,12)*100
rank(std(amount_0,15))
rank_avg_amount_0/rank_avg_amount_8
ts_argmin(low_0,20)
rank_return_30
(low_1-close_0)/close_0
ta_bbands_lowerband_14_0
mean(mf_net_pct_s_0,4)
amount_0/avg_amount_3
return_0/return_5
return_1/return_5
rank_avg_amount_7/rank_avg_amount_10
ta_sma_10_0/close_0
sqrt(high_0*low_0)-amount_0/volume_0*adjust_factor_0
avg_turn_15/(turn_0+1e-5)
return_10
mf_net_pct_s_0
(close_0-open_0)/close_1"""
)# 抽取基础特征
m15 = M.general_feature_extractor.v7(instruments=m1.data,features=m3.data,start_date='',end_date='',before_start_days=0
)# 提取派生特征
m16 = M.derived_feature_extractor.v3(input_data=m15.data,features=m3.data,date_col='date',instrument_col='instrument',drop_na=False,remove_extra_columns=False
)# 合并标签和特征
m7 = M.join.v3(data1=m2.data,data2=m16.data,on='date,instrument',how='inner',sort=False
)# 删除缺失值
m13 = M.dropnan.v1(input_data=m7.data
)# 获取2021年至2022年股票数据
m9 = M.instruments.v2(start_date=T.live_run_param('trading_date', '2021-01-01'),end_date=T.live_run_param('trading_date', '2022-01-01'),market='CN_STOCK_A',instrument_list='',max_count=0
)# 抽取基础特征
m17 = M.general_feature_extractor.v7(instruments=m9.data,features=m3.data,start_date='',end_date='',before_start_days=0
)# 提取派生特征
m18 = M.derived_feature_extractor.v3(input_data=m17.data,features=m3.data,date_col='date',instrument_col='instrument',drop_na=False,remove_extra_columns=False
)# 删除缺失值
m14 = M.dropnan.v1(input_data=m18.data
)# 标准化训练数据和测试数据
m6 = M.cached.v3(input_1=m13.data,input_2=m3.data,input_3=m14.data,run=m6_run_bigquant_run,post_run=m6_post_run_bigquant_run,input_ports='',params='{}',output_ports=''
)# 对数据进行RobustScaler标准化处理
m8 = M.RobustScaler.v13(train_ds=m6.data_1,features=m3.data,test_ds=m6.data_2,scale_type='standard',quantile_range_min=0.01,quantile_range_max=0.99,global_scale=True
)# 使用SVC进行训练和预测
m10 = M.svc.v1(training_ds=m8.train_data,features=m3.data,predict_ds=m8.test_data,C=1,kernel='rbf',degree=3,gamma=-1,coef0=0,tol=0.1,max_iter=100,key_cols='date,instrument',other_train_parameters={}
)# 创建交易策略实例
m4 = M.trade.v4(instruments=m9.data,options_data=m10.predictions,start_date='',end_date='',handle_data=m4_handle_data_bigquant_run,prepare=m4_prepare_bigquant_run,initialize=m4_initialize_bigquant_run,before_trading_start=m4_before_trading_start_bigquant_run,volume_limit=0,order_price_field_buy='open',order_price_field_sell='open',capital_base=10000000,auto_cancel_non_tradable_orders=True,data_frequency='daily',price_type='后复权',product_type='股票',plot_charts=True,backtest_only=False,benchmark=''
)

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/news/36883.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

Android布局【FrameLayout】

文章目录 常见属性说明项目结构主要代码 常见属性 android:foreground:设置前景android:foregroundGravity:设置前景位置 说明 FrameLayout的其他属性与前面学的差不多,只不过需要特别注意上面两个即可 项目结构 主要代码 activity_main…

计算机视觉中的特征检测和描述

一、说明 这篇文章是关于计算机视觉中特征检测和描述概念的简要理解。在其中,我们探讨了它们的定义、常用技术、简单的 python 实现和一些限制。 二、什么是特征检测和描述? 特征检测和描述是计算机视觉中的基本概念,在图像识别、对象跟踪和图…

Beats:使用 Filebeat 将 golang 应用程序记录到 Elasticsearch - 8.x

毫无疑问,日志记录是任何应用程序最重要的方面之一。 当事情出错时(而且确实会出错),我们需要知道发生了什么。 为了实现这一目标,我们可以设置 Filebeat 从我们的 golang 应用程序收集日志,然后将它们发送…

微信小程序备案流程

微信小程序备案流程 📔 千寻简笔记介绍 千寻简笔记已开源,Gitee与GitHub搜索chihiro-notes,包含笔记源文件.md,以及PDF版本方便阅读,且是用了精美主题,阅读体验更佳,如果文章对你有帮助请帮我…

Android布局【TableLayout】

文章目录 说明常见属性子控件设置属性 项目结构主要代码 说明 TableLayout也称为表格布局 常见属性 android:collapseColumns:设置需要被隐藏的列的序列号,从0开始android:stretchColumns:设置允许被拉伸的列的列序号,从0开始&…

Python中使用隧道爬虫ip提升数据爬取效率

作为专业爬虫程序员,我们经常面临需要爬取大量数据的任务。然而,有些网站可能会对频繁的请求进行限制,这就需要我们使用隧道爬虫ip来绕过这些限制,提高数据爬取效率。本文将分享如何在Python中使用隧道爬虫ip实现API请求与响应的技…

(十八)大数据实战——Hive的metastore元数据服务安装

前言 Hive的metastore服务作用是为Hive CLI或者Hiveserver2提供元数据访问接口。Hive的metastore 是Hive元数据的存储和管理组件,它负责管理 Hive 表、分区、列等元数据信息。元数据是描述数据的数据,它包含了关于表结构、存储位置、数据类型等信息。本…

Android Jetpack Compose 中的分页与缓存展示

Android Jetpack Compose 中的分页与缓存展示 在几乎任何类型的移动项目中,移动开发人员在某个时候都会处理分页数据。如果数据列表太大,无法一次从服务器检索完毕,这就是必需的。因此,我们的后端同事为我们提供了一个端点&#…

ArcGIS Pro应用—暨基础入门、制图、空间分析、影像分析、三维建模、空间统计分析与建模、python融合、案例应用全流程科研能力提升教程

详情点击链接:ArcGIS Pro应用—暨基础入门、制图、空间分析、影像分析、三维建模、空间统计分析与建模、python融合、案例应用全流程科研能力提升教程 第一:GIS及ArcGIS Pro 1.GIS基本原理及常用软件 2.ArcGIS Pro 安装与配置 3.ArcGIS Pro 3.0 的新…

小白到运维工程师自学之路 第七十三集 (kubernetes应用部署)

一、安装部署 1、以Deployment YAML方式创建Nginx服务 这个yaml文件在网上可以下载 cat nginx-deployment.yaml apiVersion: apps/v1 #apiVersion是当前配置格式的版本 kind: Deployment #kind是要创建的资源类型,这里是Deploymnet metadata: #metadata是该资源…

Photoshop多图片与多窗口下排列操作方法

首先,在Photoshop中打开6张图片,在“窗口”菜单下切换窗口排列状态: 在 “窗口”菜单下对窗口进行排列,分别呈现如下: (一). 点击“窗口” -> “排列”->"全部垂直拼贴": &am…

本地oracle登录账号锁定处理,the account is locked

1.打开cmd命令窗口 2.打开sqlplus: sqlplus /nolog(加/nolog是不登录服务器的意思,不加就需要输账号密码) 3.切换到管理员:conn / as sysdba; 第2步第3步可以合并,直接使用sysdba登录:sqlplus / as sysdba; 4.解锁账号&#x…

如何从cpu改为gpu,pytorch,cuda

1.cmd输入nvcc -V 2.得到 cuda版本后,去pytorch官网 3.根据自己的cuda进行选择 4.复制上述链接,进入cmd 5.cmd中输入activate XXX,这里的"XXX"指代自己在工程中用到的环境 6.进入后,将刚才链接粘贴,回车等待下载结束 …

《高性能MySQL》——查询性能优化(笔记)

文章目录 六、查询性能优化6.1 查询为什么会慢6.2 慢查询基础:优化数据访问6.2.1 是否向数据库请求了不需要的数据查询不需要的记录多表关联时返回全部列总是取出全部列重复查询相同的数据 6.2.2 MySQL 是否在扫描额外的记录响应时间扫描的行数与返回的行数扫描的行…

新增守护进程管理、支持添加MySQL远程数据库,支持PHP版本切换,1Panel开源面板v1.5.0发布

2023年8月14日,现代化、开源的Linux服务器运维管理面板1Panel正式发布v1.5.0版本。 在这个版本中,1Panel新增了守护进程管理功能;支持添加MySQL远程数据库;支持添加FTP/S和WebDAV的SFTP服务;支持PHP版本切换。此外&am…

jupyter打开ipynb后,还没有运行cell,反复报错

今天遇到了一个比较奇怪的问题: 这个原因是当前目录下有一个code.py的文件,一旦打开ipynb,就是先执行code.py,而且遇到报错,还会反复执行,导致内核崩溃。

创建一个 React+Typescript 项目

接下来 我们来一起探索一下用TypeScript 来编写react 这也是一个非常好的趋势,目前也非常多人使用 那么 我们就先从创建项目开始 首先 我们先找一个 或者 之前创建一个目录 用来放我们的项目 然后 在这个目录下直接输入 例如 这里 我想创建一个叫 tsReApp 的项目…

面向对象设计与分析40讲(20)消息驱动编程和事件驱动编程模型

文章目录 消息驱动编程事件驱动编程消息驱动和事件驱动的区别 消息驱动编程 消息驱动是一种编程模型,它基于事件和消息的传递来驱动程序的执行流程。在消息驱动的模型中,系统中的各个组件(或对象)通过发送和接收消息进行通信和协…

matplotlib绘制位置-时序甘特图

文章目录 1 前言2 知识点2.1 matplotlib.pyplot.barh2.2 matplotlib.legend的handles参数 3 代码实现4 绘制效果5 总结参考 1 前言 这篇文章的目的是,总结记录一次使用matplotlib绘制时序甘特图的经历。之所以要绘制这个时序甘特图,是因为22年数模研赛C…

【IDEA问题】下载不了源代码

引出问题 最近不知道怎么打开 IDEA,本想查看源代码,然后点击下载源码,总是报找不到此对象的源代码。百度找了半天,GPT问了半天还是解决不了,直到遇到了这篇:idea中无法下载源码问题解决,终于得…