从基础到实战的量化交易全流程学习:1.3 数学与统计学基础——概率与统计基础 | 数字特征

从基础到实战的量化交易全流程学习:1.3 数学与统计学基础——概率与统计基础 | 数字特征

在这里插入图片描述


第一部分:概率与统计基础
第2节:数字特征:期望值、方差、协方差与相关系数


一、期望值(Expected Value):用“平均值”预测未来

期望值是随机变量的“加权平均”,代表长期来看最可能的“平均结果”,是量化交易中评估策略收益的核心指标。

1. 数学定义与性质

  • 离散型随机变量
    E ( X ) = ∑ i = 1 n x i ⋅ P ( X = x i ) E(X) = \sum_{i=1}^n x_i \cdot P(X=x_i) E(X)=i=1nxiP(X=xi)
    例:抛一枚硬币,正面盈利100元(概率0.5),反面亏损50元(概率0.5),期望收益为:
    E ( X ) = 100 × 0.5 + ( − 50 ) × 0.5 = 25 元 E(X) = 100 \times 0.5 + (-50) \times 0.5 = 25 \ \text{元} E(X)=100×0.5+(50)×0.5=25 

  • 连续型随机变量
    E ( X ) = ∫ − ∞ + ∞ x ⋅ f ( x ) d x E(X) = \int_{-\infty}^{+\infty} x \cdot f(x) \, dx E(X)=+xf(x)dx
    f ( x ) f(x) f(x) 为概率密度函数,如股票收益率的正态分布)

  • 线性性质(关键!):

    • E ( a X + b Y ) = a E ( X ) + b E ( Y ) E(aX + bY) = aE(X) + bE(Y) E(aX+bY)=aE(X)+bE(Y) a , b a,b a,b 为常数)
    • 无论 X X X Y Y Y 是否独立,线性性都成立。

2. 量化交易中的应用

  • 投资组合预期收益计算
    假设持有30%的股票A(期望收益15%)和70%的债券B(期望收益5%),组合期望收益为:
    E ( R ) = 0.3 × 15 % + 0.7 × 5 % = 8 % E(R) = 0.3 \times 15\% + 0.7 \times 5\% = 8\% E(R)=0.3×15%+0.7×5%=8%

  • 策略有效性筛选
    通过回测计算策略的期望收益 E ( R ) E(R) E(R),若 E ( R ) < 0 E(R) < 0 E(R)<0(长期亏损),则直接排除。


二、方差(Variance)与标准差(Standard Deviation):用“波动”衡量风险

期望值相同的策略,风险可能差异巨大——方差描述收益围绕均值的离散程度,是量化风险的核心指标。

1. 数学定义与性质

  • 方差
    Var ( X ) = E [ ( X − E ( X ) ) 2 ] = E ( X 2 ) − [ E ( X ) ] 2 \text{Var}(X) = E\left[(X - E(X))^2\right] = E(X^2) - [E(X)]^2 Var(X)=E[(XE(X))2]=E(X2)[E(X)]2
    例:上述抛硬币策略,方差为:
    Var ( X ) = ( 100 − 25 ) 2 × 0.5 + ( − 50 − 25 ) 2 × 0.5 = 5625 \text{Var}(X) = (100-25)^2 \times 0.5 + (-50-25)^2 \times 0.5 = 5625 Var(X)=(10025)2×0.5+(5025)2×0.5=5625

  • 标准差(方差的平方根):
    σ = Var ( X ) \sigma = \sqrt{\text{Var}(X)} σ=Var(X)
    (单位与原变量一致,比方差更直观)

  • 性质

    • Var ( a X + b ) = a 2 Var ( X ) \text{Var}(aX + b) = a^2 \text{Var}(X) Var(aX+b)=a2Var(X)(常数 b b b 不影响波动)
    • 独立变量的和的方差: Var ( X + Y ) = Var ( X ) + Var ( Y ) \text{Var}(X+Y) = \text{Var}(X) + \text{Var}(Y) Var(X+Y)=Var(X)+Var(Y)(若 X , Y X,Y X,Y 独立)

2. 量化交易中的应用

  • 风险度量
    • 标准差越大,收益波动越剧烈,风险越高。
    • 例:策略A年均收益10%,标准差5%;策略B年均收益10%,标准差20%。虽然期望相同,但策略B的风险远高于策略A。

在这里插入图片描述

图1:标准差小(左)的收益更集中在均值附近,风险低;标准差大(右)的收益更分散,风险高。

  • 马科维茨有效前沿
    通过优化组合权重,在给定期望收益下最小化方差(或在给定方差下最大化期望收益),构建“风险-收益”最优的投资组合。

三、协方差(Covariance)与相关系数(Correlation):用“联动性”分析资产关系

单个资产的风险容易衡量,但多个资产的“互动”才是组合风险的关键——协方差和相关系数描述变量间的线性关联程度。

1. 协方差:衡量“同方向波动”的强度

  • 定义
    Cov ( X , Y ) = E [ ( X − μ X ) ( Y − μ Y ) ] = E ( X Y ) − μ X μ Y \text{Cov}(X,Y) = E\left[(X - \mu_X)(Y - \mu_Y)\right] = E(XY) - \mu_X \mu_Y Cov(X,Y)=E[(XμX)(YμY)]=E(XY)μXμY

    • 正协方差 X X X 增大时 Y Y Y 倾向于增大(如股票与股市指数)。
    • 负协方差 X X X 增大时 Y Y Y 倾向于减小(如股票与黄金)。
    • 绝对值越大:联动性越强;绝对值越小(接近0):联动性越弱。
  • 性质

    • Cov ( X , X ) = Var ( X ) \text{Cov}(X,X) = \text{Var}(X) Cov(X,X)=Var(X)(自身协方差即方差)
    • Cov ( X , Y ) = Cov ( Y , X ) \text{Cov}(X,Y) = \text{Cov}(Y,X) Cov(X,Y)=Cov(Y,X)
    • 独立变量协方差为0(反之不一定成立)。

2. 相关系数:“标准化”的协方差

  • 定义
    ρ X Y = Cov ( X , Y ) σ X σ Y ( ρ ∈ [ − 1 , 1 ] ) \rho_{XY} = \frac{\text{Cov}(X,Y)}{\sigma_X \sigma_Y} \quad (\rho \in [-1, 1]) ρXY=σXσYCov(X,Y)(ρ[1,1])

    • ρ = 1 \rho = 1 ρ=1:完全正相关(变量同步波动,如同一行业的两只股票)。
    • ρ = − 1 \rho = -1 ρ=1:完全负相关(变量反向波动,如期货对冲组合)。
    • ρ = 0 \rho = 0 ρ=0:无线性相关(可能存在非线性关系)。
  • 可视化:散点图与相关系数
    在这里插入图片描述

    图2:从左到右分别为 ρ = 1 \rho=1 ρ=1(严格正相关)、 ρ = 0.5 \rho=0.5 ρ=0.5(正相关)、 ρ = 0 \rho=0 ρ=0(无相关)、 ρ = − 1 \rho=-1 ρ=1(严格负相关)。

3. 量化交易中的应用

  • 资产配置分散风险

    • 若两只股票 ρ = 0.3 \rho=0.3 ρ=0.3,组合标准差会低于两者标准差的加权平均,实现“风险分散”。
    • 例:资产A( σ A = 20 % \sigma_A=20\% σA=20%)和资产B( σ B = 15 % \sigma_B=15\% σB=15%),等权重配置,若 ρ = 0.3 \rho=0.3 ρ=0.3,则组合标准差为:
      σ = ( 0. 5 2 × 0. 2 2 ) + ( 0. 5 2 × 0.1 5 2 ) + 2 × 0.5 × 0.5 × 0.3 × 0.2 × 0.15 ≈ 12.8 % \sigma = \sqrt{(0.5^2 \times 0.2^2) + (0.5^2 \times 0.15^2) + 2 \times 0.5 \times 0.5 \times 0.3 \times 0.2 \times 0.15} \approx 12.8\% σ=(0.52×0.22)+(0.52×0.152)+2×0.5×0.5×0.3×0.2×0.15 12.8%
      低于简单平均 ( 20 % + 15 % ) / 2 = 17.5 % (20\% + 15\%)/2 = 17.5\% (20%+15%)/2=17.5%
  • 多因子模型去冗余

    • 若两个因子的相关系数 ρ > 0.9 \rho>0.9 ρ>0.9,说明存在严重多重共线性,需剔除其中一个因子。

四、Python实战:计算投资组合的风险收益指标

import numpy as np# 资产参数:3只股票的期望收益、协方差矩阵、持仓权重
returns = np.array([0.12, 0.08, 0.06])  # 期望收益
cov_matrix = np.array([[0.04, 0.02, 0.01],[0.02, 0.03, 0.015],[0.01, 0.015, 0.02]
])  # 协方差矩阵
weights = np.array([0.5, 0.3, 0.2])     # 权重# 1. 计算组合期望收益
expected_return = np.dot(weights, returns)
print(f"组合期望收益: {expected_return:.4f}")  # 输出:0.1020 (10.2%)# 2. 计算组合方差与标准差
portfolio_var = np.dot(weights.T, np.dot(cov_matrix, weights))
portfolio_std = np.sqrt(portfolio_var)
print(f"组合方差: {portfolio_var:.4f}, 标准差: {portfolio_std:.4f}")  
# 输出:组合方差: 0.0229, 标准差: 0.1513 (15.13%)# 3. 计算资产间相关系数矩阵
corr_matrix = cov_matrix / (np.outer(np.sqrt(np.diag(cov_matrix)), np.sqrt(np.diag(cov_matrix))))
print("相关系数矩阵:\n", np.round(corr_matrix, 2))
# 输出:
# 相关系数矩阵:
#  [[1.  0.58 0.5 ]
#  [0.58 1.   0.75]
#  [0.5  0.75 1.  ]]

本节总结

  • 期望值 是收益的“指南针”,告诉我们长期平均结果。
  • 方差/标准差 是风险的“量尺”,衡量收益的波动程度。
  • 协方差/相关系数 是联动性的“温度计”,帮助我们分散风险、优化组合。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/bicheng/78627.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

MySQL(聚合函数)

单行函数 对每一条记录输入值进行计算&#xff0c;得到相应的计算结果&#xff0c;返回给用户&#xff0c;也就是说&#xff0c;每条记录作为一个输入参数&#xff0c;经过函数计算得到每条记录的计算结果。 每一个函数中都有一些常用的函数&#xff08;方法&#xff09; 在学…

babel核心知识点

Babel 是一个 JavaScript 编译器&#xff0c;主要用于将 ECMAScript 2015 版本的代码转换为向后兼容的 JavaScript 代码&#xff0c;以便在旧版本的浏览器或环境中运行。以下是 Babel 的核心知识点&#xff1a; 1. 基本概念 编译器&#xff1a;Babel 本质上是一个编译器&…

javaScript--数据结构和算法

在 JavaScript 里&#xff0c;数据结构和算法是十分关键的部分&#xff0c;下面介绍几种常见的数据结构和对应的算法。 数组&#xff08;Array&#xff09; 数组是最基础的数据结构&#xff0c;用于存储一系列有序的数据。 // 创建数组 const arr [1, 2, 3, 4, 5];// 访问元素…

π0.5:带开放世界泛化的视觉-语言-动作模型

25年4月来自具身机器人创业公司 PI 公司的论文“π0.5: a Vision-Language-Action Model with Open-World Generalization”。 为了使机器人发挥作用&#xff0c;它们必须在实验室之外的现实世界中执行实际相关的任务。虽然视觉-语言-动作 (VLA) 模型在端到端机器人控制方面已…

使用 OpenCV 和 dlib 进行人脸检测

文章目录 1. 什么是 dlib2. 前期准备介绍2.1 环境准备2.2 dlib 的人脸检测器 3. 代码实现3.1 导入库3.2 加载检测器3.3 读取并调整图像大小3.4 检测人脸3.5 绘制检测框3.6 显示结果 4. 完整代码5. 优化与改进5.1 提高检测率5.2 处理 BGR 与 RGB 问题 6. 总结 人脸检测是计算机视…

spring 的PropertySource 类与 @PropertySource 注解详解与对比

PropertySource 类与 PropertySource 注解详解与对比 在这里插入图片描述 一、PropertySource 类详解 1. 类型与作用 类型&#xff1a;接口&#xff08;org.springframework.core.env.PropertySource&#xff09;作用&#xff1a;抽象配置数据源&#xff0c;提供统一的键值…

Java后端开发day37--源码解析:TreeMap可变参数--集合工具类:Collections

&#xff08;以下内容全部来自上述课程&#xff09; 1. TreeMap 1.1 须知 1.1.1 Entry 节点初始为黑色&#xff1a;提高代码阅读性 1.1.2 TreeMap中的成员变量 comparator&#xff1a;比较规则root&#xff1a;红黑树根节点的地址值size&#xff1a;集合的长度和红黑树…

基于Playwright的浏览器自动化MCP服务

一、服务定位与核心功能 github.com/executeautomation/mcp-playwright 是一个基于 Playwright&#xff08;微软开源的跨浏览器自动化测试框架&#xff09;的 Model Context Protocol (MCP) 服务&#xff0c;核心功能是将浏览器自动化能力集成到大语言模型&#xff08;LLM&…

OSPF网络协议

OSPF&#xff08;Open Shortest Path First&#xff09;是一种链路状态路由协议&#xff0c;属于IGP&#xff08;内部网关协议&#xff09;&#xff0c;用于在单一自治系统&#xff08;AS&#xff09;内动态分发路由信息。它通过计算最短路径&#xff08;基于Dijkstra算法&…

Ubuntu 22.04.4操作系统初始化详细配置

上一章节&#xff0c;主要讲解了Ubuntu 22.04.4操作系统的安装&#xff0c;但是在实际生产环境中&#xff0c;需要对Ubuntu操作系统初始化&#xff0c;从而提高系统的性能和稳定性。 一、查看Ubuntu系统版本和内核版本 # 查看系统版本 testubuntu:~$ sudo lsb_release -a Rel…

【Linux应用】开发板快速上手:镜像烧录、串口shell、外设挂载、WiFi配置、SSH连接、文件交互(RADXA ZERO 3为例)

【Linux应用】开发板快速上手&#xff1a;镜像烧录、串口shell、外设挂载、WiFi配置、SSH连接、文件交互&#xff08;RADXA ZERO 3为例&#xff09; 参考&#xff1a; ZERO 3 | Radxa Docs 大部分的Linux开发板等设备都大同小异 如树莓派、香橙派、STM32MP135的Linux开发板等 …

Redis使用总结

NoSQL 1.1为什么要用NoSQL 面对现在用户数据的急剧上升&#xff0c;我们需要对这些用户数据进行挖掘&#xff0c;传统的关系型数据库已经不适合这些 应用了.Nosql 的发展可以很了的处理这些大的数据. 1.2什么是NoSQL Not Only Sql->NoSQL(不仅仅是SQL) 非关系型数据库.随…

Unity ML-Agents + VScode 环境搭建 Windows

安装Unity 先去官网下载Unity Hub&#xff0c;然后安装在D盘就可以了&#xff0c;你需要手机上安装一个Unity Connect进行账号注册。 详细的注册可以参考&#xff1a; https://blog.csdn.net/Dugege007/article/details/128472571 注册好了以后登入电脑端的Unity Hub&#x…

Linux电源管理(2)_常规的电源管理的基本概念和软件架构

原文&#xff1a; Linux电源管理(2)_Generic PM之基本概念和软件架构 1. 前言 Linux系统中那些常规的电源管理手段&#xff0c;包括关机&#xff08;Power off&#xff09;、待机&#xff08;Standby or Hibernate&#xff09;、重启&#xff08;Reboot&#xff09;等。这些…

机器学习基础理论 - 分类问题评估指标

几个定义:混淆矩阵 TP: True Positives, 表示实际为正例且被分类器判定为正例的样本数FP: False Positives, 表示实际为负例且被分类器判定为正例的样本数FN: False Negatives, 表示实际为正例但被分类器判定为负例的样本数TN: True Negatives, 表示实际为负例且被分类…

在线教育系统开发常见问题及解决方案:源码部署到运营维护

当下&#xff0c;越来越多的教育机构、企业培训部门以及创业者&#xff0c;选择开发属于自己的在线教育系统。然而&#xff0c;从源码部署到实际运营&#xff0c;整个过程中常常会遇到一系列技术与管理难题。今天&#xff0c;笔者将从在线教育系统源码维护、运营等几个方向为大…

RAG(Retrieval-Augmented Generation,检索增强生成)

RAG&#xff08;Retrieval-Augmented Generation&#xff0c;检索增强生成&#xff09;是一种结合 信息检索 和 文本生成 的技术&#xff0c;旨在提升大语言模型&#xff08;LLM&#xff09;生成内容的准确性和时效性。其核心思想是&#xff1a;先检索相关知识&#xff0c;再基…

项目实战 -- 状态管理

redux基础 还记得好久好久之前就想要实现的一个功能吗&#xff1f; 收起侧边栏折叠菜单&#xff0c;没错&#xff0c;现在才实现 因为不是父子通信&#xff0c;所以处理起来相对麻烦一点 可以使用状态树或者中间人模式 这就需要会redux了 Redux工作流&#xff1a; 异步就…

Go语言之路————指针、结构体、方法

Go语言之路————指针、结构体、方法 前言指针结构体声明初始化使用组合引用结构体和指针结构体的标签 方法例子结合结构体总结 前言 我是一名多年Java开发人员&#xff0c;因为工作需要现在要学习go语言&#xff0c;Go语言之路是一个系列&#xff0c;记录着我从0开始接触Go…

[创业之路-390]:人力资源 - 社会性生命系统的解构与重构:人的角色嬗变与组织进化论

前言&#xff1a; 人、财、物、信息、机制、流程、制度、方法共同组合了一个持续的消耗资源、持续的价值创造、持续面临生存与发展、遗传与变异的社会性生命系统。 "人"是所有社会性生命系统最最基础性的要素&#xff0c;它弥漫在系统中多维立体空间的不同节点上&am…