第三章 随机变量的数字特征

数学期望

 数学期望用来反映平均情况。

定义

 设离散型随机变量X的分布律为P(X=xk)=pk,k=1,2,3...,若级数+k=1xkpk是收敛的,则称级数+k=1xkpk的值为随机变量X的数学期望。记为E(X)。

E(X)=k=1+xkpk

  pk可以理解为加权平均中的权值。数学期望又称为 均值
 设连续型随机变量X的概率密度函数为f(x),如果积分 +xf(x)dx绝对收敛,则称 +xf(x)dx为随机变量X的数学期望。
E(X)=+xf(x)dx

常见随机变量分布的数学期望

 如果X~B(p),E(X)=p
 如果X~B(n,p),E(X)=np
 如果X~P(λ),E(X)=λ
 如果X~Geom(p),E(X)=1p
 
 如果X~U(a,b),E(X)=(a+b)2
 如果X~E(λ),E(X)=1λ
 如果X~N(μ,σ2),E(X)=μ
 

随机变量函数的数学期望

 懒人定理:设Y是随机变量X的函数:Y=g(x)
 X是离散型随机变量,X的分布律为P(X=xk)=pk,k=1,2,3...,若+k=1g(xk)pk收敛,则E(Y)=E(g(X))=+k=1g(xk)pk
 X是连续型随机变量,X的概率密度函数是f(x),若+g(x)f(x)dx绝对收敛,则E(Y)=E(g(X))=+g(x)f(x)dx
 因为有了定理,就不需要先求出g(X)的分布律或者概率密度函数,再计算期望,所以称为懒人定理。
 二元随机变量函数的期望定理:设Z是随机变量X,Y的函数:Z=h(X,Y),
 若二元离散型随机变量(X,Y)的分布律为:P(xi,yj)=pij,i,j=1,2,3...,则有E(Z)=E(h(X,Y))=+i=1+j=1h(xi,yj)pij
 若二元连续型随机变量(X,Y)的概率密度函数为:f(x,y),则有E(Z)=E(h(X,Y))=++h(x,y)f(x,y)dxdy
 特别地,

E(X)=++xf(x,y)dxdy

 
E(Y)=++yf(x,y)dxdy

 

数学期望的性质

  1. c是常数,E(c)=c。
  2. X是一个随机变量,c是常数,则E(cX)=cE(X)。
  3. 设X,Y是两个随机变量,则有E(X+Y)=E(X)+E(Y)。可以拓展到任意有限个随机变量的线性组合:
    E(c0+i=1nciXi)=c0+i=1nciE(Xi)
  4. 设X,Y是相互独立的随机变量,则E(XY)=E(X)E(Y)。可以拓展到任意有限个随机变量乘积的情况:
    E(i=1nXi)=i=1nE(Xi)
    ,其中Xi,i=1,2,3...相互独立。

方差

 方差是用来反映波动性的。

定义

 X是一个随机变量,如果E{(XE(X))2}是存在的,则称E{(XE(X))2}是X的方差。记为D(X)或者Var(X)。D(X)记为σ(x),称为X的标准差或者均方差
 D(X)和σ(x)刻画了X取值的波动性,是衡量X取值分散程度的数字特征。如果D(X)较小,则X取值比较集中。

计算公式

 D(X)=E(X2)E(X)2

常见随机变量分布的方差

 如果X~B(p),D(X)=p(1-p)
 如果X~B(n,p),D(X)=np(1-p)
 如果X~P(λ),D(X)=λ
 如果X~Geom(p),D(X)=1pp2
 
 如果X~U(a,b),D(X)=(ba)212
 如果X~E(λ),D(X)=1λ2
 如果X~N(μ,σ2),E(X)=σ2 

方差的性质

1 设c是常数,则D(c)=0。
2 设X是随机变量,c是常数,则D(cX)=c2D(X)
3 设X,Y是两个随机变量,D(X+Y)=D(X)+D(Y)+2tail,tail=E{(X-E(X))(Y-E(Y))}。特别地,如果X,Y相互独立,则有D(X+Y)=D(X)+D(Y)。推广到任意有限个独立随机变量线性组合:

D(c0+i=1nciXi)=i=1nc2iD(Xi)
,其中 Xi,i=1,2,3...n相互独立。
4 D(X)=0的充要条件是P(X=c)=1,且c=E(X)。

n个正态分布

 n个独立的正态随机变量的线性组合仍然服从正态分布。若Xi~N(μi,σ2i),i=1,2,...n且相互独立,则它们的线性组合c0+c1X1+c2X2+...+cnXn~N(co+c1μ1+c2μ2+...+cnμn,c21σ21+c22σ22+...+c2nσ2n),其中c1,c2...cn是不全为0 的常数。

标准化变量

 设随机变量X具有数学期望E(X)=μ,方差D(X)=σ2,记X=Xμσ。称X是X的标准化变量。
 

协方差与相关系数

来源

 方差定义中,当X,Y不独立时候的tail就是协方差。用来描述两个变量的相关程度。

定义

 数值E{[X-E(X)][Y-E(Y)]}为随机变量X,Y的协方差,记为Cov(X,Y),即

Cov(X,Y)=E[XE(X)][YE(Y)]

 
D(X+Y)=D(X)+D(Y)+2Cov(X,Y)

 Cov(X,Y)反映了X,Y的相关性。
  当Cov(X,Y)>0,X,Y是正相关。
  当Cov(X,Y)<0,X,Y是负相关。
  当Cov(X,Y)=0,X,Y不相关。
 

计算公式

 Cov(X,Y)=E(XY)E(X)E(Y)

协方差的性质

1 Cov(X,Y)=Cov(Y,X)
2 Cov(X,X)=D(X)
3 Cov(aX,bY)=abCov(X,Y)
4 Cov(X1+X2,Y)=Cov(X1,Y)+Cov(X2,Y)

相关系数

来源

 协方差是有量纲的数字特征,为了消除量纲的影响,引入相关系数。

定义

 数值ρXY=Cov(X,Y)D(X)D(Y)称为随机变量X与Y的相关系数。若记标准化变量X=XE(X)D(X)Y=YE(Y)D(Y),则ρXY=XY
 相关系数是衡量X,Y两个随机变量的线性相关关系的。|ρXY|绝对值越大,则X,Y的线性相关性越好。当|ρXY|=1,表明X,Y以概率1存在线性关系;当|ρXY|=0,表明X,Y之间没有线性关系,称为不相关

相关系数的性质

1 |ρXY|1
2 |ρXY|=1存在常数a,b使得P(Y=aX+bY)=1。特别地,ρXY=1b>0ρXY=1b<0

不相关与独立

 不相关是指没有线性关系。独立是指没有任何关系。两个随机变量除了线性关系还可能存在平方关系、平方根关系等其他关系。
 独立=>不相关。反之,则不可以。
 判断两个随机变量是否独立的依据是:f(X,Y)=fX(x)fY(y)
 判断两个随机变量是否线性相关的依据是:Cov(X,Y)=0 或者E(XY)=E(X)E(Y)。
 如果(X,Y)服从二元正态分布N(μ1,μ2,σ21,σ22,ρ),则ρXY=ρ。X,Y相互独立的充要条件是ρ=0。所以对于二元正态变量,相互独立等价于不相关。
 

多元正态分布的性质

 设X为一个随机变量,如果E(Xk)k=1,2...存在,则称之为X的k阶(原点)矩
 设X为一个随机变量,如果E[(XE(X))k)]k=1,2...存在,则称之为X的k阶中心矩
 期望E(X)就是X的1阶原点矩。D(X)是X的2阶中心矩。
 设X,Y是两个随机变量,如果E{XkYl}k,l=1,2...存在,则称之为X与Y的k+l阶混合原点矩
 设X,Y是两个随机变量,如果E[(XE(X))k(YE(Y))l]k,l=1,2...存在,则称之为X与Y的k+l阶混合中心矩
 协方差Cov(X,Y)就是1+1阶混合中心矩。

n元随机变量的期望向量和协方差矩阵

 设n元随机变量X=(X1,X2,...Xn)T,n1,若其每一分量的数学期望都存在,则称E(X)=(E(X1),E(X2),...E(Xn))T,n1为n元随机变量X的数学期望(向量)。
 

n元正态随机变量

这里写图片描述

四条性质

1 任意子向量(Xi1,Xi2,...Xik)T服从k元正态分布。
2 任意线性组合l0+l1X1+L2X2...+lnXnl1,l2...0,服从一元正态分布。
 如果X=(X1,X2,X3)T为三元正态随机变量,则Z1=3X1X2,或者Z2=2X1+4X2+5Z1,Z2都是一元正态 变量。只是在计算Z1,Z2的参数时候与相互独立的三元正态随机变量不同。会利用相关系统计算协方差的值。
 
3 若Y1,Y2,...Yk均为Xi的线性函数, 则(Y1,Y2,...Yk)T也服从k元正态分布。这是正态变量线性变换不变性。
4 若X=(X1,X2,...Xn)T,n1,服从n元正态分布,则X1,X2...Xn相互独立。X的协方差矩阵为对角矩阵。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/news/424992.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

python二进制、字符编码及文件操作

1. 二进制 bin()十进制转二进制 0b oct&#xff08;&#xff09;十进制转八进制 0o hex&#xff08;&#xff09;十进制转十六进制 0x&#xff0c;4个二进制对应1个16进制&#xff0c;用于网络编程&#xff0c;数据存储 print(int(110111,2)) 55 print(int(ffff,16)) 65535 p…

【数据结构与算法】【字符串匹配】Trie树

单模式串匹配 BF 算法和 RK 算法 BM 算法和 KMP 算法多模式串匹配算法 Trie 树和 AC 自动机 一、 什么是“Trie树”&#xff1f; 1. 他是一种树形结构&#xff0c;是一种专门处理字符串匹配的数据结构&#xff0c;解决在一组字符串集合中快速查找某个字符串的问题。 2. Trie…

第十三期:消灭 Java 代码的“坏味道”

代码中的"坏味道"&#xff0c;如"私欲"如"灰尘"&#xff0c;每天都在增加&#xff0c;一日不去清除&#xff0c;便会越累越多。如果用功去清除这些"坏味道"&#xff0c;不仅能提高自己的编码水平&#xff0c;也能使代码变得"精白…

[Leetcode][第100题][JAVA][相同的树][二叉树][深度遍历][递归]

【问题描述】[中等] 【解答思路】 深度遍历/递归 终止条件与返回值&#xff1a; 当两棵树的当前节点都为 null 时返回 true 当其中一个为 null 另一个不为 null 时返回 false 当两个都不为空但是值不相等时&#xff0c;返回 false 执行过程&#xff1a;当满足终止条件时进…

第十四期:5 个 JS 不良编码习惯,你占几个呢?

在阅读JavaScript代码时&#xff0c;你是否有过这种感觉&#xff1a;你几乎不明白代码的作用&#xff1f;代码使用了很多 JavaScript 技巧&#xff1f;命名和编码风格太过随意&#xff1f; 这些都是不良编码习惯的征兆。 在阅读JavaScript代码时&#xff0c;你是否有过这种感觉…

第十五期:详解Java集合框架,让你全面掌握!

一、Java集合框架概述 集合可以看作是一种容器&#xff0c;用来存储对象信息。所有集合类都位于java.util包下&#xff0c;但支持多线程的集合类位于java.util.concurrent包下。 数组与集合的区别如下&#xff1a; 1&#xff09;数组长度不可变化而且无法保存具有映射关系的…

[Leetcode][第98 450 700 701题][JAVA][二叉搜索树的合法性、增、删、查][递归][深度遍历]

【二叉搜索树定义】&#xff08;BST&#xff09; 二叉搜索树&#xff08;Binary Search Tree&#xff0c;简称 BST&#xff09;是一种很常用的的二叉树。它的定义是&#xff1a;一个二叉树中&#xff0c;任意节点的值要大于等于左子树所有节点的值&#xff0c;且要小于等于右边…

关于CNN的权重共享,CNN到底学到了什么?

CNN的fliter里的每个值都是学习出来的不是事先设定好的。 经过fliter处理后得到是特征图(feature map) 卷积减少权重参数的本质&#xff1a; 权重共享&#xff0c;不同的fliter会在某些神经元上权重共享。 到底fliter&#xff0c;到底CNN学到了什么&#xff1f; 底层的flite…

复盘二进制的习题(1)

本文是对近期二进制专题的leetcde习题的复盘。文中的解决思路来源于leetcode的讨论&#xff0c;以及一些网页。 342 判断一个整数(32bits)是否是4的次幂。  写出4i,i0,1,2,3,4...的二进制表示&#xff0c;查找规律。会发现这些数的特征是 a 都>0&#xff1b;b 只有一位是…

第十六期:简单的介绍一下大数据中最重要的MapReduce

MapReduce是分布式运行的&#xff0c;由两个阶段组成&#xff1a;Map和Reduce&#xff0c;Map阶段是一个独立的程序&#xff0c;有很多个节点同时运行&#xff0c;每个节点处理一部分数据。 MapReduce执行流程图 概述 MapReduce是一种分布式计算模型&#xff0c;由Google提出…

【数据结构与算法】快排、归并 O(nlogn) 基于比较

冒泡、插入、选择 O(n^2) 基于比较 快排、归并 O(nlogn) 基于比较 计数、基数、桶 O(n) 不基于比较 一、分治思想 1.分治思想&#xff1a;分治&#xff0c;顾明思意&#xff0c;就是分而治之&#xff0c;将一个大问题分解成小的子问题来解决&#xff0c;小的子问题解决了&…

第四章切比雪夫不等式、大数定理、中心极限定理

切比雪夫不等式 设随机变量X具有数学期望E(X)μ&#xff0c;方差D(X)σ2&#xff0c;对于任意ε>0&#xff0c;都有P{|X−μ|≥ε}≤σ2ε2方差越大&#xff0c;X落在区间外的概率越大&#xff0c;X的波动也就越大&#xff0c;与方差的意义统一了。等价公式P{|X−μ|<ε}…

第十七期:记一次生产环境SQL Server服务器卡顿问题解决--内存分配不当

概述 最近有台数据库做了迁移&#xff0c;然后运维人员过了一段时间发现这台服务器非常卡&#xff0c;连远程登录都要很久&#xff0c;下面记录下其中的解决过程。 1、查看资源情况 可以发现内存爆满了&#xff0c;而排名第一的正是sqlserver的进程 2、查看sqlserver内存分配…

leetcode 42 接雨水 单调栈

接雨水 给定 n 个非负整数表示每个宽度为 1 的柱子的高度图&#xff0c;计算按此排列的柱子&#xff0c;下雨之后能接多少雨水。 上面是由数组 [0,1,0,2,1,0,1,3,2,1,2,1] 表示的高度图&#xff0c;在这种情况下&#xff0c;可以接 6 个单位的雨水&#xff08;蓝色部分表示雨水…

第十八期:网页禁止复制粘贴怎么办?教你六招轻松搞定

经常在网上遇到一些无法复制的文章&#xff0c;那么问题来了&#xff0c;有什么办法可以绕开这种限制&#xff0c;将网页内容轻松下载回来呢&#xff1f; 经常在网上遇到一些无法复制的文章&#xff0c;那么问题来了&#xff0c;有什么办法可以绕开这种限制&#xff0c;将网页内…

[Leetcode][第99题][JAVA][恢复二叉搜索树][中序遍历]

【问题描述】[困难] 【解答思路】 1. 显示中序遍历 时间复杂度&#xff1a;O(N) 空间复杂度&#xff1a;O(N) class Solution {public void recoverTree(TreeNode root) {List<Integer> nums new ArrayList<Integer>();inorder(root, nums);int[] swapped find…

第四十一期:深度解析5G核心网建设难点和挑战

目前核心网处于架构转型和业务转型的关键期。在架构层面&#xff0c;NFV、CU分离、边缘计算等技术的成熟推动核心网络架构转型&#xff0c;控制面进一步集中&#xff0c;转发面进一步下沉。 目前核心网处于架构转型和业务转型的关键期。在架构层面&#xff0c;NFV、CU分离、边缘…

[Leetcode][第696题][JAVA][计算二进制子串][分组]

【问题描述】[简单] 【解答思路】 1. 按字符分组 将字符串 ss 按照 00 和 11 的连续段分组&#xff0c;存在counts 数组中&#xff0c;例如 s 00111011&#xff0c;可以得到这样的counts 数组&#xff1a;counts{2,3,1,2}。 这里counts 数组中两个相邻的数一定代表的是两种…

Scrapy安装报错

python3 pip 安装Scrapy在win10 安装报错error: Microsoft Visual C 14.0 is required. Get it with "Microsoft Visual C Build Tools": http://landinghub.visualstudio.com/visual-cpp-build-tools 问题描述 当前环境win10&#xff0c;python_3.6.1&#xff0c;64…

第四十三期:2020年企业面临的20大数据安全风险

为了帮助企业为日益增长的确定性风险做好准备&#xff0c;以下我们总结了企业2020年可能面临的20种数据安全风险。 如今&#xff0c;数据安全已成为公司、消费者和监管机构的头等大事。 近年来数据泄露和隐私事故越来越普遍&#xff0c;而且代价高昂。Risk Based Security的一…