概率论与贝叶斯先验

文章目录

  • 概率论与贝叶斯先验
    • 概率论基础
      • 问题代码
      • 图像
        • 本福特定律
          • 应用:公路堵车模型
            • 代码模型
            • 初速不同:影响不大
            • 减速概率:影响大
          • 应用:商品推荐
            • 解答
      • 概率公式
        • 应用
        • 样本贝叶斯公式
      • 分布
        • 两点分布
        • 二项分布
        • 泊松分布
          • 期望和方差表示强度应用
        • 均匀分布
        • 指数分布
          • 无记忆性
          • 半记忆性
        • 正态分布
          • EX
          • DX
          • 代码
          • 图像
        • Beta分布
          • 期望
          • 图像
        • 指数族
          • 伯努利分布应用
            • 参数Logistic方程
        • 作用:分类需要假定模型
          • 得到似然函数
      • 事件独立性
    • 统计量
      • 期望
        • 性质
        • 应用
          • 答案
          • 代码
          • 进一步思考
        • 应用2
      • 方差
        • 性质
          • 应用
          • 切尔雪夫不等式
            • 应用
      • 协方差
        • 意义
          • 协方差上界
            • 上界证明
        • 协方差矩阵
      • 相关系数为0不相关
        • 代码
        • 一次
        • 二次
        • 正切
        • 二次函数
        • 椭圆
    • 大数定律
      • 意义
      • 推论
        • 引用
    • 中心极限定理
      • 意义
      • 应用

概率论与贝叶斯先验

概率论基础

统计数字的概率
给定某正整数N,统计从1到N!的所有数中,首位数字出现1的概率。
进而,可以计算首位数字是2的概率,是3的概率,从而得到一条“九点分布

问题代码

def first_digital(x):while x>=10:x/=10return x
if _name_=="_main_":n=1frequency=[0]*9//造一个数据for i in range(1,1000):n*=im=first_digital(n)-1frequency[m]+=1print frequencyplt.plot(frequency,'r-',linewidth=2)plt.plot(frequency,'go',makersize=8)			plt.grid(True)plt.show

在这里插入图片描述

图像

在这里插入图片描述

本福特定律

在这里插入图片描述

应用:公路堵车模型

路面上有N辆车,以不同速度向前行驶,模拟堵车问题。有以下假设:

  1. 假设某辆车当前速度是v
  2. 若前方可见范围没车,则它下一秒车速提升至v+1,直到达到最高的规定速度。
  3. 若前方有车,前方车的距离为d,且d<v,则它下一秒车速降至d-1
  4. 每辆车会议随机概率减速v-1
代码模型
path=5000       #环形公路长度
n=100           #公路中的车辆数目
v0=5            #车辆初始速度
p=0.3           #随机减速概率
Times=3000
np.random.send(0)
x=xp.random.rand(n)*path
x.sort()
v=np.title([v0],n).astype(np.float)plt.figure(figize=(10,8),facecolor
for t in range(Times):plt.scatter(x,[t])*n,s=1,c='k',for i in range(n):if x[(i+1)%n]>x[i]:d=x[(i+1)%n]-x[i]else:d=path-x[i]+x[(i+1)if v[i]<d:if np.random.rand()>p:v[i]+=1else:v[i]-=1else:v[i]=d-1v=v.clip(0,150)x+=vclip(x,path)
plt.xlim(0,path)
plt.ylim(0,path)
plt.xlabel(u'车辆位置',fontsize=16)	
plt.ylabel(u'模拟时间',fontsize=16)		
plt.title(u'环形公路车辆模拟',fontsize=16)
plt.tight_layout(pad=2)	
plt.show()						

在这里插入图片描述
其中c,python随机是伪随机

初速不同:影响不大

在这里插入图片描述

减速概率:影响大

在这里插入图片描述

应用:商品推荐
  1. 商品推荐场景中过于聚焦的商品推荐往往会损害用户的购物体验,在有些场景中,系统会通过一定程度的随机性给用户带来发现的惊喜感
  2. 假设某推荐场景中,经计算A和B两个商品与当前访问用户匹配度分别为0.8分和0.2分,系统将随机为A生成一个均匀分布于0和0.8的最终评分,为B生成一个均匀分布于0和0.2最终评分,并计算最终B分数大于A分数概率
解答

A=B直线上方区域即为B>A情况在这里插入图片描述

概率公式

条件概率
在这里插入图片描述
全概率公式
在这里插入图片描述
贝叶斯公式
在这里插入图片描述
在这里插入图片描述

应用

在这里插入图片描述

样本贝叶斯公式

在这里插入图片描述

分布

两点分布

在这里插入图片描述

二项分布

在这里插入图片描述在这里插入图片描述

泊松分布

推导
在这里插入图片描述
期望和方差
在这里插入图片描述
在这里插入图片描述

期望和方差表示强度应用

在这里插入图片描述

均匀分布

在这里插入图片描述

指数分布

在这里插入图片描述
分部积分法 中间减在这里插入图片描述

无记忆性

在这里插入图片描述

半记忆性

马尔可夫模型

正态分布

在这里插入图片描述

EX

在这里插入图片描述

DX

在这里插入图片描述

代码
import...
mp1.rcParams['axes.unicode_minus']=False
mp1.rcParams['font.sans-serif']='SimMEI'if __name__='__main__':x1,x2=np.mgrid[-5:-5:51j,-5:-5:51j]x=np.stack((x1,x2),axis=2)plt.figure(figsize=(9,8),facecolar='w')sigma=(np.identity(2,np.diag((3,3)),np.diag((2,5)),np.array(((2,1),(2,5)))for i in np.arrange(4):ax=plt.subplot(2,2,i+1,projection='3d')norm=states.multivariate_normal((0,0),sigma[i])y=norm.pdf(x)ax.plot_surface(x1,x2,y,cmap=cm.Accent,rstride=4,cstride=4,alpha=0.9,lw=0.3)ax.set_xlabel(u'X')ax.set_ylabel(u'Y')ax.set_zlabel(u'Z')plt.suptitle(u'二元高斯分布方差比较',fontsize=18)plt.tight_layout(1.5)plt.show()	
图像

在这里插入图片描述
在这里插入图片描述
方差大,半轴长
在这里插入图片描述
斜的
在这里插入图片描述

Beta分布

在这里插入图片描述
推导过程
在这里插入图片描述

期望

在这里插入图片描述

图像

在这里插入图片描述

指数族

在这里插入图片描述
指数族分布:一个峰可能是指数族:高斯分布
在这里插入图片描述
多个峰一定不是指数族分布

伯努利分布应用

在这里插入图片描述
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述
推导参数Logistic方程

参数Logistic方程

在这里插入图片描述

在这里插入图片描述
在这里插入图片描述

作用:分类需要假定模型

在这里插入图片描述

得到似然函数

事件独立性

给定A和B事件,若有P(AB)=P(A)P(B) 则称事件A和B相互独立
说明
A和B独立,则P(A|B)=P(A)
实践中往往根据两个事件是否互相影响而判断独立性,如给定M个样品,若干次采样等情形,往往假设他们相互独立
思考:给出A,B相互包容的信息量的定义I(A,B)要求:如果A,B独立,则I(A,B)=0
在这里插入图片描述

统计量

期望

离散型在这里插入图片描述
连续型在这里插入图片描述
概率加权下“平均值”

性质

无条件成立
E(kX)=kE(X)
E(X+Y)=E(x)+E(Y)
若X和Y相互独立
E(XY)=E(X)E(Y)
反之不成立。事实上,若E(XY)=E(X)E(Y),只能说明X和Y不相关

应用

从1,2,3……98,99,2015这100个数中任意选择若干个数(可能为0个数)求异或,是求异或期望值

答案

在这里插入图片描述
首先我们来分析 2015这个值,

在1,2,3,…,98,99这99个数中任意选择若干个数的选法一共有在这里插入图片描述种,

而在1,2,3,…,98,99,2015这100个数中任意选择若干个数的选法一共有在这里插入图片描述

种,

因此在全部的选法中,出现2015的概率为(2100-299)/2^100=0.5
分析1~99 和2015这些数的特点

(2015) = 111 1101 1111

(99) = 000 0110 0011

我们发现:前4位取0或1,完全是由2015这个数决定的。

因此,设,每一位的取值用Xi表示

前4位 中每一位 P(Xi = 1)= P(出现2015)= 1/2
分析除前四位的其他位
设第 i 位共有n个1,m个0
采样取到1的个数为K
在这里插入图片描述
因为,一列数据求异或时,0其实不起作用的,主要还是看1的个数,偶数个1 异或记过为0,基数个1 异或为结果为1.
在这里插入图片描述

代码

在这里插入图片描述

进一步思考

在这里插入图片描述

应用2

在这里插入图片描述
在这里插入图片描述

方差

在这里插入图片描述

性质

在这里插入图片描述

应用

在这里插入图片描述
在这里插入图片描述

切尔雪夫不等式

在这里插入图片描述

应用

在这里插入图片描述
在这里插入图片描述

协方差

在这里插入图片描述
独立,协方差为0
协方差为0,不相关, 不一定独立,线性独立

意义

协方差是两个随机变量具有相同方向变化趋势的度量
若Cov(X,Y)>0,他们变化趋势相同
若Cov(X,Y)<0,他们变化趋势相反
若Cov(X,Y)=0,称x和y不相关

协方差上界

在这里插入图片描述

上界证明

在这里插入图片描述

协方差矩阵

在这里插入图片描述

相关系数为0不相关

在这里插入图片描述

代码

def calc_pearson(x,y):std1=np.std(x)std2=np.std(x)cov=np.cov(x,y,bias=True)[0,1]return cov/(std1*std2)
def pearson(x,y,tip):clrs=list('rgbmyc')plt.figure(figsize=(10,8),facecolor='w')for i,theta in enumerate(np.linspace(0,90,6)):xr,yr=rotate(x,y,theta)p=states.pearson(xr,yr)[0]print'旋转角度:',theta,'Pearson相关系数:',pstr=u'相关系数:%.3f'%pplt.scatter(xr,yr,s=40,alpha=0.9,lineswidth=0.5,c=clr)plt.legend(loc='upper left',shadow=True)plt.xlabel(u'x')	plt.ylabel(u'y')plt.title(u'Pearson相关系数与数据分布:%s'% tip,fontsize=18)plt.grid(b=True)plt.show()

一次

tip=u'一次函数关系'
x=np.random.rand(N)
y=np.zero(N)+np.random.randn(N)*0.001

在这里插入图片描述

二次

tip=u'二次函数关系'
x=np.random.rand(N)
y=x**2

在这里插入图片描述

正切

tip=u'正切关系'
x=np.random.rand(N)*1.4
y=np.tan(x)

在这里插入图片描述

二次函数

tip=u'二次函数关系'
x=np.linspace(-1,1,101)
y=x**2

在这里插入图片描述

椭圆

tip=u'椭圆'
x,y=np.random.rand(2,N)*60-30
y/=5
idx=(x**2/900+y**2/36<1)
x=x[idx]
y=y[idx]

在这里插入图片描述

大数定律

在这里插入图片描述

意义

在这里插入图片描述

推论

一次实验中事件A发生概率为p;重复n次独立实验中
事件A发生了nA次,则p,n,nA关系满足
在这里插入图片描述

引用

上述事件为我们实际应用中用频率来估计概率提供一个理论依据
正态分布的参数估计
朴素贝叶斯做垃圾邮件分类
隐性马尔可夫模型做有监督学习

中心极限定理

在这里插入图片描述

意义

实际问题中,很多随机现象可以看作许多因素的独立影响 综合反应,很多近似服从正态分布
城市耗电量:大量用户的耗电量综合
测量误差:许多观察不到微小的变化
注意:多个随机变量的和才可以,有些问题乘性误差,则需要鉴别或者取对数后才可以使用
线性回归中,使用该理论论证最小二乘法

应用

在这里插入图片描述
在这里插入图片描述
在这里插入图片描述

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/news/467822.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

vue项目导入外部css样式和js文件

转自&#xff1a;http://blog.csdn.net/xiejunna/article/details/54943957 css文件放入static文件夹下。 转载于:https://www.cnblogs.com/ourLifes/p/7444074.html

Linux内核0.12完全注释

推荐一本书 Linux 0.12内核完全注释 先把麻雀解剖了&#xff0c;再去研究老鹰和飞机可能会更好。现在市面的很多书籍都是基于比较新的内核讲解的&#xff0c;2.6的内核或者4.4的内核&#xff0c;因为内核版本越高&#xff0c;里面的东西就越多&#xff0c;想要讲解明白就需要花…

矩阵和线性代数

文章目录矩阵和线性代数矩阵SVD提法举例推导代码分解效果方阵行列式范德蒙行列式作用代数余子式伴随矩阵方阵的逆矩阵乘法模型举例概率转移矩阵平稳分布&#xff1a;向量乘法矩阵的秩秩与方程组的解推论向量组等价系数矩阵对CAB重认识正交阵特征值和特征向量性质不同特征值对应…

对比一段ADC键值读取的代码

最近接触到的一个代码&#xff0c;这个代码看起来很简单&#xff0c;但是却蕴藏了人类的智慧与结晶。正是这些不断产生的智慧与结晶&#xff0c;让我们的电子产品越来越稳定&#xff0c;越来越智能。周五了&#xff0c;评论文章&#xff0c;选两个同学赠送书籍《Linux内核完全剖…

HTML5权威指南 11.通信API

1 <!DOCTYPE html>2 <html>3 4 <head>5 <meta charset"UTF-8">6 <title></title>7 <script type"text/javascript">8 //&#xff08;1&#xff09;监听message事件9 window.addEve…

在线登记系统代码 php_PHP框架实现WebSocket在线聊天通讯系统

ThinkPHP使用Swoole需要安装think-swooleComposer包&#xff0c;前提系统已经安装好了SwoolePECL拓展tp5的项目根目录下执行composer命令安装think-swoole&#xff1a;composerrequiretopthink/think-swoole话不多说&#xff0c;直接上代码&#xff1a;新建WebSocket.php控制器…

机器学习数据包之numpy

numpy 属性 import numpy as np#矩阵运算arraynp.array([[1,2,3],[2,3,4]])print (array)[[1 2 3][2 3 4]]维度 print(number of dim,array.ndim)number of dim 2形状 print(shape,array.shape)shape (2, 3)大小 print(size,array.size)size 6创建 创建类型 anp.array([…

RK 利用SARADC 来做多个按键

#DTS配置#配置DTS节点#驱动文件中匹配 DTS 节点#驱动说明#获取ADC通道#获取ADC值#计算采集到的电压#接口说明#调试方法#节点ADC值RK3399开发板上的 AD 接口有两种&#xff0c;分别为&#xff1a;温度传感器 (Temperature Sensor)、逐次逼近ADC (Successive Approximation Regis…

概率论之pandas

快速入门 1 import numpy as npspd.series([1,3,5,np.nan,8,4])Series spd.Series([1,3,5,np.nan,8,4])sOut[6]: 0 1.01 3.02 5.03 NaN4 8.05 4.0dtype: float64date_range datespd.date_range(20190301,periods6)datesOut[10]: DatetimeIndex([2019-03-…

学习,一定是脱“贫”致富的捷径

周末加班&#xff0c;加班后觉得有点无聊&#xff0c;到公司阳台坐了坐&#xff0c;想到最近的工作和生活&#xff0c;也理了理最近的状态&#xff0c;然后分享了一段话在知识星球里。如下:我平时很少静下来想东西&#xff0c;其中一个原因是因为我害怕安静&#xff0c;晚上睡觉…

人应该活成什么样子?该以什么方式活着?

“您幸福吗&#xff1f;”“我是外地打工的&#xff0c;不要问我。”“您幸福吗&#xff1f;”“我姓曾。”相信大家还记得这段央视走基层采访的经典问答。“幸福是什么”是一个人类社会中被广泛讨论的话题&#xff0c;人要怎么生活才能获得幸福&#xff0c;一直是众生要追寻的…

MIPI白皮书

#mipi 5G中优势#5G手机中的mipi#mipi#背景2020年 是5G元年&#xff0c;很多行业因5g重新定义。显示行业也不例外&#xff0c;针对5G&#xff0c;mipi联盟发表了对应的白皮书 描述了现有的MIPI规范如何能够支持第一代5G智能手机以及其他新兴的5G移动平台&#xff0c;包括互联/自…

redis rdb aof区别_Redis 持久化之 RDB 与 AOF 详解

走过路过不要错过点击蓝字关注我们文章出处&#xff1a;https://www.cnblogs.com/jojop/p/13941195.htmlRedis 持久化我们知道Redis的数据是全部存储在内存中的&#xff0c;如果机器突然GG&#xff0c;那么数据就会全部丢失&#xff0c;因此需要有持久化机制来保证数据不会因为…

块设备驱动初探

前言研究IO也很久了&#xff0c;一直无法串联bio和块设备驱动&#xff0c;只知道bio经过IO调度算法传递到块设备驱动&#xff0c;怎么过去的&#xff0c;IO调度算法在哪里发挥作用&#xff0c;一直没有完全搞明白&#xff0c;查看了很多资料&#xff0c;终于对块设备驱动有所理…

Linux 块设备,Block Layer层架构演变

前言Block Layer层在整个I/O中负责承上启下&#xff0c;上接文件系统&#xff0c;下接块驱动。我不想直接讨论代码&#xff0c;希望从一个架构的演变来初探一下Block Layer层。一、1.0版本首先我们来了解几个重要的数据结构1.1 biobio代表了一次I/0请求&#xff0c;代表一个块设…

matalotlib(2)

文章目录注释文字Tex公式区域填充极坐标注释 import matplotlib.pyplot as plt import numpy as np xnp.arange(-10,11,1) yx*x plt.plot(x,y)plt.annotate(this is the bottom,xy(0,1),xytext(0,20),arrowpropsdict(facecolorr,frac0.2)) plt.show()文字 import matplotlib…

去华为吗?

昨晚的这条朋友圈很多人给我回复&#xff0c;支持去华为的人很多&#xff0c;但是也有几个反对的&#xff0c;一个说&#xff0c;怕是有命赚钱&#xff0c;没命花钱吧。还有一个说&#xff0c;自己拿到了华为offer&#xff0c;但是拒绝了&#xff0c;去了一个做开关电源的公司做…

实例

文章目录函数积分图散点条形图球员能力值函数积分图 import matplotlib.pyplot as plt import numpy as np from matplotlib.pyplot import Polygon def func(x):return -(x-2)*(x-8)40 xnp.linspace(0,10) yfunc(x) axplt.subplot() plt.plot(x,y,r,linewidth2)a2 b9 ax.set_…

闲来无事,拆个示波器玩玩。

首先要解释一下何为混合域示波器&#xff0c;既然说到这个话题就不得不说一下示波器进化史了&#xff0c;接下来大概讲一下示波器进化简史。第一代示波器——模拟示波器(ART-analog real time oscilloscope )纯模拟机器&#xff0c;使用示波管显示X-Y扫描成像显示波形&#xff…

机器算法1)

SKLEARN Scikit-learn与特征工程 “数据决定了机器学习的上限&#xff0c;而算法只是尽可能逼近这个上限”&#xff0c;这句话很好的阐述了数据在机器学习中的重要性。大部分直接拿过来的数据都是特征不明显的、没有经过处理的或者说是存在很多无用的数据&#xff0c;那么需要…