超几何分布_常见概率分布

离散分布

退化分布

若r.v.  只取常数值c,即  ,这时分布函数为:  

把这种分布称为退化分布或者单点分布

伯努利分布

在一次实验中,事件A出现的概率为  ,不出现的概率为  ,若用  记事件A出现的次数,则  仅取值0或1,相应的概率分布为

这个分布称为伯努利分布,也叫两点分布

from IPython.core.pylabtools import figsize
import numpy as np
import scipy.stats as stats
from matplotlib import pyplot as plt
import warnings
warnings.filterwarnings("ignore")
%matplotlib inline

X = np.arange(0, 2,1)
p = 0.2 
pList = stats.bernoulli.pmf(X, p)
plt.plot(X, pList, marker='o',linestyle='None')
plt.vlines(X, 0, pList)
plt.xlabel('$k$')
plt.ylabel('$P(X = k)$')
plt.title('$P=%.2f$' % p)
plt.show()

2242f91c1899742d89e93a927b83e615.png

二项分布

  • N:实验次数或潜在事件发生数的一个正整数

  • P:在一次实验中一种事件发生的概率

figsize(12.5, 4)
binomial = stats.binom
parameters = [(10, .4), (10, .9)]

for i in range(2):
    N, p = parameters[i]
    _x = np.arange(N + 1)
    plt.bar(_x - 0.5, binomial.pmf(_x, N, p),alpha=0.6,
            label="$N$: {}, $p$: {:.1f}" .format(N, p),
            linewidth=3)

plt.legend(loc="upper left")
plt.xlim(0, 10.5)
plt.xlabel("$k$")
plt.ylabel("$P(X = k)$")
Text(0, 0.5, '$P(X = k)$')

13c4065c4536c8478573fdc9fc281e36.png

超几何分布

对某批N 件产品进行不放回抽样检查,若这
批产品中有M件次品,现从整批产品中随机抽出
n件产品,则在
这n件产品中出现的次品数x是随机变量,它取值0,1, 2,..
n,其概率分布为超几何分布.

# 超几何分布 hypergeometric(ngood, nbad, nsample, size=None) 好的总数、坏的总数、每次采样数、试验次数

s = np.random.hypergeometric(10,20,5,size=1000000)
p = sum(s>=4)/1000000.
fig = plt.figure(figsize=(8,6))
a1 = fig.add_subplot(2,2,1)
a1.hist(s ,bins=20,color='b',alpha=0.3)
plt.show()

1d2fbb603b6b0e83048774b4655ff238.png

Poisson分布

若事件流具有平稳性、无后效性、普通性,则称该事件流为泊松事件流(泊松流)。

  • 平稳性:在任意时间区间内,事件发生k次(k≥0)的概率只依赖于区间长度而与区间端点无关.

  • 无后效性:在不相重叠的时间段内,事件的发生是相互独立的.

  • 普通性:如果时间区间充分小,事件出现两次或两次以上的概率可忽略不计.

  • λ为任意正数,被称为Poisson分布的强度。λ越大,得到大值的概率越大;λ越小,得到小值的概率越大。

  • k为任意非负整数,即k必须为0、1、2之类的值。

Poisson分布的重要性质是:它的期望值和方差值都等于它的参数  

figsize(12.5, 4)

lams = [1,5,10]
for i in lams:
    plt.scatter(np.arange(20),stats.poisson.pmf(np.arange(20), mu=i),s=100,label='lam={}'.format(i))
    plt.plot(np.arange(20),stats.poisson.pmf(np.arange(20), mu=i))

plt.legend()
<matplotlib.legend.Legend at 0x277b1ad2f28>

aeb1e998ac79ccc0b76886a5f1310550.png

几何分布

在事件A发生的概率为p的伯努利试验中,若
以η记A首次出现时的试验次数,则η为随机变量,它可能取的
值为1,2,3,…其概率分布为几何分布:

 η 

k = 5  
p = 0.6
X = np.arange(1, k+1,1)
pList = stats.geom.pmf(X,p)
plt.vlines(X, 0, pList,colors='r')
plt.xlabel('$k$')
plt.ylabel('$p\{X=k\}$')
plt.title('p=%.2f' % p)
plt.show()

f16c97ab67139d91015478511b11788a.png

帕斯卡分布

在伯努利试验中,若以ζ记第r次成
功出现时的试验次数,则ζ是随机变量,取值r,r+l, .其概率
分布为帕斯卡分布: ζ 

负二项分布

对巴斯卡分布,可以略加推广,即去掉r是正整数的限制,这
便得到负二项分布
对于任意实数r>0,称

  
为负二项分布。

可证  

fig, ax = plt.subplots(1, 1)
n, p = 0.4, 0.4
mean, var, skew, kurt = stats.nbinom.stats(n, p, moments='mvsk')
x = np.arange(stats.nbinom.ppf(0.01, n, p),
              stats.nbinom.ppf(0.99, n, p))
ax.plot(x, stats.nbinom.pmf(x, n, p), 'bo', ms=8, label='nbinom pmf')
ax.vlines(x, 0, stats.nbinom.pmf(x, n, p), colors='b', lw=5, alpha=0.5)
rv = stats.nbinom(n, p)
ax.vlines(x, 0, rv.pmf(x), colors='k', linestyles='-', lw=1,
        label='frozen pmf')
ax.legend(loc='best', frameon=False)
plt.show()

4ee7af8649499d2157255c6606f5b08d.png

连续分布

均匀分布

若a,b为有限数,由下列密度函数定义的分布
称为[a, b].上均匀分布:

 或 

plt.plot(np.linspace(-4,4,100),stats.uniform.pdf(np.linspace(-4,4,100)))
plt.fill_between(np.linspace(-4,4,100),stats.uniform.pdf(np.linspace(-4,4,100)),alpha=0.15)
plt.plot(np.linspace(-4,4,100),stats.uniform.cdf(np.linspace(-4,4,100)))
plt.text(x=-1.5,y=0.7,s="pdf(uniform)",rotation=65,alpha=0.75,weight="bold",color="b")
plt.text(x=-0.4,y=0.5,s="cdf",rotation=55,alpha=0.75,weight="bold",color="r")
Text(-0.4, 0.5, 'cdf')

46a16f73b4df8825c80d293238c4d696.png

正态分布

一个正态分布用X~N(μ,1/τ)表示,它带有两个参数:均值μ和精准度τ。这里用1/τ代替了σ2,主要是因为这样能简化数据分析。记住:τ越小,分布越宽(即我们越不能确定);τ越大,分布越窄(即我们越能确定)。不管怎么样,τ永远为正数。

一个服从N(μ,1/τ)的随机变量的概率密度函数如下:

# 展示正态分布的不同密度函数
figsize(12.5, 4)

nor = stats.norm
x = np.linspace(-8, 7, 150)
mu = (-2, 0, 3)
tau = (.7, 1, 2.8)

parameters = zip(mu, tau)

for _mu, _tau in parameters:
    plt.plot(x, nor.pdf(x, _mu, scale=1./_tau),
             label="$\mu = {},\;\\tau = {:.1f}$".format(_mu, _tau))
    plt.fill_between(x, nor.pdf(x, _mu, scale=1./_tau),alpha=.33)

plt.legend(loc="upper right")
<matplotlib.legend.Legend at 0x277b3db7748>

b895a769bc272fe4a2d006c9ba53f0f3.png

指数分布

指数可以取任意非负值,包括非整数

对指定的参数λ,指数型随机变量的期望值为λ的逆                              

a = np.linspace(0, 4, 100)
expo = stats.expon
lambda_ = [0.2,0.5, 1]

for l in lambda_:
    plt.plot(a, expo.pdf(a, scale=1./l), lw=3, label="$\lambda = {:.1f}$".format(l))
    plt.fill_between(a, expo.pdf(a, scale=1./l),alpha=.33)

plt.legend()
plt.ylabel("PDF at $z$")
plt.xlabel("$z$")
plt.ylim(0,1.2)
(0.0, 1.2)

76915d7e1b7008e1471ad273247fed17.png

gamma = stats.gamma

fig, ax = plt.subplots(1, 1)
a = 1.99
mean, var, skew, kurt = gamma.stats(a, moments='mvsk')
x = np.linspace(gamma.ppf(0.01, a),
                gamma.ppf(0.99, a), 100)
ax.plot(x, gamma.pdf(x, a),
       'r-', lw=5, alpha=0.6, label='gamma pdf')
rv = gamma(a)
ax.plot(x, rv.pdf(x), 'k-', lw=2, label='frozen pdf')
r = gamma.rvs(a, size=1000)
ax.hist(r, density=True, histtype='stepfilled', alpha=0.2)
ax.legend(loc='best', frameon=False)
plt.show()

2157d045736431b36f50601d6de6f41b.png

Gamma分布

指数分布解决的问题是“要等到一个随机事件发生,需要经历多久时间”,伽玛分布解决的问题是“要等到n个随机事件都发生,需要经历多久时间”。所以,伽玛分布可以看作是n个指数分布的独立随机变量的加总。

figsize(12.5, 5)
parameters = [(1, 0.5), (9, 2), (3, 0.5), (7, 0.5)]
x = np.linspace(0.001 ,20, 150)
for alpha, beta in parameters:
    y = gamma.pdf(x, alpha, scale=1./beta)
    lines = plt.plot(x, y, label = "({:.1f},{:.1f})".format(alpha,beta), lw = 3)
    plt.fill_between(x, 0, y, alpha = 0.2, color = lines[0].get_color())
    plt.autoscale(tight=True)

plt.legend(title=r"$\alpha, \beta$ - parameters")
<matplotlib.legend.Legend at 0x277b3c247b8>

0563e640886178ad59b5307984d83174.png

Beta分布

Beta分布的密度函数为:  

figsize(12.5, 4)

datas = np.linspace(0, 1, 200)
plt.fill_between(datas,stats.beta.pdf(datas, a=5, b=10),hatch="+")
plt.fill_between(datas,stats.beta.pdf(datas, a=100, b=20),hatch="//")
plt.fill_between(datas,stats.beta.pdf(datas, a=20, b=60),hatch="*")
<matplotlib.collections.PolyCollection at 0x277b4184710>

0aa11fa4f1a2504994a35b499e0192a8.png

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/news/431658.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

struts学习

Structs2配置文件概述&#xff1a; <constant name"" value""></constant>详解&#xff1a;&#xff08;两个看不见的value都是设置true/false&#xff09; package的相关使用&#xff1a; &#xff08;name是包名。action相当于以前的servl…

里怎么做页眉页脚_这年头县城里在家做的电商利润怎么样

这年头县城里在家做的电商利润怎么样 mcfg6ek这年头县城里在家做的电商利润怎么样 通过上面的信息大家是否已经对多用户商城有什么优势有所了解了呢&#xff0c;如果还想了解更多多用户商城的信息&#xff0c;站进行查看咨询哦。店系统怎么进行推广。店系统的推广方式介绍我们都…

计算机如果算积分排名,超级电脑预测英超积分榜:蓝军守住第4 曼联无缘欧冠...

还有6天的时间&#xff0c;2019-20赛季的英超联赛就要重启了。虽然冠军的悬念已经不大&#xff0c;但欧冠席位以及降级名额仍有很大的变数&#xff0c;这让外界仍无比期待接下来的比赛。今日&#xff0c;超级计算机对剩余的比赛做了预测&#xff0c;并算出了最终的积分榜&#…

环形队列出队的元素怎么输出出来_队列:队列在线程池等有限资源池中的应用...

我们知道&#xff0c;CPU资源是有限的&#xff0c;任务的处理速度与线程个数并不是线性正相关的。相反&#xff0c;过多的线程反而会导致CPU频繁切换&#xff0c;处理性能下降。所以&#xff0c;线程池的大小一般都是综合考虑要处理任务的特点和硬件环境&#xff0c;来事先设置…

英语答题测试的软件叫什么,英语做题软件哪个好 有答案解析的英语做题软件分享...

对于一些即将参与重要英语考试的考生来说&#xff0c;每天刷题练习肯定是不可避免的事情&#xff0c;但如果你想要更高效的刷题&#xff0c;让自己的刷题时间更有价值&#xff0c;那就来看看推荐给你的这些英语做题软件。类型&#xff1a;学习 语言&#xff1a;简体中文星级&am…

raid卡组不同raid_RAID磁盘阵列是如何运作的?

本文编辑&#xff1a;意哥专业指导&#xff1a;葵芳一凡 RAID是英文Redundant Array of Independent Disks的缩写&#xff0c;中文简称为独立冗余磁盘阵列。简单的说&#xff0c;RAID是一种把多块独立的硬盘&#xff08;物理硬盘&#xff09;按不同的方式组合起来形成一个硬盘组…

java 析构函数_C++虚函数

码字不易&#xff0c;欢迎给个赞&#xff01;C虚函数是多态性实现的重要方式&#xff0c;当某个虚函数通过指针或者引用调用时&#xff0c;编译器产生的代码直到运行时才能确定到底调用哪个版本的函数。被调用的函数是与绑定到指针或者引用上的对象的动态类型相匹配的那个。因此…

象过河软件试用版_比肩许银川蒋川王天一,象棋软件下出神一样的残局,看完叹为观止...

古语有云&#xff0c;残局&#xff0c;是一盘棋的命脉所在。这对于现代象棋而言&#xff0c;也是如此&#xff0c;君不见&#xff0c;许银川有着鬼魅残功&#xff0c;蒋川有着魔衣血刀&#xff0c;王天一有着天外飞仙&#xff0c;都是一等一的残棋神器。而被誉为棋界战斗力最为…

python爬取小说出现乱码_详解Python解决抓取内容乱码问题(decode和encode解码)

一、乱码问题描述 经常在爬虫或者一些操作的时候&#xff0c;经常会出现中文乱码等问题&#xff0c;如下原因是源网页编码和爬取下来后的编码格式不一致 二、利用encode与decode解决乱码问题 字符串在Python内部的表示是unicode编码&#xff0c;在做编码转换时&#xff0c;通常…

北方股份无人驾驶矿卡_踏歌智行完成B轮2亿元融资,无人驾驶矿山赛道爆发在即...

作者 / 李笠10 月 30 日&#xff0c;矿山无人驾驶运输的领军企业踏歌智行完成了 2 亿元 B 轮融资。这是无人驾驶矿山赛道迄今为止最大的一笔融资。据悉&#xff0c;本轮融资由前海母基金和宝通投资共同领投&#xff0c;清研资本、蓝焱资本等跟投。这也是踏歌智行继 2019 年连续…

计算机视觉子方向,计算机视觉方向简介 | 人脸识别中的活体检测算法综述

原标题&#xff1a;计算机视觉方向简介 | 人脸识别中的活体检测算法综述本文转载自“SIGAI人工智能学习与实践平台”(ID&#xff1a;SIGAICN)导言1. 什么是活体检测&#xff1f;判断捕捉到的人脸是真实人脸&#xff0c;还是伪造的人脸攻击(如&#xff1a;彩色纸张打印人脸图&am…

黑客们的故事(连载三) 因为好奇

上期说到的肯和丹尼斯在黑客文化中的高知名度&#xff0c;不仅是因为他们开发出的操作系统和编程语言&#xff0c;更在于他们行为所体现出的价值观&#xff1a;求知、探索&#xff0c;以及追求极致。这些是黑客精神的精髓——虽然黑客们贯彻这些精神时的方式并不总是合理合法的…

css3禅密花园叫什么名字_新生儿起名:2021元旦出生男孩叫什么名字

2021年元旦节又是新的一年开始&#xff0c;在这辞旧迎新的日子里出生的男孩&#xff0c;都带有极好的寓意兆头&#xff0c;父母们如果能顺借此时机&#xff0c;取一个具有出生纪念意义的名字&#xff0c;那必然能让男孩的成长有着不同与众的历程。2021元旦出生男孩叫什么名字比…

10个让人很舒服的沟通技巧

转载于:https://www.cnblogs.com/yymn/p/4605237.html

idea将远程代码更新合并到本地_idea 本地调试远程服务器代码

基本原理本机和远程主机的两个 VM 之间使用 Debug 协议通过 Socket 通信&#xff0c;传递调试指令和调试信息。 被调试程序的远程虚拟机&#xff1a;作为 Debug 服务端&#xff0c;监听 Debug 调试指令。jdwp是Java Debug Wire Protocol的缩写。 调试程序的本地虚拟机&#xff…

安卓手机网页 字体垂直方向对齐_初学Excel办公软件字体对齐调整

今天我们依然讲解Excel办公软件的字体对齐调整&#xff0c;上一节我们讲过在菜单栏的上方就可以看到十个功能&#xff0c;然后我们根据这十个功能的调解我们所需要的文字对齐&#xff0c;或者是居中对齐&#xff0c;顶端对齐等等。还有另外一种操作方法&#xff0c;也是方便快捷…

英伟达_如何超越英伟达?

从AI热潮中率先获益的英伟达&#xff0c;其GPU参数和性能频繁出现在不少AI芯片发布会的对比图中。这是在缺乏AI芯片衡量的标准时&#xff0c;新的AI芯片证明自己实力的不错方式。不过&#xff0c;声称性能超越英伟达GPU的创新AI芯片不少&#xff0c;但想要超越英伟达非常困难。…

在struts2中push方法的使用_【干货】网版印刷中水墨使用注意事项及助剂使用方法...

导LEAD语在印刷生产中&#xff0c;水性油墨的黏度、干燥速度和PH值等等都会直接影响印刷质量&#xff0c;那么具体到网版印刷中&#xff0c;在使用水性油墨时应该注意哪些问题呢&#xff1f;常用的印刷助剂都有哪些特点和使用方法&#xff1f;编辑&#xff1a;华印纸箱彩盒 小张…

限定概率抽奖_守护星已点亮,内测皮肤得到没?从天美抽奖概率分析:地址什么梗...

声明&#xff1a;原创文章&#xff0c;禁止抄袭&#xff0c;违者必究&#xff01;大家好&#xff0c;我是你们的小抖。本次五五开黑节最引人注意的活动&#xff0c;当然不是超云龙胆新皮肤了。小抖觉得大家应该与我想的一样&#xff1a;内测皮肤。小抖点亮了所有守护星&#xf…

完美汽配管理系统v12服务器,完美汽车维修4S店管理系统

完美汽车维修4S店管理系统是一款十分不错的汽车修理系统&#xff0c;他可以帮助用户去处理好汽车维修&#xff0c;客户信息管理等问题&#xff0c;所以快来下载试试吧&#xff01;软件介绍完美汽车维修4S店管理系统是款界面简洁大方且主要应用汽修行业的管理软件&#xff0c;完…