离散分布:伯努力分布,二项分布,possion分布
一,伯努力分布
#执硬币
x_arr=np.array([0,1])
#x为1的概率
p=0.7
#0 1分布
#由PMF生成对应的概率 离散事件
pr_arr=stats.bernoulli.pmf(x_arr,p)
plt.plot(x_arr,pr_arr,marker='o',linestyle='None')
plt.vlines(x_arr,0,pr_arr)
plt.xlabel('Events')
plt.ylabel('Bernoulli distribution(p=0.7)')
plt.show()
伯努利分布期望
伯努利分布方差
伯努利分布推导交叉熵
二,二项分布
#二项分布 数量多时:像正态分布
n=100 #实验次数
p=0.5
x_arr=np.arange(0,n+1,1)
pr_arr=stats.binom.pmf(x_arr,n,p)
print(pr_arr)
plt.plot(x_arr,pr_arr,marker='o',linestyle='None')
plt.vlines(x_arr,0,pr_arr)
plt.xlabel('Events')
plt.ylabel('Probability')
plt.title('Bernoulli distribution(n={},p={})'.format(n,p))
plt.show()
次数到达100次就像正态分布
三,poisson分布
#poisson分布
#求某路口每小时发生k次交通事故的概率,已知每小时平均发生的次数为2
mu=2
k=10
p = 0.5
x_arr=np.arange(0,k+1,1)
pr_arr=stats.poisson.pmf(x_arr,mu)
print(pr_arr)
plt.plot(x_arr,pr_arr,marker='o',linestyle='None')
plt.vlines(x_arr,0,pr_arr)
plt.xlabel('Events')
plt.ylabel('Probability')
plt.title('Bernoulli distribution(k={},p={})'.format(k,p))
plt.show()
#
连续分布,高斯(正态分布)
四,高斯(正态分布)
mu=0#平均值
sigma=1#标准差
x_arr=np.arange(-5,5,0.1)
#概率分布函数
y_arr=stats.norm.pdf(x_arr,mu,sigma)
plt.plot(x_arr,y_arr)
plt.xlabel('x')
plt.ylabel('y')
plt.title('Gaussion distribution(mu={},sigma={})'.format(mu,sigma))
plt.show()
协方差(covariance)表达了两个随机变量的协同变化关系,即两个变量在变化过程中是同方向,还是反方向?以及其变化程度
#协防差和相关系数相关系数(correlation)就是用X、Y的协方差除以X的标准差和Y的标准差。可看作一种剔除了两个变量量纲影响、标准化后的特殊协方差。消除了两个变量变化幅度的影响,而只是单纯反应两个变量每单位变化时的相似程度temp_list=[14.2,16.4,11.9,15.2,18.5,22.1,19.4,25.1,23.4,18.1,22.0,19.5]
sale_list=[215,325,185,332,406,522,412,614,544,421,445,408]
plt.scatter(temp_list,sale_list)
plt.xlabel('temp')
plt.ylabel('sales')
plt.show()
# #协防差
cov_matrix=np.cov(temp_list,sale_list)
print(cov_matrix)
# #相关系数 判断数据是否线性相关度大
corr_matrix=np.corrcoef(temp_list,sale_list)
print(corr_matrix)
贝叶斯公式:
P(X) 代表 X 事件发生的概率,也称为先验概率;
P(Y|X) 代表在 X 事件发生的前提下,Y 事件发生的概率,也称为似然率;
P(X|Y) 代表事件 Y 发生后,X 事件发生的概率,也称为后验概率;
最大似然估计(英语:maximum likelihood estimation,缩写为MLE),是用来估计一个概率模型的参数的一种方法。
按照字面理解,最大似然估计的意思就是最大那种可能的估计。更大白话一点,那就是“已发生的事情,在它没有发生之前,就是最可能发生的事情”。
例子:求头像是假的时候,账号是假的概率.