ABtest假设检验知识|配对检验|比率检验|单向表-列联表检验

文章目录

  • 1 假设检验基础
  • 2 一般假设检验
    • 2.1 假设检验包
    • 2.2 sample - 点击转化率
      • 2.2.1 问题描述
      • 2.2.2 实验设计
      • 2.2.3 数据处理
      • 2.2.4 方差齐性检验
      • 2.2.5 假设检验
      • 2.2.6 结果分析
  • 3 检验两个均值的差:配对
    • 3.1 大样本检验
      • 3.1.1 单侧检验
      • 3.1.2 双侧检验
    • 3.2 小样本检验
      • 3.2.1 单侧检验
      • 3.2.2 双侧检验
    • 3.3 t检验实例
      • 3.3.1 假设检验包
      • 3.3.2 sample - 人工降雨
  • 4 检验两个比值的差
    • 4.1 单侧检验
    • 4.2 双侧检验
    • 4.3 比率检验实例
      • 4.3.1 sample - 拼车研究
  • 5 检验多个比值的差 - 单向表检验
    • 5.1 概念
    • 5.2 卡方检验
    • 5.3 单向表检验实例
      • 5.3.1 sample - 车间不合格样品比率
  • 6 检验类型的两个方向是否相关 - 列联表检验

1 假设检验基础

根据Fisher提出的方法,如果我们想检验关于概率函数p(y)或密度函数f(y)的唯一参数 θ \theta θ的假设,令 L L L表示样本的似然函数,那么为了检验原假设 H 0 : θ = θ 0 H_0:\theta=\theta_0 H0:θ=θ0,Fisher似然比检验统计量为:
λ = 假定 θ = θ 0 时的似然函数 假定 θ = θ ^ 时的似然函数 = L ( θ 0 ) L ( θ ^ ) \lambda = \frac{假定\theta=\theta_0时的似然函数}{假定\theta=\hat \theta时的似然函数} = \frac{L(\theta_0)}{L(\hat \theta)} λ=假定θ=θ^时的似然函数假定θ=θ0时的似然函数=L(θ^)L(θ0)
其中 θ ^ \hat \theta θ^ θ \theta θ的极大似然估计。Fisher分析指出,若实际参数值 θ \theta θ与假设参数值 θ 0 \theta_0 θ0不同,那么通过极大似然估计出来的 L ( θ ^ ) L(\hat \theta) L(θ^)将远大于 L ( θ 0 ) L(\theta_0) L(θ0)。这也就说明如果按照如上关系构造检验统计量,该检验统计量的拒绝域应当由较小的 λ \lambda λ构成

所幸的是,我们直观选取的检验统计量多数都是相应似然比统计量 λ \lambda λ的函数,他们同时也都是构造置信区间的枢轴统计量

因此,这也就能够说明为什么我们使用假设检验时构造的枢轴统计量与置信区间所使用的枢轴统计量同质

2 一般假设检验

我们常做两个分布的均值检验,在这个范畴下,我们常接触到的假设检验分别是

  1. 分布方差相同的均值差假设检验
  2. 分布方差不同的均值差假设检验

由于两个不同分布的方差决定不同的假设检验模型,我们在进行假设检验之前需要提前对方差进行估计

常见的方差估计模型有Levene(没有正态性假设)检验和Bartlett(相互独立且正态假设)检验

接下来,我们直接对两个分布进行均值差的假设检验

2.1 假设检验包

  1. 方差齐性检验包位于scipy.stats 包下,我们常使用Levene进行检验
  2. 均值差检验包位于scipy.stats 包下,

    如果我们在方差齐性检验中得到方差齐性,使用ttest_rel;

    如果是方差非齐性,使用ttest_ind

2.2 sample - 点击转化率

2.2.1 问题描述

某社交APP希望增加直播频道的点击转化率

数据是连续5天点击率

2.2.2 实验设计

  1. 产品方案如下:在直播频道的选项卡上增加红点提示
  2. 实验设计方法如下:

混淆变量:相同用户行为特征的两组用户,主要控制的变量有

视频的观看习惯:观看时长|观看互动水平,显示为留言量和弹幕量

app的使用习惯:使用app的时间段|用户生命周期处于同一水平

用户的社会学特征:年龄和地域分层抽样,保证AB两组中用户比例与总体一致

干预:直播频道选项卡上是否出现红点

目标变量:直播频道点击转化率

  1. 样本量选取
  2. 实验周期: 5个连续日历天
  3. 构造假设

H 0 H_0 H0 = AB两组在直播频道点击转化率上没有本质差异

H 1 H_1 H1 = AB两组在直播频道点击转化率上有本质差异

  1. 检验分布: 由于样本量只有5,因此我们使用t分布进行检验函数的构造

2.2.3 数据处理

import numpy as np
import pandas as pd
import warnings
import oswarnings.filterwarnings('ignore')
test_res = pd.DataFrame({"Date": pd.date_range(start='2023-09-27',end='2023-10-01',freq='D'),"A":np.array([12.8,12.7,12.3,13.8,11.6],dtype=np.float16),"B":np.array([12.2,10.5,12.2,11.2,18.8],dtype=np.float16)})
test_res.head(5)

在这里插入图片描述

2.2.4 方差齐性检验

采用Levene方差齐性检验,构造的检验统计量本质上是一个组间方差和组内方差的F检验

返回值w即为F检验的实际分布值,p即为显著性变量

from scipy.stats import levenew,p = levene(test_res["A"],test_res["B"],center="mean")
print("w-value:{}\np:{}".format(w,p))$w-value:3.414548215849387
$p:0.10181205725676695

由于p> α = 0.05 \alpha=0.05 α=0.05,我们认为支持原假设,即实验组和对照组方差是相同的

test_res.describe()

在这里插入图片描述

2.2.5 假设检验

from scipy.stats import ttest_ind, ttest_relt,p = ttest_ind(test_res["A"],test_res["B"],equal_var=True)
print("t-value:{}\np:{}".format(t,p))$t-value:-0.22446175163718796
$p:0.8280247967287839

2.2.6 结果分析

结果表明,p值远大于 α = 0.05 \alpha=0.05 α=0.05,我们没有充分的理由拒绝原假设 H 0 H_0 H0,也就是说明AB两个实验不存在显著差异,
因此我们可以得出结论,该产品的优化没有达到预期
我们不能认为红点方案对于提升直播频道点击转化率有促进作用

3 检验两个均值的差:配对

对同一组实验对象,控制混淆变量后,我们只改变目标变量,此时将会得到两个实验统计总体

由于两个实验总体是相关的,因此我们做假设检验的总体思想是将两个总体样本间的差值作为假设检验统计量

3.1 大样本检验

当样本容量 n > 30 n>30 n>30时,我们可以采用Z检验

3.1.1 单侧检验

H 0 : ( μ 1 − μ 2 ) = D 0 H 1 : ( μ 1 − μ 2 ) > D 0 ; [ H 1 : ( μ 1 − μ 2 ) < D 0 ] H_0: (\mu_1-\mu_2) = D_0 \\ H_1: (\mu_1-\mu_2) > D_0 ;\\ [H_1: (\mu_1-\mu_2) < D_0] H0:(μ1μ2)=D0H1:(μ1μ2)>D0;[H1:(μ1μ2)<D0]
检验统计量:
Z = d ˉ − D 0 σ d / n ≈ d ˉ − D 0 s d / n Z = \frac{\bar d - D_0}{\sigma_d/\sqrt{n}} \approx \frac{\bar d - D_0}{s_d/\sqrt{n}} Z=σd/n dˉD0sd/n dˉD0
其中 d ˉ \bar d dˉ s d s_d sd分别表示样本的均值和标准差

拒绝域:
Z > z α ; [ Z < − z α ] p = P { Z > z c } < α ; [ p = P { Z < z c } < α ] Z > z_\alpha ; \\ [Z < -z_\alpha]\\ p = P\{Z>z_c\} < \alpha;\\ [p = P\{Z<z_c\} < \alpha] Z>zα;[Z<zα]p=P{Z>zc}<α;[p=P{Z<zc}<α]
其中, z c z_c zc是检验统计量的计算值

3.1.2 双侧检验

原假设与备择假设:
H 0 : ( μ 1 − μ 2 ) = D 0 H 1 : ( μ 1 − μ 2 ) ≠ D 0 H_0: (\mu_1-\mu_2) = D_0 \\ H_1: (\mu_1-\mu_2) \ne D_0 H0:(μ1μ2)=D0H1:(μ1μ2)=D0
检验统计量:
Z = d ˉ − D 0 σ d / n ≈ d ˉ − D 0 s d / n Z = \frac{\bar d - D_0}{\sigma_d/\sqrt{n}} \approx \frac{\bar d - D_0}{s_d/\sqrt{n}} Z=σd/n dˉD0sd/n dˉD0
其中 d ˉ \bar d dˉ s d s_d sd分别表示样本的均值和标准差

拒绝域:
Z > ∣ z α / 2 ∣ p = 2 P { Z > z c } < α Z > |z_{\alpha/2}| \\ p = 2P\{Z>z_c\} < \alpha Z>zα/2p=2P{Z>zc}<α
其中, z c z_c zc是检验统计量的计算值

注意,双侧检验的显著性变量p应为单侧检验的2倍,因为我们要关注的“小概率事件”实际上是Z正太分布的上尾和下尾

3.2 小样本检验

由于实际情况中我们很少能够对数据进行大样本的假设,因此我们一般使用对尾分布更加平滑的t分布

3.2.1 单侧检验

原假设与备择假设:
H 0 : ( μ 1 − μ 2 ) = D 0 H 1 : ( μ 1 − μ 2 ) > D 0 ; [ H 1 : ( μ 1 − μ 2 ) < D 0 ] H_0: (\mu_1-\mu_2) = D_0 \\ H_1: (\mu_1-\mu_2) > D_0;\\ [H_1: (\mu_1-\mu_2) < D_0] H0:(μ1μ2)=D0H1:(μ1μ2)>D0;[H1:(μ1μ2)<D0]
检验统计量:
T = d ˉ − D 0 σ d / n ≈ d ˉ − D 0 s d / n T = \frac{\bar d - D_0}{\sigma_d/\sqrt{n}} \approx \frac{\bar d - D_0}{s_d/\sqrt{n}} T=σd/n dˉD0sd/n dˉD0
其中 d ˉ \bar d dˉ s d s_d sd分别表示样本的均值和标准差

拒绝域:
T > t α ; [ T < − t α ] p = P { T > t c } < α ; [ p = P { T < t c } < α ] T > t_\alpha ; \\ [T < -t_\alpha]\\ p = P\{T>t_c\} < \alpha;\\ [p = P\{T<t_c\} < \alpha] T>tα;[T<tα]p=P{T>tc}<α;[p=P{T<tc}<α]
其中, t c t_c tc是检验统计量的计算值

3.2.2 双侧检验

原假设与备择假设:
H 0 : ( μ 1 − μ 2 ) = D 0 H 1 : ( μ 1 − μ 2 ) ≠ D 0 H_0: (\mu_1-\mu_2) = D_0 \\ H_1: (\mu_1-\mu_2) \ne D_0 H0:(μ1μ2)=D0H1:(μ1μ2)=D0
检验统计量:
T = d ˉ − D 0 σ d / n ≈ d ˉ − D 0 s d / n T = \frac{\bar d - D_0}{\sigma_d/\sqrt{n}} \approx \frac{\bar d - D_0}{s_d/\sqrt{n}} T=σd/n dˉD0sd/n dˉD0
其中 d ˉ \bar d dˉ s d s_d sd分别表示样本的均值和标准差

拒绝域:
T > ∣ t α / 2 ∣ p = 2 P { T > t c } < α T > |t_{\alpha/2}| \\ p = 2P\{T>t_c\} < \alpha T>tα/2p=2P{T>tc}<α
其中, t c t_c tc是检验统计量的计算值

注意,双侧检验的显著性变量p应为单侧检验的2倍,因为我们要关注的“小概率事件”实际上是T分布的上尾和下尾

3.3 t检验实例

3.3.1 假设检验包

scipy.stats 包中提供多种假设检验的工具

对于假设检验来说,最为重要的计算机优化点实际上在于样本均值和方差的计算,

与此同时,计算机还需要根据自由度存储相应统计分布的分位值数据,除此之外我们完全可以手动完成如上计算工作

3.3.2 sample - 人工降雨

人工降雨:考虑人工降雨试验,比较5个耕作地区的使用催化求雨技术与否的月降水量,

在这个实验中,目标变量时对该地区使用催化,观察对象是5个耕作地区

import numpy as np 
import pandas as pd
import warnings 
from scipy.stats import ttest_1sampwarnings.filterwarnings("ignore")
decipitation = np.array([[1.75,2.12,1.53,1.10,1.70],[1.62,1.83,1.40,0.75,1.71]])
df_decipitation = pd.DataFrame(columns=np.arange(1,6,1),index=["catalyzed","uncatalyzed"],data=decipitation).transpose()
df_decipitation

在这里插入图片描述

df_decipitation["d"] = df_decipitation.catalyzed - df_decipitation.uncatalyzed
df_decipitation

在这里插入图片描述

t,p = ttest_1samp(df_decipitation.d,0)
print("t={},p={}".format(t,p))$t=2.778537907692358,
$p=0.04989306151921203

由于scipy.stats尝试做双边t检验,因此得出的p结果如果应用到单侧,应当做对半处理,

同时我们发现t值处于t分布右半曲线,因此原假设的确应当是右侧(即>)单边检验

由于我们在假设时将催化分布样本减去为催化分布样本,因此我们的原假设和备择假设实际上是:
H 0 : ( μ 1 − μ 2 ) = 0 H 1 : ( μ 1 − μ 2 ) > 0 H_0: (\mu_1-\mu_2) = 0 \\ H_1: (\mu_1-\mu_2) > 0 H0:(μ1μ2)=0H1:(μ1μ2)>0
即当我们得到单侧检验p值为0.025左右时,可以拒绝原假设而得出催化地区平均月降水量大于未催化地区的结论

4 检验两个比值的差

由于二项分布当满足 n p q ≥ 4 npq \ge 4 npq4的条件时能够被近似视为服从 N ( n p , n p q ) N~(np,npq) N (np,npq)的正态分布,

因此我们也能够通过大样本比率构造假设检验的枢轴统计量Z;

不同于两个样本之间均值的比较,两个样本比率的比较更关心的是某个实验结果出现比率之间的比较

4.1 单侧检验

原假设和备择假设:
H 0 : ( p 1 − p 2 ) = D 0 H 1 : ( p 1 − p 2 ) > D 0 ; [ H 1 : ( p 1 − p 2 ) < D 0 ] H_0: (p_1 - p_2) = D_0 \\ H_1: (p_1 - p_2) > D_0; \\ [H_1: (p_1 - p_2 ) < D_0] H0:(p1p2)=D0H1:(p1p2)>D0;[H1:(p1p2)<D0]
检验统计量:
T = ( p ^ 1 − p ^ 2 ) − D 0 σ ( p ^ 1 − p ^ 2 ) T = \frac{(\hat p_1 - \hat p_2) - D_0}{\sigma_{(\hat p_1 - \hat p_2)}} T=σ(p^1p^2)(p^1p^2)D0

{ σ ( p ^ 1 − p ^ 2 ) = p ^ 1 q ^ 1 n 1 + p ^ 2 q ^ 2 n 2 , D 0 ≠ 0 σ ( p ^ 1 − p ^ 2 ) = p ^ q ^ ( 1 n 1 + 1 n 2 ) , D 0 = 0 p ^ = y 1 + y 2 n 1 + n 2 \left \{ \begin{array}{ll} \sigma_{(\hat p_1 - \hat p_2)} & = & \sqrt{\frac{\hat p_1 \hat q_1}{n_1}+\frac{\hat p_2 \hat q_2}{n_2}}, D_0 \ne 0 \\ \sigma_{(\hat p_1 - \hat p_2)} & = & \sqrt{\hat p \hat q(\frac{1}{n_1}+\frac{1}{n_2})}, D_0 = 0 \\ \hat p & = & \frac{y_1 + y_2}{n_1+n_2} \\ \end{array} \right . σ(p^1p^2)σ(p^1p^2)p^===n1p^1q^1+n2p^2q^2 ,D0=0p^q^(n11+n21) ,D0=0n1+n2y1+y2
其中 p ^ 1 \hat p_1 p^1 p ^ 2 \hat p_2 p^2分别表示两个分布期望发生事件的比率,而 q ^ 1 = 1 − p ^ 1 \hat q_1 = 1- \hat p_1 q^1=1p^1, q ^ 2 = 1 − p ^ 2 \hat q_2 = 1- \hat p_2 q^2=1p^2

D 0 = 0 D_0 = 0 D0=0时, y 1 , y 2 y_1,y_2 y1,y2分别是两个总体中关注事件的发生频次, n 1 , n 2 n_1,n_2 n1,n2是两个总体的样本容量

拒绝域:
Z > z α ; [ Z < − z α ] p = P { Z > z c } < α ; [ p = P { Z < z c } < α ] Z > z_\alpha ; \\ [Z < -z_\alpha]\\ p = P\{Z>z_c\} < \alpha;\\ [p = P\{Z<z_c\} < \alpha] Z>zα;[Z<zα]p=P{Z>zc}<α;[p=P{Z<zc}<α]
其中, z c z_c zc是检验统计量的计算值

4.2 双侧检验

原假设和备择假设:
H 0 : ( p 1 − p 2 ) = D 0 H 1 : ( p 1 − p 2 ) ≠ D 0 H_0: (p_1 - p_2) = D_0 \\ H_1: (p_1 - p_2) \ne D_0 H0:(p1p2)=D0H1:(p1p2)=D0
检验统计量:
T = ( p ^ 1 − p ^ 2 ) − D 0 σ ( p ^ 1 − p ^ 2 ) T = \frac{(\hat p_1 - \hat p_2) - D_0}{\sigma_{(\hat p_1 - \hat p_2)}} T=σ(p^1p^2)(p^1p^2)D0

{ σ ( p ^ 1 − p ^ 2 ) = p ^ 1 q ^ 1 n 1 + p ^ 2 q ^ 2 n 2 , D 0 ≠ 0 σ ( p ^ 1 − p ^ 2 ) = p ^ q ^ ( 1 n 1 + 1 n 2 ) , D 0 = 0 p ^ = y 1 + y 2 n 1 + n 2 \left \{ \begin{array}{ll} \sigma_{(\hat p_1 - \hat p_2)} & = & \sqrt{\frac{\hat p_1 \hat q_1}{n_1}+\frac{\hat p_2 \hat q_2}{n_2}}, D_0 \ne 0 \\ \sigma_{(\hat p_1 - \hat p_2)} & = & \sqrt{\hat p \hat q(\frac{1}{n_1}+\frac{1}{n_2})}, D_0 = 0 \\ \hat p & = & \frac{y_1 + y_2}{n_1+n_2} \\ \end{array} \right . σ(p^1p^2)σ(p^1p^2)p^===n1p^1q^1+n2p^2q^2 ,D0=0p^q^(n11+n21) ,D0=0n1+n2y1+y2
其中 p ^ 1 \hat p_1 p^1 p ^ 2 \hat p_2 p^2分别表示两个分布期望发生事件的比率,而 q ^ 1 = 1 − p ^ 1 \hat q_1 = 1- \hat p_1 q^1=1p^1, q ^ 2 = 1 − p ^ 2 \hat q_2 = 1- \hat p_2 q^2=1p^2

D 0 = 0 D_0 = 0 D0=0时, y 1 , y 2 y_1,y_2 y1,y2分别是两个总体中关注事件的发生频次, n 1 , n 2 n_1,n_2 n1,n2是两个总体的样本容量

拒绝域:
Z > z α / 2 p = 2 P { Z > | z c | } < α Z > z_\alpha/2 \\ p = 2P\{Z>|z_c|\} < \alpha Z>zα/2p=2P{Z>zc}<α
其中, z c z_c zc是检验统计量的计算值

4.3 比率检验实例

由于比率检验较为简单,我们可以通过手动的方式进行计算

4.3.1 sample - 拼车研究

进来正兴起一场运动,鼓励人们合伙拼车上班以节约能源,计划是指定某些高速公路只能由拼车使用

某一城市的收费站工作人员分别在拼车专用公路上与计划实施前后随机选取了2000辆和1500辆汽车,

调查结果为:

建立拼车道前 n 1 = 2000 n_1=2000 n1=2000, 拼车数 y 1 = 652 y_1=652 y1=652

建立拼车道后 n 1 = 1500 n_1=1500 n1=1500, 拼车数 y 1 = 576 y_1=576 y1=576

试问这些数据能否证明计划实施后合乘汽车比率有所提高? α = 0.05 \alpha=0.05 α=0.05

import numpy as np
import warnings 
import math
from scipy.stats import normwarnings.filterwarnings("ignore")
p1 = 652/2000
p2 = 576/1500
p = (652+576)/(2000+1500)
q = 1-p
sigma = math.sqrt(p*q*(1/2000+1/1500))
Z = (p1-p2-0)/sigmaprint("p:{},\nsigma:{}, \nZc:{}".format(p,sigma,Z))alpha = 0.05
z = -norm.ppf(1-alpha)
print("Z:{}".format(z))$p:0.35085714285714287,
$sigma:0.016300791683958468, 
$Zc:-3.558109392752839
$Z:-1.6448536269514722

由于我们一开始做单边检验,
H 0 : ( p 1 − p 2 ) = D 0 H 1 : ( p 1 − p 2 ) < D 0 H_0: (p_1 - p_2) = D_0 \\ H_1: (p_1 - p_2 ) < D_0 H0:(p1p2)=D0H1:(p1p2)<D0
故当 Z c < z α Z_c<z_\alpha Zc<zα时我们选择拒绝原假设,认定采取措施后拼车率的确有所提高

5 检验多个比值的差 - 单向表检验

5.1 概念

当我们关注的事件不再是01事件而是分立的几个时,每一个事件都会拥有一个比率,

此时我们希望每一个事件发生的比率是某一组数值,这也就是我们进行单向表检验的原假设

在这个假设检验中,我们将要借助卡方分布

卡方分布这一枢轴统计量的构造数学逻辑也十分清晰,

我们只需要保证观测和期望比率的离差加权平方和最小即可,该统计量的构造也是完全符合Fisher假设的

5.2 卡方检验

假定:

为了卡方近似的有效性,对所有 n i n_i ni都有 E ( n i ) ≥ 5 E(n_i)\ge 5 E(ni)5

原假设和备择假设
H 0 : p 1 = p 1 , 0 , p 2 = p 2 , 0 , ⋯ , p k = p k , 0 H 1 : 至少有一个多项概率不等于假设值 \begin{array}{ll} H_0: p_1= p_{1,0},p_2= p_{2,0},\cdots,p_k= p_{k,0} \\ H_1: 至少有一个多项概率不等于假设值 \end{array} H0:p1=p1,0,p2=p2,0,,pk=pk,0H1:至少有一个多项概率不等于假设值
其中, p k , 0 p_{k,0} pk,0代表多项概率的假设值

检验统计量:
χ c 2 = ∑ i = 1 k [ n i − E ( n i ) ] 2 E ( n i ) = ( ∑ i = 1 k n i 2 n p i ) − n \chi_c^2 = \sum_{i=1}^k \frac{{[n_i -E(n_i)]}^2}{E(n_i)} = (\sum_{i=1}^k \frac{{n_i}^2}{np_i})-n χc2=i=1kE(ni)[niE(ni)]2=(i=1knpini2)n
其中, E ( n i ) = n p i , 0 E(n_i)=np_{i,0} E(ni)=npi,0是在 H 0 H_0 H0成立的条件下得到类型i的期望个数,总样本大小为n

拒绝域:
χ c 2 > χ α 2 p = P { χ 2 > χ c 2 } \chi_c^2 > \chi_\alpha^2 \\ p=P\{\chi^2>\chi_c^2\} χc2>χα2p=P{χ2>χc2}
注意,这里 χ α 2 \chi_\alpha^2 χα2 ( k − 1 ) (k-1) (k1)个自由度

5.3 单向表检验实例

5.3.1 sample - 车间不合格样品比率

一共有 n = 103 n=103 n=103个不合格样品,分别来自5条生产线,

下面需要检验5条生产线生产出的不合格样品比率是否相等

生产线1:15 生产线2:27 生产线3:31 生产线4:19 生产线5:11

import numpy as np
import math
import warnings
from scipy.stats import chi2warnings.filterwarnings("ignore")
alpha = 0.05
n = 5
mean = (15+27+31+19+11)/5
chi2_c= (math.pow((15-mean),2)+math.pow((27-mean),2) \+math.pow((31-mean),2)+math.pow((19-mean),2) \+math.pow((11-mean),2))/meanchi2_a = chi2(n-1).ppf(1-alpha)print("mean:{}\nchi2_c:{}".format(mean,chi2_c))
print(chi2_a)$mean:20.6
$chi2_c:13.359223300970873
$9.487729036781154

由于我们的原假设是每一个比率都是相同的,即
H 0 : p 1 = 0.2 , p 2 = 0.2 , ⋯ , p 5 = 0.2 H 1 : 至少有一个多项概率不等于假设值 \begin{array}{ll} H_0: p_1= 0.2,p_2= 0.2,\cdots,p_5= 0.2 \\ H_1: 至少有一个多项概率不等于假设值 \end{array} H0:p1=0.2,p2=0.2,,p5=0.2H1:至少有一个多项概率不等于假设值
结果通过计算我们发觉$ \chi_c^2 > \chi_\alpha^2$,因此我们选择拒绝原假设

至少有一条生产线比其他生产线对较高的不合格率富有责任

6 检验类型的两个方向是否相关 - 列联表检验

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/news/840331.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

【大模型】(记一面试题)使用Streamlit和Ollama构建PDF文件处理与聊天机器人应用

【大模型】(记一面试题)使用Streamlit和Ollama构建PDF文件处理与聊天机器人应用 我在找工作的过程中&#xff0c;遇到一个面试题&#xff1a;搭建一个简易的利用大型 LLM 和 RAG 来实现用户与PDF文件的自然语言交互。 参考链接&#xff1a;https://medium.com/the-ai-forum/ra…

算法题1:电路开关(HW)

题目描述 实验室对一个设备进行通断测试,实验员可以操控开关进行通断,有两种情况: ps,图没记下来,凭印象画了类似的 初始时,3个开关的状态均为断开;现给定实验员操控记录的数组 records ,records[i] = [time, switchId],表示在时刻 time 更改了开关 switchId 的状态…

【大模型】 基于AI和全球化进程的权衡:开源大模型与闭源大模型

【大模型】 基于AI和全球化进程的权衡&#xff1a;开源大模型与闭源大模型 前言 实际上关于开源or闭源&#xff0c;一直以来都是颇有争议的话题&#xff0c;人们争执于数据的隐私性和共享性&#xff0c;到底哪一方能获得的收益更大。而对于开源与闭源哪个更好实际上也就是说是…

深度学习500问——Chapter09:图像分割(5)

文章目录 9.12 DenseNet 9.13 图像分割的数据集 9.13.1 PASCAL VOC 9.13.2 MS COCO 9.13.3 Cityscapes 9.14 全景分割 9.12 DenseNet 这篇论文是CVPR2017年的最佳论文。 卷积神经网络结构的设计主要朝着两个方向发展&#xff0c;一个是更宽的网络&#xff08;代表&#xff1a…

【算法例题】n元钱买n只鸡

题目描述&#xff1a;公鸡5元1只&#xff0c;母鸡3元1只&#xff0c;小鸡1元3只&#xff0c;问&#xff1a;n元钱买n只鸡&#xff0c;怎么买&#xff1f; 解题思路&#xff1a;这题要用枚举算法&#xff0c;枚举鸡的数量&#xff0c;代码如下&#xff1a; ​#include <bit…

初步学习pygame,使用pygame搭建简单的窗口效果

在VSCode上使用pygame 第一步&#xff1a;创建 Python 虚拟环境 打开 VSCode 中的 Terminal&#xff08;在菜单栏中选择 View > Terminal&#xff09;使用 cd 命令切换到你的项目文件夹输入以下命令来创建一个新的虚拟环境&#xff1a; python3 -m venv env这将在你的项目…

每天五分钟深度学习框架PyTorch:创建具有特殊值的tensor张量

本文重点 tensor张量是一个多维数组,本节课程我们将学习一些pytorch中已经封装好的方法,使用这些方法我们可以快速创建出具有特殊意义的tensor张量。 创建一个值为空的张量 import torch import numpy as np a=torch.empty(1) print(a) print(a.dim()) print(s.shape) 如图…

三菱机械手维修控制器故障

在工业自动化领域&#xff0c;三菱工业机器人凭借其高性能、高可靠性和易用性&#xff0c;受到了广泛应用。然而&#xff0c;随着时间的推移&#xff0c;可能会出现MITSUBISH工业机械臂控制器故障&#xff0c;需要进行三菱机械手维修。 一、MITSUBISH机械手控制器故障诊断 在进…

冷干机的日常维护

冷干机的日常维护保养。 观察记录 (一)每班观察记录仪表值4次 1、压缩空气进出口压差不超过0.035Mpa; 2、蒸发压力表0.4Mpa-0.5Mpa; 高压压力表1.2Mpa-1.6Mpa。&#xff08;冷媒R22&#xff09; 3、压缩机的运行电流、电压。 (二)经常观察冷却水系统、压缩空气系统的进口温度…

【Numpy】深入解析numpy.mgrid()函数

numpy.mgrid()&#xff1a;多维网格生成与数值计算的利器 &#x1f308; 欢迎莅临我的个人主页&#x1f448;这里是我深耕Python编程、机器学习和自然语言处理&#xff08;NLP&#xff09;领域&#xff0c;并乐于分享知识与经验的小天地&#xff01;&#x1f387; &#x1f393…

Qt下使用QImage和OpenCV实现图像的拼接与融合

文章目录 前言一、使用QImage进行水平拼接二、使用OpenCV进行水平拼接三、使用OpenCV进行图像融合四、示例完整代码总结 前言 本文主要讲述了在Qt下使用QImage和OpenCV实现图像的拼接与融合&#xff0c;并结合相应的示例进行讲解&#xff0c;以便大家学习&#xff0c;如有错误…

首发!飞凌嵌入式FETMX6ULL-S核心板已适配OpenHarmony 4.1

近日&#xff0c;飞凌嵌入式在FETMX6ULL-S核心板上率先适配了OpenHarmony 4.1&#xff0c;这也是业内的首个应用案例&#xff0c;嵌入式核心板与OpenHarmony操作系统的结合与应用&#xff0c;将进一步推动千行百业的数智化进程。 飞凌嵌入式FETMX6ULL-S核心板基于NXP i.MX 6ULL…

码蹄集部分题目(2024OJ赛16期;单调栈集训+差分集训)

&#x1f9c0;&#x1f9c0;&#x1f9c0;单调栈集训 &#x1f96a;单调栈 单调递增栈伪代码&#xff1a; stack<int> st; for(遍历数组) {while(栈不为空&&栈顶元素大于当前元素)//单调递减栈就是把后方判断条件变为小于等于即可{栈顶元素出栈;//同时进行其他…

【Linux】LAMP集群分布式安全方案

LAMP集群分布式安全方案主要涉及确保Linux、Apache、MySQL和PHP&#xff08;LAMP&#xff09;组合构成的集群环境的安全性和稳定性。 本次实验通过网络层安全对防火墙配置&#xff1a;使用防火墙&#xff08;如iptables或firewalld&#xff09;来限制对集群的访问&#xff0c;只…

[集群聊天服务器]----(五)User类、UserModel类

接着上文[集群聊天服务器]----(四)MySQL数据库模块&#xff0c;接下来我们对User类、UserModel类进行剖析&#xff0c;User表和UserModel类是项目最基本也是最重要的部分&#xff0c;通过它我们对用户的id&#xff0c;用户名&#xff0c;密码&#xff0c;状态相关信息进行存储&…

uniapp+canvas实现逐字手写效果

在移动端使用 UniApp 进行逐字手写的功能。用户可以在一个 inputCanvas 上书写单个字&#xff0c;然后在特定时间后将这个字添加到 outputCanvas 上&#xff0c;形成一个逐字的手写效果。用户还可以保存整幅图像或者撤销上一个添加的字。 初始化 Canvas&#xff1a; 使用 uni.c…

Top3专业课150满分,怎么考的?

这个系列会邀请上岸学长学姐进行经验分享~ 今天经验分享的同学是小马哥上海交大819的全程班学员&#xff0c;专业课150分满分&#xff0c;这位同学也是819期末考试的第一名&#xff0c;非常厉害&#xff01;大家吸吸欧气&#xff01; 初试成绩单 前言 先介绍下自己&#xff0…

新火种AI|复旦团队在“冷冻人脑”领域获得重大进展!人工智能是否会对此形成助力?

​在低温医学领域&#xff0c;“冷冻人脑”技术的研究和突破既是重点&#xff0c;也是难点。因为这项技术关乎着人类是否可以取得一个令人瞩目的突破——人类的生命是否能够得到延续。 早几年&#xff0c;诸如“利用人体冷冻技术将身患绝症的病人保存十几年&#xff0c;几十年…

C# 文件清理

/// <summary>/// 定期清除文件/// </summary>/// <param name"fileDirect">文件夹</param>/// <param name"postFix">文件后缀</param>/// <param name"saveDay">保存天数</param>private voi…

IntelliJ IDEA集成Baidu Comate,商城系统支付交易功能开发实战

文章目录 Baidu Comate介绍安装配置体验安装插件配置体验注释生成代码技术问答 实战设计表生成代码导入数据 总结 Baidu Comate介绍 在科技互联网飞速发展的今天&#xff0c;百度凭借其深厚的技术积累和创新能力&#xff0c;推出了一款名为Baidu Comate智能代码助手的产品。该…