第七章 假设检验(3)

关于样本量n的取值

 如果希望在控制第I类错误的情况下,同时限制第II类错误的,这个时候就需要考虑样本量。样本量越大,错误概率越低。使用OC曲线。

分布拟合检验

 如果不知道总体服从什么类型的分布,就需要根据样本来检验分布的假设。

单个分布的卡方拟合检验法

 卡方拟合检验法可以检验总体是否具有某一个指定的分布或者属于某一分布族。具体参见第8章第6节。要求样本量n大于等于50。

定义

 记:F(x)为总体X的未知分布函数
 假设:F0(x)是形式已知,但含有若干个未知参数的分布函数。
 检验假设:H0:F(x)=F0(x),xR
 说明:如果总体X是离散的,则假设H0为:
 H0:总体X的分布律为P{X=ti}=pi,i=1,2,3....
 若总体X是连续的,则假设H0为:
 H0:总体X的概率密度函数为f(x)

原理和步骤

 1在H0下,总体X取值的全体分为k个两两不相交的子集A1,A2...Ak
 2以ni(i=1,2...k)记录样本观察值x1,x2,...xk中落在Ai的个数(实际频数)。
 3当H0为真,且F0(x)完全已知时,计算事件Ai发生的概率pi=PF0(Ai),i=1,2...k
 3.1如果F0(x)含有r个未知参数的时候,先利用极大似然估计r个未知参数,然后求得pi的估计值p^i
 4检验统计量ki=1hi(ninpi)2。这个统计量表示事件实际Ai发生的次数与理论上事件Ai发生的次数之间的平方差。当试验次数够多,H0为真,这个数应该不会太大。hi是个常数。检验的拒绝域形式是ki=1hi(ninpi)2c
 
 4.1如果hi=npi,统计量变为ki=1npi(ninpi)2

 4.2hi的值。皮尔逊证明以下定理
 若n充分大(n50),则当h0为真时,
 统计量ki=1npi(ninpi)2近似服从χ2(k1)
 统计量ki=1npi(ninp^i)2近似服从χ2(kr1)
 k是分类个数,r是未知参数个数。
 4.3简化统计量得到最终的拒绝域
 χ2=ki=1npi(ninpi)2=ki=1n2inpin
 χ2=ki=1npi(ninpi)2=ki=1n2inp^in
 χ2=ki=1n2inpinχ2α(k1)
 χ2=ki=1n2inp^inχ2α(kr1) 
 注意:n要足够大,n50npi>5

正态性检验方法

 偏度、峰度检验法。偏度、峰度是指X的标准化变量的三阶矩、四阶矩。
 v1=E[(XE(X)(D(X)))3]
 v2=E[(XE(X)(D(X)))4]
 样本量大于100为宜

秩和检验

 在前面都介绍的是显著性检验。这里会介绍秩和检验。

 ok。It’s great to finish this course.
 

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/news/424927.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

git 多用户多仓库配置

ssh全称是Secure Shell,即安全Shell,是一种可以进行安全远程登录的协议,在Linux中以OpenSSH为代表,Windows中则有Putty作为实现。ssh的会话建立阶段类似TCP协议的三次握手,里面涉及到利用非对称加密(RSA/DSA)和密码协商…

第二十三期:你用的Windows操作系统是不是盗版?微软知道吗

长期以来,一些小白对于微软操作系统的“正版”“盗版”“原版”的含义不太明确,从根本上说Windows原始版权属于微软,我们没有那个技术去开发盗版操作系统,很多人用的可能是二次修改的版本,而操作系统的激活方式&#x…

[Leetcode][第109题][JAVA][有序链表转换二叉搜索树][分治][快慢指针][中序遍历]

【问题描述】[中等] 【解答思路】 1. 分治 快慢指针 复杂度 class Solution {public TreeNode sortedListToBST(ListNode head) {return buildTree(head, null);}public TreeNode buildTree(ListNode left, ListNode right) {if (left right) {return null;}ListNode mid …

第四十六期:关于云存储的五大优势

5G时代,越来越多的企业开始选择在云上存储数据,对于IT部门来说,了解云存储的优势是很有必要的。今天给大家介绍云存储的五大优势,以及它们如何帮助用户解决一些常见IT问题。 1、可扩展性 传统存储系统以及横向扩展增加的节点&…

leetcode之回溯backtracing专题5

参考链接 http://blog.csdn.net/zhongkeli/article/details/6966805 https://leetcode.com/problems/permutation-sequence/#/description

第四十七期:毕业3年Java程序员,年薪20W,他是如何达到的?

Java架构师,首先要是一个高级java攻城狮,熟练使用各种框架,并知道它们实现的原理。jvm虚拟机原理、调优,懂得jvm能让你写出性能更好的代码;池技术,什么对象池,连接池,线程池…… Java架构师&…

【数据结构与算法】散列表

一、散列表的由来? 1.散列表来源于数组,它借助散列函数对数组这种数据结构进行扩展,利用的是数组支持按照下标随机访问元素的特性。 2.需要存储在散列表中的数据我们称为键,将键转化为数组下标的方法称为散列函数,散列…

第八章方差分析以及线性回归(1)

方差分析 方差分析是由英国统计学家Fisher在20世纪20年代提出的。  方差分析的目的是推断两个或者两个以上的总体均值是否有差异的显著性检验。 单因素方差分析 例子 保险公司为了了解某一险种在4个不同地区索赔额情况是否存在差异。收集了四个地区一年的索赔额记录。这四个…

react树状组件

最近在react项目中需要一个树状组件,但是又不想因为这个去引入一套UI组件,故自己封装了一个基于react的树状组件, 个人认为比较难得部分在于数据的处理,话不多说直接上代码: 下面是tree.js import React, {Component} …

第四十八期:只因写了一段爬虫,公司200多人被抓!

刚从朋友听到这个消息的时候,我有点不太相信,做为一名程序员来讲,谁还没有写过几段爬虫呢?只因写爬虫程序就被端有点夸张了吧。 作者:纯洁的微笑|2019-10-17 09:51 “一个程序员写了个爬虫程序,整个公司20…

[Leetcode][第647题][JAVA][回文子串][动态规划][中心扩展][Manacher 算法]

【问题描述】[中等] 【解答思路】 1. 暴力 首先明确如何判断一个字符串是否为回文字符串。第一个字符与最后一个字符相同,第二个字符与倒数第二个字符相同…关于中心位置轴对称。 本题要求一共有多少个回文子串,那么就需要判断,索引[i, j]的…

66-加一

给定表示非负整数的非空数字数组,加上整数的1。 存储数字使得最高有效数字位于列表的开头,并且数组中的每个元素包含单个数字。 您可以假设整数不包含任何前导零,除了数字0本身 例1: 输入: [1,2,3] 输出: […

玩转oracle 11g(52):Oracle导出导入表(.sql、.dmp文件)两种方法

提示:在导入sql和dmp文件之前,先建立用户,指明表空间。其中要注意用户名和表空间最好跟sql文件中的一样。 方法一:.sql文件的导出与导入 导出步骤 使用PL/SQL Developer登录你需要备份的数据库;选择工具->导出用…

第八章方差分析以及线性回归(2)

一元线性回归 变量间的关系 变量与变量之间的关系分为确定性关系和相关性关系。  确定性关系是指当自变量给定一个值的时候,就能计算出应变量的值。例如物体下落高度h与下落时间t的关系:h12gt2。  相关性关系是指变量之间的关系不确定,表…

Creating a Pulsing Circle Animation

Creating a Pulsing Circle Animation 原文 https://www.kirupa.com/animations/creating_pulsing_circle_animation.htm Outside of transitions that animate between states, we dont see a whole lot of actual animation in the many UIs we interact with. We dont have …

第四十九期:化繁为简的五种码农必备工具

如今,开发工具已成为了软件开发过程中必不可少的组成部分。本文将向您介绍当前软件开发市场上颇具影响力的五种化繁为简的码农必备工具。 不知您是否已经发现:那些以任务为中心的软件开发工作,会比独立的研究式开发复杂得多。针对软件产品的开…

【数据结构与算法】哈希算法

一、什么是哈希算法? 1.定义 将任意长度的二进制值串映射成固定长度的二进制值串,这个映射的规则就是哈希算法,而通过原始数据映射之后得到的二进制值串就是哈希值。 2.如何设计一个优秀的哈希算法? ①单向哈希: 从哈…

自然语言处理与文本检索

今天开始把翟成祥教授的文本检索课程做一下笔记。 说明:文章内容来源于课程视频和课程ppt。我只学习了课程没有做习题。文章不是翻译,是我对课程的理解。 nlp的主要内容 1 词语处理(lexical analysis part-of-speech tagging):分词与词性标…

第五十期:工作强度超996,失业半年即出局,硅谷为何如此“嗜血”?

在硅谷,靠创业发财的人被称为中了“硅谷六合彩”,大多数个体的艰难挣扎,最终换来了硅谷长久的繁荣昌盛。 划重点 1、在硅谷,靠创业发财的人被称为中了“硅谷六合彩”。 2、谷歌的合同工必须比正式工早两小时到公司打卡&#xff…

分块入门笔记

祝劳动快乐 数列分块 数列分块入门5 蒲公英 莫队 小Z的袜子 数颜色/维护队列 乱搞 块速递推 块状链表 文本编辑器 树上分块 王室联邦 树的统计 转载于:https://www.cnblogs.com/HenryHuang-Never-Settle/p/10804588.html