p-value

p-value

  p-value翻译为假定值,假设几率。我们在生物信息中通常使用p值方法(P-Value, Probability, Pr)来做检验。那么p-value是什么呢?其实P-value就是一种概率,表示在原假设为真的前提下出现观察样本以及更极端情况的概率。

  什么叫“更极端”情况呢,在此我们借用(https://blog.csdn.net/rongbaohan/article/details/53521147)举的抛硬币的例子,我们要检验一枚硬币是否质地均匀,现在我们假设这枚硬币质地是均匀的。那如何检验我们的假设呢?我们知道抛一枚质地均匀的硬币,正面和反面出现的概率均为0.5。那么我们就开始做实验:抛这枚硬币100次,假如我们观察到的结果是正面出现90次,反面出现10次,这个结果已经很不可能发生了,也就是极端情况了(质地均匀的硬币观察的应该是正反面出现次数均为50左右),那么所谓“更极端”的情况就是出现正面91次,反面9次,以此类推。为什么要去找“更极端”的情况呢?因为一个事件很极端,那么比它“更极端”的事件就非常少。

  我们观察的结果(正面90次,反面10次)是在一次实验中得出的。我们重复做这个实验100次,每次抛100回硬币,现在要来考察“更极端”事件出现的概率。P-value=P(出现“更极端”情况的次数),如果这个p-value < 显著性水平α,则说明在原假设为真的情况下出现事件(正面90次,反面10次)是极端的,以至于我们不再相信原假设,因为p-value很小就说明在原假设为真的情况下出现观察到的极端情况的概率很低,但是根据小概率事件原理,概率很低的情况在一次实验中不可能出现,而极端情况却出现了,所以我们拒绝原假设。

 

p-value有什么意义呢?

  我们如果计算出的p-value很小,说明原假设情况发生的概率很小,而如果出现了,根据小概率原理,我们就有理由拒绝原假设,p-value越小,我们拒绝原假设的理由越充分。

  另外,p-value越小,表明结果越显著。但是检验的结果究竟第“显著的”、“中度显著的”还是“高度显著的”,需要我们自己根据p-value的大小和实际问题来解决。

 

  我们再举一个生物信息上的例子,现在要在人类21号染色体上找图a这样的模式序列,我们将这种模式序列称为motif。(来源Noble W S. How does multiple testing correction work?[J]. Nature Biotechnology, 2009, 27(12):1135-7.)

 

  该motif一共由20个碱基组成,碱基有四种(A, T, G, C),其中每一列上字母的大小表示出现的可能性大小,比如说第6个碱基,明显“C”最大,那么该位置是“C”的可能性就越高。

  我们在人类21号染色体上找到6800万个长度为20个碱基的序列,我们给每个序列一个score,表示该序列与motif的相似性,score值越大表明该序列越可能是我们要找的motif序列。我们打完分数,列出score值最大的20个序列(我们将这20个序列集合设为A)。现在要表明我们的方法计算出的这前20个序列是有意义的,就要评估这种情况偶然发生的可能性。

  下图为前20个得分最高的序列,我们只关注score。其中最高的分数为26.30.

 

 

  我们提出零假设:前20个序列是随机出现的。相应地,备择假设:前20个序列不是随机出现的,而是与我们的方法有关(备择假设的意义为:我们的方法是可行的,通过我们给出的方法找出前20个序列是有意义的)。

  现在我们将21号染色体上的碱基顺序打乱,根据零假设,高分数是随机的,所以我们的方法对于顺序打乱的序列依然会得到很高的分数。我们记打乱顺序后找到的分数最高的20个序列的集合为B。通过相同的方法计算出的结果显示:在B集合中只有1个得分≥26.30,即分数为26.30的序列的p-value = 1/(6800万)=1.5*10-8(找比26.30这个分数更极端的分数),如果设显著性水平为0.05,那么p-value << 0.05,原假设成立的情况下,出现26.30这样的高分数的概率非常非常小,也就是我们得到的结果对原假设的支持程度非常非常小,所以我们拒绝原假设

  我们需要注意的是,p-value不是给定样本结果时原假设为真的概率,而是给定原假设为真时样本结果出现的概率。

  所以我们的结果并不是在随机情况下出现的,说明我们的方法是有意义的,可以发现那些与motif相似性很高的序列。如果在碱基顺序打乱后,我们依然可以得到很多分数很高的序列,那么就表明我们的方法没有什么用,进而说明我们发现的那些分数很高的序列没有什么意义,那么我们做的这种研究就没有用了。

  从假设检验上说,我们做研究时,并不希望得到的结果否定自己的假设,但是又无法完全证明得到的结果正确,所以我们通过建立一个与研究假设相反的假设H0,利用假设检验来证明否定H0,那么我们研究的假设相对来说就得到了接受。

转载于:https://www.cnblogs.com/datamining-bio/p/8681545.html

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/news/570996.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

webstorm激活

2018-12-20(最新可用&#xff0c;选中间的activetion code)&#xff1a; 前提&#xff1a;修改本地的hosts配置文件&#xff08;/etc/hosts&#xff09; 最后一行新增这句话&#xff1a;0.0.0.0 account.jetbrains.com 然后去 http://idea.lanyus.com/ 这个网站生成一个激活码…

面向对象初调用:foolish 电梯

本周我们完成的任务是傻瓜电梯的调度&#xff0c;对于那十分十分详细的指导书&#xff0c;我感觉想要说明白题目要求&#xff0c;是做不到的&#xff0c;所以就把指导书贴出来给大家看了&#xff0c;&#xff0c;由于在下还不会网页制作&#xff0c;只能通过百度网盘了&#xf…

Studio 3T更改使用时间破解免费使用方式(转,可以使用)

echo off ECHO 重置Studio 3T的使用日期...... FOR /f "tokens1,2,* " %%i IN (reg query "HKEY_CURRENT_USER\Software\JavaSoft\Prefs\3t\mongochef\enterprise" ^| find /V "installation" ^| find /V "HKEY") DO ECHO yes | reg a…

Maven学习之(一)基本配置

安装maven还几次没成功&#xff0c;不过最后还是查资料成功了&#xff0c;所以记录一下。 1.安装JDK&#xff0c;比较简单&#xff0c;就不说明了。 2.配置java的环境变量 JAVA_HOME &#xff08;最开始因为java配置成C:\Program Files (x86)\Java\jdk1.8.0_144\bin 所以出问题…

Rabbitmq java.util.concurrent.TimeoutException小问题解决

最近在研究rabbitmq的各个工作模式时。 出现了一个rabbitmq java.util.concurrent.TimeoutException异常 java.util.concurrent.TimeoutExceptionat com.rabbitmq.utility.BlockingCell.get(BlockingCell.java:77)at com.rabbitmq.utility.BlockingCell.uninterruptibleGet(B…

个人服务器

1、用yum install 安装太方便了&#xff0c;不用考虑依赖 yum install java yum install mysql yum install tomcat 一下子就搞定了。 安装好mysql好像并不能启动&#xff0c;还要yum install mariadb-server -y 具体看&#xff1a;https://blog.csdn.net/lixingdefeng…

org.hibernate.QueryTimeoutException: Could not execute JDBC batch update问题解决(转)

这个bug的原因就是 在插入数据操作时 插入字段的长度 超出了数据库表设计时的该字段长度 导致的这个异常 解决办法&#xff1a; 1.减短字段长度 2.增加字段长度限制 例&#xff1a;alter table table_name modify column_name varchar(50); 转&#xff1a;https://blo…

Neither BindingResult nor plain target object for bean name 'xxx' availabl问题解决

明明已经按网上进行处理了为什么还是这个异常呢&#xff1f; 解决方法&#xff1a; 1.<form:form modelAttribute"user" 标签内绑定页面传来的数据。 2.在页面上加上 <jsp:useBean id"command" class"com.mvc.domain.BlogForm" scope&q…

JS中Date.parse()和Date.UTC()返回值不一致

Date.parse() 方法解析一个表示某个日期的字符串&#xff0c;并返回从1970-1-1 00:00:00 UTC 到该日期对象&#xff08;该日期对象的UTC时间&#xff09;的毫秒数&#xff0c;如果该字符串无法识别&#xff0c;或者一些情况下&#xff0c;包含了不合法的日期数值&#xff08;如…

浅学习使用Ribbon 和 Feign的理解和使用

Ribbon是Netflix公司开源的一个负载均衡的项目,是一个基于 HTTP、TCP的客户端负载均衡器. 什么是负载均衡? 负载均衡是微服务架构中必须使用的技术&#xff0c;通过负载均衡来实现系统的高可用、集群扩容等功能。负载均衡可通过 硬件设备及软件来实现&#xff0c;硬件比如&am…

OSI七层协议模型

OSI七层协议模型 1. OSI七层和TCP/IP四层的关系 OSI引入了服务、接口、协议、分层的概念&#xff0c;TCP/IP借鉴了OSI的这些概念建立TCP/IP模型。OSI先有模型&#xff0c;后有协议&#xff0c;先有标准&#xff0c;后进行实践&#xff1b;而TCP/IP则相反&#xff0c;先有协议和…

Centos启动卡住,starting auditd: [failed]

具体原因可能是什么权限导致的吧 &#xff0c;母鸡啊 解决方式&#xff1a; 在重启客户端时输入 i 然后输入 a &#xff0c;在<_root KEYBOARDTYPEpc KEYTABLEus rd_NO_DM后空格输入 single再 enter就进入了

FPGA中计数器设计探索

FPGA中计数器设计探索&#xff0c;以计数器为32位为例&#xff1a; 第一种方式&#xff0c;直接定义32位计数器。 reg [31:0]count; quartus ii 下的编译&#xff0c;资源消耗情况。 85C模型下的时钟频率。 0C模型下的时钟频率。 chip planner下资源分布情况。 第二种方式&…

存储过程存储函数得简记(转)

oracle中的存储过程和存储函数的区别&#xff08;尊重劳动成果&#xff0c;转载请注明出处&#xff1a;https://blog.csdn.net/qq_39778516/article/details/84033710 consistencely的博客&#xff09; 1.存储过程 存储过程&#xff08;Stored Procedure&#xff09;是在大型数…

MongoDB服务无法注册

按此步骤执行出现无法注册服务名问题时&#xff0c;如下解决&#xff1a; 方法一&#xff1a; 方法二&#xff1a; 如果还是无法解决的话&#xff0c;首先卸载MongoDB&#xff0c;然后清MongoDB注册表&#xff0c;重新安装&#xff0c;然后按一开始那样执行mongo.conf文件&am…

006 list类型

一.概述 在redis之中,我们需要把list视为一个链表,存储的元素我们需要视为一个字符串(可以是序列化的字符串). list的核心就是 : 有序的字符串列表. 二 .基本操作 [1]lpush , rpush 从左方向和右方向追加元素 [2] 查询指定范围的数据 --- lrange index last_indezx [3] 获取指…

WIN10注册表出现“无法删除所有指定的值”解决办法

win --> cmd 右键以管理员运行 --> regedit 进入注册表 --> 找到你要删除的值的所属文件夹 --> 右键权限 -->修改为完全控制

SpringBoot学习笔记(8):事物处理

SpringBoot学习笔记&#xff08;8&#xff09;&#xff1a;事物处理 快速入门 在传统的JDBC事务代码开发过程中&#xff0c;业务代码只有一部分&#xff0c;大部分都是与JDBC有关的功能代码&#xff0c;比如数据库的获取与关闭以及事务的提交与回滚、大量的try..catch..finally…

Nignx出现failed (3: The system cannot find the path specified)问题

一般这个问题都是都是nginx.conf配置出现问题导致的。 仔细检查location配置等信息&#xff0c;核对error.log中显示路径是否产生跳转&#xff0c;核对跳转路径是否正确来推断自己配置是否有误。 如果无误的话。 查看window下或linux下的nginx进程是否出现多个进程&#xff…

nignx处理Html中SSI技术代码注意事项

当我们将服务部署至Nignx中时&#xff0c;想要页面静态化后的Html文件使用SSI技术获取包含页面内的js代码时。 需要注意的是&#xff0c;当我们从nignx访问动态地址时&#xff0c;返回的页面结果一定要是html页面才可以支持SSI技术&#xff0c;jsp是不支持SSI的&#xff0c;所…