停止使用p = 0.05

How many of you use p=0.05 as an absolute cut off? p ≥ 0.05 means not significant. No evidence. Nada. And then p < 0.05 great it’s significant. This is a crude way of using p-values, and hopefully I will convince you of this.

你们中有多少人使用p = 0.05作为绝对截止值? p≥0.05表示不显着。 没有证据。 娜达 然后p <0.05很好,很有意义。 这是使用p值的粗略方法,希望我能说服您。

什么是p值? (What is a p-value?)

A lot of us use p-values following this arbitrary cut off but don’t actually know the theoretical background of a p-value. A p-value is the probability, under the null hypothesis, of observing data at least as extreme as the observed data. It is not, for example, the probability that some population parameter x = 0. x either equals 0 or it does not (in a frequentist setting).

我们中的许多人都在此任意取舍之后使用p值,但实际上并不了解p值的理论背景。 p值是在零假设下观察数据至少与观察数据一样极端的概率。 例如,这不是某个总体参数x = 0的概率。x等于0或不等于0(在常客设置中)。

So, the smaller the p-value, the more unlikely it is that this data would have been observed under the null hypothesis. In essence, the smaller the p-value, the stronger the evidence against the null hypothesis.

因此,p值越小,在原假设下观察到该数据的可能性就越小。 本质上,p值越小,针对原假设的证据越强。

什么会影响p值? (What affects p-values?)

Two things mainly. The first is the strength of effect. The greater the difference from the null hypothesis. The smaller the p-value will be.

主要有两件事。 首先是效果的强度。 与原假设的差异越大。 p值越小。

The second is the sample size. The larger the sample, the smaller the p-value will be (if in fact the null hypothesis is false).

第二个是样本量。 样本越大,p值就越小(如果实际上零假设是假的)。

So, this means that if p ≥ 0.05, it could be because the effect isn’t that strong (or doesn’t exist) or that our sample is too small, resulting in our test being underpowered to detect a difference.

因此,这意味着如果p≥0.05,则可能是因为效果不那么强烈(或不存在)或我们的样本太小,导致我们的测试能力不足以检测差异。

一些例子 (Some examples)

致命药 (A deadly drug)

Suppose we were looking at adverse events of a new drug. Now suppose p=0.051 for evidence that the drug increases the rate of deaths. Now, if we used p=0.05 as a cut-off then it’s great. No evidence that the drug increases the rate of deaths — let’s put it into production. Now imagine that p=0.049 of an increase in the rate of deaths. Oh no! There’s evidence that the drug is harmful. Let’s not put it into production.

假设我们正在研究一种新药的不良React。 现在假设p = 0.051作为该药物增加死亡率的证据。 现在,如果我们使用p = 0.05作为临界值,那就太好了。 没有证据表明这种药物会增加死亡率,我们将其投入生产。 现在,假设死亡率增加了p = 0.049。 不好了! 有证据表明这种药物有害。 我们不要将其投入生产。

Mathematically, there’s not really a difference between the two. They are essentially the same. But by using this arbitrary cut off we reach very different conclusions.

从数学上来说,两者之间并没有真正的区别。 它们本质上是相同的。 但是,通过使用这种任意截断,我们得出了截然不同的结论。

这种药物有效吗 (Does this drug work)

Now imagine another drug. We’ve got a very large sample (n=10,000) and we want to know whether this drug cures cancer. So we get p=0.049 that it cures cancer. Great! Significant evidence this drug cures cancer. Let’s give it to everyone.

现在想象另一种药物。 我们有一个非常大的样本(n = 10,000),我们想知道这种药物是否可以治愈癌症。 因此我们得到p = 0.049可以治愈癌症。 大! 重要证据表明该药可治愈癌症。 让我们给大家。

Though, it’s a large sample. Wouldn’t we expect p to be smaller? It’s not that strong evidence against the null hypothesis. There’s approximately a one in twenty chance that our results are down to chance. Now suppose this drug is really expensive. Do we really want to start giving it out to everyone based on some fairly weak evidence? Probably not.

虽然,这是一个很大的样本。 我们难道不希望p变小吗? 并非没有证据支持原假设。 我们的结果接近偶然的可能性大约为十分之一。 现在假设这种药真的很贵。 我们是否真的要根据一些相当薄弱的证据开始向所有人分发? 可能不是。

Now of course if p=0.001 this would be a one in a hundred chance that our results our down to chance. This would be much stronger evidence that the drug works.

当然,现在如果p = 0.001,这将是我们得出结果的机会的百分之一。 这将是该药有效的更有力证据。

那么我们应该如何解释p值呢? (So how should we interpret p-values?)

As a continuous scale. The smaller the p-value is, the stronger the evidence is. But, you should take the sample size and effect size into account. You should also consider whether you are looking at something positive or negative. If looking at something like our deadly drug example, we should be concerned even if the evidence is very weak. However, with something like wanting to know whether a drug works, we can afford to be much more sceptical about our result.

作为连续的规模。 p值越小,证据越强。 但是,您应该考虑样本大小和效果大小。 您还应该考虑看的是正面还是负面。 如果以类似我们致命毒品的例子来看,即使证据不足,我们也应予以关注。 但是,由于想知道某种药物是否有效,我们可以对我们的结果持怀疑态度。

So, hopefully in the future, you’ll stop using p=0.05 as some threshold picked out of threshold and consider it as what it truly is — the weight of evidence against the null hypothesis. And, of course, if you don’t have the evidence you need that isn’t necessarily because it doesn’t exist it could be that you lack statistical power to detect an effect.

因此,希望在将来,您将停止使用p = 0.05作为从阈值中选出的某个阈值,并将其视为真正的阈值-反对原假设的证据权重。 而且,当然,如果您没有所需的证据,不一定是因为该证据不存在,可能是您缺乏统计能力来检测效果。

翻译自: https://towardsdatascience.com/stop-using-p-0-05-4a059e622c75

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/news/387939.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

centos7系统根目录扩容

比如 点击了后 点击创建虚拟磁盘 选择一个 20G 然后启动虚拟机使用fdisk查看所有的磁盘 看是否新增了一个20G的硬盘 [rootlocalhost ~]# fdisk -l磁盘 /dev/sda&#xff1a;8589 MB, 8589934592 字节&#xff0c;16777216 个扇区 Units 扇区 of 1 * 512 512 bytes 扇区大小(…

instrumentation模拟很多activity的操作

android.app.Instrumentation好像原来是用来做测试的, 可以用来模拟很多activity的操作 主要代码如下 如果在文本框中输入24,或者25 点击按钮就能模拟音量加减键 键值可以查看android.view.KeyEvent [java] view plaincopy package com.qefee.testinstrumentation; import…

成像数据更好的展示_为什么更多的数据并不总是更好

成像数据更好的展示Over the past few years, there has been a growing consensus that the more data one has, the better the eventual analysis will be.在过去的几年中&#xff0c;越来越多的共识是&#xff0c;数据越多&#xff0c;最终的分析就越好。 However, just a…

支付宝架构

支付宝系统架构图如下&#xff1a; 支付宝架构文档有两个搞支付平台设计的人必须仔细揣摩的要点。 一个是账务处理。在记账方面&#xff0c;涉及到内外两个子系统&#xff0c;外部子系统是单边账&#xff0c;满足线上性能需求&#xff1b;内部子系统走复式记账&#xff0c;满足…

怎样可以跨进程测试

在Android系统下模拟鼠标键盘等输入设备&#xff0c;网络上资料非常多。但不少是人云亦云&#xff0c;甚至测试都不愿测试一下就抄上来了。这次写一点体会&#xff0c;当作抛砖引玉。0. 背景知识&#xff1a;众所周知&#xff0c;Android是将Framework架在Linux之上的系统。Lin…

Android Studio 导入新工程项目

1 导入之前先修改工程下相关文件 1.1 只需修改如下三个地方1.2 修改build.gradle文件 1.3 修改gradle/wrapper/gradle-wrapper.properties 1.4 修改app/build.gradle 2 导入修改后的工程 2.1 选择File|New|Import Project 2.2 选择修改后的工程 如果工程没有变成AS符号&#xf…

马蜂窝张矗:绩效考核是为了激发工作潜力,而不是逃避问题

3 月 23 日&#xff0c;由高端技术领导者社交平台 TGO 鲲鹏会主办的 GTLC 全球技术领导峰会分站首站在北京举行。会上马蜂窝技术副总裁 \u0026amp; TGO 鲲鹏会会员张矗发表了主题为“我在马蜂窝的技术管理实践”的演讲。本文根据其演讲整理而成。大家好&#xff0c;我是来自马蜂…

vue domo网站_DOMO与Tableau-逐轮

vue domo网站Let me be your BI consultant. Best yet, let me be your free consultant on the following question:让我成为您的BI顾问。 最好的是&#xff0c;让我成为您的免费顾问 &#xff0c;解决以下问题&#xff1a; DOMO vs. Tableau — What should I use?DOMO vs.…

fiddler抓包1-抓小程序https包

抓小程序包和抓app包是一样的操作方法&#xff1b;安卓用fiddler&#xff0c;ios用charles&#xff1b; 一、环境准备 1.电脑已装最新版fiddler 2.手机和电脑在同一局域网 二、fiddler设置 1.fiddler>Tools>Options>HTTPS 勾选Capture HTTPS CONNECTs 及下边的子项&am…

多态使用的前提

1&#xff1a;必须是继承&#xff08;extends&#xff09;&#xff0c;实现&#xff08;implements&#xff09; 才行2&#xff1a;必须要重写&#xff08;覆盖&#xff09;父类的方法。转载于:https://www.cnblogs.com/liyunchuan/p/10663788.html

Linux下的 FTP

1.安装vsftpd yum install vsftpd 2.启动/重启/关闭vsftpd服务器 [rootlocalhost ftp]# /sbin/service vsftpd restart Shutting down vsftpd: [ OK ] Starting vsftpd for vsftpd: [ OK ] OK表示重启成功了. 启动和关闭分别把restart改为start/stop即可. 如果是源码安装的,到…

python入门23 pymssql模块(python连接sql server增删改数据 )

增删改数据必须connect.commit()才会生效 回滚函数 connect.rollback() 连接数据库 dinghanhua sql server增删改 import pymssqlserver 192.168.1.1 user user password 111111 database testdbconnect pymssql.connect(server server,user user,passwordpassword,da…

每个人都应该使用的Python 3中被忽略的3个功能

重点 (Top highlight)Python 3 has been around for a while now, and most developers — especially those picking up programming for the first time — are already using it. But while plenty of new features came out with Python 3, it seems like a lot of them ar…

iframe自适应高度

为什么需要使用iframe自适应高度呢&#xff1f;其实就是为了美观&#xff0c;要不然iframe和窗口长短大小不一&#xff0c;看起来总是不那么舒服&#xff0c;特别是对于我们这些编程的来说&#xff0c;如鲠在喉的感觉。 首先设置样式 body{margin:0; padding:0;} 如果不设置bod…

.Net转Java自学之路—SpringMVC框架篇八(RESTful支持)

RESTful架构&#xff0c;REST即Representational State Transfer。表现层状态转换&#xff0c;就是目前最流行的一种互联网软件架构。它结构清晰、符合标准、易于理解、扩展方便&#xff0c;所以得到越来越多网站的采用。 RESTful其实就是一个开发理念&#xff0c;是对http的很…

冲刺第七天

今天任务进行情况&#xff1a;今天我们将我们的游戏导到界面形成可用的应用程序&#xff0c;并且进行调试与运行&#xff0c;让同学试玩&#xff0c;发现了困难并加以改正。 遇到的困难及解决方法&#xff1a; 运行时发现游戏界面中UI的button和image的位置会随分辨率的不同而发…

数据探查_数据科学家,开始使用探查器

数据探查Data scientists often need to write a lot of complex, slow, CPU- and I/O-heavy code — whether you’re working with large matrices, millions of rows of data, reading in data files, or web-scraping.数据科学家经常需要编写许多复杂&#xff0c;缓慢&…

Node.js Streams:你需要知道的一切

Node.js Streams&#xff1a;你需要知道的一切 图像来源 Node.js流以难以使用而闻名&#xff0c;甚至更难理解。好吧&#xff0c;我有个好消息 - 不再是这样了。 多年来&#xff0c;开发人员在那里创建了许多软件包&#xff0c;其唯一目的是简化流程。但在本文中&#xff0c;我…

oracle表分区

1.表空间:是一个或多个数据文件的集合,主要存放的是表,所有的数据对象都存放在指定的表空间中;一个数据文件只能属于一个表空间,一个数据库空间由若干个表空间组成,其中包括:a.系统表空间:10g以前,默认系统表空间是System,10g包括10g以后,默认系统表空间是User,存放数据字典和视…

oracle异机恢复 open resetlogs 报:ORA-00392

参考文档&#xff1a;ALTER DATABASE OPEN RESETLOGS fails with ORA-00392 (Doc ID 1352133.1) 打开一个克隆数据库报以下错误&#xff1a; SQL> alter database open resetlogs; alter database open resetlogs * ERROR at line 1: ORA-00392: log 1 of thread 1 is being…