被Nature科学家封杀的P值,到底有什么意义?观点

/ / 2015-10-25
大数据文摘出品编译:武帅、宁静我们在日常生活中做出决定时,总会在心里提前打个“小算盘“——估算一下概率值P,研究者做某项检测,根据概率值P,得出最终的结果;资本.........


大数据文摘出品

编译:武帅、宁静


我们在日常生活中做出决定时,总会在心里提前打个“小算盘“——估算一下概率值P,研究者做某项检测,根据概率值P,得出最终的结果;资本家做投资,根据以往数据的统计分布,估算P值,得出最终的决策等等。P值在潜移默化地影响着我们的生活,那么有没有想过我们所依赖的P值到底可靠吗?


P值的表面意义是,当原假设为真时,检验统计量出现某不应该值所需的概率;而其实际意义则是,只需多小的概率就能出现拒绝原假设的检验统计值。


Nature上的统计学家早就发现,P值本身无法提供支持相关模式或假说之证据,P值可能给我们每个人都上演了一场“楚门的世界”,先附上Nature链接,看看他们怎么说。


Nature链接:

https://www.nature.com/articles/d41586-019-00857-9


P值不可靠?


发布这篇文章的三位统计学家,分别是瑞士巴塞尔大学的动物学教授Valentin Amrhein,加州大学洛杉矶分校的流行病学的统计学教授Sander Greenland,伊利诺伊州埃文斯顿西北大学的统计学方法学家和营销学教授Blake McShane。


他们提出:“我们永远不应该仅仅因为P值大于0.05之类的阈值而得出“没有差异”或“没有关联”?,或者等价,因为置信区间包括零。我们也不应该断定两项研究之间存在冲突,因为一项研究结果具有统计学意义,另一项则没有。这些错误会浪费研究工作并误导政策决策。"




这些错误以及类似的错误普遍存在,对数百篇文章的调查发现,统计上不显着的结果被解释为“没有差异”或“没有影响”的约有一半。



这个发现说明,我们所看到的文献,都是所谓通过了显著性检验的部分,或者说都是符合研究者意图的部分,而对于那些没有通过检验、不符合研究者意图的研究到底是个什么情况,我们就不得而知了。


例如研究者为了使研究结果符合自身意图,事先通过样本选择、条件控制等手段对实验设计进行了优化,选择性地只报告符合意图的变量,甚至选择性地删除、补充或修改数据,选择性地扩大样本容量等等。显然,这种为了发表文章而人为地达到p


那么P值的真正含义是什么呢?


或许,数据科学家Admond Lee会给我们答案,下文是他对于P值的探索经历,可随文摘菌一探究竟。


探索P值的真正含义


犹记得当我作为暑期学生在欧洲核子研究中心进行第一次海外实习时而为大众所熟知),那时候大多数人还在谈论着希格斯玻色子的发现,即使已经确认希格斯玻色子的发现满足5个标准差阈值。


然而,那时候我对p值、假设检验甚至统计显著性都一无所知。接下来的事你猜对了。我用谷歌搜索了p-value这个词,看了维基百科后我却更困惑了…


在统计学的假设检验中,对一个给定的统计模型来说,p值或概率值是一个特定的概率,即当原假设为真时,统计结果不小于实际观测值的概率。

? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ??——维基百科


所以P值的真正含义是什么呢?到了现在,尤其是当我进入数据科学领域之后,我才慢慢理解了p值的含义,以及它是如何在某些实验成为决策制定工具的一部分的。


因此,我决定讲清楚p值是什么,以及如何将它们用于假设检验,以期有助于你更加直观透彻地理解p值,显然我们不能跳过对其他相关概念和p值定义的基本理解,但我保证会以一种直观的方式进行解释,而不是直接向你扔去一堆技术术语。


为你提供从构建假设检验到理解P值,我将从以下四个方面解释我们的决策过程的全流程,我“墙裂”建议你仔细地阅读所有内容,从而对P值有一个详细的理解:

假设检验

正态分布

什么是p值?

1
联系我们