介绍

“显著性水平”(Significance Level)这个术语在统计学中用于描述在假设检验中拒绝原假设(null hypothesis)的风险水平。这个水平通常表示为 (alpha),如

这个名字中的”显著性”(Significance)意味着我们正在寻找一个结果是否足够“显著”以至于能够拒绝原假设。换句话说,如果一个观察到的效应(比如,药物疗效、教育干预的影响等)是真实存在的,而不仅仅是随机变异或误差导致的,那么我们就说这个效应是“统计显著的”。

“水平”(Level)则指的是我们愿意接受的错误的概率阈值。在假设检验中,这个错误通常是第一类错误(Type I error),即错误地拒绝一个真实的原假设。

综合来说,“显著性水平”这个名字基本上是在描述我们有多大的风险愿意接受,以确定一个观察到的效应是否是“显著”的。

需要注意的是,尽管名字中有“显著性”,但这并不意味着结果具有实际或科学上的重要性。一个结果可能是统计显著的,但在实际应用或科学研究中可能并不重要。因此,在解释“显著性水平”时,通常还需要结合其他统计量(如效应量)和领域知识。

示例

通过一个具体的例子来解释显著性水平的概念。

场景:药物效果测试

假设一个制药公司开发了一种新药,声称这种药物可以有效地降低血压。为了验证这一点,研究人员进行了一个随机对照试验。

  • 原假设(: 新药没有降低血压的效果。
  • 备择假设(: 新药有降低血压的效果。

研究人员选择了100名高血压患者,其中50名接受新药治疗,另外50名接受安慰剂(对照组)。

设定显著性水平

在进行试验之前,研究人员设定了显著性水平 。这意味着,如果试验结果的概率小于或等于0.05,那么他们将拒绝原假设,认为新药是有效的。

试验结果与 p 值

假设试验结束后,研究人员计算出一个 p 值为 0.03。这个 p 值表示,在原假设(新药无效)为真的情况下,观察到这样的结果或更极端结果的概率。

做出决策

因为 p 值 0.03 小于显著性水平 ,研究人员拒绝原假设,认为新药具有降低血压的效果。

解释

在这个例子中,显著性水平 是研究人员愿意接受的错误概率,即错误地认为新药有效的概率。因为 p 值(0.03)小于这个阈值,所以研究人员有足够的证据拒绝原假设。

需要注意的是,即使结果是统计显著的,这并不意味着新药的效果就一定是大的或者具有临床意义。统计显著性只是告诉我们观察到的效应不太可能是随机产生的。