为什么除以n-1

在统计学中,样本方差的计算可以使用作为分母。这两种方式的选择取决于我们是在计算总体方差还是样本方差。

  1. 除以的情况:

    • 当我们拥有一个数据集的全部数据,也就是说我们正在处理的是一个总体时,我们通常会使用作为分母来计算方差。这种情况下的方差公式为:
    • 在这个公式中,是数据点的数量,是每个数据点的值,是数据集的平均值。这个公式提供了一个对数据集波动程度的准确度量。
  2. 除以的情况:

    • 当我们只有部分样本,而不是整个总体时,我们通常会使用作为分母来计算样本方差。这种情况下的方差公式为:
    • 在这个公式中,是样本数据点的数量,是每个数据点的值,是样本的平均值。使用作为分母是为了得到一个无偏估计(unbiased estimate),这意味着长期平均下,我们的估计会接近真实的总体方差。

这种区别的背后逻辑是,当我们只有样本数据时,我们倾向于低估总体的方差,因为样本往往会围绕总体的真实平均值聚集。通过使用而不是作为分母,我们可以对这种低估进行修正,使得我们的方差估计更为准确。这种修正通常被称为贝塞尔修正(Bessel’s correction)。

在实际应用中,是否使用作为分母通常取决于我们是否知道总体的真实平均值,以及我们是否正在尝试估计总体方差或仅仅是描述我们手头的样本数据。