协方差是一个统计量,用于衡量两个随机变量的联动性或共同变动的程度。它可以帮助我们理解两个变量是否有趋势同时增加(正协方差)或一个变量增加时另一个变量减少(负协方差)。

给定两个随机变量,它们的协方差定义为:

其中, 分别是 的期望值(均值)。

在实际数据分析中,当我们有一组观测值,协方差可以通过以下公式计算:

其中, 分别是 的样本均值。

协方差的一些关键点:

  1. 正值:如果 的值高于其均值时 的值也倾向于高于其均值,那么协方差为正。
  2. 负值:如果 的值高于其均值时 的值倾向于低于其均值,那么协方差为负。
  3. 零值:如果 之间没有系统的线性关系,那么协方差接近零。

需要注意的是,协方差的大小受到数据尺度的影响,因此它本身并不总是很有意义。为了得到一个无尺度的度量,我们通常使用相关系数(如皮尔逊相关系数),它是协方差与两个变量的标准差的乘积的比值。