知乐空间

样本方差与总体方差(方差怎么算)

如何计算方差(样本方差和总体方差)Best边肖带大家一探究竟。

如何计算方差(样本方差和总体方差)。

1.方差:随机变量或一组数据离散程度的度量。
在概率论中,方差用来衡量随机变量与其数学期望(即均值)之间的偏离程度。

统计中的方差(样本方差)是每个样本值之间的差值的平方值与所有样本值的平均值的平均值。

概率论中的方差表示:

样本方差,无偏估计,无偏方差。对于一组随机变量,从其中随机选择n个样本,这组样本的方差是Xi^2平方和除以N-1。

最佳网络


总体方差,也叫有偏估计,其实就是我们初中学的标准定义的方差,除数是n.
方差在统计学中的表示:


其次,为什么样本方差的分母是n-1?为什么叫无偏估计?
简单的答案是因为你用了n个数的平均值来估计平均值。寻求方差时,只有(n-1)个数字与均值信息无关。

而你的第n个数可以由之前的(n-1)个数和平均值唯一确定,但实际上没有信息。因此,在计算方差时,只除以(n-1)。

更严格的证明呢?

方差计算公式中的分母是n-1,以便使方差估计无偏。

无偏估计量优于有偏估计量,比较直观,虽然有些统计学家认为最小均方误差(MSE)更有意义,所以这里就不讨论这个问题了。最佳网络

不直观的是,为什么分母必须是n-1而不是n,才能使估计无偏。

首先,我们假设随机变量的数学期望已知,但方差未知。在这种情况下,根据方差的定义,我们有。

这可从最佳网络获得。


这个结果很直观,数学上也很明显。现在,我们考虑随机变量
III。理论推导
为了叙述方便,这里解释一下数学符号:


我前面说过,样本方差应该除以(n-1)的原因是这样的方差估计量是总体方差的无偏估计量。根据公式,样本方差估计的期望值应等于总体方差。如下所示:


但没有修正的方差公式,其期望不等于总体方差。


也就是说,如果用没有修正的方差公式来估计总方差,则样本方差估计量是有偏差的。

下面是一个众所周知的公式推导过程:

也就是说,除非。


否则,一定有。


需要注意的是,不等式的右边是方差的“正确”估计,但我们不知道真正的总体均值是什么,所以只能用样本均值来代替总体均值。

因此,如果样本方差估计器使用未修正的方差公式来估计总方差,将会有偏差,低估总体样本方差。为了无偏差地估计总体方差,方差的计算公式应修正如下:


这一修订估计数将是对总体方差的无偏估计,这一修订的来源将在下文中给出。

为了理解这种修正是如何发生的,我们必须首先有以下等式:

1.方差计算公式:


2。均值和均值方差的计算公式:


对于未修正的方差计算公式,我们有:

版权声明:本文内容由互联网用户自发贡献,该文观点仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌抄袭侵权/违法违规的内容,请发送邮件至 ZLME@xxxxxxxx@hotmail.com 举报,一经查实,立刻删除。

留言与评论(共有 0 条评论)
验证码: