先求出
总体各单位变量值与其
算术平均数的
离差的平方,然后再对此
变量取
平均数,就叫做样本方差。样本方差用来表示一列数的变异程度。样本均值又叫样本均数。即为样本的均值。
在许多实际情况下,人口的真实差异事先是不知道的,必须以某种方式计算。 当处理非常大的人口时,不可能对人口中的每个物体进行计数,因此必须对人口样本进行计算。样本方差也可以应用于从该分布的样本的连续分布的方差的估计。
我们从一个样本取n个值y1,...,yn,其中n 偏差的
平均值:
估计值可以简单地称为样本方差。 同样的证明也适用于从
连续概率分布中抽取的样本。
例如,n=5个样本观测值值为3,4,4,5,4,则
样本均值= , 样本方差 = 。样本方差是常用的统计量之一,是描述一组数据变异程度或分散程度大小的指标。
n-1的使用称为贝塞尔校正(Bessel's correction),也用于样本
协方差和样本
标准偏差(方差平方根)。 平方根是一个凹函数,因此引入负偏差(由Jensen不等式),这取决于分布,因此校正样本标准偏差(使用贝塞尔校正)有偏差。 标准偏差的无偏估计是技术上的问题,对于使用术语n-1.5的正态分布,形成无偏估计。
如果大数定律的条件对于平方观测值同样适用,则s2是σ2的一致估计量。 可以看出,估计的方差趋于零。 在Kenney and Keeping(1951:164),Rose和Smith(2002:264)和Weisstein(n.d.)中给出了渐近等效的公式。