偏度
统计数据分布偏斜方向程度的度量
偏度(skewness)也称为偏态偏态系数,是统计数据分布偏斜方向和程度的度量,是统计数据分布非对称程度的数字特征。
偏度简介
偏度(skewness),是统计数据分布偏斜方向和程度的度量,是统计数据分布非对称程度的数字特征。偏度(Skewness)亦称偏态偏态系数
表征概率分布密度曲线相对于平均值不对称程度的特征数。直观看来就是密度函数曲线尾部的相对长度。
定义上偏度是样本的三阶标准化矩,定义式如下,其中 分别表示二阶和三阶中心矩
正态分布的偏度为0,两侧尾部长度对称。若以bs表示偏度。bs<0称分布具有负偏离,也称左偏态,此时数据位于均值左边的比位于右边的少,直观表现为左边的尾部相对于与右边的尾部要长,因为有少数变量值很小,使曲线左侧尾部拖得很长;bs>0称分布具有正偏离,也称右偏态,此时数据位于均值右边的比位于左边的少,直观表现为右边的尾部相对于与左边的尾部要长,因为有少数变量值很大,使曲线右侧尾部拖得很长;而bs接近0则可认为分布是对称的。若知道分布有可能在偏度上偏离正态分布时,可用偏离来检验分布的正态性。右偏时一般算术平均数>中位数>众数,左偏时相反,即众数>中位数>平均数。正态分布三者相等。
计算
偏度是利用3阶矩定义的,偏度的计算公式为:
公式中,Sk——偏度;μ3——3阶中心矩;σ——标准差
在一般情形下,当统计数据为右偏分布时,Sk> 0,且Sk值越大,右偏程度越高;当统计数据为左偏分布时,Sk< 0,且Sk值越小,左偏程度越高。当统计数据为对称分布时,显然有Sk= 0。
在实际计算中虽然可以采用定义式进行计算,但是需要多次遍历各个样本以计算均值和方差,当样本容量很大时耗时很大。所以常常利用1至3阶原点矩进行计算:
首先:
于是:
上面的矩方法同时还适用于峰度的计算。针对偏度还所以可以使用下面公式简化计算:
峰度
峰度(Kurtosis)与偏度类似,是描述总体中所有取值分布形态陡缓程度的统计量。这个统计量需要与正态分布相比较,峰度为0表示该总体数据分布与正态分布的陡缓程度相同;峰度大于0表示该总体数据分布与正态分布相比较为陡峭,为尖顶峰;峰度小于0表示该总体数据分布与正态分布相比较为平坦,为平顶峰。峰度的绝对值数值越大表示其分布形态的陡缓程度与正态分布的差异程度越大。
峰度的具体计算公式为:
参考资料
最新修订时间:2024-07-18 10:14
目录
概述
偏度简介
参考资料