峰度(peakedness;kurtosis)又称
峰态系数。表征
概率密度分布曲线在
平均值处
峰值高低的特征数。直观看来,峰度反映了峰部的尖度。样本的峰度是和正态分布相比较而言统计量,如果峰度大于三,峰的形状比较尖,比正态分布峰要陡峭。反之亦然。
峰度以bk表示,Xi是样本测定值,Xbar是样本n次测定值的平均值,s为样本
标准差。
标准正态分布的峰度为3。以一般而言,正态分布为参照,峰度可以描述分布形态的陡缓程度,若bk<3,则称分布具有不足的峰度,若bk>3,则称分布具有过度的峰度。若知道分布有可能在峰度上偏离正态分布时,可用峰度来检验分布的
正态性。
根据
均值不等式,可以确定出峰度(系数)的取值范围:它的下限不会低于1,上限不会高于数据的个数。有一些典型分布的峰度(系数)值得特别关注。例如,正态分布的峰度(系数)为常数3,均匀分布的峰度(系数)为常数1.8。在统计实践中,我们经常把这两个典型的分布曲线作为评价样本数据序列分布性态的参照。设若先将数据标准化,则峰度(系数)相当于标准化数据序列的四阶中心矩。所以,在相同的标准差下,峰度系数越大,分布就有更多的极端值,那么其余值必然要更加集中在众数周围,其分布必然就更加陡峭。
在更通常的情况下,峰度被定义为四阶累积量除以二阶累积量的平方,它等于四阶中心矩除以
概率分布方差的平方再减去3:
这也被称为超值峰度(excess kurtosis)。“减3”是为了让
正态分布的峰度为0。
其中m4是四阶样本中心矩,m2是二阶中心矩(即使
样本方差),xi是第i个值, 是样本平均值。注意此处计算方差的时候除数是N,而不是单独计算样本方差的(N-1)。
其中,n为样本大小,D为事先计算的方差,xi为第i个测量值, 为事先计算的
算术平均数。
在实际应用中,通常将峰度值做减3处理,使得正态分布的峰度0。因此,在使用统计软件进行计算时,应注意该软件默认的峰度值计算公式。如Eviews默认的正态分布峰度为3。