正偏态
数学概念
正偏态(positive skewness)分布不对称为偏态。分布高峰偏左,长尾向右延伸的偏态分布称为正偏态,亦称右偏态。此时均数大于众数。
定义
正偏态分布指在一个不对称或偏斜的次数分布中,次数分布的高峰偏左,而长尾则从左侧逐渐延伸于右端。即次数分布的众数在较小分数或量数的一侧(左侧),而长尾是在较大分数或量数的一侧(右侧)。这种分布的偏态系数大于零。
图像及参数分析
正态分布之概率密度是对直线左右对称的。它的均值(数字期望)、中位数、众数重合在这一点(图1)。有
其中为以上的密度函数。
若有随机变量其均值,而
则称是正偏态的,图形为右侧有一个长尾而左侧没有,此时众数最小,其次为中位数,期望最大,如图2所示。
图2显示取右侧极端值是有可能的,而均值受极端值的影响最大,与受极端值的影响很小。这是因为均值是矩(一阶中心矩),无论是原点矩还是中心矩均受极端值的影 响较大,如图2,值被右侧极端值拉向右方比及都大很多。与不是矩,受极端值影响小得多,这是它们比均值优越的性质。
类似地,若,则称为负偏态的,密度函数在左侧有一个长尾而右侧没有,如图3所示,此时最小,其次,最大。
设,则称
为的偏度,当时,概率密度对直线对称。
有时,中位数比均值提供更多的信息。如人的寿命的分布密度函数是正偏态的,即有个别人有很高的寿命。当我们说中国人的平均寿命是71岁时,并不表示我们有1/2的可能活到71岁。此时,若中位数时,则表示我们有1/2的可能活到65岁而不是71岁。正偏态时,分布的尾巴在右侧,中位数总是比均数小的。
均值虽然有不稳健的缺点,但它有非常重要的优点是中位数和众数所无法取代的。
参考资料
最新修订时间:2023-12-22 10:21
目录
概述
定义
图像及参数分析
参考资料