分位数(Quantile),亦称分位点,是指将一个
随机变量的
概率分布范围分为几个等份的数值点,常用的有
中位数(即二分位数)、
四分位数、
百分位数等。
分位数指的就是连续分布函数中的一个点,这个点对应概率p。若
概率0
随机变量X或它的概率分布的分位数Za,是指满足条件p(X≤Za)=α的实数。
对于有限的数集,可以通过把所有观察值高低排序后找出正中间的一个作为
中位数。如果观察值有偶数个,则
中位数不唯一,通常取最中间的两个数值的平均数作为
中位数,即二分位数。
计算
有限个数的数据的二分位数的方法是:把所有的同类数据按照大小的顺序
排列。如果数据的个数是
奇数,则中间那个数据就是这群数据的中位数;如果数据的个数是偶数,则中间那2个数据的
算术平均值就是这群数据的中位数。
四分位数(Quartile)是
统计学中分位数的一种,即把所有数值由小到大排列并分成四等份,处于三个分割点位置的数值就是四分位数。
2)第二四分位数(Q2),又称“
中位数”,等于该样本中所有数值由小到大排列后第50%的数字;
百分位数,
统计学术语,如果将一组数据从小到大排序,并计算相应的累计百分位,则某一百分位所对应数据的值就称为这一百分位的百分位数。运用在教育统计学中,例如表现测验成绩时,称
PR值。
分位数回归思想的提出至今已经有近30多年了,经过这近30多年的发展,分位数回归在理论和方法上都越来越成熟,并被广泛应用于多种学科中。它对于实际问题能提供更加全面的分析,无论是
线性模型还是
非线性模型,分位数回归都是一种很好的工具,它对一般回归模型做了有益的补充。
分位数回归是对以古典条件均值模型为基础的
最小二乘法的延伸,它用几个分位函数来估计整体模型。分位数回归法的特殊情况就是中位数回归(最小一乘回归),用对称权重解决残差最小化问题,而其他条件分位数回归则需要用非对称权重解决
残差最小化。
分位数回归采用加权残差绝对值之和的方法估计参数,其优点体现在以下几方面:首先,它对模型中的
随机扰动项不需做任何分布的假定,这样整个回归模型就具有很强的稳健性;其次,分位数回归本身没有使用一个连接函数来描述因变量的均值和方差的相互关系,因此分位数回归有着比较好的弹性性质;第三,分位数回归由于是对所有分位数进行回归,因此对于数据中出现的异常点具有耐抗性;第四,不同于普通的最小二乘回归,分位数回归对于因变量具有单调变换性;最后,分位数回归估计出来的参数具有在大样本理论下的渐进优良性。