抗差估计(Robust Estimation,有人译成“稳健估计”),实际是在粗差不可避免的情况下,选择适当的估计方法使未知量估值尽可能减免粗差的影响,得出正常模式下的最佳估值。
定义
一个估计方法当其依为根据的模型与实际模型有微小差异时,其估计方法的性能只受到微小的影响,即估计方法具有一定的“稳定性”。因若不然,则针对理论模型假设下的估值之优良性不仅没有实际意义,还可能导致使用者误入歧途。这是估计方法抗差性意义的一个方面。
估计方法抗差性的另一个方面的意义是当观测样本中混入少量粗差(outlier)时,估计量的数值受其影响不大,即估计方法具有一定的“抗干扰性”。因若不然,则极少数的观测粗差都可能导致估计量面目全非。
这种既能抵制模型偏差又能抗拒异常观测扰动的估值方法称为抗差估计法。从一定意义上说,上述抗差性的两种含义是相通的。因为当数据受到粗差污染时,该数据可被视为来自另—·个总体,其分布与原来模型所规定者不同。
目标
抗差估计所追求的并非只具有抗差性,还应具有其它的良好性能。抗差估计的三个主要目标:
(1)在所假定的模型下,估值具有合理的优效性(最优或接近最优),
(2)在实际模型与假设的模型有微小差异时,其估值或统计方法(如估值的渐近方差或检验量的检验功效等)所受的影响也较小,
(3)在实际模型与假定模型有严重偏离时,其估值的性能仍能“过得去”或者说,不致使估值受到破坏性影响。
Hampel等提出了与之相类似的四个抗差估计目标:
(1)估值应最优地拟合于观测样本(数据群体),
(2)估值方法应能识别异常值,
(3)对于不平衡设计空间,估值方法应能识别强影响观测,
(4)估值方法应能处理与假设相关结构有偏离的数据。
在其它文献中,还有许多抗差估计目标。如高渐近相对效率(relative efficiency)或高绝对效率(absolute;efficiency)等,但这些目标与前面提到的抗差目标相比要次要一些。
类型
统计学家已经发展了各种不同的稳健估计统计方法。三种较基本的抗差估计类是:极大似然型估计(M估计)、
顺序统计量线性组合型估计类(L估计)和非参数型秩检验估计(R估计)。
研究内容
抗差估计应具备两大特点:一是它能消除和削弱粗差对参数估值的影响。二是它基本上具备经典估计的一些优良特性。前者是主要的,因为一个不可靠的估计量很难保证其估值是有效的。有两种方式排除粗差对估值的干扰。一种是完全排除一部分可疑的观测值。另一种只是对一些观测值加以限制,削弱它们对估值影响的程度。后者在排除粗差方面比前者要缓和一些,其目的是避免损失一些还可以利用的信息。鉴别粗差的方法有多种,基本上都是根据余差绝对直的大小来判定。因此在处理粗差之前,要事先对观测数据进行“前期”平差计算来获得余差。为了通过余差正确地发现粗差,要求寻找一种抗差能力很强的平差模型。前期平差的目的是获得可靠的余差,并不十分强调估值的效率。
有了抗差估计的数学模型还不够,还要研究抗差估计的计算方法。实际上,在抗差估计的计算中,排除粗差和求有效估值不能绝然分开,因此抗差估计的计算是逐步趋近最佳解的迭代过程。
总之,抗差估计理论研究的最终目的是寻求一些具有实际意义的有效估计。