设定误差(specification error)亦称“设定偏误”,指由
经济计量模型设定条件的错误,引起的未知参数最小二乘估计的误差。模型设定条件的错误主要有:1)遗漏了重要的
解释变量;2)包含了不必要的解释变量;3)选取了错误的模型函数形式;4)不满足高斯-马尔可夫定理的条件等。
设定误差的含义
在经典
线性回归模型(CLRM) 的假定下,通常我们认为所使用的模型都是正确的,所关心的问题是对模型回归的结果进行检验,比如,检验,检验,检验等,当然,还要对
随机误差项进行自相关和异方差检验。如果这些检验在统计上都“通过了”或者针对“
多重共线性”、“异方差”和“自相关”等问题对模型都进行了修正,那么最终得到的模型便是一个“可用”的模型。然而,这种计量经济学模型并非是“万能的”或“绝对正确的”,它仅仅是根据观测数据对经济理论的一种统计上的验证。
经济学家多年来对“真理”的寻求曾给人一种观感:经济学家们就好像在一间黑房子里搜寻一只原本并不存在的黑猫,而计量经济学家还经常声称找到了一只。
因此,假设正确的模型,可能是不正确的,我们把这个问题就叫做模型设定误差(model specification error) 或模型设定偏误( model specification bias)。那么,如何去发现一个“正确”的模型呢? 尽管计量经济学家们对所谓“正确”的模型设置了很多限制或选择准则,但是,也许这种所谓“正确”的模型根本就不存在。所谓的限制或选择准则,只不过是开列出一个“好”模型的清单罢了。然而,这一切都不能阻止人们对模型设定问题的研究和探讨。
设定误差的类型
我们把模型设定误差归纳为如下的原因:
漏掉一个有关变量
假设我们认为存在一个好的模型:
其中,代表生产总成本,代表产出,方程(1)为立方总成本函数。
出于某种原因,研究者使用另一种比较简单的模型:
这样,就构成了模型设定误差,即漏掉一个有关变量(omitting a relevant variable)的误差。事实上,模型(2)中
随机干扰项包含了被漏掉的变量,即
需要说明的是,被漏掉的变量也可以是被解释变量的滞后项,比如。这样的模型设定误差被称为动态设定偏误(dynamic mis-specification)。
包含一个无关变量
假设研究者使用了一种更复杂点的模型:
这样,也构成了模型设定误差,即包含一个无需或无关变量(including an unnecessary orirrelevant variable)的误差。事实上,模型(4) 中系数一定为0,否则,模型(1)的“正确”性就出现矛盾。也就是说,模型(4)在的约束条件下即为模型(1)。
从而有
因为真实模型中。
采用错误的函数形式
假设研究者采用了半对数模型:
这样,也构成了模型设定误差,其原因在于采用了错误的函数形式(wrong function form)。
测量误差
假如研究者考虑使用如下模型:
其中,和均为观测值,不是真实的也就是说,模型存在测量误差偏误(errorof measurement bias)。实际上,这样的观测偏误是无法避免的,因为,数据不仅受到近似计算、数据缺失等因素的干扰,而且通常情况下,获得第一手资料难度很大,因此,数据使用者往往采用第二手资料,而第一手资料也许存在误差。
对随机误差项设定不正确
模型设定误差与
随机误差项进入模型的方式也有关系。设简单
线性回归模型:
其中,随机误差项是以乘积的形式进入回归模型,并且满足CLRM假定。模型(8)等价于
显然,斜率系数和是不同的,若方程(8)是“正确”的,而不是真实的一个无偏估计,则构成了模型设定误差。