随机扰动项在
计量经济学模型中占据特别重要的地位,也是计量经济学模型区别于其它
经济数学模型的主要特征。李子奈(2008)将计量经济学应用研究的总体模型设定归纳为:将影响
被解释变量的因素集进行有效分解,按照与被解释变量关联关系的恒常性和
显著性两个维度,分解为显著的恒常性因素集、显著的偶然性因素集和无数单独影响可以忽略的非显著因素集;所有显著的恒常性因素作为解释变量;显著的偶然性因素对被解释变量的影响,则通过对数据进行奇异点诊断后采用技术手段予以消除;而无数非显著因素对被解释变量的影响则用一个随机扰动项(stochastic disturbance term)表示,并引入模型。W.H.Greene (2000)指出,没有什么模型可以期望处理经济现实的无数偶然因素,因此在经验模型中纳入随机因素是必须的,被解释变量的观察值不仅要归于已经清楚了解的变量,也要考虑来自人们并不清楚了解的偶然性和无数微弱因素的影响。
Y代表居民支出;X1代表居民收入;X2代表家庭财富;c是常数,即居民基本消费。这时,随机误差项代表的是:GDP、
消费者价格指数、
工业品价格指数、本币汇率、大宗商品价格指数、房价均值、子女教育费均值等等等等。我们知道,收入和财富是决定居民支出较为直接的变量,所以我们将其引入模型中,而宏观经济情况和价格水平都是间接影响着居民支出的。如果我们需要更详细全面的模型,那么我们需要引入更多的变量;但引入更多变量的成本也较大,比如多重共线、自相关问题等等。所以模型利用随机误差项将该部分庞大而对因变量影响不大的变量们都统一在一起表示,并且由于这些变量们对因变量的影响有正有负亦可相互抵消,只是影响模型的设定全面性而已。虽然如此,任意将模型的变量放入随机误差项也是不对的,比如:上述模型可以改为:
我们可以看到,家庭财富被挪入随机误差项,这是可以的,但是模型存在设定偏误,即模型忽略了家庭富足,而收入不高,靠有钱的老爹过着花天酒地生活的人群,而这种人群我们不能证明其是大还是小,就很有可能对模型产生较大影响。好吧,直接公布答案,通过很多学者的研究,在模型(1)中我们得到的那条曲线更真实,所以我们刚才说的那种靠爹吃饭的人还真不是少数。所以模型(2)是有问题的。当然这不证明模型(1)就完全没有问题,模型(1)存在较为严重的多重共线问题,即收入和家庭财富是相关性非常高的。不管他,扯远了,我们是为了解释随机误差项的含义,怎么合理利用需要大量的阅读……
如果你让我从数学式上对随机误差项进行解释,我只能说其期望值是0,方差好像是1,忘记了。刚才说的模型(2)至少就不符合期望值是0的假设,所以模型(2)是有问题的。当然这都是理论的假设前提,在这些前提下,模型是有效的,我们也称之为BLUE,如果前提被破坏,我们就要对模型进行调整和修正以使之回归BLUE的结果。所谓BLUE就是模型符合:无偏性、有效性、一致性。无偏性就是估计值的期望值等于实际值;有效性就是估计值是方差最小的;一致性就是估计值依概率收敛到实际值