虚拟变量
又称虚设变量
虚拟变量 ( Dummy Variables) 又称虚设变量、
名义变量
或哑变量,用以反映质的属性的一个
人工变量
,是量化了的
自变量
,通常取值为0或1。引入哑变量可使线性回归模型变得更复杂,但对问题描述更简明,一个方程能达到两个方程的作用,而且接近现实。
例子
例如,反映文化程度的虚拟变量可取为:1:本科学历;0:非本科学历
一般地,在虚拟变量的设置中:基础类型、肯定类型取值为1;比较类型,否定类型取值为0。
作用
模型中引入虚拟变量的作用
1、分离异常因素的影响,例如分析我国
GDP
的
时间序列
,必须考虑“**”因素对
国民经济
的破坏性影响,剔除不可比的“**”因素。
2、检验不同属性类型对
因变量
的作用,例如工资模型中的文化程度、季节对销售额的影响。
3、提高模型的精度,相当于将不同属性的样本合并,扩大了
样本容量
(增加了误差自由度,从而降低了
误差方差
)
设置原则
虚拟变量设置的原则
在模型中引入多个虚拟变量时,虚拟变量的个数应按下列原则确定:
(1)如果
回归模型
有截距项
有m种互斥的属性类型,在模型中引入(m-1)个虚拟变量。
(2)如果回归模型无截距项,有m个特征,设置m个虚拟变量
参考资料
最新修订时间:2023-02-09 13:52
条目作者
小编
资深百科编辑
目录
概述
例子
作用
设置原则
参考资料
Copyright©2024
闽ICP备2024072939号-1