因子得分
数学函数
因子分析的数学模型是将变量 (或样品)表示为主因子的线性组合,但有时也需要反过来将主因子表示为原始变量的线性组合,即Fi=βi1x1+βi2x2+…+βipxp,i=1,2,…m,称上式Fi为因子得分函数,简称为因子得分。由于Fi是不可观测因子,只能对它作出估计。估计因子得分的方法有加权最小二乘法(这个估计也叫巴特利特因子得分),回归法,Thomson因子得分法等。
基本介绍
因子得分(factor score)是一种估计值,是在因子分析中,对不可观测的公因子做出的估计值。因子分析是将变量分解为公因子和特殊因子的线性组合。由于m个公因子能反映原p个变量的相关关系(m<p),故反过来考察,将公因子表成变量的线性组合Fj=bj1x1+bj2x2+…+bjpxp(j=1,2,…,m),如能估出bji,就可以估计Fj的值,称之为公因子Fj的得分。这样,就把p维空间的问题化为m (m<p)维空间的问题,在低维空间Rm中,进一步考察样本分类或把样本的公因子得分作为进一步分析的原始数据。
相关分析
因子分析模型建立后,还有一个重要的作用是应用因子分析模型去评价每个样本存整个模型中的地位,即进行综合评价。例如,地区经济发展的因子分析模型建立后,我们希望知道每个地区经济发展的情况,把区域经济划分归类,以清晰地看出哪些地区发展较快,哪些地区发展不快不慢,哪些地区发展较慢等。这时需要将公共因子用变量的线性组合来表示,也即由地区经济的各项指标值来估计它的因子得分。
设公共因子F由变量x表示的线性组合为:
该式称为因子得分函数,由它来计算每个样品的公共因子得分。若取m=2,则将每个样品的p个变量代入上式即可算出每个样品的因子得分和,并将其在平面上作九子得分散点图,进而对样品进行分类或对原始数据进行更深入的研究,
但因子得分函数中方程的个数m小于变量的个数p,所以并不能精确计算出因子得分,只能对因子得分进行估计。估计因子得分的方法较多,常用的有回归(regression)估计法和Bartlett估计法(也称加权最小二乘法)。
估计因子得分的方法
回归估计法
设因子对p个变量的回归模型为
因为变量和因子均已标准化,所以,上式可写成矩阵形式,根据最小二乘估计,有,又由于因子载荷矩阵,于是:
这里R为相关阵,且。
Bartlett估计法
Bartlett估计因子得分可由最小二乘法极大似然法导出,下面给出最小二乘法求解Bartlett因子得分。
在因子分析模型中,若将载荷矩阵A看作自变量的数据矩阵,将X看作因变量的数据向量,将F看作未知的回归系数,将看作随机误差,那么因子分析模型就是一个回归模型。由于的方差各不相同,需将异方差的化为同方差,将下述模型进行变换:
变成同方差回归模型。这里,利用最小二乘法,可求得因子得分的估计值:
参考资料
最新修订时间:2024-01-08 19:08
目录
概述
基本介绍
相关分析
参考资料