极大似然法(the method of maximum likelihood)就是在参数θ的可能取值范围内,选取使L(θ)达到最大的参数值θ,作为参数θ的估计值。
设总体X是
离散型随机变量,其概率函数为p(x, θ),其中θ是未知参数。设X1,X2,…,Xn为取自总体X的样本,则可求出X1,X2,…,Xn的联合概率函数。如果样本取值x1,x2,...,xn,则事件(X1=x1,X2=x2,…,Xn=xn)发生的概率是为可求,这一概率值随θ的值的变化而变化,从直观上来看,既然样本值x1,x2,...,xn已经出现,它们出现的概率相对来说应比较大,应使其概率取比较大的值。极大似然法就是在参数θ的可能取值范围内,选取使L(θ)达到最大的参数值θ,作为参数θ的估计值。即取θ,使得L(θ)=L(x1,x2,...,xn; θ)=max(x1,x2,...,xn; θ)。
因此,求参数θ的
极大似然估计值得问题就是求似然函数L(θ)最大值问题。通过解方程dL(θ)/dθ=0来得到,因为lnL(θ)和L(θ)的增减性相同,所以它们在θ的同一值处取得最大值,称lnL(θ)为对数似然函数,可以通过求解对数似然函数的最大值来得到极大似然解。
(4)在最大值点的表达式中,用样本值代入即得到参数的
极大似然估计值。
从矩估计法公式我们得到,对正态总体N(μ, σ2),未知参数μ、σ2的矩估计与μ,、σ2的极大似然估计是相同的。一般地,在相当多的情况下,矩估计与极大似然估计是一致的,但也确有许多情形,矩估计法和极大似然估计法给出的估计是不同的。谁优谁劣?我们可以用估计量的优劣标准进行评价。除此之外,亦可以根据问题的实际意义进行判定。
给定一个
概率分布D ,假定其
概率密度函数(连续分布)或概率
聚集函数(离散分布)为fD,以及一个分布参数θ ,我们可以从这个分布中抽出一个具有n 个值的采样 ,通过利用fD,我们就能计算出其概率: 但是,我们可能不知道θ 的值,尽管我们知道这些
采样数据来自于分布D 。那么我们如何才能估计出θ 呢?一个自然的想法是从这个分布中抽出一个具有n 个值的采样X1,X2,…,Xn,然后用这些采样数据来估计θ 。一旦我们获得 ,我们就能从中找到一个关于θ 的估计。最大似然估计会寻找关于 θ 的最可能的值(即,在所有可能的θ 取值中,寻找一个值使这个采样的“可能性”最大化)。
对参数估计来说,预报误差法、
极大似然估计法适用范围均较为广泛,他们不仅适用于线性模型,也适用于
非线性模型,是处理残差序列相关情况下的另一类辨识方法。