分布参数(distributed parameter)是
统计学的基本
概念之一。指
统计学中用以区别分布函数族{Fθ|θ∈Θ}中的各个分布的指标θ的函数g(θ)和分布的数字特征,如总体均值、
总体标准差、总体相关系数等。参数的所有可能值组成的集合Θ称为参数空间。参数一般不易获得,可根据反映总体情况的样本求出的统计量去估计它。
定义
分布参数(distributed parameter)是
统计学的基本概念之一。指
统计学中用以区别分布函数族{Fθ|θ∈Θ}中的各个分布的指标θ的函数g(θ)和分布的数字特征,如总体均值、
总体标准差、总体相关系数等。
参数的所有可能值组成的集合Θ称为参数空间。参数一般不易获得,可根据反映总体情况的样本求出的统计量去估计它。这种由样本对总体参数作推断,正是统计推断经常要进行的工作。
类型
定义分布所采用的大多数参数,根据其物理或几何解释,可分为三个基本类型。它们是:
(1)位置参数(记为γ)
位置参数γ确定了一个分布函数取值范围的横坐标。当γ改变时,相应的分布函数仅仅向左或向右移动而不发生其他变化,因而又称为位移参数。
例如,均匀分布函数U(a,b),其密度函数为
其中,参数a定义为位置参数,当a改变时(保持b-a不变),f(x)向左或向右移动(参见图1)。
(2)比例参数(记为β)
比例参数决定分布函数在其取值范围内取值的比例尺。β的改变只压缩或扩张分布函数,而不会改变其基本形状。
例如,指数分布函数Exp(β),其密度函数为
图2给出了β=2,1,0.5时f(x)的图形。
(3)形状参数(记为α)
形状参数确定分布函数的形状,从而改变分布函数的性质,例如韦伯分布Weibull(α,β),其密度函数为
当α改变时,其形状发生很大的变化。图3给出了α=1,2,3时f(x)的图形。
对于随机变量X,Y,如果存在一个实数γ,使X与Y具有相同的分布,则称X与Y仅仅是位置上不同的变量;如果对于某个正实数β,使得βX与Y具有相同的分布,则称X与Y仅仅是比例尺不同的随机变量;如果能找到实数γ与β,使γ+βX与Y具有相同的分布,则称X与Y仅在位置与比例上不同。如果不存在γ与β使γ+βX与Y的分布相同,则X与Y或者其形状参数不同,或者根本不服从同一类分布。
估计
由观测数据估计某一分布参数的方法很多,使用最普遍的是最大似然估计,其他还有最小二乘估计、无偏估计等。这里我们讨论最大似然估计,其他方法可参阅有关文献。
先讨论只有一个未知参数的情形,设该参数为θ,观测数据为x1,x2,...,xn。
在离散分布情形,可令Pθ(x)为该分布的概率质量函数,定义似然函数L(θ)为
则L(θ)是联合质量函数,θ的最大似然估计值 是使L(θ)取最大值的θ,即对于所有可能的θ值,L( )≥L(θ)。
在连续分布情形,令fθ(x)为该分布的
概率密度函数,其似然函数定义为L(θ):
下面举例说明如何由观测值估计分布参数。
举例
泊松分布,被估计参数θ=λ(λ>0),分布质量函数为Pλ(x)=e-λλx/x!,(x=0,1,2,...),则
令R(λ)=ln L(λ),再计算
解得
又由
所以泊松分布参数λ的最大似然估计值为