重要抽样法(importance sampling method)是最有效的蒙特卡罗技巧之一,其主要思想是,它不从给定的概率分布函数中进行抽样,而是对所给定的概率分布进行修改,使得对模拟结果有重要贡献的部分多出现,从而达到提高效率,减少模拟的时间,以及缩减方差的目的。
基本介绍
其中为随机变量的分布密度,的二阶矩存在。引入新的分布密度,当时,,则上述积分也可以表示成另一种形式
其中,计算积分(1)的重要抽样方法是,确定合适的,用下式作为其近似估计
其中是母体分布为的简单子样。无偏统计量的方差由下式给出
则使此方差达到最小的为
因此,对的最合适的选择是使其与成正比。重要抽样法有时也称偏倚抽样法,它的一般原理是:选择偏倚分布密度,使得所确定的无偏统计量尽量与其中的随机变量的取值关系不大。只要抽样分布与无偏统计量的变化引起的计算量改变不大,便可用此偏倚分布与相应的无偏统计量代替原分布与相应的无偏统计量。
相关分析
重要抽样法对应于数学上的变量代换方法。即
此时随机点的选择不再是均匀的,而是以分布函数分布的。被积函数也乘以权重,其中。这时公式(6)右边积分中被积函数的方差为。
如果选择恰当,以使它在积分域内的函数形状与接近,则该方差可以变得很小。因
而函数的选择十分关键,它应满足如下条件:
(1)应当是个分布密度函数。
(2)不应起伏太大,使之尽量在积分域内近似等于常数,以保证方差比小。
(3)密度函数对应的分布函数,能较方便地解析求出。
(4)能方便地产生在积分域内,满足分布函数分布的随机点。
如能按上述条件找到函数,就可以依下列步骤求积分:
(1)根据密度函数产生随机点,例如采用反函数法。
(2)求出各抽样点的函数值,并将所有点的该函数值叠加起来除以抽样点数就得到积分结果。
也可采用作为分布密度函数,利用舍选法以舍去或接受各随机点的值。用此方法时,应当至少可以事先以经验判断出的最大值。当然最好能从中,推导出,但在很多时候这是比较困难的。
以上的讨论可很容易地推广到更高维的积分计算中,但要注意如下两方面的问题:第一,在产生随机向量的某个分量时,没有必要用舍选法,在产生了随机向量的所有分量后,再用舍选法往往更快,效率更高。第二,在计算值之前,作随机变量到的变换有时是很有用的,这时需将雅可比行列包括在权重因子内。
重要抽样法的局限性
重要抽样法无疑是蒙特卡罗计算中最基本和常用的技巧之一,它无论在提高计算速度和增加数值结果的稳定性方面都有很大的潜力,但是它仍有一些局限性,譬如:
(1) 寻找分布函数,并能解析求出其对应的分布函数的情况并不多。当然也可用数值计算方法求出,但通常这样处理不灵活速度也慢,并且也不精确。
(2) 当选择在某点为零或很快趋于零时(如高斯分布),这时是很危险的,其方差可能趋于无穷大。即使是在某点不为零,但却很小时,方差也可能很大,但是通常采用的从样本点估计方差的方法却可能不能检查出来,这会使得结果不稳定。