假设我们进行一系列的实验,这些实验之间是与统计无关的,而且每个实验仅有两种可能的结果,设所有这些实验取得两个中的任一结果的概率都是一样的。例如,当投掷一个硬币时,那么可能的结果就是头像朝上和头像朝下。在理想的情况下,如果这些实验满足所说的条件,我们就称它为“贝努利实验”。
基本简介
假设我们进行一系列的实验,这些实验之间是与统计无关的,而且每个实验仅有两种可能的结果,设所有这些实验取得两个中的任一结果的概率都是一样的。例如,当投掷一个硬币时,那么可能的结果就是头像朝上和头像朝下。在理想的情况下,如果这些实验满足所说的条件,我们就称它为“贝努利实验”。这种实验包含几次独立试验,且每次试验中只有两种可能结果:成功或失败;又被称为二次实验。
重复进行n次独立的贝努利试验,这里“重复”的意思是指各次试验的条件是相同的,它意味着各次试验中事件发生的概率保持不变,“独立”的意思是指是指各次试验的结果是相互独立的,这种试验所对应的数学模型成为贝努利概型。有时为了突出实验次数n,也称为n重贝努利试验。
目标
讨论贝努力试验最终的目的乃建立一模型,据此模型可求得当我们重复进行此种试验时,两种结果之一(成功或失败)可能出现的次数。
当某种试验连续且重复进行时,每一次重复的实验称为一个试验。此外,一个试验可能出现两个结果,分别称为成功(S)与失败(F)。再次特别强调的是,此种试验下只有两种可能结果,但并非取其成功或失败的字面上的意义。习惯上,将某研究中我们所关心的事件标记为成功(即使是一个悲惨的事件),例如,研究失业率的问题中,我们往往将失业的事件视为两种结果之一的“成功”事件。
贝努利模型
我们做n次实验。每次实验能以概率p出现事件A或者以概率q=1-p出现与A对立的事件 ,且这n次实验的秸果是相互独立的。我们指定数1代表事件A出现,数0代表事件 出现。在n次实验中,事件4可能出现0,1,2,…,n次。以X=k表示在n次实验中事件A恰好出现k次的事件,因此随机变数X能取值k=0,1,2,…,n。
这个随机数的概率函数可以表示如下:
因此二项分布函数是
其中和是对于所有小于x的非负整数k来求的。
定理
说明
如果我们把贝努利试验中某种结果称为成功或是失败的,而且只是关心n次贝努利试验中总的成果次数,而不关心它出现的次序,那么在n次贝努利试验中,k次成功可以有 种方式分布。
如果每次成功的概率是p,那么失败的概率是q=1-p,出现k次成功的每一种方式的概率是 ,而表示这种成功的分布函数称为“二项式分布函数”。
注意
定理
n次贝努利试验中,每次成功的概率为p,失败的概率为q=1-p,k次成功和n-k次失败(0≤k≤n)的概率为:
证明
假设进行n次贝努利试验时,用n元组(a1,a2,a3,…an)表示结果,其中ai=S表示成功,ai=F表示失败,i=1,2,3,4,5,…,n。
由于n次试验是独立的,是由k次成功和n-k次失败组成的,所以每个n次实验结果的概率为 ,而由S和F构成的包含k个S和n-k个F的n元组有个,所以k次成功和n-k次失败(0≤k≤n)的概率为:
我们可以把成功概率为p,失败概率为q=1-p的n次独立的伯努利实验中有k次成功和n-k次失败的概率记为 ,且有 。
应用
一个工厂希望生产的产品中次品只有10%,采用的质量控制方法是由在40个产品的一次采样中计算次品的数目组成,经过400采样后,所得结果如下:
“成功”应该算是找到一个次品,这里我们计算每40个试验中成功的次数,因为“成功”的概率为p=0.1,虽然我们不能期望每次都正好有10%的次品,但是,这个分布符合
二项式分布:
虽然400是一个比较少的采样数,但是实验证明理论和实际符合得相当好,下表所示是实际的数据,和理论的数据相符合。