多阶段抽样
数理统计领域名词
多阶段抽样(Multistage sampling):是指将抽样过程分阶段进行,每个阶段使用的抽样方法往往不同,即将各种抽样方法结合使用,其在大型流行病学调查中常用。
定义
多阶段抽样(Multistage sampling):是指将抽样过程分阶段进行,每个阶段使用的抽样方法往往不同,即将各种抽样方法结合使用,其在大型流行病学调查中常用。其实施过程为,先从总体中抽取范围较大的单元,称为一级抽样单元,再从每个抽得的一级单元中抽取范围更小的二级单元,依此类推,最后抽取其中范围更小的单元作为调查单位。
多阶段抽样(multistage sampling).也称为多级抽样或分段抽样,指在抽取样本的时候,按照抽样个体的隶属关系或层次关系,分为两个或两个以上的阶段从总体中抽取样本的一种抽样方式。其具体操作过程是:第一阶段.将总体划分为若干个一级抽样单位。从中抽选若干个一级抽样单位入样;第二阶段,将入样的每个一级单位分成若干个二级抽样单位,从入样的每个一级单位中抽选若干个二级抽样单位入样。从集体抽样到个体抽样,分成若干阶段逐步地进行。在社会研究中,当总体的规模特别大,或者总体分布的范围特别广时,研究者一般采取多阶段抽样的方法来抽取样本。
比如,为了调查某县人口的抽样,可以分为三段进行,首先以乡为抽样框,抽取一部分,然后在抽中的乡里面,以村为单位进行抽样,即抽出若干个,最后,再在抽取的村里面抽取一定的人口。整个过程中各阶段的抽样,则可以采取简单随机抽样或者分层抽样。
多阶段抽样区别于分层抽样,也区别于整群抽样.适用于抽样调查的面特别广,不要求有具体的包括所有总体单位的抽样框的情况.因而比较容易进行。它同样适用于总体范围太大,无法直接抽取样本的情况。可以相对节省调查费用。因此在总体范围特别大、对象的层次特别多的社会研究中一般采用多阶段抽样方法。但是由于每段抽样都会有误差,经过多阶段抽样,最后抽出来的样本误差就会比较大,这是多阶段抽样的主要缺点。另外,多阶段抽样时比较麻烦,从样本对总体的估计比较复杂。在同等条件下可以通过增加开头阶段的样本数适当减少最后阶段的样本数来尽量缩小误差。
总目标
多阶段抽样的基本思路是将多阶段总目标的抽样精度分解为各阶段目标量的抽样精度,在总精度和各阶段的精度之间建立一种有机的、量化的联系。
(1)可以解决特大总体的抽样问题。当抽样推断的面很广,没有一个包括所有总体单位的抽样框,或者总体范围太大无法直接抽取样本时,需要采用多阶段抽样。例如,全国农产量调查和城市居民的住户调查,样本单位遍布全国各地,显然不可能直接一次抽到所需要的样本,只能分成几个阶段来逐级抽取。
(2)可以相对地节约人力物力。从一个比较大的总体,抽取一个随机样本,势必使抽到的样本单位比较分散,若要派人调查,人力和物力的支出比较大。例如,一个县要确定一些农户作样本,用一次随机抽样的样本很可能分布在全县各个乡,调查往返的路费就比较大。如果分阶段进行,先抽乡,然后在抽中的乡再抽若干户,这样可以使样本相对比较集中,因而可以节省人力和物力。
(3)可以利用现成的行政区划、组织系统作为划分各阶段的依据,为组织抽样调查提供方便。根据我国政治、经济、管理的特点,各级党政领导都需要统计数字,因而全国抽样调查的数字往往不能满足各级需要。如果能把多阶段抽样和各地需要结合起来,如各阶段根据需要再适当地补充样本,把多阶段抽样和各地的需要结合起来从而解决这一矛盾。
过程
多阶段抽样具体操作过程是:
第一阶段,将总体分为若干个一级抽样单位,从中抽选若干个一级抽样单位入样;
第二阶段,将入样的每个一级单位分成若干个二级抽样单位,从入样的每个一级单位中各抽选若干个二级抽样单位入样……,依此类推,直到获得最终样本
如果我们面对的一阶单元内总体基本单元数相当大,作全面的调查就会比较困难,或者一阶单元内各二阶单元可以给出相近的结果,作全面的调查又无必要。此时从费用和抽样估计效率考虑,便可以从总体中随机抽取一部分一阶单元,然后再从被抽中的一阶单元内,随机抽取部分二阶单元并对他们作全面调查,我们把这种抽样技术称为两阶抽样。
如果在被抽中的二阶单元中,再抽取部分三阶单元组成样本,并对抽中的三阶单元进行全面的调查,这就是三阶抽样。类似地,可以定义四阶抽样或更高阶的抽样,通常将两阶以上的抽样称为多阶段抽样。
需要指出的是,多阶段抽样中,各阶可以采用不同的抽样方法,也可采用同一种抽样方法,要视具体情况和要求而定。
在两阶抽样中,总体各一阶单元所包含的二阶单元数,有相等和不相等的两种情况。前者无论在样本的抽取还是在指标的估算方面都相对比较简单,然而在抽样实践中却很少有这种情况的存在,但作为基本方法仍然有其实际意义;后种情况在抽样和指标的估算方法上都较为复杂,然而在实际中普遍存在此种情况。
区别差异
多阶段抽样区别于分层抽样,也区别于整群抽样,其优点在于适用于抽样调查的面特别广,没有一个包括所有总体单位抽样框,或总体范围太大,无法直接抽取样本等情况,可以相对节省调查费用。其主要缺点是抽样时较为麻烦,而且从样本对总体的估计比较复杂。
将总体分为若干个一阶单元,如果在每一个一阶单元中,都随机抽取部分二阶单元,由这些二阶单元中的总体基本单元组成的样本,在抽样的方式上,就相当于分层抽样;如果在全部的一阶单元中,只抽取了部分一阶单元,并对抽中的一阶单元中的所有的基本单元都做全面调查,这就是整群抽样。
因此,分层抽样实际是第一阶抽样比为100%时的一种特殊的两阶抽样;而整群抽样实际上是第二阶抽样比为100%时的一种特殊的两阶抽样,故也称单级整群抽样。令fi为抽样比,即有:
当时,二阶抽样可视为分层抽样,当时,二阶抽样可视为整层抽样。
多阶抽样与分层抽样的主要区别在于:
一、分层抽样是对总体中的每个一级样本群体进行全面入样,再对所有的样本进行抽查;而两阶抽样则把总体中所有的群体视为一阶单元,对这些一阶单元进行抽样,将抽出的样本再次进行抽样(两次都不是进行全面的调查),产生两级样本,最后综合估算出总的一级样本指标。
二、整群抽样是对总体中抽取的每个样本群体所包含的基本单元进行全面调查;而两阶抽样则把总体中所有的群体视为一阶单元,对每一个被抽中的一阶单元所包含的二级单元(即基本单位),不是进行全面的调查,而是再进行一次抽样调查(也称抽子样本)。即两阶抽样,产生两级样本,最后综合估算出总的一级样本指标。至于在综合估算的方式方法上,两阶抽样与整群抽样也是极其相似的,只不过前者为就被抽一级单元的样本指标进行综合估算,后者为就被抽样群体单元的全体指标进行综合估算。
特征
(一) 便于组织抽样。
当总体单元数目很大,分布很广时,若采用简单随机抽样,那么,编制全体总体单元的抽样框和现场实施随机抽样,都是相当困难的;如果采用等距抽样,则须将全部总体单元进行有序排列并等距抽取,也是很困难的;若采用分层抽样。则为提高抽样估计效率,需掌握全部总体单元的有关资料,按照分层的原则进行分层,然后到各层中去抽样,这一分层和大范围抽样的工作,是很繁重的;若采用单级整群抽样,也需掌握全部总体单元的有关资料,按分群的原则分群,并在抽中的群内作全面调查,这一分群和在群内做全面调查的工作也是很庞大的。
例如,我国有一亿八千万农户,为做农村住户调查,如果按上述几种方式进行抽样,其工作量之大是难以想象的。
若采用多阶段抽样,就可避免上述抽样技术中的麻烦。它可按现有的现有的行政区域或地理区域划分为各阶抽样单元,从而简化抽样框的编制便于样本单元的抽取使整个抽样调查组织工作容易进行。多阶段抽样既保持了单级整群抽样的优点,又克服了他的缺点。
(二)抽样方式灵活,有利于提高抽样的估计效率。
多阶段抽样中,各阶段可以采用同一种抽样方法,也可以根据各阶单元的分布情况,采用不同的抽样方法。同时,还可以根据各阶单元分布情况的不同,安排不同的抽样比。
(三)多阶段抽样对基本调查单元的抽选不是一步到位的。
至少要经过两步抽样,这也是多阶段抽样与单阶抽样的区别所。
在。因此,多阶段抽样的随机性体现在每一阶单元的抽选上。而在各阶段可以充分利用辅助信息来增加效率。但由于在现实中,各阶单元大小相等的情形又几乎是不存在,所以对于各阶单元大小不等的多阶段抽样,如何保证每个基本单元都有相同的可能性被抽中,是一个较为复杂的问题,有待进一步探讨。
(四)多阶段抽样实质上是分层抽样整群抽样的有机结合。
以两阶段抽样为例,从总体上所有一阶单元中抽取一部分单元,相当于从总体所有群中抽取部分群的整群抽样;而在每个抽中的一阶单元中分别抽取部分二阶单元,就相当于分层抽样。即先整群,后分层。因此,二阶抽样从技术上看是整群抽样与分层抽样的综合。
(五)多阶段抽样在抽样时并不需要二阶或更低阶单元的抽样框
对于第一阶抽样,初级单元的抽样框是必要的。在以后的各阶抽样中,仅仅需对那些已抽中的单元准备下一级单元的抽样框。
(六)多阶段抽样还可用于“散料”的抽样,即散料抽样。
所谓“散料”,是指连续松散的、不易区分的个体或抽样单元的材料。例如一堆煤,一车水泥等。对于散料,抽样单元可以人为划分,也可以取其自然的单位。进行散料抽样时,一级单元是自然或人为划分的分装(例如一袋水泥),二级单元则是从分装中抽取一定数量(如一千克)的份样作调查。
举例分析
以某省粮食产量调查为例。可以按行政区域划分层次,以省为总体,以县为抽样单位。步骤为:
(1)从全省所有县级单位中,抽取部分县作为第一阶段抽取的样本。
(2)从被抽中县的所有乡或村中,抽取部分乡或村作为第二阶段抽取的样本。
(3)从被抽中乡或村的所有农户中,抽取部分农户作为第三阶段抽取的样本。
(4)从被抽中农户的所有播种面积中,抽取部分地块,进行调查,作为最基层阶段的样本,计算其样本平均亩产量,然后逐级往上综合估算平均亩产量,并推算总产量。
(5)抽样阶段数不宜过多,一般以划分两、三阶段,至多四个阶段为宜。
在多阶段抽样中,前几个阶段的抽样,都类似整群抽样。每一阶段抽样都会存在抽样误差。为提高抽样指标的代表性,各阶段抽取群数的安排和抽样方式,都应注意样本单位的均匀分布。首先,适当多抽第一阶段的群数,使样本单位在总体中得到均匀分布。但是,样本过于分散则需要更多的人力和经费。其次,根据方差的大小,来考虑各阶段抽取群数的多少。对于群间方差大的阶段,应当适当多抽一些群;反之,则可少抽一些群。最
后,各阶段抽样时,可以根据条件,将各种抽样组织方式灵活运用,而且尽可能利用现成资料。
各种组织形式各有特点,在抽样推断过程中,结合各个阶段抽样的条件,可以把各种抽样组织方式灵活地结合运用。
参考资料
最新修订时间:2024-01-08 15:09
目录
概述
定义
参考资料