随机抽样
一种数理统计方法
按照随机的原则,即保证总体中每一个对象都有已知的、非零的概率被选入作为研究的对象,保证样本的代表性
简介
它的最大优点是在根据样本资料推论总体时,可用概率的方式客观地测量推论值的可靠程度,从而使这种推论建立在科学的基础上。正因为此,随机抽样在社会调查和社会研究中应用较广泛。常用的随机抽样方法主要有纯随机抽样分层抽样、系统抽样、整群抽样多阶段抽样等。
特点
随机抽样是在全部调查单位中按照随机原则抽取一部分单位进行调查,根据调查结果推断总体的一种调查方式。
随机抽样具有以下几个基本特点。
(1)按照随机原则抽选调查单位。所谓随机原则就是指样本单位的抽取不受任何主观因素及其他系统性因素的影响,总体的每个单位都有一定的机会被抽选为样本单位。
(2)对部分单位调查的目的是为了推断总体指标。根据数理统计原理,抽样调查中的样本指标和对应的总体指标之间存在内在联系,而且两者的误差是可以计算出来的,因此提供了用实际调查部分信息对总体数量特征进行推断的科学方法。
(3)抽样误差可以事先计算并加以控制。以样本资料对总体数量特征进行推断,不可避免会产生代表误差,但抽样调查的代表性误差是可以根据有关资料事先计算并进行控制,故可以保证推断结果达到预期的可靠程度。
随机抽样最主要的优点是,由于每个样本单位都是随机抽取的,根据概率论不仅能够用样本统计量对总体参数进行估计,还能计算出抽样误差,从而得到对总体目标变量进行推断的可靠程度。但随机抽样比较复杂,对调查人员的专业技术要求高,调查中需要抽样框,而构建和维护一个高质量的抽样框费用很高,抽样单位可能非常分散,而且不能轻易更换样本单位,增加了调查费用。
分类
单纯随机抽样
又称简单随机抽样。是最基本的抽样方法。分为重复抽样不重复抽样。在重复抽样中,每次抽中的单位仍放回总体,样本中的单位可能不止一次被抽中。不重复抽样中,抽中的单位不再放回总体,样本中的单位只能抽中一次。社会调查采用不重复抽样。
纯随机抽样的具体作法有:①抽签法。将总体的全部单位逐一作签,搅拌均匀后进行抽取。②随机数字表法。将总体所有单位编号,然后从随机数字表中一个随机起点(任一排或一列),开始从左向右或从右向左、向上或向下抽取,直到达到所需的样本容量为止。
纯随机抽样必须有一个完整的抽样框,即总体各单位的清单。总体太大时,制作这样的抽样框工作量巨大,加之有许多情况,使总体名单根本无法得到。故在大规模社会调查中很少采用纯随机抽样。
分层抽样
先依据一种或几种特征将总体分为若干个子总体,每一子总体称作一个层;然后从每层中随机抽取一个子样本,这些子样本合起来就是总体的样本。各层样本数的确定方法有 3种:①分层定比。即各层样本数与该层总体数的比值相等。例如,样本大小n=50,总体N=500,则n/N=0.1即为样本比例,每层均按这个比例确定该层样本数。②奈曼法。即各层应抽样本数与该层总体数及其标准差的积成正比。③非比例分配法。当某个层次包含的个案数在总体中所占比例太小时,为使该层的特征在样本中得到足够的反映,可人为地适当增加该层样本数在总体样本中的比例。但这样做会增加推论的复杂性。
总体中赖以进行分层的变量为分层变量,理想的分层变量是调查中要加以测量的变量或与其高度相关的变量。分层的原则是增加层内的同质性和层间的异质性。常见的分层变量有性别、年龄、教育、职业等。分层随机抽样在实际抽样调查中广泛使用,在同样样本容量的情况下,它比纯随机抽样的精度高,此外管理方便,费用少,效度高。
系统抽样
又称等距抽样。是纯随机抽样的变种。在系统抽样中,先将总体从1~N相继编号,并计算抽样距离K=N/n。式中N为总体单位总数,n为样本容量。然后在1~K中抽一随机数k1,作为样本的第一个单位,接着取k1+K,k1+2K……,直至抽够n个单位为止。
系统抽样要防止周期性偏差,因为它会降低样本的代表性。例如,军队人员名单通常按班排列,10人一班,班长排第 1名,若抽样距离也取10时,则样本或全由士兵组成或全由班长组成。
简单的一个例子:在100个人里要抽10个人,现把他们从1号编到100号,然后分成1-10号, 11-20号, 21-30号, 31-40号, 41-50号。。。。。。91号到100号。在这10组中,第一组抽3号(其实可以选1-10号里的任意一号)。 那么第2组抽13号,第3组抽23号,第4组抽33号。。。第10组抽93号。
整群抽样
又称聚类抽样。先将总体按照某种标准分群,每个群为一个抽样单位,用随机的方法从中抽取若干群,抽中的样本群中所有单位都要进行调查。与分层抽样相反,整群抽样的分类原则是使群间异质性小,群内异质性大。分层抽样时各群(层)都有样本,整群抽样时只有部分群有样本。整群抽样只需列出入样群的单位,因此可节约大量财力、人力。整群抽样的代表性低于简单随机抽样。
多阶段抽样
又称多级抽样。前 4种抽样方法均为一次性直接从总体中抽出样本,称为单阶段抽样。多阶段抽样则是将抽样过程分为几个阶段,结合使用上述方法中的两种或数种。例如,先用整群抽样法从北京市某中等学校中抽出样本学校,再用整群抽样法从样本学校抽选样本班级,最后用系统或纯随机抽样从样本班级的学生中抽出样本学生。当研究总体广泛且分散时,多采用多阶段抽样,以降低调查费用。但由于每级抽样都会产生误差,经过多级抽样产生的样本,误差也相应增大。
优缺点
优点
单纯随机抽样有不少优点,主要有:
第一,单纯随机抽样方法简单、直观,是随机抽样理论中最基本的组织形式,是抽样理论的基石。例如,日常生活中经常进行的挑选购物,某种商品短缺时的抓阄认购等,均是单纯随机抽样的简单原型。
第二,单纯随机抽样是其他抽样方式的基础,即随机抽样的各种组织形式都是单纯随机抽样的派生方式。例如,整群抽样即是把某一标志下性质相同的一些总体单位构成的群体或组视为一个个体,然后进行单纯随机抽样,其中的分群工作并不具有随机性,仅是分群前提下的随机抽样。
第三,单纯随机抽样是衡量各种抽样方式效果好坏的一个比较标准。用样本指标估计、推断相应的总体指标,随着所采取的组织形式的不同,其对同一个调查指标估计结果的有效程度就不同。
缺点
第一,采用单纯随机抽样,一般需要对总体单位加以编号,而当总体包含的个体数目很大时,编号工作就很困难,逐一编号无法做到。例如,对于连续不断生产的大量产品进行质量检验,就不能对全部产品进行编号抽样。
第二,当总体的标志变异程度较大,即总体单位标志值之间差异很大时,单纯随机抽样的代表性就不如经过分层后再抽样的代表性高(详见以下的“分层抽样”)。
第三,当调查对象范围很广,即总体中各单位较为分散时,调查所需的人力、物力、财力就较大。因此,单纯随机抽样适用于总体容量不太庞大,以及总体分布比较均匀的调查对象。
参考资料
最新修订时间:2024-10-05 10:26
目录
概述
简介
特点
参考资料