聚类取样(Cluster Sampling)又称
整群抽样。是将总体中各单位归并成若干个互不交叉、互不重复的集合,称之为群;然后以群为抽样单位抽取样本的一种抽样方式。应用整群抽样时,要求各群有较好的代表性,即群内各单位的差异要大,群间差异要小。
定义
取样又称抽样,即从目标事物中选择有代表性的
样本。取样又称为采样,即采集样本。通俗解释:从大量物品或材料中抽取少数做
样品。取样可以分为随机取样和非随机取样两种,而判断取样属于随机取样的一种。
实施步骤
先将总体分为i个群,然后从i个群中随机抽取若干个群,对这些群内所有个体或单元均进行调查。抽样过程可分为以下几个步骤:
1、确定分群的标注
2、总体(N)分成若干个互不重叠的部分,每个部分为一群。
3、据各样本量,确定应该抽取的群数。
4、采用
简单随机抽样或系统抽样方法,从i群中抽取确定的群数。
例如,调查中学生患近视眼的情况,抽某一个班做统计;进行
产品检验;每隔8h抽1h生产的全部产品进行检验等。
适用情况
整群抽样方法的运用,需要与分层抽样方法区别。
当某个总体是由若干个有着自然界限和区分的子群(或类别、层次)所组成,同时,不同子群相互之间差很大、而每个子群内部的差异不大时,则适合于分层抽样的方法;反之,当不同子群之间差别不大、而每个子群内部的异质性比较大时,则特别适合于采用整群抽样的方法。
优缺点
优点:整群抽样的优点是实施方便、节省经费。
缺点:往往由于不同群之间的差异较大,由此而引起的
抽样误差往往大于
简单随机抽样,且样本分布面不广、样本对总体的代表性相对较差。
误差
整群抽样的误差视各群单位方差大小而定,各群单位方差的简单平均数是计算其
抽样平均误差的依据。从公式上看,整群抽样平均误差的公式与类型抽样平均误差的公式相似,用R表示
全及总体中划分的群(组)数。r表示被抽中的群(组)数。表示
抽样总体各群(组)方差的
平均数。
取样分类
随机抽样法
调查对象总体中每个部分都有同等被抽中的可能,是一种完全依照机会均等的原则进行的抽样调查方法。
随机抽样法主要有简单随机抽样、系统抽样、分组抽样、分层抽样四种。
是指从总体N个单位中任意抽取n个单位作为
样本,使每个可能的样本被抽中的
概率相等的一种抽样方式。简单随机抽样的缺陷在于事先要把研究对象编号,比较费时、费力。当样本容量较小时,可能发生偏向,影响样本的代表性。
是指先将总体的全部单元按照一定顺序排列,采用简单随机抽样抽取第一个样本单元(或称为随机起点),再顺序抽取其余的样本单元的一种抽样方式。相对于
简单随机抽样方式,系统抽样最主要的优势就是经济性。等距抽样方式比简单随机抽样更为简单,花的时间更少,并且花费也少。使用等距抽样方式最大的缺陷在于
总体单位的排列上。
即按照某一标准将总体单位分成“群”或“组”,从中抽选“群”或“组”,然后把被抽出的“群”或“组”所包含的个体合在一起作为样本,被抽出的“群”或“组”的所有单位都是样本单位,最后利用所抽“群”或“组”的调查结果推断。这种抽样方法的优点是实施方便、节省经费。缺点是往往由于不同群之间的差异较大,由此而引起的抽样误差往往大于
简单随机抽样、样本分布面不广、样本对总体的代表性相对较差等。
④分层抽样
是从一个可以分成不同子总体(或称为层)的总体中,按规定的比例从不同层中随机抽取
样品(个体)的方法。这种方法的优点是,能够避免简单随机抽样中样本集中于某种特性或缺少某种特性的现象,
样本的代表性比较好,
抽样误差比较小。缺点是抽样手续较
简单随机抽样还要繁杂些。
非随机抽样法
抽样时不是遵循随机原则,而是按照研究人员的主观经验或其它条件来抽取样本的一种抽样方法。主要有偶遇抽样、判断抽样、等额抽样、滚雪球抽样。
是指完全按调查者的意愿选取样本的一种方法。这种抽样方法的优点是方便、灵活,简便易行,及时取得所需资料,节约时间和费用成本低。缺点是由于个体差异性,抽样误差很大,结果不够可靠,应用价值较低。
是指由市场调查的专家依据自己的判断来选取样本的一种方法。优点是按照调查人员的需要来选定样本,所以较好地满足了特殊的调查需要。缺点是如果调查人员在选取样本时主观判断出现偏差,则判断抽样极易发生较大的抽样误差。
是指按照一定的标准确定地区别和职业别等不同群体的样本配额,然后由调查人员主观地抽取配额内样本的方法。这种抽样适用于设计调查者对总体的有关特征具有一定的了解而样本数较多的情况下,实际上,配额抽样属于先“分层”(事先确定每层的样本量)再“判断”(在每层中以判断抽样的方法选取抽样个体)。优点是费用不高,易于实施,能满足总体比例的要求。缺点是容易掩盖不可忽略的偏差。
是指先随机选择一些被访者并对其实施访问,再请他们提供另外一些属于所研究目标总体的调查对象,根据所形成的线索选择此后的调查对象的抽样方法。这种抽样方法的优点是调查费用大大减少,缺点是样本很可能出现偏差,不能很好地代表整个总体。