由于组数是个只能取整数的
离散变量,一般取式(2)的四舍五入数值作为组数的参考数值。例如,当数据的总数N为80时,采用经验公式计算出组数为,可考虑将该组数分为7组。
确定组数的目的是为了使数据恰当地分布在各组中,数据过于集中和过于分散都有碍于对数据分布特征的展示,不利于后续的分析研究,计算组数的经验公式正是从这个角度出发,总结出的一个根据待分组数据的多少计算组数的具体方法。但是,经验公式计算出来的组数只是一个参考数值,组距的确定还要根据研究对象的实际情况,具体问题具体分析,因地制宜地加以确定。例如,在考试成绩的分析中,人们习惯将其分为优、良、中、及格和不及格5组,不论数据个数多少,分成这样5组较为适宜。
由于取值范围是客观存在的,当组数确定之后,组距也就随之确定了,两者成
反比例关系。设H为组数,d为组距,即有组距d=R/H。为了便于数据分组和
组限的划定,组距一般取5,10的整数倍。
确定组限就是具体规定各组中变量可能取值的上限和下限。确定组限的原则是“不重不漏”,使每一数据都能够被分配到其中一组里,并且只能分配到其中一组里。组限的具体形式有间断组限和重合组限,闭口组限和开口组限。
闭口组限是既有上限又有下限的组限设置。由闭口组限设置形成的数据分组称为闭口组。开口组限是缺少上限或者缺少下限的组限设置。由开口组限设置形成的数据分组称为开口组。开口组限用于组距的上下两端的组限设置,即最高数值和最低数值组的组限设置。当继续采用相等的组距进行分组,落在上下两端的分组中的数据明显过少,不具有单独分析价值时,通常采用开口组限设置。