对于
有序分类变量,除了给出各类别的频数和频率外,还有一个很重要的一方面:低于或者高于某类别的取值的案例的频数和频率。因为,个案之间是有等级的,知道比它们高的或者比它们低的频数或者频率,是有用的。但是,特别注意的是,统计软件只能按照类别编码从小到大进行频数和百分比的累计,如果编码不符合要求,就需要手工统计。所以,正确的编码至关重要。
按照某种标志(性质或数量)将数据分成若干组,分别统计各组数据的频数(有时包括频率), 以反映数据分布在各组的情况。分组标志以及与各组对应的频数(或频率) 是频数分布的主要部分。当分组标志是数值大小时,作频数分布的步骤是:(1)求全距;(2)决定组距和组数;(3)列出组限;(4)统计各组频数或频率。频数分布可用表格或图形来表示,分别叫作
频数分布表或
频数分布图,便于直观地反映数据的一些分布规律。
在日常生活和经济管理中,常见的频数分布曲线主要有钟形分布(
正态分布、偏态分布)、J形分布、U形分布,洛伦茨分布曲线等几种类型。