第三节 品质数据的整理与展示
一、分类数据的整理与图示
1.频数与频数分布
频数是落在某一特定类别或组中的数据个数。把各个类别及落在其中的相应频数全部列出,并用表格形式表现出来,称为频数分布。由两个或两个以上变量交叉分类的频数分布表也称为列联表。二维的列联表(两个变量交叉分类)也称为交叉表。
2.分类数据的图示
(1)条形图
条形图指用宽度相同的条形来表示数据多少的图形。可以横置或纵置,纵置时也称为柱形图。条形图有简单条形图、对比条形图等形式。
当分类变量在不同时间或空间上有多个取值时,为对比分类变量的取值在不同时间或空间上的差异或变化趋势,可以绘制对比条形图。
(2)帕累托图
帕累托图指按各类别数据出现的频数多少排序后绘制的条形图。通过对条形图的排序,容易看出哪类数据出现得多,哪类数据出现得少。
(3)饼图
饼图指用圆形及圆内扇形的角度来表示数值大小的图形,它主要用于表示一个样本(或总体)中各组成部分的数据占全部数据的比例。饼图对于研究结构性问题十分有用。
(4)环形图
把饼图叠在一起,挖去中间的部分就是环形图。
环形图与饼图类似,但又有区别。环形图中间有一个“空洞”,每个样本用一个环来表示,样本中的每一部分数据用环中的一段表示。因此环形图可显示多个样本或总体各部分所占的相应比例,从而有利于进行比较研究。
二、顺序数据的整理与图示
分类数据的频数分布表和图示方法适用于对顺序数据的整理与显示。但一些适用于顺序数据的整理和显示方法,并不适用于分类数据。对于顺序数据,还可以计算累积频数和累积频率(百分比)。
1.累积频数(或频率)
累积频数(或频率)是将各有序类别或组的频数(或频率)逐级累加起来得到的频数(或频率)。它有向上累积频数(或频率)和向下累积频数(或频率)两种。
(1)向上累积频数(或频率)分布,其方法是先列出各组的上限,然后由标志值低的组向标志值高的组依次累积;向上累积频数表明某组上限以下的各组单位数之和是多少,向上累积频率表明某组上限以下的各组单位数之和占总体单位数的比重。
(2)向下累积频数(或频率)分布,其方法是先列出各组的下限,然后由标志值高的组向标志值低的组依次累积;向下累积频数表明某组下限以上的各组单位数之和是多少,向下累积频率表明某组下限以上的各组单位数之和占总体单位数的比重。
2.顺序数据的图示
根据累积频数(或频率),可以绘制累积频数(或频率)分布曲线。
对于不同类型的品质数据,数据的整理和图示总结如表2-2所示。
表2-2 品质数据的整理与展示