![Stata统计分析与行业应用案例详解(第2版)](https://wfqqreader-1252317822.image.myqcloud.com/cover/500/26943500/b_26943500.jpg)
3.4 实例四——两个分类变量的列联表分析
3.4.1 两个分类变量的列联表分析功能与意义
在上节中,我们讲述了单个分类变量进行概要统计的实例,在本节中,我们将以实例的方式讲解一下两个分类变量是如何进行概要统计的,即二维列联表。
3.4.2 相关数据来源
![](https://epubservercos.yuewen.com/82CDCB/15367245804192406/epubprivate/OEBPS/Images/figure_0076_0002.jpg?sign=1739123657-Ox8BIaz0uTFjAtLyO6tZkyuLFcW86H7G-0-fbcc528624d8cf65c29915ef9afe388a)
【例3.4】为研究A市居民的身体情况,某课题组对A市居民的吸烟喝酒情况进行了调查研究,调查得到的数据经整理后如表3.6所示。试对该数据资料进行二维列联表分析。
表3.6 A市居民的吸烟喝酒情况
![](https://epubservercos.yuewen.com/82CDCB/15367245804192406/epubprivate/OEBPS/Images/figure_0076_0003.jpg?sign=1739123657-7Ywg7yBQvJZOAOX4M4HtNPKzxKUwZKm4-0-a9084f034f22918ed19d204228f249f6)
3.4.3 Stata分析过程
在用Stata进行分析之前,我们要把数据录入到Stata中。容易发现本例中有3个变量,分别是性别、是否吸烟以及是否喝酒。我们把性别变量设定为gender,把是否吸烟变量设定为smoke,把是否喝酒变量设定为drink,变量类型及长度采取系统默认方式,然后录入相关数据。相关操作我们在第1章中已有详细讲述。录入完成后数据如图3.16所示。
![](https://epubservercos.yuewen.com/82CDCB/15367245804192406/epubprivate/OEBPS/Images/figure_0077_0004.jpg?sign=1739123657-7IISRbdGszPs4GGhRolVZoey2jpB1SGp-0-7e4a1f95123c435eeeaac0ef9642fa29)
图3.16 案例3.4数据
先做一下数据保存,然后开始展开分析,步骤如下:
进入Stata 14.0,打开相关数据文件,弹出主界面。
在主界面的“Command”文本框中输入命令:
tabulate smoke drink
设置完毕后,按键盘上的回车键,等待输出结果。
3.4.4 结果分析
在Stata 14.0主界面的结果窗口我们可以看到如图3.17所示的分析结果。
![](https://epubservercos.yuewen.com/82CDCB/15367245804192406/epubprivate/OEBPS/Images/figure_0077_0005.jpg?sign=1739123657-KAxkMRkw0vTQx2nkvrcHlWTLtT5IQohO-0-a5c8354b7f7d38ddf8b95ee0157f3957)
图3.17 分析结果图
从分析结果中可以看出本次调查所获得的信息:发现共有124位A市居民参与了有效调查,其中有68人吸烟,有56人不吸烟,有41人喝酒,有83人不喝酒,具体来说,既吸烟又喝酒的居民人数为29人,不吸烟也不喝酒的居民人数为44人,只吸烟不喝酒的居民人数为39人,只喝酒不吸烟的居民人数为12人。
3.4.5 案例延伸
上述的Stata命令比较简洁,分析过程及结果已达到解决实际问题的目的。但是Stata 14.0的强大之处在于,它同样提供了更加复杂的命令格式以满足用户更加个性化的需求。
延伸:显示每个单元格的列百分比与行百分比
在本节的例子中,操作命令应该相应地修改为:
tabulate smoke drink, column row
在命令窗口输入命令并按回车键进行确认,结果如图3.18所示。
![](https://epubservercos.yuewen.com/82CDCB/15367245804192406/epubprivate/OEBPS/Images/figure_0078_0001.jpg?sign=1739123657-4M0VghDv9W7TwhYAYZ0qIrJn7WqUs7W1-0-cfcdf3543670c3e549259d4aab35a279)
图3.18 分析结果图
分析结果表中的单元格包括3部分信息,其中第1行表示的是频数,第2行表示的是行百分比,第3行表示的是列百分比。例如,最左上角的单元格的意义是:不吸烟也不喝酒的样本个数有44个,这部分样本在所有不吸烟的样本中占比为78.57%、在所有不喝酒的样本中占比为53.01%。