交叉列联分析
合集下载
相关主题
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
7.9%
7.4%
—
合计
23.8%
28.6% 21.4%
ppt课件完整
26.2%
100%
15
80% 68.0%
70%
60%
62.5% 63.3%
71.8%
50%
40%
32.0%
37.5% 36.7%
28.2%
30%
20%
10%
0% 一分公司 二分公司 三分公司 四分公司
赞成 反对
ppt课件完整
16
推断统计-进行卡方检验
• 在零假设成立时,该统计量近似服从自由度为(r1)×(s-1)的2分布。当该统计量的值很大(或p值 很小)时,就可以拒绝零假设,认为这两个变量 不相互独立。
农村
价格
品牌
款式
• 以列联表为基础可以对两个变量之间的关系进行多种统 计检验
ppt课件完整
2
列联表举例
条件频数—酒店管理专业的男生2人
列变量
行变量 酒店管理专业
男生
2
女生
49
合计
51
旅游管理专业 合计
行边缘分布
10
12
61
110
71
122
列边缘分布
ppt课件完整
3
男生
行百分比 列百分比 总百分比
• 行百分比:行的每一个观察频数除以相应的行 合计数(fij / ri)
• 列百分比:列的每一个观察频数除以相应的列 合计数( fij / cj )
• 总百分比:每一个观察值除以观察值的总个数 ( fij / n )
ppt课件完整
14
行百分比
列百分比
总百分比
一分公司 二分公司 三分公司 四分公司 合计
r1 c1 n n
由于观察频数的总数为n ,所以f11 的期望频数 e11 应为
e1 1n r n 1 c n 1 r1 n c1247 1290 060 .4 6 3 66
ppt课件完整
19
期望频数的分布
一分公司 二分公司 三分公司 四分公司
实际频数
68
赞成该
方案
期望频数
96.1%
85.9%
40.2%
50.0%
51
71
41.8%
58.2%
Total 12
9.8% 110
90.2% 122
100.0%
• 条件频数反映了数据的分布,但不适合对比 • 采取百分比分布更加直观
ppt课件完整
4
复式柱状图
61 70
49 60
50
40
30
20
10
2
10
0
酒店管理
旅游管理
图1 频数分布图
男 女 合计
初中及 高中 以下
大学 研究生 合计 及以上
ppt课件完整
7
编制交叉列联表(SPSS)
ppt课件完整
8
ppt课件完整
9
ppt课件完整
10
三维交叉列联表举例
ppt课件完整
11
二、交叉列联表行列变量间关系的分析
【例】一个集团公司在四个不同的地区设有分公司,现该集 团公司欲进行一项改革,此项改革可能涉及到各分公司的利 益,故采用抽样调查方式,从四个分公司共抽取420个样本 单位(人),了解一分职公工司对此二项分改公司革的三看分法公,司调查四分结公果司如下合表计
ppt课件完整
Hale Waihona Puke Baidu18
期望频数的分布
一分公司 二分公司 三分公司 四分公司 合计
的赞 反概例成对率该该如方方估,案案计第值1行为6382和r1第/n1;列它74的55落实在际第频153数列73 为的概f11率73,它91的落估在计第21值74191行为 c1/n合。计根据概率10的0 乘法公120式,该频90数落在1第101行和第4201列 的概率应为
• 检验行变量与列变量是否独立 • 拟合优度检验(多个总体的比例是否相等)
ppt课件完整
17
独立性检验(基本原理)
• 原假设:行变量和列变量是相互独立的 • 前提成立的情况下,每个单元格的频数期望值称
之为期望频数eij,
eij nrni cnj rincj
• 如果期望频数和实际频数相差不大,不拒绝原假 设,如果二者相差很大,拒绝原假设
性别 女生
Total
Count %within性别 %within专业 %of Total Count %within性别 %within专业 %of Total Count %of Total
专业
酒店管理 旅游管理
2
10
16.7%
83.3%
3.9%
14.1%
1.6%
8.2%
49
61
44.5%
55.5%
66
75
57
79
80
60
73
实际频数
32
反对该
方案
期望频数
34
45
33
31
40
30
37
ppt课件完整
20
检验统计量
r
2
c ( fij eij )2
i1 j1
eij
其自由度为(r 1)(c 1) 式中:fij — 列联表中第i行第j列类别的实际频数
eij — 列联表中第i行第j列类别的期望频数
赞成该方案
68
75
57
反对该方案
32
45
33
合计
100
120
90
• 列边缘分布
• 列观察值的合计数的分布
• 四个公司接受调查的人数分别为100人
120人,90人,110人
ppt课件完整
79
279
31
141
110
420
列边缘分布
13
描述统计-百分比分布
• 在相同的基数上进行比较,可以计算相应
的百分比,称为百分比分布
ppt课件完整
5
列联表分析
• 交叉分组下的频数分析称为列联表分析 • 两大基本任务
• 根据收集到的样本数据编制交叉列联表 • 在交叉列联表的基础上,对两两变量间是否存在一
定的相关性进行分析 • 拟合优度检验
ppt课件完整
6
一、编制交叉列联表(EXCEL)
• 比如分析性别与受教育程度之间的关系 • 性别变量中’1’=‘男’,‘2’=‘女’ • 文化程度变量中 • 编制交叉列联表
第8章 列联表分析 (Crosstabs )
●列联表是什么,可以用来做什么 ●采用卡方检验统计量
ppt课件完整
1
8.1 解释列联表
• 对分类数据的描述和分析通常使用列联表
• 根据两个变量分组,汇总得到的结果称为列联表,可以 用来分析两个变量之间的关系
列联表中的数字为交叉单元格中的频数或频率
大城市 中小城市 乡镇
赞成该方案 24.4% 26.9% 20.4% 28.3% 66.4%
68.0% 62.5% 63.35 71.8%
—
16.2% 17.8% 13.6% 18.8%
—
反对该方案 22.7% 31.9% 23.4% 22.0% 33.6%
32.0% 37.5% 36.7% 28.2%
—
7.6%
10.7%
赞成该方案
68
75
57
79
279
反对该方案
32
45
33
31
141
合计
100
120
90
110
420
每个分公司的看法是否相同
ppt课件完整
12
描述统计-观察值的分布
• 行边缘分布
• 行观察值的合计数的分布 • 赞成改革方案和反对改革方案的分别为279人,141人
行边缘分布
一分公司 二分公司 三分公司 四分公司 合计