王静龙定性数据分析第四章二维列联表答案
合集下载
相关主题
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
2 i 1 j 1 r c
ˆ ij ) 2 (nij np ˆ ij np
2
i 1 j 1
r
c
nij 2 ni n j / n
n 7.712
p P{ (4) 7.714} 0.103 0.05
2
接受H 0,供应商于零件质量独立
= D(nij)
E ( )
2 i j
r
c
Biblioteka Baidu
D(nij ) ni n j / n
( n r 1) c 1 n 1
• 9、假设二维
r r 概率方表为:
B1 … …
Br p1r
合计 p1+
A1
p11
Ar
合计
pr+ n
pr1 p+1
„ „
prr p+r
• 如果对所有的 1 i j r ,都有 pij • ①设所二维 表频数方表:
r r
p ji 则称该方表具有对称性
Br n1r 合计 n1+
B1 A1 n11
„ „
Ar 合计
nr1 n+1
„ „
nrr n+r
nr+ n
q1 q2 1 q2
•
2 n n n n n ii i j i 1 i 1
r
r
1 ni n j n 2
i 1
r
0.776
0并不能确定是否偶然一致,则进行下一步检验。
第7题
(2)一致性检验
H 0 :两位医师偶然达到一致
D ()
从 n 个单元中抽取 n j 个单元,则 k 由于 k 都是随机的,其分布律如下:
1, 第k个单元第一次入样 0, 否则
k
概率
n
1
0 1- n j /n
n j /n
则有 nij k yk ,则有 E (nij ) E ( k ) yk
k 1
k =0
2
n j (n - n j ) n(n 1)
yk ni
k 1
n
D( nij )
n j n
(1
n j n
)ni (( yk ) yk 2 )cov( k1 , k2 )
2 k 1 k 1
n
n
第8题
n j n (1 n j n )ni (ni
啤酒偏好 淡啤酒 男性 女性 合计 352 293 645 普通啤酒 284 133 417 黑啤酒 717 210 927 合计 1353 636 1989
• (1)相合性的度量,用Kendall系数检验
G 352 (133 210) 284 210 180376 H 717 (133 293) 284 293 388654
GH
0.3394 0
• (2)相合性的检验 • H0:A(收入)和B(性别)相互独立 VS H1:A和B正相合
2
n n n n 15738 ( z)
3 3 3 3 i j
9n
3
•
检验统计量:U
z GH = 2.9414 ( z) ( z)
ni + n j n r c ij n 2 的数学期望。 2 计算 Pearson 的检验统计量 ni + n j i 1 j 1 n
2
第8题
n 1, 第k个单元属于Ai (1) n 个单元中有 ni 个单元属于 Ai ,令 yk ,这些 y k 给定,则 yk ni ,现 0 , 否则 k 1
• 年龄越大的人,冠状动脉硬化的程度是否有越重的趋势? • (取水平 =0.05 )
第5题
• (1) 相合性的度量 G 15880 H 4324
4
TA
i 1
ni ni 1 2
10070
TB
j 1
4
n j n j 1 2
12442
D(q1 ) 2 (1 q2 )
(q2 q2
2
ni n i n i ni ( 2 2 )) 2 n n n i 1 0.0058 2 (n 1)(1 q2 )
r
检验统计量 U
D( )
10.185
pP (N (0,1 ) 10.185) 0 拒绝H 0
第6题
• 处理抽样0的方法:将频数 都增加一个正的常量(如0.5)
工资 A1(22500-25000) A2(25000-27500) A3(27500-30000) A4(30000-32500) A5(32500-35000) A6(35000-37500) A7(37500-40000) A8(40000-42500) 合计 B1(女职工) 1.5 4.5 2.5 10.5 3.5 5.5 1.5 0.5 30 B2(男职工) 0.5 1.5 1.5 3.5 5.5 6.5 6.5 2.5 28 合计 2 6 4 14 9 12 8 3 58
3 3 3 3
GH
0.20054 0
2
n n n n ( z) 488047028.8
i j
U 检验统计量:
z GH = 9.42784 ( z) ( z)
9n3
p P{N (0,1) 9.42784} 0 拒绝H 0,即是有题中的趋势
第5题
• 278例尸体解剖资料整理如下:
冠状动脉硬化等级(由低到高) + ++ 22 4 24 9 23 13 20 15 89 41
年龄(岁) 20 至 30 30 至 40 40 至 50 50 以上 合计
70 27 16 9 122
+++ 2 3 7 14 26
合计 98 63 59 58 278
认为两位中医师不是偶然一致的.
第8题
设有 r c 列联表: B1 A1 n11 „ „ Bc n1c 合计 n1+
Ar 合计
nr1 n+1
„ „
nrc n+c
nr+ n
假设属性 A 与 B 相互独立。试在边际和 n1 , , nr 与 n1 , , n c 都给定的条件下, (1) 计算 nij 的数学期望和方差, i 1, , r ; j 1, , c .
第2题
• 向100个女性和100个男性做调查,了解他们关于给谁买节日礼物最难 得看法。调查结果如下:
给谁买礼物最难 兄弟姐妹 姻亲 3 10 8 4
性别 女性 男性
配偶 25 37
父母 31 28
子女 19 7
其他亲戚 12 16
• 女性和男性关于给谁买节日礼物最难的看法上有没有显著的差异? •
第2题
2
ni n j n
因为 D(nij ) D( k ) yk yk1 yk2 cov( k1 , k2 )
k1 k 2
第8题
当 k1 k2 时:
k =1
1
k =0
1
k =1
2
n j (n j 1) n(n 1)
n j (n - n j ) n(n 1) (n - n j - 1 ) (n - n j ) n(n 1)
2
n( j n j - n) - ni ) 2 n (n 1)
=
n( ( j n - n j)ni n - ni ) n 2 (n 1)
2 2
(2) E (nij ni n j / n) E (nij E (nij ))
n( ( j n - n j)ni n - ni ) n 2 (n 1)
提出的问题 你满意吗 你不满意吗 139 128 82 69 12 20 10 23
• 问:这两种提问方式对被调查者回答问题有没有影响?
第3题
• H0:这两种提问方式对被调查者回答问题无影响的 • H1:这两种提问方式对被调查者回答问题有影响
2
i 1 j 1
4
2
nij 2 ni n j / n
• (1) 相合性的度量
G 547.5
H 178.5
第6题
TA
i 1 8
ni ni 1 2
246
TB
j 1
2
n j n j 1 2
813
n n 1 / 2 TA n n 1 / 2 TB 正相合
第1题
• 三家供应商提供的零件合格和不合格的情 况如下:
供应商 A B C 良好 90 170 135 零件质量 小缺陷 3 18 6 大缺陷 7 7 9
• 取 检验供应商与零件质量的独立性。你的 分析结果能告诉采购部分什么?
第1题
• H0 : 供应商与零件质量独立 • H1:供应商与零件质量不独立
n 8.675
p P ( 2 4 1 2 1 2 8.675) 0.0339 0.05 拒绝H 0,即有影响
0.01接受H 0,即没影响
第4题
• 表4.3的数据是否说明有这种趋势:女性倾向于饮淡啤酒,男性倾向于 饮浓啤酒?试用相合性的度量和检验方法回答这个问题。
• H0:女性和男性关于给谁买礼物最难的看法上没有显著差 异 • H1:女性和男性关于给谁买礼物最难的看法上有显著差异。
2
i 1 j 1
r
c
nij 2 ni n j / n
n 13.429
p P( 2 6 1 2 1 2 13.429) 0.0197 当 =0.05时拒绝H 0,有显著差异 当 =0.01时接受H 0,没有显著差异
n n 1 / 2 TA n n 1 / 2 TB 正相合
(2)相合性的检验
GH
0.4245 0
H0:A(年龄)和B(冠状动脉硬化的程度)相互独立 H1:A和B正相合
第5题
2
n n n n ( z) 1942119
第3题
• 调查人们对某项措施的满意程度,可以问他:“你对这项措施满意 吗?”,也可以问他:“你对这项措施不满意吗?”为了解这两种提 问方式对被调查者回答问题有没有影响,向243人问:“你满意吗?”, 另外向240人问:“你不满意吗?”。 • 调查结果如下:
回答
非常满意 比较满意 比较不满意 不满意
3 3 3 3 i j
9n 3
z GH 检验统计量: U = 8.29219 ( z) ( z)
p P{N (0,1) 8.29219} 0 0.05 拒绝H 0
第6题
• 习题三第8题说四格表可用来比较两个总体在中心位置上有没有差异。列 联表也有这样的作业。第8题中26位女职工和24位男职工的年收入分组列 表表示如下(单位:元):
p P{N (0,1) 2.9414} 0.0016 0.05
拒绝H 0
第7题
• 两个中医对同一批57个病人的诊断结果如下:
B 医生 阳虚 阴虚 阴阳两虚 阳虚 25 1 1 阴虚 3 9 2 阴阳两虚 1 0 15
A 医生
• 试计算一致性度量 的估计值。试问这两位中医师是不是偶然一致的? • (1)一致性度量kappa系数k的估计值
TA
i 1 3 2
ni ni 1 2
1116558 723627
TB
j 1
n j n j 1 2
第4题
n n 1 / 2 TA n n 1 / 2 TB 负相合
• (2)相合性的检验 • H0:A(性别)和B(啤酒偏好)相互独立 • H1:A和B负相合
工资 22500-25000 25000-27500 27500-30000 30000-32500 32500-35000 35000-37500 37500-40000 40000-42500 合计 女职工 1 4 2 10 3 5 1 0 26 男职工 0 1 1 3 5 6 6 2 24
•
这是 列联表。基于列联表的检验方法,回答问题:收入和性别有没有关 系?女职工的收入是否比男职工低?