2019年数学2-3讲义+第8章 8.4 列联表独立性分析案例
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
8.4列联表独立性分析案例
[读教材·填要点]
1.列联表
一般地,对于两个因素X和Y,X的两个水平取值:A和A(如吸烟和不吸烟),Y也有两个水平取值:B和B(如患肺癌和不患肺癌),我们得到下表中的抽样数据,这个表格称为2×2列联表.
Y
X
B B合计
A a b a+b
A c d c+d
合计a+c b+d a+b+c+d
2.χ2的求法
公式χ2=n(ad-bc)2
(a+b)(c+d)(a+c)(b+d)
.
3.独立性检验的概念
用随机变量χ2研究两变量是否有关的方法称为独立性检验.
4.独立性检验的步骤
要判断“X与Y有关系”,可按下面的步骤进行:
(1)提出假设H0:X与Y无关;
(2)根据2×2列联表及χ2公式,计算χ2的值;
(3)查对临界值,作出判断.
其中临界值如表所示:
P(χ2
≥x0)
0.500.400.250.150.100.050.0250.0100.0050.001
x00.4550.708 1.323 2.072 2.706 3.841 5.024 6.6357.87910.82 8
表示在H0成立的情况下,事件“χ2≥x0”发生的概率.5.变量独立性判断的依据
(1)如果χ2
>10.828时,就有99.9%的把握认为“X 与Y 有关系”; (2)如果χ2>6.635时,就有99%的把握认为“X 与Y 有关系”; (3)如果χ2>2.706时,就有90%的把握认为“X 与Y 有关系”;
(4)如果χ2≤2.706时,就认为没有充分的证据显示“X 与Y 有关系”,但也不能作出结论“H 0成立”,即X 与Y 没有关系.
[小问题·大思维]
1.利用χ2进行独立性分析,估计值的准确度与样本容量有关吗?
提示:利用χ2进行独立性分析,可以对推断的正确性的概率作出估计,样本容量n 越大,这个估计值越准确.如果抽取的样本容量很小,那么利用χ2进行独立性检验的结果就不具有可靠性.
2.在χ2运算后,得到χ2的值为29.78,在判断因素相关时,P (χ2≥6.64)≈0.01和P (χ2≥7.88)≈0.005,哪种说法是正确的?
提示:两种说法均正确.P (χ2≥6.64)≈0.01的含义是在犯错误的概率不超过0.01的前提下认为两因素相关;而P (χ2≥7.88)≈0.005的含义是在犯错误的概率不超过0.005的前提下认为两因素相关.
独立性分析的原理
[例1] 打鼾不仅影响别人休息,而且可能与患某种疾病有关.下表是一次调查所得的数据:
患心脏病 未患心脏病
总计 每一晚都打鼾
30 224 254 不打鼾 24 1 355 1 379 总计
54
1 579
1 633
根据列联表的独立性分析,是否有99%的把握认为每一晚都打鼾与患心脏病有关系? [解] 由列联表中的数据,得χ2的值为 χ2=
1 633×(30×1 355-224×24)2
254×1 379×54×1 579
≈68.033>6.635.
因此,有99%的把握认为每一晚打鼾与患心脏病有关系.
解决一般的独立性分析问题,首先由所给2×2列联表确定a ,b ,c ,d ,a +b +c +d 的值,然后代入随机变量的计
算公式求出观测值χ2,将χ2
与临界值x 0进行对比,确定有多大的把握认为两个分类变量有关系.
1.某大型企业人力资源部为了研究企业员工工作积极性和对待企业改革态度的关系,经过调查得到如下列联表:
积极支持
企业改革 不太支持 企业改革 总计 工作积极 54 40 94 工作一般 32 63 95 总计
86
103
189
根据列联表的独立性分析,是否有99%的把握认为工作态度与支持企业改革之间有关系?
解:由列联表中的数据,得 χ2=
189×(54×63-40×32)2
94×95×86×103
≈10.759>6.635,
∴有99%的把握认为工作态度与支持企业改革之间有关系.
独立性分析的应用
[例2] 得病 不得病 合计 干净水 52 466 518 不干净水 94 218 312 合计
146
684
830
(1)(2)若饮用干净水得病5人,不得病50人,饮用不干净水得病9人,不得病22人.按此样本数据分析这种疾病是否与饮用水有关,并比较两种样本在反映总体时的差异.
[解] (1)假设H 0:传染病与饮用水无关.把表中数据代入公式,得χ2=830×(52×218-466×94)2
146×684×518×312
≈54.21,
因为当H 0成立时,χ2≥10.828的概率约为0.001,
所以我们有99.9%的把握认为该地区这种传染病与饮用不干净水有关. (2)依题意得2×2列联表:
得病
不得病
合计
干净水 5 50 55 不干净水 9 22 31 合计
14
72
86
此时,χ2
=86×(5×22-50×9)2
14×72×55×31
≈5.785.
由于5.785>2.706,所以我们有90%的把握认为该种疾病与饮用不干净水有关. 两个样本都能统计得到传染病与饮用不干净水有关这一相同结论,但(1)中我们有99.9%的把握肯定结论的正确性,(2)中我们只有90%的把握肯定.
独立性分析的步骤:
要推断“X 与Y 是否有关”可按下面的步骤进行: ①提出统计假设H 0:X 与Y 无关;
②根据2×2列联表与χ2计算公式计算出χ2的值; ③根据两个临界值,作出判断.
2.为了探究学生选报文、理科是否与对外语的兴趣有关,某同学调查了361名高二在校学生,调查结果如下:理科对外语有兴趣的有138人,无兴趣的有98人,文科对外语有兴趣的有73人,无兴趣的有52人.是否有90%的把握认为“学生选报文、理科与对外语的兴趣有关”?
解:根据题目所给的数据得到如下列联表:
理科 文科 总计 有兴趣 138 73 211 无兴趣 98 52 150 总计
236
125
361
根据列联表中数据由公式计算得随机变量 χ2=
361×(138×52-73×98)2211×150×236×125
≈1.871×10-
4.
因为1.871×10-
4<2.706,所以没有90%的把握认为“学生选报文、理科与对外语的兴趣有关”.
独立性分析的综合应用
[例3] 为了比较注射A ,B 两种药物后产生的皮肤疱疹的面积,选200只家兔做试验,将这200只家兔随机地分成两组,每组100只,其中一组注射药物A ,另一组注射药物B .