北师大版高中数学选修1-2课件2.2独立性检验2.3独立性检验的基本思想2.4独立性检验的应用
合集下载
相关主题
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
试问:这种传染病与饮用水的卫生程度有关吗?
解:根据表中的数据计算得下表
得病情况
饮用水卫生程度
2 830 (52 218 466 94)2 54.21 6.635. 146 684 518 312
所以有99%以上的把握认为这种传染病与饮用水的卫 生程度有关.
1.2×2列联表的定义 变量A:A1, A2 A1 ;变量B:B1,B2 B1,用如下数据:
总计 1988 4590 6578
6578 (56 4567 1932 23)2 62.698 6.635. 1988 4590 79 6499
所以有99%以上的把握认为吸烟与患肺癌是有关的.
思考:在进行χ 2运算,判断变量相关时, 若χ 2=56.632,P(χ 2>6.635)≈0.01和 P(χ 2>3.841)≈0.05,哪种说法是正确的? 提示:两种说法均正确. P(χ2>6.635)≈0.01的含 义是有99%以上的把握认为两变量相关;而 P(χ2>3.841)≈0.05的含义是有95%以上的把握认为 两变量相关.
绩是否优秀与所在的班级有关.
1.下面是一个2×2列联表:
x
y
y1
y2
x1
a
21
x2
2
25
总计
b
46
总计 73 27
n
则表中a,b的值分别为( C )
A.94,96
B.52,50
C.52,54
D.54,52
2.分类变量X和Y的列联表如下,则( C )
X
Y
Y1
Y1
X1
X2
A.ad-bc越小,说明X与Y的关系越弱 B.ad-bc越大,说明X与Y的关系越强 C.(ad-bc)2越大,说明X与Y的关系越强 D.(ad-bc)2越接近于0,说明X与Y的关系越强
解:由 2的计算公式可知,(ad-bc)2越大,则 2
越大,故相关关系越强.
3.若由一个2×2列联表中的数据计算得 2=4.013,
那么有__9_5_%__的把握认为两个变量有关联
解:因为 2 =4.013>3.841.所以有95%的把握判定
两个变量有关联.
4.根据下表计算 2≈_1_._7_8_.
患心脏病情况 是否易怒
易怒 不易怒
患心脏病 27 53
未患心脏病 606
2 110
试问:容易生气的人是否更有可能患心脏病?
解:根据表中的数据计算得下表(单位:人):
患心脏病情况 是否易怒
患心脏病
未患心脏病
总计
易怒
27
606
633
不易怒
53
2 110
2 163
总计
80
2 716
2 796
2 2 796 (27 2 110 606 53)2 5.805 3.841.
【变式练习】
为了了解高中生是否喜欢参加体育锻炼与性别之间 的关系,调查者随机调查了500名高中生的情况, 调查结果如下(单位:人):
性别
参加体育锻炼情况 喜欢参加 体育锻炼
不喜欢参加 体育锻炼
男
197
48
女
135
120
试问:高中生是否喜欢参加体育锻炼与性别之
间有关系吗?
解:根据表中的数据得 a=197,b=48,c=135,d=120
2.如果>2.706,有90%的把握判定变量A,B有关联;
3.如果>3.841,有95%的把握判定变量A,B有关联; 4.如果>6.635,有99%的把握判定变量A,B有关联.
对于吸烟和患肺癌的问题
患肺癌情况 吸烟情况
患肺癌B1
未患肺癌B2
吸烟A1
56
1932
不吸烟A2
23
4567
总计
79
6499
另一方面,如果吸烟与患肺癌是独立的,那么有
都成立,由上表数据可得:
患肺癌情况 吸烟情况
既吸烟又患肺癌的人频率为: 吸烟的人频率为:
患肺癌的人频率为: 显然 两边相差很大,可以估计 结论:患肺癌与吸烟有关.
【概括总结】 设 A,B为两个变量,每个变量都可取两个值,
变量A: ,A1= ; 变量B: , B1=.
例1.某组织对男女青年是否喜爱古典音乐进行了一 个调查,调查者随机调查了146名青年,下表中给出 了调查的结果(单位:人):
喜欢古典音乐情况 青年
喜爱
不喜爱
男青年
46
30
女青年
20
50
试问:男女青年喜爱古典音乐的程度是否有差异?
解:根据表中的数据计算得下表(单位:人):
喜欢古典音乐情况 青年
喜爱
不喜爱
高中数学课件
(金戈铁骑 整理制作)
2.2 独立性检验 2.3 独立性检验的基本思想
2.4 独立性检验的应用
2
人们都认可“吸烟具有危害性”,那么,人们认可这 个观点,有什么根据么?吸烟是否对患肺癌有影响呢? 下面我们用数学知识来分析一下,这个观点是否具有 科学根据……
1.掌握利用2×2列联表进行独立性检验,会用2×2 列联表解决实际问题.(重点) 2.了解独立性检验的基本思想及实施步骤.(重点) 3. 掌握独立性检验的简单应用.(难点)
nn
n
cd ac
nn
n
cd bd
n
n
n
n
当χ 2较大 时,说明 变量之间 不独立.
2
n(ad bc)2
.
2
(a b)(c d )(a c)(b d )
当数据量较大时,在统计中,用以下结果对变量的独 立性进行判断. 1.如果 ≤2.706,没有充分的证据判定变量A,B有关联, 可以认为变量A,B是没有关联的;
解:根据表中的数据计算得下表(单位:人):
头发颜色
眼睛虹膜颜色
蓝色
棕色
红∕金黄色
156
12
黑色
20
24
总计
176
2
36
总计
168 44 n=212
因为55.576>6.635,所以有99%以上的把握认为 头发的颜色与眼睛虹膜的颜色有关.
【总结】
要推断“Ⅰ和Ⅱ是否有关系”,可按下面的步骤进行:
B
B1
A
A1
a
A2
c
总计
a+c
B2
b d _b_+_d_
总计
_a_+_b_ c+d n=_a_+_b_+_c_+_d_
设,用 估计
,
估计
,
估计 . a a b a c nn n
若有式子
b n
a
n
b
b
n
d
,
,则可认为
与
独立.
同理,若 c c d a c , 则可认为A1与B2独立;若
B
B1
A
A1
a
A2
c
总计
a+c
B2
总计
b
a+b
d
c+d
b+d
n=a+b+c+d
根据2×2列联表中的数据,来判断两个变量A,B是 否独立的问题
2.统计量χ 2的计算公式
χ 2=
n ad bc2
a bcda cb d
3.独立性检验判断方法
人生难免遇风雨,天空难免有阴云,别因雨 水湿透衣衫而难过,别为坎坷阻力而叹息,用乐 观心态面对人生遭遇,用积极的拼搏迎接雨后的 彩虹,相信自己.
(1)根据2×2列联表得出合计总表;
(2)用公式计算 2 的值;
(3)查对临界值,作出判断. 由于抽样的随机性,由样本得到的推断有可能正 确,也有可能错误.利用 No 进行独立性检验,可以
Image
对推断的正确性作出估计,样本量n越大,估计越准确.
【变式练习】
有甲乙两个班级进行一门课程的考试,按照学生考试 成绩优秀和不优秀统计成绩后,得到如下列联表:
之间是独立的.
探究点2 独立性检验的基本思想
在上面吸烟是否对患肺癌有影响的问题中
a n
ab n
ac n
,b
n
abbd nn
,c n
cd n
ac n
, [(a ab ac)2 (b abbd)2
2 n n n n n n n
abac
abbd
通过表格中的数据计算可得 吸烟人群中患肺癌的人所占百分比是: 56 2.82%
1 988
不吸烟人群中患肺癌的人所占百分比是: 23 0.50%
4 590
结论:吸烟人群中患肺癌的人所占的百分比,与不吸 烟人群中患肺癌的人所占百分比不等,且相差较大. 由此我们可以推断,开始的假设是不成立的.也就是 说,患肺癌与吸烟是有关系的.由吸烟人群中患肺癌 的人所占的百分比较多,我们认为吸烟会对肺癌的发 病率造成一定的影响.
手术情况
发病情况
解:由 2的计算公式,得 2
n(ad bc)2
(a b)(c d)(a c)(b d)
392 (39 167 157 29)2 1.78. 196196 68 324
5.下表是某地区的一种传染病与饮用水的调查表:
得病情况 饮用水卫生程度
2
n(ad bc)2
(a b)(c d)(a c)(b d)
500 (197 120 135 48)2
245 255 332 168
42.252 4 6.635.
所以有99%以上的把握认为高中生是否喜欢参加体 育锻炼与性别之间是有关的.
探究点3 独立性检验的应用
得病情况
n
n
n
则判断种子处理与得病之间的独立性.
解:由题意可知a=32,b=101,c=61,d=213,从而
a 32 0.078 6, n 407 a b a c 133 93 0.074 7,
n n 407 407
可得 a a b a c ,所以种子处理与得病 nn n
为了讨论的方便,我们引入以下记号:
变量A:A1=吸烟,B2 B1 未患肺癌.
变量B:B1=患肺癌, 计算得如下表格:
患肺癌情况 吸烟情况
吸烟A1
不吸烟A2
总计
患肺癌B1 56 23 79
未患肺癌B2 1 932 4 567 6 499
总计 1 988 4 590 6 578
我们假设吸烟与患肺癌是独立的,即吸烟不影响患 肺癌.根据直观的经验,我们把吸烟人群中患肺癌的 人所占百分比,与不吸烟人群中患肺癌的人所占百 分比作比较.如果吸烟不影响患肺癌,就意味着,无 论吸烟与否,患肺癌的人所占的百分比应该是基本 一样的,就此题而言:
633 2 16380 2 716
所以有95%以上的把握认为患心脏病与易怒有关.
例3.生物学上对于人类头发的颜色与眼睛虹膜的颜 色是否有关进行了调研,以下是一次调查结果,调 查人数共212人,调查记录如表(单位:人):
头发颜色
眼睛虹膜颜色
蓝色
棕色
红∕金黄色
156
12
黑色
20
Biblioteka Baidu
24
试问:头发的颜色与眼睛虹膜的颜色有关吗?
探究点1 独立性检验
2×2 列联表
为了调查吸烟与患肺癌是否有联系,某机构随机调
查了6 578人,得到表中的数据(单位:人)
患肺癌情况 吸烟情况
吸烟
不吸烟
患肺癌 56 23
不患肺癌 1 932 4 567
这一问题称为2×2列联表的独立性检验.
思考:如何根据表格中的数据来判断吸烟与患肺
癌是否有联系?
总计
男青年
46
30
76
女青年
20
50
70
总计
66
80
146
2 146 (46 50 30 20)2 15.021 6.635.
76 70 6680
所以有99%以上的把握认为是否喜爱古典音乐与青年的 性别有关.
例2.容易生气的人更有可能患心脏病吗?某机构随机 调查了2 796人,下表给出了调查的结果(单位:人):
班级
成绩
甲班
优秀 10
不优秀 35
乙班
7
38
试问:学生的学习成绩与所在的班级有关吗?
解:根据表中的数据计算得下表
班级
成绩
优秀
不优秀
总计
甲班
10
35
45
乙班
7
38
45
总计
17
73
90
2 90 (10 38 35 7)2 0.653. 17 73 45 45
因为0.653<2.706,所以没有充分的证据认为成
nn
nn
当上面的值较大时,变量A,B不独立.
思考:当这些量多大时才能说明变量间不独立呢?
我们能不能选择一个量,用它的大小来检验变量之
间是否独立呢?
统计学家选取以下统计量,用它的大小来检验变
量之间是否独立:
] ( c c d a c )2 ( d c d b d )2
nn n
d n
cd n
bd n
,
则可认为A2与B1独立;若
则可认为A2与B2独立.
在
中,由于 ,
,表
示的是频率,不同于概率,即使变量之间独立,式子两
边也不一定恰好相等,但是当两边相差很大时,变量
之间就不独立.
【练一练】 考察棉花种子经过处理跟棉花生病之间的关系, 得到数据如下:
a a b a c 种子处理情况