3.1独立性检验
合集下载
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
患心脏病 每一晚都打鼾 不打鼾 30 24 未患心脏病 224 1355 合计 254 1379
合计
54
1579
1633
解:由公式
163330 1355 224 24 68.033.. 1379 254 54 1579
2 2
因为
2
6.635
所以有99%的把握说,每一晚都打鼾与患心脏病有关。
√
解析 独立性检验的结论是一个统计量,统计的结果只是说明
事件发生的可能性的大小,具体到一个个体,则不一定发生.
1 2 3 4 5
解析
答案
4. 某大学在研究性别与职称 ( 分正教授、副教授 ) 之间是否有关
系
,
你
认
为 女正教授人数、男正教授人数、女副 应 该 收 集 哪 些 数 据 ?
_________________________________________ 教授人数、男副教授人数 _____________.
解析
答案
跟踪训练2 已知列联表:药物效果与动物试验列联表
患病 服用药 未服药 总计 10 20 30 未患病 45 30 75 总计 55 50 105
6.109 则χ2≈________.( 结果保留3位小数)
2 105 × 10 × 30 - 20 × 45 解析 χ2= ≈6.109. 30×75×55×50
1%把握认为 A与B无关
99.9%把握认 为A与B有关
99%把握认 6.635 为A与B有关 90%把握认 10%把握认为 2 2.706 为A与B有关 A与B无关 没有充分的依据显示A与B有关, 2 2.706 但也不能显示A与B无关
解:H0: 吸烟和患病之间没有关系
患慢性气管 未患慢性气 — 炎(B) 管炎 ( B) 不吸烟 — 吸烟 ( A) 43 13 合计 205 n1+
因为
2
我们有0.99的把握说“工作积极”与“积极支持企业改革 6.635
有关,可以认为企业的全体员工对待企业改革态度与其工作积极性是有关的。
例 4. 在一次恶劣气候的飞行航程中调查男女乘客在机 飞行中男性比女性更易晕机? 晕机 男性 女性
上述表格称为2×2列联表.
类型一 2×2列联表和χ2统计量 命题角度1 2×2列联表及应用
例1
为了解人们对于国家新颁布的“生育二孩放开”政策的
热度,现在某市进行调查,随机抽调了50人,他们年龄的频数 分布及支持“生育二孩放开”人数如下表:由以上统计数据填 下面2×2列联表:
年龄 频数 [5,1 [15, [25,3 [35,4 [45, [55,6 5) 5 25) 10 5) 15 5) 10 55) 5 5) 5 支 持 不 年龄不低于 年龄低于45 合 45岁的人数 a= 岁的人数 c= 计
2
a b c d a c b d
其中n a b c d
n ad bc
2
第四步:查对临界值表,作出判断。
P(≥x0) x0 0.50 0.40 0.25 0.15 0.10 0.05 0.025 0.010 0.005 0.001 0.455 0.708 1.323 2.072 2.706 3.841 5.024 6.635 7.879 10.828
P(χ≥x0) 0.50 0.40 0.25 0.15 x0
0.10
0.05 0.025 0.010 0.005 0.001
0.455 0.708 1.323 2.072 2.706 3.841 5.024 6.635 7.879 10.828
例如
10.828
2 2
0.1%把握认 为A与B无关
独立性检验
用χ2统计量研究 这类问题的方法 步骤
通过数据和图表分析,得到 结论是:吸烟与患病有关 结论的可靠 程度如何?
第一步:H0: 吸烟和患病之间没有关系
第二步:列出2×2列联表
吸烟 不吸烟 总计 患病 a c a+c 不患病 b d b+d 总计 a+b c+d a+b+c+d
第三步:引入一个随机变量:卡方统计量
为了探究患慢性气管炎是否与吸烟有关, 调查了339名50岁以上的人,调查结果如 下表所示: ( A) 吸烟
合计 患慢性气管 未患慢性气 — ( B ) 炎 管炎 ( B) 43 13 56 162 121 283 合计 205 134 339
— 不吸烟 ( A)
试问:50岁以上的人患慢性气管炎与吸烟习惯有关吗?
合计
24 8
不晕机
31 26
合计 55 34
32
57
89
解:由公式
2
8924 26 31 8 3.689. 55 34 32 57
2 2
因为
我们没有理由说“晕机”与“是否男女性别” 3.841
有关,尽管这次男性比例比女性比例高。
例 5. 打鼾不仅影响别人休息,而且可能与患某种疾病 有关。下表是一次调查所得的数据,试问:每一晚都打 鼾与患心脏病有关吗?
判断假设是否成立. (2)解题时应注意准确代数与计算,不可错用公式,准确进行比较 与判断.
复习回顾
1 正态总体函数解析式:
f ( x)
2 正态曲线
y μ= -1 σ=0.5
1 e 2
( x )2 2 2
x (,)
y μ=1
y
μ=0 σ=1
σ=2 -3 -2 -1 0 1 2 3 4x
1
2
3
4
5
答案
5.为研究学生的数学成绩与对学习数学的兴趣是否有关,对 某年级学生作调查,得到如下数据:
成绩优秀 成绩较差 合计
兴趣浓厚的 兴趣不浓厚的
64 22
30 73
94 95
合计 86 103 189 学生的数学成绩好坏与对学习数学的兴趣是否有关?
1
2
3
4
5
解答
规律与方 法
2 n n n - n n 11 22 12 21 2 (1)利用 χ = 求出 χ2 的值,再利用临界值的大小来 n1+n2+n+1n+2
n11
162 n12
121 n 134 n2+ n21 22 合计 56 n+1 283 n+2 339 n 通过公式计算 2 33943 121 162 132 7.469。 205 134 56 283
( A)
因为7.469>6.635,所以我们有99℅的把握说: 50岁以上的人患慢性气管炎与吸 烟习惯有关。
解:由公式
2
39239 167 157 29 1.780. 196 196 68 324
2 2
因为
病” 有关,可以认为病人又发作过心脏病与否跟他做过任何手术无关。
我们没有理由说“心脏搭桥手术”与“又发作过心脏 3.841
例3.某大型企业人力资源部为了研究企业员工工作积极 性和对待企业改革态度的关系,随机抽取了 189 名员工 进行调查,所得数据如下表所示:
支持
“生 育二 孩放 开” 4 5 12 8 2 1
支
持 合
b=
d=
计
解
2×2列联表如下:
年龄不低于45岁的人数
年龄低于45岁的人数
合计
支持
a=3
c=29
32
不支持
b=7
d=11
18
合计
10
40
50
为了把问题讨论清楚,并便于向一般情况推广,我们用字母来代替 2×2列联表 中的事件和数据,得到一张用字母来表示的2×2列联表,如下表所示:
-3 -2 -1 0
1 2
x
-3 -2 -1 0
1 2 3 x
复习回顾
3 正态曲线的性质 (1)曲线在x轴的上方,与x轴不相交. (2)曲线关于直线x=μ对称.
(3)曲线在x=μ时位于最高点.
(4)当 x<μ时,曲线上升;当x>μ时,曲线下降. 并且当曲线向左、右两边无限延伸时,以轴为渐近线, 向它无限靠近. (5)当μ一定时,曲线的形状由σ确定 . σ越大,曲线越“矮胖”,表示总体的分布越分散; σ越小,曲线越“瘦高”,表示总体的分布越集中.
总计
A.94,96
B.52,50
C.52,54
D.54,52
√
解析 ∵a+21=73,∴a=52,b=a+2=52+2=54.
1 2 3 4 5
解析
答案
2.某科研机构为了研究中年人秃发与心脏病是否有关,随机调
查了一些中年人的情况,具体数据如表:
心脏病 秃发 20 无心脏病 300
不秃发
5
450
2 775 × 20 × 450 - 5 × 300 2>6.635 2 因为 χ 根据表中数据得到 χ = ≈15.968, 则断定秃发与心脏病有关系,那么这种判断出错的可能性为 25×750×320×455
解析
答案
2 (2)上面的表达式就是统计中非常有用的 (读作“卡方”)统计量
它可以化简为
n n11 n22 n12 n21 n1 n2 n1 n 2
2
2
(3)两个临界值:3.841与6.635.
当 3.841 有95%把握说事件A与B有关
2
当 2 6.635 有99%把握说事件A与B有关 当 2 3.841有把握说事件A与B无关
2 2
2 n ( ad bc ) 2 (a c)(b d )( a b)(c d )
命题角度2 χ2统计量及计算 例2 根据下表计算:
不看电视 男 女 37 35 看电视 85 143
4.514 则χ2≈________.(保留3位小数)
2 300 × 37 × 143 - 85 × 35 解析 χ2= ≈4.514. 122×178×72×228
知识点二 独立性检验 独立性检验 要推断“Ⅰ与Ⅱ有关系”,可按下面的步骤进行:
(1)作2×2列联表;
(2)根据2×2列联表计算 的值; χ2 (3)查对临界值,作出判断.
当堂训练
1.下面是一个2×2列联表:
y1 x1 x2 a 2 b y2 21 25 46 总计 73 27
则表中a,b处的值分别为
3. 1 独立性检验
例1.某医疗机构为了了解患慢性支气管 炎与吸烟是否有关,进行了一次抽样调查, 共调查了339名50岁以上的人,其中吸烟 者205人,不吸烟者134人.调查结果是: 吸烟的205人中有43人患呼吸道疾病(简 称患病),162人未患呼吸道疾病(简称 未患病);不吸烟的134人中有13人患病, 121人未患病.问题:根据这些数据能否 断定“患慢性支气管炎与吸烟有关”?
例2.对196个人接受心脏搭桥手术的病人和 196个接受血 管清障手术的病人进行了 3 年的跟踪研究,调查他们是 否又发作过心脏病,调查结果如下表所示:
又发作过心脏病 心脏搭桥手术 血管清障手术 39 29 未发作过心脏病 157 167 合计 196 196
合计
68
324
392
试根据上述数据比较这两种手术对病人又发作心脏病的影响有没有差别。
积极支持企业改革 工作积极 工作一般 合计 54 32 86 不太赞成企业改革 40 63 103 合计 94 95 189
对于人力资源部的研究项目,根据上述数据能得出什么结论?
解:由公式
18954 63 40 32 10.759. 94 95 86 103
2 2
A.0.1
B.0.05
C.0.025
D.0.01
√
1 2 3 4 5
解析
答案
3.若在研究吸烟与患肺癌的关系中,通过收集、整理分析数据 得“吸烟与患肺癌有关”的结论,并且有99%以上的把握认为
这个结论是成立的,则下列说法中正确的是
A.100个吸烟者中至少有99人患有肺癌 B.1个人吸烟,那么这个人有99%的概率患有肺癌 C.在100个吸烟者中一定有患肺癌的人 D.在100个吸烟者中可能一个患肺癌的人也没有
分析
例1中给出的表称为2×2列联表
知识点一 2×2列联表和统计量χ2 1.2×2列联表 一般地,对于两个研究对象Ⅰ和Ⅱ,Ⅰ有两类取值类A和类B,
Ⅱ也有两类取值类1和类2,得到如下列联表所示的抽样数据:
Ⅱ
类1
类A Ⅰ 类B 合计 n21 n+1 n11
类2
n12 n22 n+2
合计
n1+ n2+ n
患慢性气管 未患慢性气 — 炎(B) 管炎 ( B)
合计 205 n1+ 134 n2+ 339
— 不吸烟 ( A)
合计
吸烟 ( A)
43 13 56
n11
162 n12 121
n21 n+ 1
n22 283 n+2
n
2.统计量χ2 (读作“卡方”)
nn11n22-n12n21 χ= ,其中 n=n11+n12+n21+n22. n1+n2+n+1n+2
合计
54
1579
1633
解:由公式
163330 1355 224 24 68.033.. 1379 254 54 1579
2 2
因为
2
6.635
所以有99%的把握说,每一晚都打鼾与患心脏病有关。
√
解析 独立性检验的结论是一个统计量,统计的结果只是说明
事件发生的可能性的大小,具体到一个个体,则不一定发生.
1 2 3 4 5
解析
答案
4. 某大学在研究性别与职称 ( 分正教授、副教授 ) 之间是否有关
系
,
你
认
为 女正教授人数、男正教授人数、女副 应 该 收 集 哪 些 数 据 ?
_________________________________________ 教授人数、男副教授人数 _____________.
解析
答案
跟踪训练2 已知列联表:药物效果与动物试验列联表
患病 服用药 未服药 总计 10 20 30 未患病 45 30 75 总计 55 50 105
6.109 则χ2≈________.( 结果保留3位小数)
2 105 × 10 × 30 - 20 × 45 解析 χ2= ≈6.109. 30×75×55×50
1%把握认为 A与B无关
99.9%把握认 为A与B有关
99%把握认 6.635 为A与B有关 90%把握认 10%把握认为 2 2.706 为A与B有关 A与B无关 没有充分的依据显示A与B有关, 2 2.706 但也不能显示A与B无关
解:H0: 吸烟和患病之间没有关系
患慢性气管 未患慢性气 — 炎(B) 管炎 ( B) 不吸烟 — 吸烟 ( A) 43 13 合计 205 n1+
因为
2
我们有0.99的把握说“工作积极”与“积极支持企业改革 6.635
有关,可以认为企业的全体员工对待企业改革态度与其工作积极性是有关的。
例 4. 在一次恶劣气候的飞行航程中调查男女乘客在机 飞行中男性比女性更易晕机? 晕机 男性 女性
上述表格称为2×2列联表.
类型一 2×2列联表和χ2统计量 命题角度1 2×2列联表及应用
例1
为了解人们对于国家新颁布的“生育二孩放开”政策的
热度,现在某市进行调查,随机抽调了50人,他们年龄的频数 分布及支持“生育二孩放开”人数如下表:由以上统计数据填 下面2×2列联表:
年龄 频数 [5,1 [15, [25,3 [35,4 [45, [55,6 5) 5 25) 10 5) 15 5) 10 55) 5 5) 5 支 持 不 年龄不低于 年龄低于45 合 45岁的人数 a= 岁的人数 c= 计
2
a b c d a c b d
其中n a b c d
n ad bc
2
第四步:查对临界值表,作出判断。
P(≥x0) x0 0.50 0.40 0.25 0.15 0.10 0.05 0.025 0.010 0.005 0.001 0.455 0.708 1.323 2.072 2.706 3.841 5.024 6.635 7.879 10.828
P(χ≥x0) 0.50 0.40 0.25 0.15 x0
0.10
0.05 0.025 0.010 0.005 0.001
0.455 0.708 1.323 2.072 2.706 3.841 5.024 6.635 7.879 10.828
例如
10.828
2 2
0.1%把握认 为A与B无关
独立性检验
用χ2统计量研究 这类问题的方法 步骤
通过数据和图表分析,得到 结论是:吸烟与患病有关 结论的可靠 程度如何?
第一步:H0: 吸烟和患病之间没有关系
第二步:列出2×2列联表
吸烟 不吸烟 总计 患病 a c a+c 不患病 b d b+d 总计 a+b c+d a+b+c+d
第三步:引入一个随机变量:卡方统计量
为了探究患慢性气管炎是否与吸烟有关, 调查了339名50岁以上的人,调查结果如 下表所示: ( A) 吸烟
合计 患慢性气管 未患慢性气 — ( B ) 炎 管炎 ( B) 43 13 56 162 121 283 合计 205 134 339
— 不吸烟 ( A)
试问:50岁以上的人患慢性气管炎与吸烟习惯有关吗?
合计
24 8
不晕机
31 26
合计 55 34
32
57
89
解:由公式
2
8924 26 31 8 3.689. 55 34 32 57
2 2
因为
我们没有理由说“晕机”与“是否男女性别” 3.841
有关,尽管这次男性比例比女性比例高。
例 5. 打鼾不仅影响别人休息,而且可能与患某种疾病 有关。下表是一次调查所得的数据,试问:每一晚都打 鼾与患心脏病有关吗?
判断假设是否成立. (2)解题时应注意准确代数与计算,不可错用公式,准确进行比较 与判断.
复习回顾
1 正态总体函数解析式:
f ( x)
2 正态曲线
y μ= -1 σ=0.5
1 e 2
( x )2 2 2
x (,)
y μ=1
y
μ=0 σ=1
σ=2 -3 -2 -1 0 1 2 3 4x
1
2
3
4
5
答案
5.为研究学生的数学成绩与对学习数学的兴趣是否有关,对 某年级学生作调查,得到如下数据:
成绩优秀 成绩较差 合计
兴趣浓厚的 兴趣不浓厚的
64 22
30 73
94 95
合计 86 103 189 学生的数学成绩好坏与对学习数学的兴趣是否有关?
1
2
3
4
5
解答
规律与方 法
2 n n n - n n 11 22 12 21 2 (1)利用 χ = 求出 χ2 的值,再利用临界值的大小来 n1+n2+n+1n+2
n11
162 n12
121 n 134 n2+ n21 22 合计 56 n+1 283 n+2 339 n 通过公式计算 2 33943 121 162 132 7.469。 205 134 56 283
( A)
因为7.469>6.635,所以我们有99℅的把握说: 50岁以上的人患慢性气管炎与吸 烟习惯有关。
解:由公式
2
39239 167 157 29 1.780. 196 196 68 324
2 2
因为
病” 有关,可以认为病人又发作过心脏病与否跟他做过任何手术无关。
我们没有理由说“心脏搭桥手术”与“又发作过心脏 3.841
例3.某大型企业人力资源部为了研究企业员工工作积极 性和对待企业改革态度的关系,随机抽取了 189 名员工 进行调查,所得数据如下表所示:
支持
“生 育二 孩放 开” 4 5 12 8 2 1
支
持 合
b=
d=
计
解
2×2列联表如下:
年龄不低于45岁的人数
年龄低于45岁的人数
合计
支持
a=3
c=29
32
不支持
b=7
d=11
18
合计
10
40
50
为了把问题讨论清楚,并便于向一般情况推广,我们用字母来代替 2×2列联表 中的事件和数据,得到一张用字母来表示的2×2列联表,如下表所示:
-3 -2 -1 0
1 2
x
-3 -2 -1 0
1 2 3 x
复习回顾
3 正态曲线的性质 (1)曲线在x轴的上方,与x轴不相交. (2)曲线关于直线x=μ对称.
(3)曲线在x=μ时位于最高点.
(4)当 x<μ时,曲线上升;当x>μ时,曲线下降. 并且当曲线向左、右两边无限延伸时,以轴为渐近线, 向它无限靠近. (5)当μ一定时,曲线的形状由σ确定 . σ越大,曲线越“矮胖”,表示总体的分布越分散; σ越小,曲线越“瘦高”,表示总体的分布越集中.
总计
A.94,96
B.52,50
C.52,54
D.54,52
√
解析 ∵a+21=73,∴a=52,b=a+2=52+2=54.
1 2 3 4 5
解析
答案
2.某科研机构为了研究中年人秃发与心脏病是否有关,随机调
查了一些中年人的情况,具体数据如表:
心脏病 秃发 20 无心脏病 300
不秃发
5
450
2 775 × 20 × 450 - 5 × 300 2>6.635 2 因为 χ 根据表中数据得到 χ = ≈15.968, 则断定秃发与心脏病有关系,那么这种判断出错的可能性为 25×750×320×455
解析
答案
2 (2)上面的表达式就是统计中非常有用的 (读作“卡方”)统计量
它可以化简为
n n11 n22 n12 n21 n1 n2 n1 n 2
2
2
(3)两个临界值:3.841与6.635.
当 3.841 有95%把握说事件A与B有关
2
当 2 6.635 有99%把握说事件A与B有关 当 2 3.841有把握说事件A与B无关
2 2
2 n ( ad bc ) 2 (a c)(b d )( a b)(c d )
命题角度2 χ2统计量及计算 例2 根据下表计算:
不看电视 男 女 37 35 看电视 85 143
4.514 则χ2≈________.(保留3位小数)
2 300 × 37 × 143 - 85 × 35 解析 χ2= ≈4.514. 122×178×72×228
知识点二 独立性检验 独立性检验 要推断“Ⅰ与Ⅱ有关系”,可按下面的步骤进行:
(1)作2×2列联表;
(2)根据2×2列联表计算 的值; χ2 (3)查对临界值,作出判断.
当堂训练
1.下面是一个2×2列联表:
y1 x1 x2 a 2 b y2 21 25 46 总计 73 27
则表中a,b处的值分别为
3. 1 独立性检验
例1.某医疗机构为了了解患慢性支气管 炎与吸烟是否有关,进行了一次抽样调查, 共调查了339名50岁以上的人,其中吸烟 者205人,不吸烟者134人.调查结果是: 吸烟的205人中有43人患呼吸道疾病(简 称患病),162人未患呼吸道疾病(简称 未患病);不吸烟的134人中有13人患病, 121人未患病.问题:根据这些数据能否 断定“患慢性支气管炎与吸烟有关”?
例2.对196个人接受心脏搭桥手术的病人和 196个接受血 管清障手术的病人进行了 3 年的跟踪研究,调查他们是 否又发作过心脏病,调查结果如下表所示:
又发作过心脏病 心脏搭桥手术 血管清障手术 39 29 未发作过心脏病 157 167 合计 196 196
合计
68
324
392
试根据上述数据比较这两种手术对病人又发作心脏病的影响有没有差别。
积极支持企业改革 工作积极 工作一般 合计 54 32 86 不太赞成企业改革 40 63 103 合计 94 95 189
对于人力资源部的研究项目,根据上述数据能得出什么结论?
解:由公式
18954 63 40 32 10.759. 94 95 86 103
2 2
A.0.1
B.0.05
C.0.025
D.0.01
√
1 2 3 4 5
解析
答案
3.若在研究吸烟与患肺癌的关系中,通过收集、整理分析数据 得“吸烟与患肺癌有关”的结论,并且有99%以上的把握认为
这个结论是成立的,则下列说法中正确的是
A.100个吸烟者中至少有99人患有肺癌 B.1个人吸烟,那么这个人有99%的概率患有肺癌 C.在100个吸烟者中一定有患肺癌的人 D.在100个吸烟者中可能一个患肺癌的人也没有
分析
例1中给出的表称为2×2列联表
知识点一 2×2列联表和统计量χ2 1.2×2列联表 一般地,对于两个研究对象Ⅰ和Ⅱ,Ⅰ有两类取值类A和类B,
Ⅱ也有两类取值类1和类2,得到如下列联表所示的抽样数据:
Ⅱ
类1
类A Ⅰ 类B 合计 n21 n+1 n11
类2
n12 n22 n+2
合计
n1+ n2+ n
患慢性气管 未患慢性气 — 炎(B) 管炎 ( B)
合计 205 n1+ 134 n2+ 339
— 不吸烟 ( A)
合计
吸烟 ( A)
43 13 56
n11
162 n12 121
n21 n+ 1
n22 283 n+2
n
2.统计量χ2 (读作“卡方”)
nn11n22-n12n21 χ= ,其中 n=n11+n12+n21+n22. n1+n2+n+1n+2