1.2独立性检验

合集下载

1.2独立性检验

1.2独立性检验

9965(7775 49 42 2099) k 56.632. 7817 2148 9874 91
2
这个值到底能告诉我们什么呢?
统计学家经过研究发现,在H0成立的情况下,
P( K 6.635) 0.01
2
即在 H 0 成立的情况下,K2 大于6.635概率非常小,近似为0.01
不吸烟 吸烟 总计
表1-8
a c a+c
b d b+d
a+b c+d a+b+c+d
如果“吸烟与患肺癌没有关系”,那么吸烟样本中不 患肺癌的比例应该与不吸烟样本中相应的比例差不多, 即 a c
ab cd a(c d ) c( Nhomakorabea b)
ad bc 0
因此|ad-bc|越小,说明吸烟与患肺癌之间关系越弱; |ad-bc|越大,说明吸烟与患肺癌之间关系越强.
一般地,假设有两个分类变量X和Y,它们的可能取值 分别为 {x1,x2} 和 {y1,y2}, 其样本频数列联表(称为 2x2列联表)为: y1 x1 x2 总计 a c a+c y2 b d b+d 总计 a+b c+d a+b+c+d
若要判断结论为: H1 :“ X 与 Y 有关系”,如果通过直 c 接计算或观察等高条形图发现 a 和 相差很大, cd ab 就判段两个分类变量之间有关系.
怎样判断K² 的观测值k是大还是小呢? 这仅需确定一个正数 k 0 ,当 k k 0 时就认为IK² 的观测 值k大,此时相应于的判断规则为:如果k k 0 ,就认为
“两分类变量有关系”;否则就认为“两分类变量没有 k k 0 为一个判断规则的临界值 关系”.我们称这样的 .按照 上述规则,把“两个分类变量没有关系”错误地判断为 “两个分类变量有关系”的概率为 P(K 2 k0 )

高中数学:1.2《独立性检验的基本思想及其初步应用》复习教案

高中数学:1.2《独立性检验的基本思想及其初步应用》复习教案

1.2独立性检验的基本思想及其初步应用教学目标:1理解独立性检验的基本思想2、会从列联表、柱形图、条形图直观判断吸烟与患癌有关。

3、了解随机变量K2的含义。

教学重点:理解独立性检验的基本思想。

教学难点;1、理解独立性检验的基本思想、2、了解随机变量K2的含义。

教学过程:一、引入:从问题“吸烟是否与患肺癌有关系”引出独立性检验的问题,并借助样本数据的列联表,柱形图,和条形图的展示,使学生直观感觉到吸烟和患肺癌可能会有关系。

但这种结论能否推广到总体呢?要回答这个问题,就必须借助于统计理论来分析。

二、独立性检验就是检验两个分类变量是否有关的一种统计方法:用字母表示吸烟与患肺癌的列联表:不患肺癌患肺癌合计不吸烟 a b a+b吸烟 c d c+d合计a+c b+d a+b+c+d样本容量 n=a+b+c+d假设H0 : 吸烟与患肺癌没有关系。

则吸烟者中不患肺癌的的比例应该与不吸烟者中相应的比例差不多,即:()()()()()()()220a ca c d c ab ad bc a b c dad bc n ad bc k a b c d a c b d n a b c d≈⇒+≈+⇒-≈++--=++++=+++因此 : 越小, 说明吸烟与患肺癌之间关系越弱.构造随机变量 其中()()2781721489874916.635⨯⨯≈⨯⨯⨯≥≈≥2020220202若H 成立,则K 应该很小. 把表中数据代入公式9965777549-422099K =56.632在H 成立的情况下.统计学家估算出如下概率P K 0.01即在H 成立的情况下,K 的值大于6.635的概率非常小.如果K 6.635,就断定H 不成立,出错的可能性有多大?出现K =56.6326.635 的概率不超过1% .因此,我们有99%的把握认为"吸烟与患肺癌有关系."三、作业:预习17页。

1.2独立性检验的基本思想及其初步应用(第二课时)。

1.2独立性检验的基本思想

1.2独立性检验的基本思想
1.2
独立性检验的基本思想及其初步应用
在统计学中, 在统计学中,独立性检验就是检验两个分类变量是 否有关系的一种统计方法。 否有关系的一种统计方法。 所谓“分类变量” 就是指个体所属的类别不同, 所谓“分类变量”,就是指个体所属的类别不同,也 称为属性变量或定型变量。 称为属性变量或定型变量。 在日常生活中, 在日常生活中,我们常常关心两个分类变量之间是 否有关系,例如吸烟是否与患肺癌有关系? 否有关系,例如吸烟是否与患肺癌有关系?性别是否对 于喜欢数学课程有影响等等。 于喜欢数学课程有影响等等。
在吸烟与患肺病这两个分类变量的计算中,下列说法正确 在吸烟与患肺病这两个分类变量的计算中, 的是( 的是(
c

A、若K的观测值为 、 的观测值为k=6.635,我们有 我们有99%的把握认为吸烟与患 的观测值为 我们有 的把握认为吸烟与患 肺病有关系,那么在 个吸烟的人中必有99个患肺病 肺病有关系,那么在100个吸烟的人中必有 个患肺病 个吸烟的人中必有 B、从独立性检验可知有99%的把握认为吸烟与患肺病有关 、从独立性检验可知有 的把握认为吸烟与患肺病有关 系时,我们说某人吸烟,那么他有99%的可能患肺病 系时,我们说某人吸烟,那么他有 的可能患肺病 C、若从统计量中求出有95%的把握认为吸烟与患肺病有关 、若从统计量中求出有 的把握认为吸烟与患肺病有关 系,是指有5%的可能性使得推理出现错误 是指有 的可能性使得推理出现错误 D、以上三种说法都不对 、
列联表的条形图: 90% 列联表的条形图: 100%
80% 70% 60% 50% 40% 30% 20% 10% 0%
优秀 不优秀
由图及表直观判断,好像“成绩优秀与班级有关系”,由表中 由图及表直观判断,好像“成绩优秀与班级有关系” 数据计算, 数据计算,得 K 2 的观察值为 k ≈ 0.653 > 0.455。由教科书中表 11, 1-11,得

《独立性检验的基本思想及其初步应用》PPT课件

《独立性检验的基本思想及其初步应用》PPT课件

0.05 3.841
0.025 5.024
0.010 0.005 6.635 7.879
0.001 10.828
K2的观测值为k
如果 k k0,就以 (1 P(K 2 k0 )) 100%的把握
认为“X与Y有关系”;而这种判断有可能出错,出
错的概率不会超过 P(K 2 k0 )。
7
例如 :
1如果k 10.828,就有99.9%把握认为" X与Y有
❖ 试用你所学过的知识进行分析,能否在犯错 误的概率不超过0.005的前提下,认为“喜欢 体育还是文娱与性别有关系”?
体育 文娱 总计
男生 21 23 44
女生 6 29 35
总计 27 52 79
16
[思路探索] 可用数据计算 K2,再确定其中的具体关系. 解 判断方法如下: 假设 H0“喜欢体育还是喜欢文娱与性别没有关系”,若 H0 成立, 则 K2 应该很小. ∵a=21,b=23,c=6,d=29,n=79, ∴k=a+bcn+add-ab+cc2b+d =21+237×9×6+212×9×29-212+3×66×223+29≈8.106.
12
例4:为研究不同的给药方式(口服与注射)和药的效果(有效 与无效)是否有关,进行了相应的抽样调查,调查的结果列 在表中,根据所选择的193个病人的数据,能否作出药的效果 和给药方式有关的结论?
口服 注射 合计
有效 58 64 122
无效 40 31 71
合计 98 95 193
P(k≥k0) 0.50 0.40 0.25 0.15 0.10 0.05 0.025 0.010 0.005 0.001 k0 0.455 0.708 1.323 2.072 2.706 3.841 5.024 6.635 7.879 10.828

2014年人教A版选修1-2课件 1.2 独立性检验的基本思想及其初步应用

2014年人教A版选修1-2课件 1.2  独立性检验的基本思想及其初步应用

问题1. 下表是对吸烟和不吸烟的人中患肺癌的调 查数据, 你能从中分析吸烟对患肺癌的影响程度吗?
不吸烟 吸烟 总计 不患肺癌 7775 2099 9874 患肺癌 42 49 91 总计 7817 2148 9965
对于某种变量取不同的 “值” 表示不同的类别, 这样的变量称为分类变量. 如: 是否吸烟, 是否信仰宗教, 男性或女性等. 如上表这样, 列出两个分类变量的频数表, 称为 列联表.
不患肺癌 患肺癌 总计 不吸烟 a b a+ b 即 |ad -bc| 越小, 吸烟与患肺癌之间的关系越弱 ; 吸烟 c d c+d 反之越强.总计 a+ c b+ d a+b+c+d
为了使不同容量的数据有统一的评判标准, 我们 我们把列联表中的数字用字母代替, 并计算: 把检查 |ad-bc| 的大小转换成检查 a ; “不吸烟” 样本中 “不患肺癌” 的比例 : n(ad - bc)2 a+ b 2 K , (a + b)(c + d )(a的比例 + c)(b +c “吸烟” 样本中 “不患肺癌” :d ) . c+d 其中 na+b+c+d 为样本容量. 假设 H0: 吸烟与患肺癌没有关系 , 则需 2 若 H0 成立, a则 K c 应该很小. , ad-bc≈0. a + b c + d H0 成立与否呢? 小到什么程度来判断
0.4
0.2 0 不吸烟 吸烟
问题1. 下表是对吸烟和不吸烟的人中患肺癌的调 查数据, 你能从中分析吸烟对患肺癌的影响程度吗?
不吸烟 吸烟 总计 不患肺癌 7775 2099 9874
1

1.2独立性检验的基本思想及其初步应用

1.2独立性检验的基本思想及其初步应用

试用图形判断服用药和患病之间是否有关系?
解析:相应的等高条形图如下:
从图形可以看出,服用药的样本中患病的比例明显低于 没有服用药的样本中患病的比例,因此可以认为:服用药和 患病之间有关系.
独立性检验方法——K2公式
在调查的480名男士中有38名患有色盲,520名女 士中有6名患有色盲,能否在犯错误的概率不超过0.001的前 提下认为性别与患色盲有关系? 分析:
4.下面是一个2×2列联表: x1 x2 总计 y1 a 2 b y2 21 25 46 总计 73 27 100
则表中a、b的值分别为( C ) A.94、96 C.52、54 B.52、50 D.54、52
5.性别与身高列联表如下: 男 女 总计 高(165 cm以上) 37 6 43 矮(165 cm以下) 4 13 17 总计 41 19 60
作出2×2列联表 → 计算随机变量K2的值 → 对照临界值作出结论 解析:根据题目所给的数据作出如下的列联表:
色盲 不色盲 总计

女 总计
38
6 44
442
514 956
480
520 1 000
根据列联表中所给的数据可以得: a=38,b=442,c=6,d=514,a+b=480,c+d= 520,a+c=44,b+d=956,n=1 000.
3.独立性检验. 利用随机变量K2来判断“两个分类变量有关系”的方法 定义 称为独立性检验.
nad-bc2 公式 K2=_____________________ a+bc+da+cb+d ,其中n=______________. a+b+c+d
①根据实际问题的需要确定容许推断“两个分类变量有 临界值 k0 .② 关系”犯错误概率的上界α,然后查表确定 ________ k________ ≥k0 利用公式计算随机变量K2的 ________ , 观测值 k .③如果 具体 就推断“X与Y有关系”,这种推断犯错误的概率不超过 步骤 α;否则,就认为在犯错误的概率不超过α的前提下不能 推断“X与Y有关系”,或者在样本数据中没有发现足够 证据支持结论“X与Y有关系”.

1.2独立性检验的基本思想及其初步应用课件人教新课标

1.2独立性检验的基本思想及其初步应用课件人教新课标
解答
类型二 由K2进行独立性检验 例2 对196个接受心脏搭桥手术的病人和196个接受血管清障手术的病 人进行3年的跟踪研究,调查他们是否又发作过心脏病,调查结果如下 表所示.
心脏搭桥手术 血管清障手术
总计
又发作过心脏病 39 29 68
未发作过心脏病 总计
157
196
167
196
324
392
试根据上述数据比较这两种手术对病人又发作过心脏病的影响有没有差别. 解 假设病人又发作过心脏病与做过心脏搭桥手术还是血管清障手术没 有关系,由表中数据得a=39,b=157,c=29,d=167,a+b=196,c +d=196,a+c=68,b+d=324,n=392, 由公式得K2的观测值
解答
达标检测
1.通过随机询问110名性别不同的大学生是否爱好某项运动,得到如下列
联表:
喜欢程度


总计
爱好
40
20
60
不爱好
20
30
50
总计
60
50
110
nad-bc2 由 K2=a+bc+da+cb+d算得,
110×40×30-20×202 k= 60×50×60×50 ≈7.8,
12345
附表:
12345
解析 答案
5.“全国文明城市”称号是最有价值的城市品牌,某市为创建第五届“全 国文明城市”,开展了“创建文明城市人人有责”活动.为了了解哪些人 更关注“创城”活动,随机抽取了年龄在10~70岁之间的100人进行调 查,并按年龄绘制如下频数散布表.
年龄(岁) [10,20) [20,30) [30,40) [40,50) [50,60) [60,70]

1.2独立性检验的基本思想及其初步应用课件人教新课标

1.2独立性检验的基本思想及其初步应用课件人教新课标
a+b c+d
因此,
|ad-bc|越小,说明吸烟与患肺癌之间关系越弱; |ad-bc|越大,说明吸烟与患肺癌之间关系越强.
为了使不同样本容量的数据有统一的评判 标准,基于上述分析,我们构造一个随机变量:
K2 =
n(ad - bc)n
(a + b)(c + d)(a + c)(b + d)
其中n=a+b+c+d为样本容量.
48 121 208 223 193 165 42
(I)将各组的频率填入表中;
(II)根据上述统计结果,计算灯管使用寿命不足 1500小时的频率.
解答
分组
频数 频率
[500,9 [900, 00) 1100)
48 121 0.048 0.121
[1100, 1300)
208 0.208
[1300, 1500)
P(k2>k) 0.50 0.40 0.25 0.15 0.10 0.05 0.025 0.010 0.005 0.001 k 0.455 0.708 1.323 2.072 2.706 3.84 5.024 6.635 7.879 10.83
(2)利用K2公式,计算随机变量K2的观测值k.
(3)如果k>k0,就推断“X与Y有关系”,这 种推断犯错误的概率不超过a;否则,就认为在犯 错误的概率不超过a的前提下不能推断“X与Y有关 系”.
k=
16.373 > 6.635
3891048 665 772
所以有99%的把握认为”秃顶与患心脏病有关”.
解答
根据题目所得数据得到列联表:
秃顶 不秃顶
总计
患心脏病 214 451 665

高中数学《1.2 独立性检验的基本思想及其初步应用》导学案2 新人教A版选修1-2

高中数学《1.2 独立性检验的基本思想及其初步应用》导学案2 新人教A版选修1-2

独立性检验的基本思想及其初步应用通过探究“秃顶是否与患心脏病有关系”引出独立性检验的问题,并借助样本数据的列联表、柱形图和条形图展示患心脏病的秃顶比例比患其它病的秃顶比例高,让学生亲身体验独立性1416 复习1:统计量2K :复习2:独立性检验的必要性:二、新课导学 ※ 学习探究新知1:独立性检验的基本思想: 1、 独立性检验的必要性:探究任务:吸烟与患肺癌的关系第一步:提出假设检验问题 H 0:第二步:根据公式求2K 观测值k =(它越小,原假设“H 0:吸烟与患肺癌没有关系”成立的可能性越 ;它越大,备择假设“H 1: ” 成立的可能性越大.)第三步:查表得出结论※典型例题例1 在某医院,因为患心脏病而住院的665名男性病人中,有214人秃顶;而另外772名不是因为患心脏病而住院的男性病人中有175名秃顶. 分别利用图形和独立性检验方法判断秃顶与患心脏病是否有关系?你所得的结论在什么范围内有效?小结:用独立性检验的思想解决问题:第一步:第二步:第三步:例2为考察高中生的性别与是否喜欢数学课程之间的关系,在某城市的某校高中生中随机抽k . 在多大程度上可以认为高中生的性别与是否由表中数据计算得到K的观察值 4.513数学课程之间有关系?为什么?※动手试试练1. 某市为调查全市高中生学习状况是否对生理健康有影响,随机进行调查并得到如下的列联表:请问有多大把握认为“高中生学习状况Array与生理健康有关”?三、总结提升※学习小结1. 独立性检验的原理:2. 独立性检验的步骤:※知识拓展. Array※自我评价你完成本节导学案的情况为().A. 很好B. 较好C. 一般D. 较差※当堂检测(时量:5分钟满分:10分)计分:1. 在吸烟与患肺病这两个分类变量的计算中,下列说法正确的是()A. 若k=6.635,则有99%的把握认为吸烟与患肺病有关,那么100名吸烟者中,有99个患肺病.B. 从独立性检验可知,有99%的把握认为吸烟与患肺病有关时,可以说某人吸烟,那么他有99%的可能性患肺病.C. 若从统计量中求出有95%的把握认为吸烟与患肺病有关,是指有5%的可能性使推断出现错误.D. 以上三种说法都不对.2. 下面是一个22⨯列联表则表中a,b 的之分别是( )D. 54,52 3.某班主任对全班50名学生进行了作业量多少的调查,数据如下表:则认为喜欢玩游戏与认为作业量多少有关系的把握大约为( )A. 99%B. 95%C. 90%D.无充分依据4. 在独立性检验中,当统计量2K 满足时,我们有99%的把握认为这两个分类变量有关系. 5. 在22⨯列联表中,统计量2K = . 为考察某种药物预防疾病的效果,进行动物试验,得到如下列联表 能以97.5%的把握认为药物有效吗?为什么?。

1.2独立性检验的基本思想及其初步应用

1.2独立性检验的基本思想及其初步应用

(2)若饮用干净水得病的有5人,不得病的有50人;饮用不干净水得病的 有9人,不得病的有22人.按此样本数据分析这种传染病是否与饮用水有 关,并比较两种样本在反映总体时的差异.
解 依题意得2×2列联表如下所示:
得病
不得病
干净水
5
50
不干净水
9
22
总计
14
72
此时,K2
的观测值
86×5×22-50×92 k= 14×72×55×31 ≈5.785.
2.下面是一个2×2列联表:
y1
y2
总计
x1
a
21
73
x2
8
25
33
总计
b
46
则表中a、b处的值分别为( C )
A.94,96
B.52,50
C.52,60
D.54,52
解析 ∵a+21=73,∴a=52,b=a+8=52+8=60.
1 23
1 23
3.为了判断高中学生的文理科选修是否与性别有关系,随机调查了50名 学生,得到如下2×2列联表:

有兴趣
138
73
无兴趣
98
52
总计
Hale Waihona Puke 236125总计 211 150 361
代入公式得K2的观测值 k=3612×36×13182×5×522-117×3×159082≈1.871×10-4. ∵1.871×10-4非常小,∴可以认为学生选报文、理科与对外语的兴趣无关.
达标检测
1 23
1.在研究吸烟与患肺癌的关系中,通过收集数据、整理分析数据得“吸 烟与患肺癌有关”的结论,并且在犯错误的概率不超过0.01的前提下认 为这个结论是成立的,下列说法中正确的D是( ) A.100个吸烟者中至少有99人患有肺癌 B.1个人吸烟,那么这个人有99%的概率患有肺癌 C.在100个吸烟者中一定有患肺癌的人 D.在100个吸烟者中可能一个患肺癌的人也没有 解析 独立性检验的结果与实际问题有差异,即独立性检验的结论是一 个数学统计量,它与实际问题中的确定性存在差异.

人教A版高中数学选修1-2课件:1.2独立性检验的基本思想及其初步应用 (共39张PPT)

人教A版高中数学选修1-2课件:1.2独立性检验的基本思想及其初步应用 (共39张PPT)
1.2 独立性检验的基本思想及其初步应用
梅青中学
高二备课组
1.2×2列联表
(1) 分 类 变 量 : 变 量 的 不 同 “ 值 ” 表 示 个 体 所 属 的
不同类别 ________,像这类变量称为分类变量.
(2)2×2列联表 假设有两个分类变量X和Y,它们的取值分别为{x1,x2}和 {y1,y2},其样本频数列联表(也称为2×2列联表)为 变 量 x1 x2 总 计 表. y1 a c a+c y2 b d b+d 总 计 a+b c+d a+b+c+d
像上表这样列出的两个分类变量的 __________ 频数表 称为列联
在列联表中,如果两个分类变量没有关系,则应满足ad-
bc≈0.因此|ad-bc|越小,说明两个分类变量之间关系越弱; |ad -bc|越大,说明两个分类变量之间关系越强.
2.独立性检验 为了使不同样本容量的数据有统一的评判标准,我们构造
独立性检验 【例2】 某大学餐饮中心为了解新生的饮食习惯,在全校
一年级学生中进行了抽样调查,调查结果如下表所示:
学 生 喜欢甜品 60 10 70 不喜欢甜品 20 10 30 合 计 80 20 100
南方学生 北方学生 合 计
根据表中数据,问是否有 95%的把握认为“南方学生和北 方学生在选用甜品的饮食习惯方面有差异”?
关系很大; 如果 K2 的值比较小,则说明二者之间关系不明 显.
2.某大型企业人力资源部为了研究企业员工工作态度和 对待企业改革态度的关系,经过调查得到如下列联表: 态 度 积极支持企业改革 不太支持企业改革 总计 32 63 95 工作一般 86 103 189 总 计 根据列联表,能否在犯错误的概率不超过 0.005 的前提下 认为工作态度与对待企业改革态度之间有关系?

1.2独立性检验的基本思想及其初步应用课件人教新课标1

1.2独立性检验的基本思想及其初步应用课件人教新课标1

d)
P(K 2 k0 ) 0.50 0.40 0.5 0.15 0.10 0.05 0.025 0.010 0.005 0.001
k0
0.445 0.708 1.323 2.072 2.706 3.841 5.024 6.635 7.879 10.828
男生 女生 合计
喜欢足球 不喜欢足球 合计
问题7:这组数据采集于我们班这个小范围内, 为了使得结论更客观、更可靠,我们应该做何改 进?
独立性检验的基本思想
反证法
独立性检验
目标
两种 情况
理论 根据
证明结论成立(只有一种)
H0 : 结论成立; H1:结论的反面成立;
矛盾双方不可能同时成立 但是有且只有一个成立
判断分类变量A与B之间是否有关 结果有两种可能:有关或无关
H0 : A与B无关(独立); H1:A与B有关;
在一次实验中,小概率事件几 乎是不可能产生的
1.2 独立性检验的基本思想及应用
问题导入,激发兴趣
有人说:吸烟有害
健康!吸烟会引发肺癌.
另一些人说:吸烟
不影响健康.理由是,有
的吸烟老人却很长寿。
这两种观点哪个正
确呢?
用数据说话
初步探索,展示内涵
为了调查吸烟与患肺癌是否有联系,某像 类机这 变构样 量列 的随出 频机的 数调两 表查个 ,了分 称 9965人,得到了下表中的数据(单位:人) 为列联表。
操作 步骤
(1)假设H 0的反面H1成立;
(1)原假设H
成立;
0
(2)计算K 2的值;
(2)推到出矛盾,从而H1不成立; (3)确定临界值k(0 如何确定?);
(3)由H1不成立,说明H 0成立.

高中数学 第一章 统计案例 1.2 独立性检验是如何判断

高中数学 第一章 统计案例 1.2 独立性检验是如何判断

独立性检验是如何判断两个事件是否相互独立的独立性检验的基本思想类似于反证法.要确认“两个分类变量有关系”这一结论成立的可信程度,首先假设结论不成立,即假设结论“两个分类变量没有关系”成立,在该假设下构造的随机变量2χ应该很小.如果由观测数据计算得到的2χ的观测值很大,则在一定程度上说明假设不合理.根据随机变量2χ的含义,可以通过概率式评价该假设不合理的程度,由实际计算的2χ>6.635,说明假设不合理的程度约为99%,即“两个分类变量有关系”这一结论成立的可信程度约为99%.当2χ≤3.841时,认为两个分类变量是无关的.对于两事件而言即相互独立. 1.两个事件独立的判定例1: 为了研究不同的给药方式(口服与注射)和药的效果(有效与无效)是否有关,进根据193个病人的数据,能否作出药的效果与给药方式有关的结论?请说明理由. 解:提出假设H 0:药的效果与给药方式无关系.根据列联表中的数据,得χ2=2193(58314064)122719895-⨯-⨯⨯⨯⨯≈1.3896<2.072.当H 0成立时,χ2>1.3896的概率大于15%,这个概率比较大,所以根据目前的调查数据,不能否定假设H 0,即不能作出药的效果与给药方式有关的结论.注意:这是一个由列联表来验证的独立性检验问题,其结论是没有关系的假设成立.并且应该注意上述结论是对所有口服药物与注射药物的实验人而言的,绝不要误以为对被跟踪的193个跟踪研究对象成立.例2:调查某医院某段时间内婴儿出生的时间与性别的关系,得到下面的数据表.试问能以多大把握认为婴儿的性别与出生时间有关系.分析:利用表中的数据通过公式计算出2χ统计量,可以用它的取值大小来推断独立性是否成立. 解:由公式()841.368892.35732345531826248922<≈⨯⨯⨯⨯-⨯⨯=χ 故婴儿的性别与出生时间是相互独立的(也可以说没有充分证据显示婴儿的性别与出生时间有关).2.两个事件不独立的判定例3:在某医院,因为患心脏病而住院的665名男性病人中,有214人秃顶,而另外772名不是因为患心脏病而住院的男性病人中有175人秃顶.利用独立性检验方法判断秃顶与患心脏病是否有关系?你所得的结论在什么范围内有效?分析:列出22⨯列联表,利用公式求出2χ与两个临界值3.841与6.635比较大小得适当范围.解:根据题目所给数据得到如下表所示: 秃顶与患心脏病列联表由公式,得:()635.6373.167726651048389451175597214143722>≈⨯⨯⨯⨯-⨯⨯=χ 所以有99%的把握认为“秃顶与患心脏病有关”.说明:因为这组数据来自住院的病人,因此所得到的结论适合住院的病人群体.例 4.某班主任对全班50名学生进行了作业量多少的调查,喜欢玩电脑游戏的同学认为作业多的有18人,认为作业不多的有9人,不喜欢玩电脑游戏的同学认为作业多的有8人,认为作业不多的有15人,则认为喜欢玩电脑游戏与认为作业量的多少有关系的把握大约是多少?2x =059.523272426)981518(502=⨯⨯⨯⨯-⨯, ()024.52>x P =0.025,有97.5%的把握认为喜欢玩电脑游戏与认为作业多有关系.。

  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

1.2独立性检验1.2独立性检验的基本思想及其初步应用1.某班主任对全班50名学生进行了作业量多少的调查,数据如下表:认为作业多 认为作业不多 总数 喜欢玩电脑游戏 18 9 27 不喜欢玩电脑游戏 8 15 23 总数262450根据表中数据得到25018158927232426k ()⨯⨯-⨯=≈⨯⨯⨯ 5.059,因为p(K 2≥5.024)=0.025,则认为喜欢玩电脑游戏与认为作业量的多少有关系的把握大约为( )(A)97.5% (B) 95% (C)90% (D)无充分根据2.(2011•湛江一模)利用独立性检验来考虑两个分类变量X 和Y 是否有关系时,通过查阅表格来确定“X 和Y 有关系”的可信度.如果k >3.84,那么有把握认为“X 和Y 有关系”的百分比为( ) P(0.50.400.250.150.100.050.0250.0100.0050.001K2>k)k 0.455 0.7081.3232.0722.7063.845.0246.6357.87910.83A.5%B.75%C.99.5%D.95%3.(2012•泰安一模)下列说法:①将一组数据中的每个数据都加上或减去同一个常数后,方差恒不变;②设有一个回归方程,变量x增加一个单位时,y平均增加5个单位;③线性回归方程必过;④在一个2×2列联表中,由计算得K2=13.079,则有99%的把握确认这两个变量间有关系;其中错误的个数是()A.0B.1C.2D.34.(2010•泰安二模)某医疗研究所为了检验新开发的流感疫苗对甲型H1N1流感的预防作用,把1000名注射了疫苗的人与另外1000名未注射疫苗的人的半年的感冒记录作比较,提出假设H:“这种疫苗不能起到预防甲型H1N1流感的作用”,并计算出P(Χ2≥6.635)≈0.01,则下列说法正确的是()A.这种疫苗能起到预防甲型H1N1流感的有效率为1%B.若某人未使用该疫苗,则他在半年中有99%的可能性得甲型H1N1C.有1%的把握认为“这种疫苗能起到预防甲型H1N1流感的作用”D.有99%的把握认为“这种疫苗能起到预防甲型H1N1流感的作用”5.(2012•枣庄一模)通过随机询问100名性别不同的大学生是否爱好踢毪子运动,得到如下的列联表:男女总计爱好10 40 50不爱好20 30 50总计30 70 100附表:P(K2≥k)0.10 0.05 0.025k 2.706 3.841 5.024随机变量,经计算,统计量K2的观测值k≈4.762,参照附表,得到的正确结论是()A.在犯错误的概率不超过5%的前提下,认为“爱好该项运动与性别有关”B.在犯错误的概率不超过5%的前提下,认为“爱好该项运动与性别无关”C.有97.5%以上的把握认为“爱好该项运动与性别有关”D.有97.5%以上的把握认为“爱好该项运动与性别无关”6.(2013•临沂一模)某校为了研究学生的性别和对待某一活动的态度(支持和不支持两种态度)的关系,运用2×2列联表进行独立性检验,经计算K2=7.069,则所得到的统计学结论是:有()的把握认为“学生性别与支持该活动有关系”.P(k2≥k) 0.100 0.050 0.025 0.010 0.0012.7063.841 5.024 6.635 10.828 kA.0.1%B.1%C.99%D.99.9%7.(2012•武昌区模拟)通过随机询问110名性别不同的行人,对过马路是愿意走斑马线还是愿意走人行天桥进行抽样调查,得到如下的列联表:男女总计走天桥40 20 60走斑马线20 30 50总计60 50 110由,算得参照独立性检验附表,得到的正确结论是()A.有99%的把握认为“选择过马路的方式与性别有关”B.有99%的把握认为“选择过马路的方式与性别无关”C.在犯错误的概率不超过0.1%的前提下,认为“选择过马路的方式与性别有关”D.在犯错误的概率不超过0.1%的前提下,认为“选择过马路的方式与性别无关”8.(2012•上饶一模)在调查学生数学成绩与物理成绩之间的关系时,得到如下数据(人数:)合计物理成绩好物理成绩不好数学成绩好18 7 256 19 25数学成绩不好合计24 26 50数学成绩与物理成绩之间有把握有关?()A.90%B.95%C.97.5%D.99%9.(2014•韶关二模)由于工业化城镇化的推进,大气污染日益加重,空气质量逐步恶化,雾霾天气频率增大,大气污染可引起心悸、胸闷等心脏病症状.为了解某市患心脏病是否与性别有关,在某医院心血管科随机的对入院50位进行调查得到了如表:患心脏病不患心脏病合计男20 5 25女10 15 25合计30 20 50参考临界值表:p(p2≥k) 0.15 0.10 0.05 0.025 0.010.0050.001K 2.072 2.7063.8415.0246.6357.87910.828(参考公式:K2=其中n =a +b +c +d).问有多大的把握认为是否患心脏病与性别有关.答:()A.95% B.99% C.99.5% D.99.9%10.(2014•黄山二模)某部门为了了解青年人喜欢户外运动是否与性别有关,运用2×2列联表进行独立性检验,经计算K2=7.069,则所得到的统计学结论为:有()把握认为“喜欢户外运动与性别有关”.附:(独立性检验临界值表)P(K2≥k) 0.05 0.025 0.010 0.005 0.001k3.841 5.024 6.636 7.879 10.828A.0.1%B.1%C.99%D.99.9%11.(2014•永州三模)随机调查某校110名学生是否喜欢跳舞,由列联表和公式K2=计算出K2,并由此作出结论:“有99%的可能性认为学生喜欢跳舞与性别有关”,则K2可以为()附表:P(K2≥k) 0.10 0.05 0.025 0.010k2.7063.841 5.024 6.635A.3.565B.4.204C.5.233D.6.842 12.(2013•河南模拟)某中学采取分层抽样的方法从高二学生中按照性别抽出20名学生,其选报文科、理科的情况如下表所示,男女文科 2 5理科 10 3则以下判断正确的是()参考公式和数据:k2=p(k2≥k) 0.15 0.10 0.05 0.025 0.010 0.005 0.001k2.07 2.713.84 5.02 6.64 7.88 10.83A.至少有97.5%的把握认为学生选报文理科与性别有关B.至多有97.5%的把握认为学生选报文理科与性别有关C.至少有95%的把握认为学生选报文理科号性别有关D.至多有95%的把握认为学生选报文理科与性别有关13.(2014•泰安一模)为调查某地区老年人是否需要志愿者提供帮助,用简单随机抽样方法从该地区调查了500位老人,结果如表:性别是否需要志愿者男女需要40 30不需要160 270由算得,附表:P(K2≥k)0.050 0.010 0.001k 3.841 6.635 10.828参照附表,得到的正确结论是()A.在犯错误的概率不超过0.1%的前提下,认为“需要志愿者提供帮助与性别有关”B.在犯错误的概率不超过0.1%的前提下,认为“需要志愿者提供帮助与性别无关”C.有99%以上的把握认为“需要志愿者提供帮助与性别有关”D.有99%以上的把握认为“需要志愿者提供帮助与性别无关”14.(2012•潍坊二模)为了普及环保知识,增强环保意识,某大学从理工类专业的A班和文史类专业的B班各抽取20名同学参加环保知识测试.统计得到成绩与专业的列联表:优秀非优秀总计A班14 6 20B班7 13 20C班21 19 40附:参考公式及数据:(1)卡方统计量(其中n=n11+n12+n21+n22);(2)独立性检验的临界值表:P(x2≥k)0.050 0.010K3.841 6.635则下列说法正确的是()A.有99%的把握认为环保知识测试成绩与专业有关B.有99%的把握认为环保知识测试成绩与专业无关C.有95%的把握认为环保知识测试成绩与专业有关D.有95%的把握认为环保知识测试成绩与专业无关15.(2014•潍坊三模)为了解某班学生喜爱打篮球是否与性别有关,对该班50名学生进行了问卷调查,得到如下的2×2列联表.喜爱打篮球不喜爱打篮球合计男生20 5 25女生10 15 25合计30 20 50则至少有()的把握认为喜爱打篮球与性别有关.A.95%B.99%C.99.5%D.99.9% 16.(2014•珠海二模)通过随机询问100名性别不同的小学生是否爱吃零食,得到如下的列联表:男女总计爱好10 40 50不爱好20 30 50总计30 70 100P(K2≥k)0.10 0.05 0.025k 2.706 3.841 50.24由K2=算得K2=≈4.762参照附表,得到的正确结论()A.在犯错误的概率不超过5%的前提下,认为“是否爱吃零食与性别有关”B.在犯错误的概率不超过5%的前提下,认为“是否爱吃零食与性别无关”C.有97.5%以上的把握认为“是否爱吃零食与性别有关”D.有97.5%以上的把握认为“是否爱吃零食与性别无关”17.某班主任对全班50名学生作了一次调查,所得数据如表:认为作业多认为作业不多总计喜欢玩电脑游戏18 9 27不喜欢玩电脑游戏8 15 23总计26 24 50由表中数据计算得到K2的观测值k≈5.059,于是________(填“能”或“不能”)在犯错误的概率不超过0.01的前提下认为喜欢玩电脑游戏与认为作业多有关.18.为考察某种药物预防禽流感的效果,进行动物家禽试验,调查了100个样本,统计结果为:服用药的共有60个样本,服用药但患病的仍有20个样本,没有服用药且未患病的有20个样本.(1)根据所给样本数据完成下面2×2列联表;(2)请问能有多大把握认为药物有效?不得禽流感得禽流感总计服药不服药总计参考答案1.A 【解析】试题分析:∵根据表中数据得到K225018158927232426()⨯⨯-⨯=⨯⨯⨯≈5.059,因为p (K 2≥5.024)=0.025,∴认为喜欢玩电脑游戏与认为作业量的多少有关系的把握大约为1-0.025=97.5% 故选A .考点:独立性检验的应用. 2.D 【解析】试题分析:根据所给的观测值,把观测值同表格所给的临界值进行比较,看观测值大于哪一个临界值,得到说明两个变量有关系的可信程度.解:∵k>3.84,∴有0.05的几率说明这两个变量之间的关系是不可信的,即有1﹣0.05=95%的把握说明两个变量之间有关系,故选D.点评:本题考查独立性检验,考查两个变量之间的关系的可信程度,考查临界值表的应用,本题是一个基础题,关键在于理解临界值表的意义,而没有要我们求观测值,降低了题目的难度.3.C【解析】试题分析:①方差反映一组数据的波动大小,将一组数据中的每个数据都加上或减去同一个常数后,方差恒不变;②设有一个回归方程,变量x增加一个单位时,y平均减少5个单位;③线性回归方程必过必过样本中心点;④由计算得K2=13.079,则其两个变量间有关系的可能性是99.9%,解:①方差反映一组数据的波动大小,将一组数据中的每个数据都加上或减去同一个常数后,方差恒不变,故①正确;②设有一个回归方程,变量x增加一个单位时,y平均减少5个单位,故②不正确;③线性回归方程必过必过样本中心点,故③正确;④由计算得K2=13.079,对照临界值,可得其两个变量间有关系的可能性是99.9%,故④错误,综上知,错误的个数是2个故选C.点评:本题考查线性回归方程,考查独立性检验,考查方差的变化特点,是一个考查的知识点比较多的题目,注意分析,本题不需要计算,只要理解概念就可以得出结论.4.D【解析】试题分析:根据计算出的临界值,同临界值表进行比较,得到假设不合理的程度约为99%,即这种疫苗不能起到预防甲型H1N1流感的作用不合理的程度约为99%,得到正确答案.解:∵并计算出P(Χ2≥6.635)≈0.01,这说明假设不合理的程度约为99%,即这种疫苗不能起到预防甲型H1N1流感的作用不合理的程度约为99%,∴有99%的把握认为“这种疫苗能起到预防甲型H1N1流感的作用”故选D.点评:本题是一个独立性检验,我们可以利用临界值的大小来决定是否拒绝原来的统计假设,若值较大就拒绝假设,即拒绝两个事件无关.5.A【解析】试题分析:题目的条件中已经给出这组数据的观测值,我们只要把所给的观测值同节选的观测值表进行比较,发现它大于3.841,在犯错误的概率不超过5%的前提下,认为“爱好这项运动与性别有关”.解:由题意算得,k2=4.762>3.841,参照附表,可得在犯错误的概率不超过5%的前提下,认为“爱好这项运动与性别有关”.故选A.点评:本题考查独立性检验的应用,本题有创新的地方就是给出了观测值,只要进行比较就可以,是一个基础题.6.C【解析】试题分析:把观测值同临界值进行比较.得到有99%的把握说学生性别与支持该活动有关系.解:∵K2=7.069>6.635,对照表格:)0.100 0.050 0.025 0.010 P(k2≥k0.0012.7063.841 5.024 6.635 10.828k∴有99%的把握说学生性别与支持该活动有关系.故选C.点评:本题考查独立性检验,解题时注意利用表格数据与观测值比较,这是一个基础题.7.A【解析】试题分析:把所给的观测值与临界值进行比较,发现它大于6.635,得到有99%以上的把握认为“选择过马路的方式与性别有关”.解:由题意,K2≈7.8∵7.8>6.635,∴有0.01=1%的机会错误,即有99%以上的把握认为“选择过马路的方式与性别有关”故选A.点评:本题考查独立性检验的应用,这种问题一般运算量比较大,通常是为考查运算能力设计的,本题有创新的地方就是给出了观测值,只要进行比较就可以,本题是一个基础题.8.D【解析】试题分析:根据列联表可以求得K2的值,与临界值比较,即可得到结论.解:提出假设H:学生数学成绩与物理成绩之间没有关系.根据列联表可以求得K2=≈11.5>6.635,∴有0.01=1%的机会错误,即有99%以上的把握认为“数学成绩与物理成绩之间有把握有关”故选D.点评:本题考查独立性检验的应用,这种问题一般运算量比较大,通常是为考查运算能力设计的,本题是一个基础题.9.C【解析】试题分析:利用公式求得K2,与临界值比较,即可得到结论.解:K2==≈8.333又 P(k2≥7.789)=0.005=0.5%,所以我们有 99.5%的把握认为患心脏病与性别有关系.故选:C.点评:本题考查独立性检验知识,考查学生的计算能力,考查学生分析解决问题的能力,属于基础题.10.C【解析】试题分析:把观测值同临界值进行比较.得到有99%的把握说学生性别与支持该活动有关系.解:∵K2=7.069>6.635,对照表格:) 0.100 0.050 0.025 0.010 0.001P(k2≥kk2.7063.841 5.024 6.635 10.828∴有99%的把握说学生性别与支持该活动有关系.故选:C.点评:本题考查独立性检验,解题时注意利用表格数据与观测值比较,这是一个基础题.11.D【解析】试题分析:根据有99%的可能性认为学生喜欢跳舞与性别有关,可得K2>6.635,即可得出结论.解:∵有99%的可能性认为学生喜欢跳舞与性别有关,∴K2>6.635,故选:D.点评:根据列联表,计算K2,与临界值比较,是解决独立性检验的应用问题的方法12.C【解析】试题分析:根据所给的数据,代入求观测值的公式,得到观测值,把观测值同临界值进行比较得到结论.解:根据所给的数据代入求观测值的公式,得到k2=≈4.432>3.844,∴至少有95%的把握认为学生选报文理科号性别有关,故选:C.点评:本题考查独立性检验的应用,本题解题的关键是理解临界值对应的概率的意义,能够看出两个变量之间的关系,属于基础题.13.C【解析】试题分析:K2=9.967,同临界值表进行比较,得到有多大把握认为老年人是否需要志愿者提供帮助与性别有关.解:由于K2=9.967>6.635,所以有99%的把握认为该地区的老年人是否需要帮助与性别有关.故选:C.点评:本题考查独立性检验.利用观测值K2与临界值的大小来确定是否能以一定把握认为两个分类变量有关系.其方法是:K≥K0,解释为有[1﹣P(k2≥k)]×100%的把握认为两个分类变量有关系;K<K,解释为不能以[1﹣P(k2≥k)]×100%的把握认为两个分类变量有关系.14.C【解析】试题分析:由列联表中数据,代入公式,求出X2的值,进而与3.841进行比较,即可得出能否有95%的把握认为环保知识测试成绩与专业有关.解:由两个班同学的统计得到成绩与专业的列联表:根据列联表中的数据可得X2=40(14×13﹣6×7)2÷(21×19×20×20)≈4.912>3.841 ∴有95%的把握认为环保知识测试成绩与专业有关.故选C.点评:本题考查独立性检验的应用,考查数据处理能力、运算求解能力和应用意识,本题解题的关键是正确运算出观测值,理解临界值对应的概率的意义,要想知道两个变量之间的有关或无关的精确的可信程度,只有利用独立性检验的有关计算,才能做出判断,本题是一个基础题.15.C【解析】试题分析:根据所给的列联表得到求观测值所用的数据,把数据代入观测值公式中,做出观测值,同所给的临界值表进行比较,得到所求的值所处的位置,得到百分数.解:根据所给的列联表,得到k2==8.333>7.879,∴至少有99.5%的把握说明喜爱打篮球与性别有关.故选:C.点评:根据所给的列联表得到求观测值所用的数据,把数据代入观测值公式中,做出观测值,同所给的临界值表进行比较,得到所求的值所处的位置,得到百分数.16.A【解析】试题分析:根据P(K2>3.841)=0.05,即可得出结论.解:∵K2=≈4.762>3.841,P(K2>3.841)=0.05∴在犯错误的概率不超过5%的前提下,认为“是否爱吃零食与性别有关”.故选:A.点评:本题考查独立性检验的应用,考查学生分析解决问题的能力,属于基础题.17.不能【解析】查表知若要在犯错误的概率不超过0.01的前提下认为喜欢玩电脑游戏与认为作业多有关,则临界值k=6.635.本题中,k≈5.059<6.635,所以不能在犯错误的概率不超过0.01的前提下认为喜欢玩电脑游戏与认为作业多有关.考点:独立性检验.18.(1)不得禽流感得禽流感总计服药40 20 60 不服药20 20 40总计 6040 100(2)大概90%认为药物有效【解析】试题分析:(1)由所给样本数据完成下面2×2列联表即可(2)根据公式计算观测值,然后比较观测值与临界值表中相应的检验水平,最后做出统计判断.(1)填表 不得禽流感得禽流感 总计 服药 4020 60 不服药20 20 40 总计 60 40 100(2)假设检验问题H 0:服药与家禽得禽流感没有关系22()()()()()n ad bc K a b c d a c b d -=++++ 2100(40202020) 2.77860406040⨯-⨯=≈⨯⨯⨯ 由P(2 2.706K≥)=0.10 所以大概90%认为药物有效12分 考点:2×2列联表;独立性检验.。

相关文档
最新文档