《独立性检验的基本思想及其初步应用》
高中数学:1.2《独立性检验的基本思想及其初步应用》复习教案
![高中数学:1.2《独立性检验的基本思想及其初步应用》复习教案](https://img.taocdn.com/s3/m/48936a136d175f0e7cd184254b35eefdc8d31570.png)
1.2独立性检验的基本思想及其初步应用教学目标:1理解独立性检验的基本思想2、会从列联表、柱形图、条形图直观判断吸烟与患癌有关。
3、了解随机变量K2的含义。
教学重点:理解独立性检验的基本思想。
教学难点;1、理解独立性检验的基本思想、2、了解随机变量K2的含义。
教学过程:一、引入:从问题“吸烟是否与患肺癌有关系”引出独立性检验的问题,并借助样本数据的列联表,柱形图,和条形图的展示,使学生直观感觉到吸烟和患肺癌可能会有关系。
但这种结论能否推广到总体呢?要回答这个问题,就必须借助于统计理论来分析。
二、独立性检验就是检验两个分类变量是否有关的一种统计方法:用字母表示吸烟与患肺癌的列联表:不患肺癌患肺癌合计不吸烟 a b a+b吸烟 c d c+d合计a+c b+d a+b+c+d样本容量 n=a+b+c+d假设H0 : 吸烟与患肺癌没有关系。
则吸烟者中不患肺癌的的比例应该与不吸烟者中相应的比例差不多,即:()()()()()()()220a ca c d c ab ad bc a b c dad bc n ad bc k a b c d a c b d n a b c d≈⇒+≈+⇒-≈++--=++++=+++因此 : 越小, 说明吸烟与患肺癌之间关系越弱.构造随机变量 其中()()2781721489874916.635⨯⨯≈⨯⨯⨯≥≈≥2020220202若H 成立,则K 应该很小. 把表中数据代入公式9965777549-422099K =56.632在H 成立的情况下.统计学家估算出如下概率P K 0.01即在H 成立的情况下,K 的值大于6.635的概率非常小.如果K 6.635,就断定H 不成立,出错的可能性有多大?出现K =56.6326.635 的概率不超过1% .因此,我们有99%的把握认为"吸烟与患肺癌有关系."三、作业:预习17页。
1.2独立性检验的基本思想及其初步应用(第二课时)。
独立性检验的基本思想及其初步应用高中数学人教A版选修PPT课件
![独立性检验的基本思想及其初步应用高中数学人教A版选修PPT课件](https://img.taocdn.com/s3/m/9c854ab580c758f5f61fb7360b4c2e3f572725fe.png)
a ≈ a + b×a + c nn n
其中n = a + b + c + d为样本容量,即
(a+b+c+d)a (a+b)(a+c),
即ad bc
因此|ad-bc|越小,说明吸烟与患肺癌之间关系越弱; |ad-bc|越大,说明吸烟与患肺癌之间关系越强。
18
独立性检验
为了使不同样本容量的数据有统一的评判标准,基于上述分
甲生产线 97 3
100
乙生产线 95 5
100
总计
192 8
200
10
100 90 80 70 60 50 40 30 20 10 0 合格
不合格
合格
不合格
甲生产线 乙生产线
甲生产线 乙生产线
0
100
200
300
11
1 . 2×2 列 联 表 是 传 统 的 调 查 研 究 中 最 常 用的方法之一,用于研究两个变量之间相 互独立还是存在某种关联性,它适用于分 析两个变量之间的关系.
k
0.455 0.708 1.323 2.072 2.706 3.841 5.024 6.635 7.879 10.828
(1)如果k 10.828,就有99.9%的把握认为" X与Y有关系"
(2)如果k 7.879,就有99.5%的把握认为" X与Y有关系"
(3)如果k 6.635,就有99%的把握认为" X与Y有关系"
不成立,即有99%的把握认为“吸烟
0
与患肺癌有关系”。
20
判断H 0是否成立的规则
如果 k 6.635 ,就判断 H0 不成立,即认为吸烟与
《独立性检验的基本思想及其初步应用》PPT课件
![《独立性检验的基本思想及其初步应用》PPT课件](https://img.taocdn.com/s3/m/1806e45fa7c30c22590102020740be1e650ecc28.png)
0.05 3.841
0.025 5.024
0.010 0.005 6.635 7.879
0.001 10.828
K2的观测值为k
如果 k k0,就以 (1 P(K 2 k0 )) 100%的把握
认为“X与Y有关系”;而这种判断有可能出错,出
错的概率不会超过 P(K 2 k0 )。
7
例如 :
1如果k 10.828,就有99.9%把握认为" X与Y有
❖ 试用你所学过的知识进行分析,能否在犯错 误的概率不超过0.005的前提下,认为“喜欢 体育还是文娱与性别有关系”?
体育 文娱 总计
男生 21 23 44
女生 6 29 35
总计 27 52 79
16
[思路探索] 可用数据计算 K2,再确定其中的具体关系. 解 判断方法如下: 假设 H0“喜欢体育还是喜欢文娱与性别没有关系”,若 H0 成立, 则 K2 应该很小. ∵a=21,b=23,c=6,d=29,n=79, ∴k=a+bcn+add-ab+cc2b+d =21+237×9×6+212×9×29-212+3×66×223+29≈8.106.
12
例4:为研究不同的给药方式(口服与注射)和药的效果(有效 与无效)是否有关,进行了相应的抽样调查,调查的结果列 在表中,根据所选择的193个病人的数据,能否作出药的效果 和给药方式有关的结论?
口服 注射 合计
有效 58 64 122
无效 40 31 71
合计 98 95 193
P(k≥k0) 0.50 0.40 0.25 0.15 0.10 0.05 0.025 0.010 0.005 0.001 k0 0.455 0.708 1.323 2.072 2.706 3.841 5.024 6.635 7.879 10.828
“独立性检验的基本思想及其初步应用”教材与教学解析
![“独立性检验的基本思想及其初步应用”教材与教学解析](https://img.taocdn.com/s3/m/64ddfa1c4431b90d6c85c7d0.png)
二 、教 学 指 导 思 想 分 析
《 普通高 中数学课程标 准 ( 实验 ) 》 对独立性检 验的基本 思 学指 导 思 想 、教 学 目标 、教 学 中 可 能 存 在 的 问题 、 完成 教 学 所 想及其初 步应 用 的教 学要求较低 ,在教学 实践 中,也 未引起重 需的 支持条件 、引导 学生学 习的设 问方式 、达标检测题 的设计 视 , 至 多 是 围 绕 高 考 进 行 ,许 多 教 师 也 不 知 怎 么教 才 好 ,往 往 是教学生 “ 套 用 ”教 材的解题格 式或步骤 ,可是 ,没 过多长 时 间学生就 忘了 !这种 功利性极 强的 “ 应试 教学 ”行 为难 以达 到
步骤 就是顺理成 章的事 了 ,因此 ,核 心在于独立 性检验 的基 本
思想 .
一
我们在 高 中数学课 程 中教授 统计 内容 ,根本 目的应是通过 些具体 的统 计案 例 ,指导学生 领会统计思 想 ,教 导学生认识
目的 ,还 需 在 今 后 的学 习或 工 作 中加 强 训 练 和应 用 . 四 、教 学 问题 诊 断分 析
1 . 教 学 内容
本节 的教学 内容是 通过 具 体实 例 “ 患 肺 癌 是 否 与 吸 烟 有 人 们 的生 存 ,直 至 推 动 社 会 发展 . 本 部 分 的 教 学 就 应 引 导 学 生 理 关” ,介绍 独立性检验 的基本思想 ,它是用 随机变量 : 判断两 解 独 立 性 检 验 的 含 义 ,探 究 独 立 性 检 验 蕴 含 的统 计 学 思 想 和 基 个 分 类 变 量有 关 的方 法 .独立 性 检 验是 一种 假设 检 验 ,它 的基 本 本 方 法 ,培 养 学 生 学 习 数 学 、研 究 数 学 的 习 惯 和 能 力 ,不 能 只 思想 来 源 于统 计 学 中的 假设 检 验 思想 . 为 了考试而轻视概念的理解 、轻视 阅读 自学能力的培养.
1.2独立性检验的基本思想及其初步应用
![1.2独立性检验的基本思想及其初步应用](https://img.taocdn.com/s3/m/2c8a183487c24028915fc31b.png)
试用图形判断服用药和患病之间是否有关系?
解析:相应的等高条形图如下:
从图形可以看出,服用药的样本中患病的比例明显低于 没有服用药的样本中患病的比例,因此可以认为:服用药和 患病之间有关系.
独立性检验方法——K2公式
在调查的480名男士中有38名患有色盲,520名女 士中有6名患有色盲,能否在犯错误的概率不超过0.001的前 提下认为性别与患色盲有关系? 分析:
4.下面是一个2×2列联表: x1 x2 总计 y1 a 2 b y2 21 25 46 总计 73 27 100
则表中a、b的值分别为( C ) A.94、96 C.52、54 B.52、50 D.54、52
5.性别与身高列联表如下: 男 女 总计 高(165 cm以上) 37 6 43 矮(165 cm以下) 4 13 17 总计 41 19 60
作出2×2列联表 → 计算随机变量K2的值 → 对照临界值作出结论 解析:根据题目所给的数据作出如下的列联表:
色盲 不色盲 总计
男
女 总计
38
6 44
442
514 956
480
520 1 000
根据列联表中所给的数据可以得: a=38,b=442,c=6,d=514,a+b=480,c+d= 520,a+c=44,b+d=956,n=1 000.
3.独立性检验. 利用随机变量K2来判断“两个分类变量有关系”的方法 定义 称为独立性检验.
nad-bc2 公式 K2=_____________________ a+bc+da+cb+d ,其中n=______________. a+b+c+d
①根据实际问题的需要确定容许推断“两个分类变量有 临界值 k0 .② 关系”犯错误概率的上界α,然后查表确定 ________ k________ ≥k0 利用公式计算随机变量K2的 ________ , 观测值 k .③如果 具体 就推断“X与Y有关系”,这种推断犯错误的概率不超过 步骤 α;否则,就认为在犯错误的概率不超过α的前提下不能 推断“X与Y有关系”,或者在样本数据中没有发现足够 证据支持结论“X与Y有关系”.
独立性检验的基本思想及其初步应用
![独立性检验的基本思想及其初步应用](https://img.taocdn.com/s3/m/07ab18e380eb6294dd886cec.png)
如果“吸烟与患肺癌没有关系”,那么吸烟样
本中不患肺癌的比例应该与不吸烟样本中相应的比
例差不多.
所以
a a+
b
c
c +d
,
所以 a c + d ca + b,
ad bc
即 ad bc 0.
︱ad-bc︱越小,说明吸烟与患肺癌之间的关系越弱;
︱ad-bc︱越大,说明吸烟与患肺癌之间的关系越强.
患心脏病 患其他病 总计
秃顶
214
175
389
不秃顶
451
597
1 048
总计
665
772
1 437
(1)相应的等高条形图如下所示,
不患心脏病 患心脏病
秃顶
不秃顶
由图可认为秃顶与患心脏病有关系
吸烟与患肺癌列联表(单位:人)
不患肺癌
患肺癌
总计
不吸烟
7 775
42
7 817
吸烟
2 099
49
2 148
总计
9 874
91
9 965
在不吸烟者中患肺癌的比重是__0_._5_4_%_,
在吸烟者中患肺癌的比重是__2_._2_8_%_.
说明:吸烟者和不吸烟者患肺癌的可能性存在差异, 吸烟者患肺癌的可能性大.
K2
(n ad bc)2
(a b)(c d )(a c)(b d )
临界值表:
P ( K 2 k 0 ) 0.50 0.40 0.25 0.15 0.10 0.05 0.025 0.010 0.005 0.001
k 0 0.455 0.708 1.323 2.072 2.706 3.841 5.024 6.635 7.879 10.828
1.2独立性检验的基本思想及其初步应用课件人教新课标
![1.2独立性检验的基本思想及其初步应用课件人教新课标](https://img.taocdn.com/s3/m/7a54a0575b8102d276a20029bd64783e09127dc7.png)
因此,
|ad-bc|越小,说明吸烟与患肺癌之间关系越弱; |ad-bc|越大,说明吸烟与患肺癌之间关系越强.
为了使不同样本容量的数据有统一的评判 标准,基于上述分析,我们构造一个随机变量:
K2 =
n(ad - bc)n
(a + b)(c + d)(a + c)(b + d)
其中n=a+b+c+d为样本容量.
48 121 208 223 193 165 42
(I)将各组的频率填入表中;
(II)根据上述统计结果,计算灯管使用寿命不足 1500小时的频率.
解答
分组
频数 频率
[500,9 [900, 00) 1100)
48 121 0.048 0.121
[1100, 1300)
208 0.208
[1300, 1500)
P(k2>k) 0.50 0.40 0.25 0.15 0.10 0.05 0.025 0.010 0.005 0.001 k 0.455 0.708 1.323 2.072 2.706 3.84 5.024 6.635 7.879 10.83
(2)利用K2公式,计算随机变量K2的观测值k.
(3)如果k>k0,就推断“X与Y有关系”,这 种推断犯错误的概率不超过a;否则,就认为在犯 错误的概率不超过a的前提下不能推断“X与Y有关 系”.
k=
16.373 > 6.635
3891048 665 772
所以有99%的把握认为”秃顶与患心脏病有关”.
解答
根据题目所得数据得到列联表:
秃顶 不秃顶
总计
患心脏病 214 451 665
(完整)独立性检验的基本思想及其初步应用教学设计
![(完整)独立性检验的基本思想及其初步应用教学设计](https://img.taocdn.com/s3/m/f3bb229cff00bed5b9f31de3.png)
《独立性检验的基本思想及其初步应用》教学设计邹晓利两当一中《独立性检验的基本思想及其初步应用》教学设计两当一中邹晓利【教学目标】1.知识与技能:通过对典型案例的探究,了解独立性检验的基本思想,会对两个分类变量进行独立性检验,明确独立性检验的基本步骤,并能解决实际问题。
2.过程与方法:通过设置问题,引导学生自主发现、合作探究、归纳展示、质疑对抗,使学生成为课堂主体。
3.情感、态度与价值观:通过本节课学习,让学生体会统计方法在决策中的作用;合作探究的学习过程,使学生感受发现、探索的乐趣及成功展示的成就感,培养学生学习数学知识的积极态度。
【教学重点】了解独立性检验的基本思想及实施步骤。
【教学难点】K的含义。
独立性检验的基本思想;随机变量2【学情分析】本节课是在学习了统计、回归分析的基本思想及初步应用后,利用独立性检验进一步分析两个分类变量之间是否有关系,为以后学习统计理论奠定基础。
【教学方式】多媒体辅助,合作探究式教学。
【教学过程】一、情境引入,提出问题5月31日是世界无烟日,有关医学研究表明,许多疾病,例如:心脏病、癌症、脑血管病、肺病等都与吸烟有关,吸烟已经成为继高血压之后的第二号全球杀手。
这些疾病与吸烟有关的结论是怎样得出的呢?[设计意图说明]好的课堂情景引入,能激发学生的求知欲,是新问题能够顺利解决的前提之一。
问题你认为吸烟与患肺癌有关系吗?怎样用数学知识说明呢?[设计意图说明]提出问题,引导学生自主探究,指明方向,步步深入。
二、阅读教材,探究新知1.分类变量对于性别变量,其取值为男和女两种:[设计意图说明]利用图像向学生展示变量的不同取值,更加形象的表示分类变量的概念。
这种变量的不同“值”表示个体所属的不同类别,像这样的变量称为分类变量。
生活中有很多这样的分类变量如:是否吸烟宗教信仰国籍民族……2.列联表为研究吸烟是否对患肺癌有影响,某肿瘤研究所随机地调查了9965人,得到如下结果:表3—7 吸烟与患肺癌列联表单位:人不患肺癌患肺癌总计不吸烟7775 42 7817吸烟2099 49 2148总计9874 91 9965 这样列出的两个分类变量的频数表,称为列联表(一般我们只研究每个分类变量只取两2 列联表)。
独立性检验的基本思想及其初步应用
![独立性检验的基本思想及其初步应用](https://img.taocdn.com/s3/m/1dda0d571611cc7931b765ce05087632311274ab.png)
§3.2独立性检验的基本思想及其初步应用学习目标 1.了解独立性检验的基本思想、方法及其简单应用.2.理解判断两个分类变量是否有关系的常用方法、独立性检验中K2的含义及其实施步骤(重、难点).知识点1两个分类变量之间关联关系的定性分析1.分类变量变量的不同“值”表示个体所属的不同类别,像这样的变量称为分类变量.这里的“变量”和“值”都应作为“广义”的变量和值进行理解,它们取的不一定是具体的数值.2.列联表列出的两个分类变量的频数表,称为列联表.假设两个分类变量X和Y,它们的可能取值分别为{x1,x2}和{y1,y2},其样本频数列联表(也称为2×2列联表)为:y1y2总计x1 a b a+bx2 c d c+d总计a+c b+d a+b+c+d3.两个分类变量之间关联关系的定性分析的方法(1)频率分析法:通过对样本的每个分类变量的不同类别事件发生的频率大小进行比较来分析分类变量之间是否有关联关系.通常通过列联表列出两个分类变量的频数表来进行分析.(2)图形分析法:与表格相比,图形更能直观地反映出两个分类变量间是否互相影响,常用等高条形图展示列联表数据的频率特征.【预习评价】(1)下面是一个2×2列联表:y1y2总计x1 a 2173x282533总计 b 46则表中a,b处的值分别为()A.94,96B.52,50C.52,60D.54,52(2)根据如图所示的等高条形图可知吸烟与患肺病关系(填“有”或“没有”).知识点2独立性检验1.定义:利用随机变量K2来判断“两个分类变量有关系”的方法称为独立性检验.2.K2=n(ad-bc)2(a+b)(c+d)(a+c)(b+d),其中n=a+b+c+d.3.独立性检验的具体做法(1)根据实际问题的需要确定容许推断“两个分类变量有关系”犯错误概率的上界α,然后查表确定临界值k0.(2)利用公式计算随机变量K2的观测值k.(3)如果k≥k0,就推断“X与Y有关系”,这种推断犯错误的概率不超过α,否则就认为在犯错误的概率不超过α的前提下不能推断“X与Y有关系”,或者在样本数据中没有发现足够证据支持结论“X与Y有关系”.【预习评价】(1)在吸烟与患肺病这两个分类变量是否相关的判断中,下列说法中正确的是()①若K2的观测值k>6.635,则在犯错误的概率不超过0.01的前提下,认为吸烟与患肺病有关系,那么在100个吸烟的人中必有99人患有肺病;②从独立性检验可知在在犯错误的概率不超过0.01前提下,认为吸烟与患肺病有关系时,我们说若某人吸烟,则他有99%的可能患有肺病;③从统计量中得知在犯错误的概率不超过0.05的前提下认为吸烟与患肺病有关系,是指有5%的可能性使得推断出现错误.A.①B.①③C.③D.②(2)某班主任对全班50名学生进行了作业量的调查,数据如下表:认为作业量大认为作业量不大总计男生18927女生81523总计262450则推断“学生的性别与认为作业量大有关”这种推断犯错误的概率不超过()A.0.01B.0.005C.0.025D.0.001题型一利用等高条形图判断两个分类变量是否有关系【例1】为考察某种药物预防疾病的效果进行动物试验,得到如下列联表:患病未患病总计服用药104555未服用药203050总计3075105试用等高条形图分析服用药和患病之间是否有关系.规律方法(1)本题采用数形结合法通过条形图直观地看出差异,得出结论. (2)应用等高条形图判断两变量是否相关的方法在等高条形图中,可以估计满足条件X=x1的个体中具有Y=y1的个体所占的比例aa+b,也可以估计满足条件X=x2的个体中具有Y=y1的个体所占的比例cc+d.“两个比例的值相差越大,H1成立的可能性就越大.”【训练1】网络对现代人的生活影响较大,尤其是对青少年,为了解网络对中学生学习成绩的影响,某地区教育主管部门从辖区初中生中随机抽取了1 000人调查,发现其中经常上网的有200人,这200人中有80人期末考试不及格,而另外800人中有120人不及格.利用图形判断学生经常上网与学习成绩有关吗?方向1 有关“相关的检验”【例2-1】某校对学生课外活动进行调查,结果整理成下表:用你所学过的知识进行分析,能否在犯错误的概率不超过0.005的前提下,认为“喜欢体育还是文娱与性别有关系”?方向2有关“无关的检验”【例2-2】为了探究学生选报文、理科是否与对外语的兴趣有关,某同学调查了361名高二在校学生,调查结果如下:理科对外语有兴趣的有138人,无兴趣的有98人,文科对外语有兴趣的有73人,无兴趣的有52人.分析学生选报文、理科与对外语的兴趣是否有关?规律方法(1)独立性检验的关注点在2×2列联表中,如果两个分类变量没有关系,则应满足ad-bc≈0,因此|ad -bc|越小,关系越弱;|ad-bc|越大,关系越强.(2)独立性检验的具体做法①根据实际问题的需要确定允许推断“两个分类变量有关系”犯错误的概率的上界α,然后查表确定临界值k0.②利用公式K2=n(ad-bc)2(a+b)(c+d)(a+c)(b+d)计算随机变量K2的观测值k.③如果k>k0,推断“X与Y有关系”这种推断犯错误的概率不超过α;否则,就认为在犯错误的概率不超过α的前提下不能推断“X与Y有关系”,或者在样本数据中没有发现足够的证据支持结论“X与Y有关系”.【训练2】打鼾不仅影响别人休息,而且可能与患某种疾病有关.下表是一次调查所得的数据:根据独立性检验,能否在犯错误的概率不超过0.001的前提下认为每一晚都打鼾与患心脏病有关系?题型三独立性检验的综合应用【例3】某高校共有学生15 000人,其中男生10 500人,女生4 500人.为调查该校学生每周平均体育运动时间的情况,采用分层抽样的方法,收集300位学生每周平均体育运动时间(单位:时)的样本数据.(1)应收集多少位女生的样本数据?(2)根据这300个样本数据,得到学生每周平均体育运动时间的频率分布直方图(如图),其中样本数据的分组区间为[0,2],(2,4],(4,6],(6,8],(8,10],(10,12].估计该校学生每周平均体育运动时间超过4小时的概率.(3)在样本数据中,有60位女生的每周平均体育运动时间超过4小时,请完成每周平均体育运动时间与性别列联表,并判断是否认为“该校学生的每周平均体育运动时间与性别有关”.附:P(K2≥k0)0.1000.0500.0100.005k0 2.706 3.841 6.6357.879K2=n(ad-bc)2(a+b)(c+d)(a+c)(b+d).规律方法(1)解答此类题目的关键在于正确利用K2=n(ad-bc)2计算k的值,再用它与临界值k0的大小作比(a+b)(c+d)(a+c)(b+d)较来判断假设检验是否成立,从而使问题得到解决.(2)此类题目规律性强,解题比较格式化,填表计算分析比较即可,要熟悉其计算流程,不难理解掌握.【训练3】某校高三年级在一次全年级的大型考试中,数学成绩优秀和非优秀的学生中,物理、化学、总分成绩优秀的人数如下表所示,能否在犯错误的概率不超过0.001的前提下认为数学成绩优秀与物理、化学、总分成绩优秀有关系?物理优秀化学优秀总分优秀数学优秀228225267数学非优秀14315699注:该年级在此次考试中数学成绩优秀的有360人,非优秀的有880人.课堂达标1.观察下列各图,其中两个分类变量x,y之间关系最强的是()2.某同学寒假期间对其30位亲属的饮食习惯进行了一次调查,列出了如下2×2列联表:偏爱蔬菜 偏爱肉类 总计50岁以下 4 8 12 50岁以上 16 2 18 总计201030则可以说其亲属的饮食习惯与年龄有关的把握为( ) A.90%B.95%C.99%D.99.9%3.为了判断高中学生的文理科选修是否与性别有关系,随机调查了50名学生,得到如下2×2列联表:理科 文科 男 13 10 女720已知P (K 2≥3.841)≈0.05,P (K 2≥5.024)≈0.025.根据表中数据,得到K 2的观测值k =50×(13×20-10×7)223×27×20×30≈4.844.可认为选修文理科与性别有关系的可能性不低于 . 4.根据下表计算:不看电视 看电视 男 37 85 女35143K 2的观测值k ≈ (保留3位小数).5.在109个人身上试验某种药物预防感冒的作用,得到如下列联表:感冒 未感冒 总计 服用药1146 57 未服用药 213152总计3277109则有多大把握认为该药有效?课堂小结1.列联表与等高条形图列联表由两个分类变量之间频率大小差异说明这两个变量之间是否有关联关系,而利用等高条形图能形象直观地反映它们之间的差异,进而推断它们之间是否具有关联关系.2.对独立性检验思想的理解独立性检验的基本思想类似于数学中的反证法.先假设“两个分类变量没有关系”成立,计算随机变量K2的值,如果K2值很大,说明假设不合理.K2越大,两个分类变量有关系的可能性越大.基础过关1.对两个分类变量A,B的下列说法中正确的个数为()①A与B无关,即A与B互不影响;②A与B关系越密切,则K2的值就越大;③K2的大小是判定A与B是否相关的唯一依据A.0B.1C.2D.32.高二第二学期期中考试,按照甲、乙两个班学生的数学成绩优秀和及格统计人数后,得到如下列联表:优秀及格总计甲班113445乙班83745总计197190则随机变量K2的观测值约为()A.0.600B.0.828C.2.712D.6.0043.考察棉花种子经过处理跟生病之间的关系得到下表数据:种子处理种子未处理总计根据以上数据,可得出()A.种子是否经过处理跟是否生病有关B.种子是否经过处理跟是否生病无关C.种子是否经过处理决定是否生病D.以上都是错误的4.2013年6月11日,中国的“神舟十号”发射成功,由此许多人认为中国进入了航天强国之列,也有许多人持反对意见,为此进行了调查.在参加调查的3 648名男性公民与3 432名女性公民中,持反对意见的男性有1 843人、女性有1 672人,在运用这些数据说明中国“神十”发射成功是否与中国进入航天强国有关系时,用下列最具说服力.①回归直线方程;②平均数与方差;③独立性检验.5.为了解高中生作文成绩与课外阅读量之间的关系,某研究机构随机抽取了60名高中生,通过问卷调查,得到以下数据:由以上数据,计算得到K2的观测值k≈9.643,根据临界值表,以下说法正确的是(填序号).①没有充足的理由认为课外阅读量大与作文成绩优秀有关;②有0.5%的把握认为课外阅读量大与作文成绩优秀有关;③有99.9%的把握认为课外阅读量大与作文成绩优秀有关;④有99.5%的把握认为课外阅读量大与作文成绩优秀有关.6.在研究某种药物对“H1N1”病毒的治疗效果时,进行动物试验,得到以下数据,对150只动物服用药物,其中132只动物存活,18只动物死亡,对照组150只动物进行常规治疗,其中114只动物存活,36只动物死亡.(1)根据以上数据建立一个2×2列联表;(2)试问该种药物对治疗“H1N1”病毒是否有效?7.在一次恶劣天气的飞行航程中调查男女乘客在飞机上晕机的情况如下表所示,根据此资料是否能在犯错误的概率不超过0.05的前提下认为在恶劣天气飞行中男人比女人更容易晕机?能力提升8.利用独立性检验来考察两个分类变量X和Y是否有关系时,通过查阅下表来确定“X与Y有关系”的可信程度.如果K2≥5.024,那么就有把握认为“X与Y有关系”的百分比为()A.25%B.75%C.2.5%D.97.5%9.某人研究中学生的性别与成绩、视力、智商、阅读量这4个变量的关系,随机抽查了52名中学生,得到统计数据如表1至表4,则与性别有关联的可能性最大的变量是()表1表2表3表4A.成绩B.视力C.智商D.阅读量10.下表是关于男婴与女婴出生时间调查的列联表:那么,A=,B=,C=,D=,E=.11.在研究性别与吃零食这两个分类变量是否有关系时,下列说法中正确的是(填序号).①若K2的观测值k=6.635,则我们在犯错误的概率不超过0.01的前提下认为吃零食与性别有关系,那么在100个吃零食的人中必有99人是女性;②由独立性检验可知在犯错误的概率不超过0.01的前提下认为吃零食与性别有关系时,如果某人吃零食,那么此人是女性的可能性为99%;③由独立性检验可知在犯错误的概率不超过0.01的前提下认为吃零食与性别有关系时,是指每进行100次这样的推断,平均有1次推断错误.12.随着生活水平的提高,人们的休闲方式也发生了变化.某机构随机调查了n 个人,其中男性占调查人数的25.已知男性中有一半的人的休闲方式是运动,而女性中只有13的人的休闲方式是运动. (1)完成下列2×2列联表:(2)若在犯错误的概率不超过0.05的前提下,可认为“性别与休闲方式有关”,那么本次被调查的人数至少有多少?(3)根据(2)的结论,本次被调查的人中,至少有多少人的休闲方式是运动? 13.(选做题)某学校为了解该校高三年级学生在市一练考试的数学成绩情况,随机从该校高三文科与理科各抽取50名学生的数学成绩,作出频率分布直方图如图,规定考试成绩在[120,150]内为优秀.(1)由以上频率分布直方图填写下列2×2列联表.若按是否优秀来判断,是否有99%的把握认为该校的文理科数学成绩有差异.文科理科总计优秀非优秀总计5050100(2)某高校派出2名教授对该校随机抽取的学生成绩中一练数学成绩在140分以上的学生进行自主招生面试,每位教授至少面试一人,每位学生只能被一位教授面试.若甲教授面试的学生人数为ξ,求ξ的分布列和均值.。
高二数学人选修课件第三章独立性检验的基本思想及其初步应用
![高二数学人选修课件第三章独立性检验的基本思想及其初步应用](https://img.taocdn.com/s3/m/d8fdd44cbfd5b9f3f90f76c66137ee06eef94e62.png)
Fisher确切概率法
定义
Fisher确切概率法是一种基于超几何分布的假设检验方法,用于检验两个分类变量之间 的独立性。
原理
Fisher确切概率法通过计算所有可能的表格排列组合中,比观察结果更极端或同样极端 的表格出现的概率之和,从而得到检验统计量的精确分布,并据此进行假设检验。
应用场景
适用于样本量较小或列联表中有格子期望频数过小的情况,此时卡方检验可能不再适用 。
自由度
在独立性检验中,自由度通常等于(行数-1)*(列 数-1),用于调整卡方统计量的分布。
显著性水平
用于判断拒绝原假设的可靠程度,通常取0.05或 0.01。
独立性检验的意义
80%
判断分类变量是否独立
通过独立性检验,可以判断两个 分类变量是否独立,从而进一步 分析它们之间的关系。
100%
为后续分析提供基础
05
实例分析:独立性检验的应用
实例一:医学研究中基因与疾病关联性的分析
01
02
03
04
研究目的
探讨特定基因与某种疾病之间 的关联性,为疾病的预防、诊 断和治疗提供依据。
数据收集
收集大量患者的基因数据和疾 病信息,以及健康人群的基因 数据作为对照。
独立性检验
利用独立性检验的方法,分析 基因与疾病之间是否存在统计 学上的显著关联。
结果解读
如果检验结果显示产品满意度与品牌忠诚度之间 存在显著关联,则企业可以针对提高产品满意度 来增强消费者的品牌忠诚度。
实例三
研究目的
数据收集
探讨教育水平与职业成功之间的关系,为 教育政策制定和职业规划提供依据。
收集大量个体的教育水平数据和职业成功 指标(如收入、职位等),以及可能影响 职业成功的其他因素数据。
独立性检验的基本思想及其初步应用
![独立性检验的基本思想及其初步应用](https://img.taocdn.com/s3/m/f3d680af541810a6f524ccbff121dd36a22dc44f.png)
P(K2≥k0) 0.50 0.40 0.25 0.15 0.10 0.05 0.025 0.010 0.005 0.001
k0
0.455 0.708 1.323 2.072 2.706 3.841 5.024 6.635 7.879 10.828
小结: 回顾我们分析“吸烟对患肺癌是否有影响”这个案例的过程: 我们是如何判断两个分类变量是否有关系? 1.提出假设H0:两个分类变量没有关系; 2.写出2×2列联表,并由K2的公式计算其观测值k ; 3.作出推断:确定临界值k0,通过观测值k与k0比较作出判断;
利用频率判断概率是否相等
利用统计量的观测值与临界值 比较
利用等高条形图直观判断有关 利用小概率事件发生给出“判
系
断有关系”犯错误的概率
【例】在某医院,因为患心脏病而住院的665名男性病人中,有 214人秃顶, 而另外772名不是因为患心脏病而住院的男性病人 中有175人秃顶. (1)利用图形判断秃顶与患心脏病是否有关系; (2)能否在犯错误的概率不超过0.01的前提下认为秃顶与患心 脏病有关系?
(1)若k≥k0,认为k很大,推断H0不成立,从而有 [1-P(K2≥k0)]×100%的把握认为“两个分类变量有关系”, 即:在犯错误的概率不超过P(K2≥k0)的前提下认为“两个分类 变量有关系”; (2)若k<k0,认为k很小,无法拒绝H0 , 即:样本观测数据没有足够证据证明“两个分类变量有关系”.
总计 7 817 2 148 9 965
依据两个分类变量的取值,列出的频数分布表我们称为 2×2列联表
列分类(Y)
未发生数(y1)
行 分
甲(x1)
a
类 (X)
乙(x2)
c
1.2.2独立性检验的基本思想及其初步应用习题及答案
![1.2.2独立性检验的基本思想及其初步应用习题及答案](https://img.taocdn.com/s3/m/428ace492af90242a895e5ec.png)
数学·选修1-2(人教A版)独立性检验的基本思想及其初步应用►达标训练1.在研究两个分类变量之间是否有关时,可以粗略地判断两个分类变量是否有关的是()A.散点图B.等高条形图C.2×2列联表D.以上均不对,答案:B2.在等高条形图形图中,下列哪两个比值相差越大,要推断的论述成立的可能性就越大()与dc+d与ac+d与cc+d与cb+c答案:C3.对分类变量X与Y的随机变量K2的观测值k,说法正确的是()A.k越大,“ X与Y有关系”可信程度越小【B.k越小,“ X与Y有关系”可信程度越小C.k越接近于0,“X与Y无关”程度越小D.k越大,“X与Y无关”程度越大答案:B@4.下面是一个2×2列联表:则表中a、b的值分别为()。
A.94、96 B.52、50C.52、54 D.54、52答案:C5.性别与身高列联表如下:那么,检验随机变量K2的值约等于()A.B.C.22 D.答案:C:6.给出列联表如下:根据表格提供的数据,估计“成绩与班级有关系”犯错误的概率约是( ) *A .B .0.5C .D .答案:B►素能提高1.在调查中发现480名男人中有38名患有色盲,520名女人中有6名患有色盲,下列说法中正确的是( )A .男人、女人中患有色盲的频率分别为、B .男人、女人患色盲的概率分别为19240、3260C .男人中患色盲的比例比女人中患色盲的比例大,患色盲是与性别有关的 /D .调查人数太少,不能说明色盲与性别有关解析:男人患色盲的比例为38480,比女人中患色盲的比例6520大,其差值为⎪⎪⎪⎪⎪⎪38480-6520≈ 6,差值较大. 答案:C2.通过随机询问110名性别不同的大学生是否爱好某项运动,得到如下的列联表:男 女 :总计爱好40 20 60 不爱好 20 30 50总计¥6050 110由K 2=算得, K 2=≈.附表:P(K2≥k0):k0参照附表,得到的正确结论是()A.有99%以上的把握认为“爱好该项运动与性别有关”B.有99%以上的把握认为“爱好该项运动与性别无关”¥C.在犯错误的概率不超过%的前提下,认为“爱好该项运动与性别有关”D.在犯错误的概率不超过%的前提下,认为“爱好该项运动与性别无关”答案:A3.若由一个2×2列联表中的数据计算得K2=,那么在犯错误的概率不超过的前提下认为两个变量______(填“有”或“没有”)关系.答案:有4.(2013·韶关二模)以下四个命题:%①在一次试卷分析中,从每个试室中抽取第5号考生的成绩进行统计,是简单随机抽样;②样本数据:3,4,5,6,7的方差为2;③对于相关系数r,|r|越接近1,则线性相关程度越强;④通过随机询问110名性别不同的行人,对过马路是愿意走斑马线还是愿意走人行天桥进行抽样调查,得到如下列联表:男女总计走天桥—402060走斑马线203050总计6050·110由K2=可得,K2==,则有99%以上的把握认为“选择过马路方式与性别有关”,其中正确的命题序号是________.答案:②③④附表P(K2≥k0)?k05.某学校为了调查喜欢语文学科与性别的关系,随机调查了一些学生情况,具体数据如下表:^类别不喜欢语文喜欢语文性别男1310女720—为了判断喜欢语文学科是否与性别有关系,根据表中的数据,得到K2的观测值k=≈,因为k≥,根据下表中的参考数据:P(K2≥k0)/k0|判定喜欢语文学科与性别有关系,那么这种判断出错的可能性为________.答案:5%—6.某学校课题组为了研究学生的数学成绩与物理成绩之间的关系,随机抽取高二年级20名学生某次考试成绩(满分100分)如下表序号12345678~910数学成绩95758094926567 (849871)物理成绩906372879171]58829381序号11121314(151617181920数学成绩679364·78779057837283物理成绩7782 (4885699161847886)若单科成绩85以上(含85分),则该科成绩优秀.(1)根据上表完成下面的2×2列联表(单位:人).< 数学成绩优秀数学成绩不优秀合计物理成绩优秀物理成绩不优秀【合计解析:(1)2×2列联表为(单位:人):;数学成绩优秀数学成绩不优秀合计物理成绩优秀527物理成绩不优秀112;13合计61420(2)根据题(1)中表格的数据计算,能否在犯错误的概率不超过的前提下认为学生的数学成绩与物理成绩之间有关系参数数据:①假设有两个分类变量X和Y,它们的值域分别为(x1,x2)和(y1,y2),其样本频数列联表(称为2×2列联表)为:! y1y2合计x1a b a+bx2c:d c+d合计a+c b+d a+b+c+d则随机变量K2=,其中n=a+b+c+d为样本容量;②独立检验随机变量K2的临界值参考表如下:…P(K2≥k0)k0<P(K2≥k0)k0/解析:根据列联表可以求得K2的观测值k=≈>.在犯错误的概率不超过的前提下认为:学生的数学成绩与物理成绩之间有关系."7.2013年3月14日,CCTV财经频道报道了某地建筑市场存在违规使用未经淡化海砂的现象.为了研究使用淡化海砂与混凝土耐久性是否达标有关,某大学实验室随机抽取了60个样本,得到了相混凝土耐久性达标混凝土耐久性不达标总计使用淡化海砂255^30使用未经淡化海砂151530总计402060的概率不超过1%的前提下,认为使用淡化海砂与混凝土耐久性是否达标有关、解析:提出假设H0:使用淡化海砂与混凝土耐久性是否达标无关.根据表中数据,求得K2的观测值k==>.查表得P(K2≥=.∴能在犯错误的概率不超过1%的前提下,认为使用淡化海砂与混凝土耐久性是否达标有关.(2)若用分层抽样的方法在使用淡化海砂的样本中抽取了6个,现从这6个样本中任取2个,则取出的2个样本混凝土耐久性都达标的概率是多少参考数据:解析:用分层抽样的方法在使用淡化海砂的样本中抽取6个,其中应抽取“混凝土耐久性达标”的为2530×6=5,“混凝土耐久性不达标”的为6-5=1,“混凝土耐久性达标记”为A1,A2,A3,A4,A5”;“混凝土耐久性不达标”的记为B.在这6个样本中任取2个,有以下几种可能:(A1,A2),(A1,A3),(A1,A4),(A1,A5),(A1,B),(A2,A3),(A2,A4),(A2,A5),(A2,B),(A3,A4),(A3,A5),(A3,B),(A4,A5),(A4,B)(A5,B),共15种.设“取出的2个样本混凝土耐久性都达标”为事件A,它的对立事件A为“取出的2个样本至少有1个混凝土耐久性不达标”,包含(A1,B),(A2,B),(A3,B),(A4,B),(A5,B),共5种可能.∴P(A)=1-P(A)=1-515=2 3.即取出的2个样本混凝土耐久性都达标的概率是2 3.8.某食品厂为了检查甲、乙两条自动包装流水线的生产情况,随机在这两条流水线上各抽取40件产品作为样本称出它们的重量(单位:克),重量值落在(495,510]的产品为合格品,否则为不合格品.左下表是甲流水线样本频数分布表,右下图是乙流水线样本的频率分布直方图.(1)根据上表数据作出甲流水线样本的频率分布直方图;解析:甲流水线样本的频率分布直方图如下:((2)若以频率作为概率,试估计从两条流水线分别任取1件产品,该产品恰好是合格品的概率;解析:由题表知甲样本中合格品数为8+14+8=30,由题图知乙样本中合格品数为++×5×40=36,故甲样本合格品的频率为3040=,乙样本合格品的频率为36 40=.据此可估计从甲流水线任取1件产品,该产品恰好是合格品的概率为.从乙流水线任取1件产品,该产品恰好是合格品的概率为.(3)由以上统计数据完成下面2×2列联表,能否在犯错误的概率不超过的前提下认为产品的包装质量与两条自动包装流水线的选择有关甲流水线?乙流水线合计合格品a=b=不合格品c=d=|合计n=附表:P(K2≥k0)?k0~(参考公式:K2=,其中n=a+b+c+d)解析:2×2列联表如下:¥甲流水线乙流水线合计合格品a=30b=3666不合格品c=10d=4'14合计4040n=80∵K2=n ad-bc2a+b c+d a+c b+d=80×120-360266×14×40×40≈>.∴在犯错误的概率不超过的前提下认为产品的包装质量与两条自动包装流水线的选择有关.>►品味高考1.为调查某地区老年人是否需要志愿者提供帮助,用简单随机抽样方法从该地区调查了500位老人,结果如下:性别是否需要志愿者男女需要4030:不需要160270(1)解析:调查的500位老年人中有70位需要志愿者提供帮助,因此该地区老年人中需要帮助的老年人的比例的估计值为70500=14%.(2)能否在犯错误的概率不超过的前提下认为该地区的老年人是否需要志愿者提供帮助与性别有关解析:K2的观测值k=500×40×270-30×1602200×300×70×430≈,`由于>所以在犯错误的概率不超过的前提下认为该地区的老年人是否需要帮助与性别有关.(3)根据(2)的结论,能否提出更好的调查办法来估计该地区的老年人中需要志愿者提供帮助的老年人的比例说明理由.解析:由于(2)的结论知,该地区的老年人是否需要帮助与性别有关,并且从样本数据能看出该地区男性老年人与女性老年人中需要帮助的比例有明显差异,因此在调查时,先确定该地区老年人中男、女的比例,再把老年人分成男、女两层并采用分层抽样方法比采用简单随机抽样方法更好.附:K2=P(K2≥k0)k02.某工厂有25周岁以上(含25周岁)工人300名,25周岁以下工人200名.为研究工人的日平均生产量是否与年龄有关,现采用分层抽样的方法,从中抽取了100名工人,先统计了他们某月的日平均生产件数,然后按工人年龄在“25周岁以上(含25周岁)”和“25周岁以下”分为两组,再将两组工人的日平均生产件数分为5组:[50,60),[60,70),[70,80),[80,90),[90,100)分别加以统计,得到如图所示的频率分布直方图.(1)从样本中日平均生产件数不足60件的工人中随机抽取2人,求至少抽到一名“25周岁以下组”工人的概率;解析:由已知得,样本中有25周岁以上组工人60名,25周岁以下组工人40名.所以,样本中日平均生产件数不足60件的工人中,25周岁以上组工人有60×=3(人),记为A1,A2,A3;25周岁以下组工人有40×=2(人),记为B1,B2.从中随机抽取2名工人,所有的可能结果共有10种,它们是:(A1,A2),(A1,A3),(A2,A3),(A1,B1),(A1,B2),(A2,B1),(A2,B2),(A3,B1),(A3,B2),(B1,B2).其中至少有1名“25岁以下组”工人的可能结果共有7种,它们是:(A1,B1),(A1,B2),(A2,B1),(A2,B2),(A3,B1),(A3,B2),(B1,B2).故所求的概率P=7 10.(2)规定日平均生产件数不少于80件者为“生产能手”,请你根据已知条件完成列联表,并判断是否有90%的把握认为“生产能手与工人所在的年龄组有关”附:K2=P(K2≥k0)k0解析:由频率分布直方图可知,在抽取的100名工人中,“25周岁以上组”中的生产能手60×=15(人),“25周岁以下组”中的生产能手40×=15(人),据此可得2×2列联表如下:生产能手非生产能手合计25周岁以上组15456025周岁以下组152540合计3070100因为<,所以没有90%的把握认为“生产能手与工人所在年龄组有关”.。
独立性检验的基本思想及其初步应用
![独立性检验的基本思想及其初步应用](https://img.taocdn.com/s3/m/562434f01eb91a37f0115c07.png)
【解】 根据题目所给数据得如下 2×2 列联表:
(a c)(b d) n(a b)(c d)
课堂练习
1.下列关于等高条形图的叙述正确的是( ) A.从等高条形图中可以精确地判断两个分类变量是否有关系 B.从等高条形图中可以看出两个变量频数的相对大小 C.从等高条形图可以粗略地看出两个分类变量是否有关系 D.以上说法都不对 解析:选 C.在等高条形图中仅能粗略判断两个分类变量的关 系,故 A 错.在等高条形图中仅能找出频率,无法找出频数, 故 B 错.
有关概念:分类变量
对于性别变量,其取值为男和女两种,这种变量的 不同“值”表示个体所属的不同类别,像这样的变量称 为分类变量.如是否吸烟、是否患肺癌、宗教信仰、国 籍等等
在日常生活中,主要考虑分类变量之间是否有关系: 例如,吸烟是否与患肺癌有关系?等等.
“美图”欣赏
列联表 2×2 为了调查吸烟是否对肺癌有影响,某肿瘤研究所随机 地调查了9965人,得到如下结果(单位:人)
查对临界值表,作出判断。(如果K2值很大,就断言 H0不成立,即认为“两个分类变量有关系”;如果很 小,则说明在样本数据中没有发现足够证据拒绝H0。)
例题解析:
例1. 在某医院,因为患心脏病而住院的665名男性病人中, 有214人秃顶;而另外772名不是因为患心脏病而住院的 男性病人中,有175人秃顶. 利用图形判断秃顶与患心脏 病是否有关系。能否在犯错误的概率不超过0.010的前 提下认为秃顶与患心脏病有关系?
9965(7775 49 42 2099)2
k
56.632.
7817 2148 9874 91
在H0成立的情况下,统计学家估算出如下的概率:
P(K 2 6.635) 0.01
独立性检验的基本思想及其初步应用》
![独立性检验的基本思想及其初步应用》](https://img.taocdn.com/s3/m/3a8be66876232f60ddccda38376baf1ffd4fe34a.png)
独立性检验的基本思想及其初步应用》生更加直观地理解两个分类变量之间的关系。
问题2:根据三维柱形图和二维条形图,你能否看出吸烟者和不吸烟者患肺癌的比例有何不同?二、独立性检验的基本思想1、独立性检验的基本思想:独立性检验是用来检验两个分类变量是否有关系的一种统计方法。
如果两个分类变量是独立的,那么它们之间是没有关系的;如果两个分类变量不独立,则它们之间是有关系的。
2、独立性检验的步骤:1)列出列联表;2)计算期望频数;3)计算卡方值;4)查表得出显著性水平;5)判断两个分类变量是否有关系。
三、K2检验的计算公式1、K2检验的计算公式:K2=∑(Oi-Ei)²/Ei其中,Oi为观察频数,Ei为期望频数。
2、K2检验的含义:K2检验的值越大,观察频数与期望频数的差距越大,两个分类变量之间的关系就越显著。
四、独立性检验的应用举例1、应用举例:1)医学研究:调查吸烟是否对患肺癌有影响;2)社会调查:调查男女是否对某一品牌的喜好程度有影响;3)市场调查:调查年龄与消费金额是否有关系。
2、独立性检验的应用:通过独立性检验,可以判断两个分类变量是否有关系,从而为我们提供科学的依据,进行合理的决策。
教学反思:本节课通过生动的例子和图表,引入了独立性检验的基本概念和思想。
通过对K2检验公式的介绍,让学生了解了如何计算卡方值。
同时,通过应用举例,让学生了解了独立性检验的实际应用。
在教学过程中,教师注重启发学生的思维,让学生在合作探究中主动掌握知识,达到了预期的教学目标。
练1、在某医院,665名男性病人中,214人秃顶,而在772名非心脏病男性病人中,175人秃顶。
能否以99%的置信度认为“秃顶与患心脏病”有关系?思考1、为调查某地区老年人是否需要志愿者提供帮助,用简单随机抽样方法从该地区调查了500位老年人,结果如下:性别。
是否需要志愿者需要。
不需要男性。
30.170女性。
373.271)估计该地区老年人中需要志愿者提供帮助的比例;2)能否以99%的置信度认为该地区的老年人是否需要志愿者提供帮助与性别有关系?思考2、某研究小组为了研究中学生的身体发育情况,在某学校随机抽出20名15至16周岁的男生,将他们的身高和体重制成2×2列联表,根据列联表的数据,能否以95%的置信度认为该学校15至16周岁的男生的身高和体重之间有关系?课后作业:课本第18页第1题和第2题。
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
教学设计说明
黑龙江省牡丹江市第一高级中学张宁
1-人教A版
教材:普通高中课程标准实验教科书数学选修2
章节:2.1独立性检验的基本思想及其初步应用
一、授课内容的数学本质
在《数学3(必修)》概率统计内容的基础上,通过典型案例介绍独立性检验的基本思想、方法及其初步应用,使学生认识统计方法在决策中的作用。
章引言首先提出了现实中经常遇到的问题,比如肺癌是严重威胁人类生命的一种疾病,吸烟与患肺癌有关系吗?等等。
现实中类似的问题大量存在,如何得出准确的推断,这就需要科学的方法,独立性检验就是其中一种常用的统计方法。
教科书通过探究“吸烟是否与患肺癌有关系”引出了独立性检验的问题,并借助样本数据的列联表、柱形图和条形图展示在吸烟人中患肺癌的比例比不吸烟人中患肺癌的比例要高,使学生直观感觉到吸烟和患肺癌可能有关系。
“吸烟与患肺癌有关”这一直觉来自于观测数据,即样本。
问题是这种来自于样本的印象能够在多大程度上代表总体?来自于样本的结论“吸烟与患肺癌有关”能够推广到总体吗?为了回答这个问题,就必须借助于统计理论来分析。
在统计学中,独立性检验就是检验两个分类变量是否有关系的一种统计方法。
二、教学目标分析
【知识与技能】
1、了解独立性检验的基本思想、方法及初步应用。
2、会从列联表(只要求22⨯列联表)、柱形图、条形图直观分析两个分类变量是否有关。
3、会用2K公式判断两个分类变量在某种可信程度上的相关性。
【过程与方法】
运用数形结合的方法,借助对典型案例的探究,来了解独立性检验的基本思想,总结独立性检验的基本步骤。
【情感、态度与价值观】
1、通过本节课的学习,让学生感受数学与现实生活的联系,体会独立性检验的基本思想在解决日常
生活问题中的作用。
2、培养学生运用所学知识,依据独立性检验的思想作出合理推断的实事求是的好习惯。
三、教学问题诊断
在独立性检验中,教科书通过典型案例“吸烟是否与患肺癌有关系”的研究,介绍了独立性检验的基本思想、方法和初步应用。
独立性检验的步骤是固定的,仿照教科书的例题,学生不难完成习题,但独立性检验的思想对学生来说是比较难理解的,教学中如何结合例子介绍独立性检验的思想,才能使得学生很好的理解是一个教学难点。
那么,在教学过程中,采用了与反证法做类比,帮助学生理解独立性检验的思想。
两者都是先假设结论不成立,然后根据是否能够推出“矛盾”来断定结论是否成立。
但二者“矛盾”的含义不同,反证法中的“矛盾”是指一种不符合逻辑事情的发生;而独立性检验中的“矛盾”是指一种不符合逻辑的小概率事件的发生,即在结论不成立的假设下,推出有利于结论成立的小概率事件发生。
我们知道,小概率事件在一次试验中通常是不会发生的,因此认为结论在很大的程度上是成立的。
这样做了类比后,可以很好的帮助理解独立性检验的基本思想。
四、教法特点及预期效果分析
精心设计课堂环节,共同实现师生互动。
在设计本节课的时候,我是从以下几个方面入手的。
1、创设情境,导入新课
通过对典型案例“吸烟是否对患肺癌有影响?”的提出,联系生活,引起共鸣,激发学生的学习兴趣。
从生活的实例出发,让学生充分体会数学与实际生活的联系,从而使得本节知识的形成更自然、更生动。
先介绍分类变量、列联表的概念。
对于问题1的设计,是想让学生通过对列联表中数据的观察和计算,得出结论,吸烟者和不吸烟者患肺癌的可能性存在差异,吸烟者中患肺癌的可能性大。
将列联表中的数据输入到Excel 表格中,将数据呈现到图形上,用计算机演示三维柱形图和二维条形图,让生观察图形,总结可以得出什么样的结论?用多种统计图使学生直观感觉两个分类变量是否有关系,然后再进行检验。
提出问题:是否能够以一定的把握认为“吸烟与患肺癌有关系”呢? 设置问题,引发学生的思考,激发学生的求知欲望。
2、合作探究,收获新知
通过用字母表示的列联表:
表
0H :“吸烟与患肺癌没有关系”的基础上。
引导学生得出bc ad ≈。
因此,bc ad -越小,说明吸烟与患肺癌之间关系越弱;bc ad -越大,说明吸烟与患肺癌之间关系越强。
(上述结论由生思考后回答。
)
师:介绍统计学中有这样一个公式
构造一个随机变量 ()()()()()
2
2n ad bc K a b c d a c b d -=++++ (1) (其中n a b c d =+++为样本容量。
)
学生得出结论:若0H 成立,即“吸烟与患肺癌没有关系”,则2K 应该很小。
根据表1中的数据,利用公式(1)计算得到2K 的观测值为 632.5691
987421487817)209942497775(99652
≈⨯⨯⨯⨯-⨯=k 这个值到底能告诉我们什么呢?
统计学家经过研究后发现,在0H 成立的情况下,
2( 6.635)0.01P K ≥≈ (2)
对于问题2的设计,目的是让学生理解,在0H 成立的情况下,635.62
≥K 的发生的概率非常小,
是一个小概率事件。
对于问题3的设计,学生讨论的很激烈,经过同学互相点评以及教师的适时引导,学生慢慢理解了当小概率事件发生时,一般认为是假设的
H出现了问题,因此认为结论在很大的程度上是成立的。
将独立性检验和反证法作类比,加深学生对独立性检验思想的理解。
学生活动:分组进行讨论,而后让学生总结二者的区别和联系,培养学生学会用联系的观点看问题。
介绍临界值表,教学生学会运用临界值表。
总结独立性检验的基本步骤。
3、课堂练习,夯实基础
课上到这里,学生已掌握了独立性检验的基本步骤,练习就是进一步巩固所学知识,运用其来解决实际问题。
4、课堂小结,感悟提高
学生进行思考后,对本节课所学知识进行梳理,教师再进行补充概括。
让本节课所学的知识在学生的感悟中得以升华。
5、课后作业,学以致用
效果分析:本节课通过对典型案例的探究,学生理解了独立性检验的基本思想及其具体实施步骤。
让学生从中初步体会了数学与实际生活的联系,以及怎样运用所学知识去解决实际生活中的问题。
本节课通过对几个问题的设置,经过学生之间的讨论、互评,教师的引导帮助,使得本节课的难点得以突破。
学生通过总结也完善了自己的认知结构,从而对该部分得知识也有了更深的体会。
我在课堂上注重学生的主体参与,努力创设教师引导下的学生自主探究、合作交流的学习方式。
通过课堂练习,看到学生基本上能掌握用独立性检验思想解决实际问题,课前制定的教学目标基本实现。
通过反思,才能进步,我觉得课前预设与课堂生成相结合,才是符合新课程理念的对学生发展最为有利的教法。
非常感谢主办单位为我们年轻教师的成长提供了这样一个平台,我会在今后努力工作,使自己快速的成长起来,也希望各位专家,评委和同行们批评指正,谢谢!
黑龙江省牡丹江市第一高级中学张宁
2010.9.19。