2017_2018学年高中数学第三章统计案例3.2独立性检验的基本思想及其初步应用学案含解析新人教A版选

合集下载

高中数学 第三章 统计案例 3.2 独立性检验的基本思想及其初步应用(第3课时)教案 新人教A版选修23

高中数学 第三章 统计案例 3.2 独立性检验的基本思想及其初步应用(第3课时)教案 新人教A版选修23

3.2独立性检验的基本思想及其初步应用第三课时教学目标 知识与技能理解独立性检验的基本思想,会根据K 2的观测值的大小判断两个分类变量有关的可信度,培养学生的自主探究的学习能力,并能应用数学知识解决实际问题.过程与方法 通过主动探究、自主合作、相互交流,从具体实例中归纳出进行独立性检验的基本步骤,使学生充分体会知识的发现过程,并渗透统计的基本思想和方法.情感、态度与价值观使学生体会数学的理性与严谨,了解数学来源于实际,应用于实际的唯物主义思想,培养学生对新知识的科学态度,勇于探索和敢于创新的精神.重点难点教学重点:利用独立性检验的基本思想解决实际问题以及处理步骤; 教学难点:对独立性检验思想的理解.教学过程引入新课提出问题:在某医院,因为患心脏病而住院的665名男性病人中,有214人秃顶;而另外772名不是因为患心脏病而住院的男性病人中有175名秃顶.(1)利用图形判断秃顶与患心脏病是否有关系;(2)能否在犯错误的概率不超过0.01的前提下认为秃顶与患心脏病有关系? 学生活动:小组合作完成.活动结果:根据题目所给的数据画出列联表:比较来说,秃顶的病人中患心脏病的比例大一些,可以在某种程度上认为“秃顶与患心脏病有关”.根据列联表中的数据,得到k =1 437×(214×597-175×451)2389×1 048×665×772≈16.373>6.635,因此,在犯错误的概率不超过0.01的前提下认为秃顶与患心脏病有关系.设计目的:以实际问题创建情境,引起学生的好奇,激发学习和探究知识的兴趣,从而也引起学生的无意注意,在不知不觉中进入教师设计的教学情境中,为本节课的学习做有利的准备.探究新知 提出问题:上述解法中,用到了等高条形图和独立性检验两种方法来判断“秃顶与患心脏病是否有关系”,试比较两种方法的关系和各自的特点.学生活动:学生先自由发言,大胆描述.学情预测:独立性检验能精确判断可靠程度,而等高条形图的优点是直观,但只可以粗略判断两个分类变量是否有关系,一般在通过图表判断后还需要用独立性检验来确认,这主要是因为列联表中的数据来源于样本数据,它们反映出来的这种相关性的特征能够在多大程度上代表总体,则需要用独立性检验来确认.提出问题:试总结独立性检验的基本步骤. 学生活动:思考总结,然后回答.活动结果:①根据数据画出列联表;②计算随机变量K 2的观测值;③与已知数据对照下结论.设计目的:比较判断分类变量相关性方法的优缺点,并在解决问题的基础上将独立性检验的具体步骤模式化.理解新知提出问题:你所得的结论在什么范围内有效? 学生活动:学生先自由发言,教师逐步引导学生.学情预测:开始学生的回答可能不全面、不准确,但在其他学生的不断补充、纠正下,会趋于完善.活动结果:“样本只能代表相应总体”,这里的数据来自于医院的住院病人,因此题目中的结论能够很好地适用于住院的病人群体,而把这个结论推广到其他群体则可能会出现错误,除非有其他的证据表明可以进行这种推广.设计意图:让学生充分体会用样本估计总体的思想. 提出问题:两个分类变量X 和Y 的2×2列联表如下若令W =⎪⎪⎪⎪⎪⎪a a +b -c c +d ,试结合前面的学习,分析W 的大小与“X 与Y 有关系”的联系. 学生活动:分组讨论,通过协作交流来解决问题,教师进行适当的引导.学情预测:W 越大,越有利于结论“X 与Y 有关系”,它越小,越有利于结论“X 与Y 没有关系”.提出问题:类似于通过K 2的构造判断规则,我们也可以用W 构造一个判断“X 与Y 有关系”的规则,即当W 的观测值w>w 0时,就判断“X 与Y 有关系”;否则,判断“X 与Y 没有关系”.那么,在“X 与Y 没有关系”的前提下P(W≥w 0)=0.01,且P(K 2≥k 0)=0.01,可以通过k 0来确定w 0吗?学生活动:分组讨论,通过协作交流来解决问题,教师进行适当的引导.学情预测:由计算公式可得K 2=W 2×n(a +b)(c +d)(a +c)(b +d),其中n =a +b +c +d.因此,K 2≥k 0等价于W≥k 0×(a +c)(b +d)n(a +b)(c +d),即可取w 0=k 0×(a +c)(b +d)n(a +b)(c +d).设计目的:通过一组精心设计的问题链来引导和激发学生的参与意识、创新意识,培养探究问题的能力,提升思维的层次.在解决问题的过程中,激发学生的研究兴趣,培养学生的科学理性精神,体会交流、合作和竞争等现代意识.运用新知1为考察高中生的性别与是否喜欢数学课程之间的关系,在某城市的某校高中生中随机抽取300由表中数据计算得到K的观察值k≈4.513.在多大程度上可以认为高中生的性别与数学课程之间是否有关系?分析:根据K2的观察值k≈4.513,对照数据确定多大程度上可以认为高中生的性别与数学课程之间是否有关系.由上表可知k≈4.513>3.841,而P(K≥3.841)≈0.05,故在犯错误的概率不超过0.05的前提下认为“高中生的性别与数学课程之间有关系”.点评:在熟练掌握了两个分类变量的独立性检验方法之后,可直接计算K2的观测值解决实际问题,而没有必要画相应的图形,但是图形的直观性也不可忽视.【变练演编】2某市为调查全市高中生学习状况是否对生理健康有影响,随机进行调查并得到如下的列联表.案.活动设计:学生先独立探索,允许互相交流成果.然后全班交流.学情预测:等高条形图、独立性检验等.设计意图:设置本开放性问题,意在增加问题的多样性、有趣性、探索性,不仅会加深学生对数学的理解、掌握,而且会潜移默化地学会编题、解题.课堂小结1.知识收获:独立性检验的思想方法及一般步骤;2.方法收获:独立性检验的思想方法;3.思维收获:数学来源于生活.设计意图:让学生自己小结,这是一个多维整合的过程,是一个高层次的自我认识过程.补充练习【基础练习】1.在研究某种新药对猪白痢的防治效果问题时,得到以下数据:2.在一次恶劣气候的飞行航程中,调查男女乘客在机上晕机的情况如下表所示,据此资料,在犯错误的概率不超过0.1的前提下,你是否认为在恶劣气候飞行中男性比女性更容易晕机?答案:1.提示:K 20.01的前提下认为新措施对防治猪白痢有效.2.提示:K 2的观测值k≈2.149<2.706,而P(K 2>2.706)≈0.10,故在犯错误的概率不超过0.1的前提下,我们不能认为在恶劣气候飞行中男性比女性更容易晕机.【拓展练习】3.考察黄烟经过培养液处理与否跟发生青花病的关系,调查了457株黄烟,得到下表中的数据,请根据数据作统计分析.解:根据公式得K 2的观测值k =457×(25×142-80×210)235×222×105×352≈41.61,由于41.61>10.828,故在犯错误的概率不超过0.001的前提下,说明黄烟经过培养液处理与否跟发生青花病是有关系的.设计说明 本设计主要采用“诱思探究教学法”,其核心是“诱导思维,探索研究”,其教学思想是“教师为主导,学生为主体,训练为主线,思维为主攻”的“四为主”原则.教师不是抛售现成的结论,而是充分暴露学生的思维,展示“发现”的过程,突出“师生互动”的教学,这种设计充分体现了教师的主导作用.学生在一系列的思考、探究中逐步完成了本节的学习任务,充分实现了学生的主体性地位,在整个教学过程中,始终着眼于培养学生的思维能力,这种设计符合现代教学观和学习观的精神,体现了素质教育的要求:教与学有机结合而对立统一.良好的教学设想,必须通过教学实践来体现,教师必须善于驾驭教法,指导学法,完成教学目标,从而使学生愉快地、顺利地、认真地、科学地接受知识.备课资料独立性检验在实际生活中有广泛的应用,解决该类问题的关键是准确的运算. 例1为了研究色盲与性别的关系,调查了1 000人,调查结果如下表所示:根据上述数据,试问在犯错概率不超过0.001的前提下,色盲与性别是否是相互独立的?假设色盲与性别是相互独立的,即色盲与性别无关,依据公式得K2的观测值k=1 000×(442×6-38×514)2≈27.139.956×44×480×520由于27.139>10.828,∴在犯错概率不超过0.001的前提下,可认为色盲与性别有关,从而拒绝原假设,故在犯错概率不超过0.01的前提下,可以认为色盲与性别不是相互独立的.。

“独立性检验的基本思想及其初步应用”教材与教学解析

“独立性检验的基本思想及其初步应用”教材与教学解析
摘要 :“ 独 立 性 检 验 的基 本 思 想及 其初 步 应 用 ” 是 一 个 教 学 难 点 ,在 反 复 研 究 和 多 次教 学 实践 的 基 础 上 ,从 教 学 内容 、教
二 、教 学 指 导 思 想 分 析
《 普通高 中数学课程标 准 ( 实验 ) 》 对独立性检 验的基本 思 学指 导 思 想 、教 学 目标 、教 学 中 可 能 存 在 的 问题 、 完成 教 学 所 想及其初 步应 用 的教 学要求较低 ,在教学 实践 中,也 未引起重 需的 支持条件 、引导 学生学 习的设 问方式 、达标检测题 的设计 视 , 至 多 是 围 绕 高 考 进 行 ,许 多 教 师 也 不 知 怎 么教 才 好 ,往 往 是教学生 “ 套 用 ”教 材的解题格 式或步骤 ,可是 ,没 过多长 时 间学生就 忘了 !这种 功利性极 强的 “ 应试 教学 ”行 为难 以达 到
步骤 就是顺理成 章的事 了 ,因此 ,核 心在于独立 性检验 的基 本
思想 .

我们在 高 中数学课 程 中教授 统计 内容 ,根本 目的应是通过 些具体 的统 计案 例 ,指导学生 领会统计思 想 ,教 导学生认识
目的 ,还 需 在 今 后 的学 习或 工 作 中加 强 训 练 和应 用 . 四 、教 学 问题 诊 断分 析
1 . 教 学 内容
本节 的教学 内容是 通过 具 体实 例 “ 患 肺 癌 是 否 与 吸 烟 有 人 们 的生 存 ,直 至 推 动 社 会 发展 . 本 部 分 的 教 学 就 应 引 导 学 生 理 关” ,介绍 独立性检验 的基本思想 ,它是用 随机变量 : 判断两 解 独 立 性 检 验 的 含 义 ,探 究 独 立 性 检 验 蕴 含 的统 计 学 思 想 和 基 个 分 类 变 量有 关 的方 法 .独立 性 检 验是 一种 假设 检 验 ,它 的基 本 本 方 法 ,培 养 学 生 学 习 数 学 、研 究 数 学 的 习 惯 和 能 力 ,不 能 只 思想 来 源 于统 计 学 中的 假设 检 验 思想 . 为 了考试而轻视概念的理解 、轻视 阅读 自学能力的培养.

第三章--统计案例-3.2-独立性检验的基本思想及其初步应用

第三章--统计案例-3.2-独立性检验的基本思想及其初步应用

解:由列联表中的数据,得 K2 的观测值为 1 633×30×1 355-224×242 k= ≈68.033>10.828. 254×1 379×54×1 579 因此,在犯错误的概率不超过 0.001 的前提下,认为每 一晚都打鼾与患心脏病有关.
为了调查某生产线上,某质量监督员甲对产
品质量好坏有无影响,现统计数据如下:质量监督员在现 场时,990件产品中合格品为 982 件,次品数为 8 件,甲不 在现场时,510件产品中合格品为493件,次品数为17件, 试分别用列联表、等高条形图、假设检验的方法对数据进
的方法来判断色盲与性别是否有关?你所得的结论在什么
范围内有效? 解:根据题目所给的数据作出如下的列联表: 色盲 不色盲 合计
男 女 合计
38 6 44
442 514 956
480 520 1 000
根据列联表作出相应的等高条形图,如图所示:
38 从等高条形图来看在男人中患色盲的比例480比在女人
38 6 6 中患色盲的比例520要大,其差值为480-520 ≈0.068,差
位统一,图形准确,但它不能给我们两个分类变量有关或
无关的精确的判断,若要作出精确的判断,可以进行独立 性检验的有关计算.
本题应首先作出调查数据的列联表,再根据列联表画
出等高条形图,并进行分析,ห้องสมุดไป่ตู้后利用独立性检验作出判 断.
在调查 480 名男士中有 38 名患有色盲, 520名女士中有6名患有色盲,分别利用图形和独立性检验


③如果 k≥k0 ,就推断“X与Y有关系”,这种推断
犯错误的概率不超过α;否则,就认为在犯错误的概 率不超过α的前提下不能推断“X与Y有关系”,或者 在样本数据中没有发现足够证据支持结论“X与Y有 关系”.

人教版高中数学选修2-3第三章统计案例3.2独立性检验的基本思想及其初步应用教案(3)

人教版高中数学选修2-3第三章统计案例3.2独立性检验的基本思想及其初步应用教案(3)
课题:3.2独立性检验(2)第课时总序第个教案
课型:新授课编写时时间:年月日执行时间:年月日
教学目标:
通过对典型案例的探究,进一步巩固独立性检验的基本思想、方法,并能运用χ2统计量进行独立性检验.
批注
教学重点:独立性检验的基本方法是重点.基本思想的领会及方法应用是难点.
教学难点:独立性检验的基本方法是重点.基本思想的领会及方法应用是难点.
教学后记:
解:提出假设 :两种中草药的治疗效果没有差异,即病人使用这两种药物中的何种药物对疗效没有明显差异.
由列联表中的数据,求得
当 成立时, 的概率约为 ,而这里
所以我们有 的把握认为:两种药物的疗效有差异.
例3.下表中给出了某周内中学生是否喝过酒的随机调查结果,若要使结论的可靠性不低于95%,根据所调查的数据,能否作出该周内中学生是否喝过酒与性别有关的结论?
教学用具:多媒体
教学方法:重视基本思想的领会及方法应用
教学过程:
一.学生活动
练习:
(1)某大学在研究性别与职称(分正教授、副教授)之间是否有关系,你认为应该收集哪些数据?.
(2)某高校“统计初步”课程的教师随机调查了选该课的一些学生情况,具体数据如下表:
非统计专业
统计专业

13
10

7
20
为了判断主修统计专业是否与性别有关系,根据表中的数据,得到
(1)根据以上数据建立一个2× 2列联表;
(2)判断性别与休闲方式是否有关系。
解:(1)2× 2的列联表:
休闲方式
性别
看电视
运动
总计

43
27
70

21
33
54

高中数学第三章统计案例32独立性检验的基本思想及其初步应用同步课件新人教A版选修2

高中数学第三章统计案例32独立性检验的基本思想及其初步应用同步课件新人教A版选修2
(2)K2=(a+b)(cn+(da)d-(bac+)c2)(b+d),其中 n =a+b+c+d.
(3)独立性检验的具体做法: ①根据实际问题的需要确定容许推断“两个分类变量有 关系”犯错误概率的上界 α,然后查表确定临界值 k0. ②利用公式计算随机变量 K2 的观测值 k. ③如果 k≥k0,就推断“X 与 y 有关系”,这种推断犯错 误的概率不超过 α;否则,就认为在犯错误的概率不超过 α 的前提下不能推断“X 与 Y 有关系”,或者在样本数据中没有 发现足够证据支持结论“X 与 Y 有关系”.
[迁移探究] 把本例条件“理科对外语有兴趣的有 138 人,无兴趣的有 98 人,文科对外语有兴趣的有 73 人, 无兴趣的有 52 人.”换成“理科对外语有兴趣的有 100 人,无兴趣的有 136 人,文科对外语有兴趣的有 93 人, 无兴趣的有 32 人.”试分析能否在犯错误的概率不超过 0.001 的前提下,认为学生选报文科、理科与对外语的兴 趣有关.
联表)如下表所示:
Y
X
y1
y2
总计
x1
a
b
a+b
x2 c
d
c+d
总计 a+c b+d a+b+c+观地反映出两个分类 变量间是否互相影响,常用等高条形图展示列联表数据的 频数特征.
3.独立性检验
(1)定义:利用随机变量 K2 来判断“两个分类变量有 关系”的方法称为独立性检验.
(2)错,K2 独立性检验显示“患慢性气管炎和吸烟习 惯有关”,是指有一定的把握说他们相关,或者说有一定 的出错率.
(3)错,2×2 列联表中的 4 个数据是对于某组特定数 据的统计数据,故四个数据间有一定的关系.
答案:(1)√ (2)× (3)×

2017_2018学年高中数学第三章统计案例3.2独立性检验的基本思想及其初步应用学案含解析新人教A

2017_2018学年高中数学第三章统计案例3.2独立性检验的基本思想及其初步应用学案含解析新人教A

3.2 立性检验的基本思想及其初步应用独立性检验的有关概念在某次调查中,480名男人中有38名患有色盲,520名女人中有6名患有色盲.问题1:患色盲与性别有关系吗?提示:有.问题2:通过怎样比较看出患色盲与性别有关系?提示:通过患色盲的人数占性别类型的比例.1.分类变量变量的不同“值”表示个体所属的不同类别,像这样的变量称为分类变量.2.2×2列联表假设有两个分类变量X和Y,它们的取值分别为{x1,x2}和{y1,y2},其样本频数列联表(也称为2×2列联表)为:y1 y2 总计x1 a b a+bx2 c d c+d总计a+c b+d a+b+c+d3.K2统计量为了使不同样本容量的数据有统一的评判标准,我们构造一个随机变量K2n ad-bc2=,其中n=a+b+c+d为样本容量.a+b c+d a+c b+d4.独立性检验利用随机变量K2来确定是否能以给定把握认为“两个分类变量有关系”的方法,称为两个分类变量独立性检验.1.2×2列联表的特征2.在列联表中,如果两个分类变量没有关系,则应满足ad-bc≈0.因此|ad-bc|越小,说明两个分类变量之间的关系越弱;|ad-bc|越大,说明两个分类变量之间的关系越强.独立性检验的思想吸烟与患肺癌“列联表”中,事件A表示不吸烟,B表示不患肺癌.问题1:事件A,B发生的频率可求吗?提示:可以.问题2:通常情况下,为研究问题方便,常用什么近似于概率?提示:频率.问题3:事件A,B无关有怎样的概率公式?提示:P(AB)=P(A)P(B).独立性检验的思想:要确定“两个分类变量有关系”这一结论成立的可信程度,首先假设结论不成立,即假设结论“两个分类变量没有关系”成立.在该假设下我们构造的随机变量K2应该很小,如果由观测数据计算得到的K2观测值k很大,那么在一定程度上说明假设不合理,根据随机变量K2的含义,可以通过可信度表评价该假设不合理的程度,即“两个分类变量有关系”的可信程度.1.P(K2≥6.635)≈0.01表明H0成立的概率很小,是小概率事件,可以判断H0不成立,也就是“两个分类变量之间没有关系”错误地判断为“两个分类变量之间有关系”的概率不超过0.01,也可以理解为“有99%的把握认为两个分类变量之间有关系”.2.利用独立性检验解决问题的基本步骤:(1)根据相关数据作列联表;(2)求K2的观测值;(3)与临界值作比较,得出结论.列联表和等高条形图的应用某学校对高三学生作了一项调查,发现:在平时的模拟考试中,性格内向的学生426人中有332人在考前心情紧张,性格外向的学生594人中有213人在考前心情紧张.作出等高条形图,利用图形判断考前心情紧张与性格类别是否有关系.作列联表如下:性格内向性格外向总计考前心情紧张332 213 545考前心情不紧张94 381 475总计426 594 1 020相应的等高条形图如图所示:图中阴影部分表示考前心情紧张与考前心情不紧张中性格内向的比例.从图中可以看出考前心情紧张的样本中性格内向占的比例比考前心情不紧张样本中性格内向占的比例高,可以认为考前紧张与性格类型有关.进行独立性检验的前提是根据题中数据获得2×2列联表,常用等高条形图展示列联表数a cb d据的频率特征,即将与(或与)的值相比,由此能直观地反映出两个分类变量a+b c+d a+b c+d间是否相互影响,但是此方法较粗劣.为了研究子女吸烟与父母吸烟的关系,调查了一千多名青少年及其家长,数据如下:父母吸烟父母不吸烟总计子女吸烟237 83 320子女不吸烟678 522 1 200总计915 605 1 520利用等高条形图判断父母吸烟对子女吸烟是否有影响.解:等高条形图如下:由图形观察可以看出父母吸烟者中子女吸烟的比例要比父母不吸烟者中子女吸烟的比例高,因此可以在某种程度上认为“子女吸烟与父母吸烟有关系”.某大学餐饮中心为了解新生的饮食习惯,在全校一年级学生中进行了抽样调查,调查结果如下表所示:喜欢甜品不喜欢甜品合计南方学生60 20 80北方学生10 10 20合计70 30 100根据表中数据,问能否在犯错误的概率不超过0.05的前提下认为“南方学生和北方学生在选用甜品的饮食习惯方面有差异”.n ad-bc 2 将2×2列联表中的数据代入公式计算,得k=a+b c+d a+c b+d100 ×60 × 10-20 × 10 2 100==≈4.762.70 × 30 × 80 × 20 21由于4.762>3.841,故在犯错误的概率不超过0.05的前提下认为南方学生和北方学生在选用甜品的饮食习惯方面有差异.根据题意列出2×2列联表,计算K2的观测值,如果K2的观测值很大,说明两个分类变量有关系的可能性很大;如果K2的观测值比较小,则认为没有充分的证据显示两个分类变量有关系.这需要给出正确的计算,避免计算失误.在一次天气恶劣的飞机航程中,调查了男女乘客在飞机上晕机的情况:男乘客晕机的有24 人,不晕机的有31人;女乘客晕机的有8人,不晕机的有26人.请你根据所给数据判定:在天气恶劣的飞机航程中,男乘客是否比女乘客更容易晕机?解:根据题意,列出2×2列联表如下:晕机不晕机总计男乘客24 31 55女乘客8 26 34总计32 57 89假设在天气恶劣的飞机航程中男乘客不比女乘客更容易晕机.由公式可得K2的观测值n ad-bc 2k=a+b c+d a+c b+d8924 × 26-31 × 82=≈3.689>2.706,55 × 34 × 32 × 57故在犯错误的概率不超过0.10的前提下,认为“在天气恶劣的飞机航程中男乘客比女乘客更容易晕机”.4.独立性检验与统计的综合应用(12分)某工厂有工人1000名,其中250名工人参加过短期培训(称为A类工人),另外750名工人参加过长期培训(称为B类工人).现用分层抽样的方法(按A类、B类分两层)从该工厂的工人中抽取100名工人,调查他们的生产能力(此处生产能力指一天加工的零件数),结果如下表.表1A类工人生产能力的频数分布表生产能力分组[110,120) [120,130) [130,140) [140,150) 人数8 x 3 2表2B类工人生产能力的频数分布表生产能力分组[110,120) [120,130) [130,140) [140,150) 人数 6 y 27 18(1)确定x,y的值;(2)完成下面2×2列联表,并回答能否在犯错误的概率不超过0.001的前提下认为工人的生产能力与工人的类别有关系.生产能力分组[110,130) [130,150) 总计工人类别A类工人B类工人总计(1)∵从该工厂的工人中抽取100名工人,且该工厂中有250名A类工人,750名B类工人,要确定x,y的值,∴要从A类工人中抽取25名,从B类工人中抽取75名,(2 应先确定A类工人及B分)类工人中应各抽取多少∴x=25-8-3-2=12,人,此处易误认为x=25,y=75-6-27-18=24.(4分) y=75,从而导致解题错(2)根据所给的数据可以完成列联表,如下表所示:误.生产能力分组工人类别[110,130) [130,150) 总计A类工人20 5 25B类工人30 45 75总计50 50 1006分由列联表中的数据,得K2的观测值为此处易犯错误有两100 ×20 × 45-5 × 302k==12>10.828.(10分)25 × 75 × 50 × 50点:①计算失误;②将因此,在犯错误的概率不超过0.001的前提下认为工人的生公式中的数据搞错.产能力与工人的类别有关系.(12分)某学生对其亲属30人的饮食进行了一次调查,并用如图所示的茎叶图表示30人的饮食指数.(说明:图中饮食指数低于70的人,饮食以蔬菜为主;饮食指数高于70的人,饮食以肉类为主)(1)根据以上数据完成下面2×2列联表:主食蔬菜主食肉类总计50岁以下50岁以上总计(2)能否在犯错误的概率不超过0.01的前提下认为其亲属的饮食习惯与年龄有关?请写出简要分析.解:(1)2×2列联表如下:主食蔬菜主食肉类总计50岁以下 4 8 1250岁以上16 2 18总计20 10 3030 ×8-128 2(2)因为K2==10>6.635,12 × 18 × 20 × 10P(K2>6.635)=0.01.所以可以在犯错误的概率不超过0.01的前提下认为其亲属的饮食习惯与年龄有关.1.下面是一个2×2列联表:y1 y2 总计x1 a 21 73x2 2 25 27总计 b 46 100则表中a,b处的值分别为()A.94,96B.52,50C.52,54 D.54,52解析:选C由Error!得Error!2.某工厂为了调查工人文化程度与月收入的关系,随机抽取了部分工人,得到如下列联表:文化程度与月收入列联表(单位:人)月收入2 000 月收入2 000总计元以下元及以上高中文化以上10 45 55高中文化及以下20 30 50总计30 75 105由上表中数据计算得K2的观测值105 ×10 × 30-45 × 202k=≈6.109,请估计有多少把握认为文化程度与月收入55 × 50 × 30 × 75有关系()A.1% B.99%C.2.5% D.97.5%解析:选D由于6.109>5.024,所以在犯错误的概率不超过0.025的前提下,即有97.5% 的把握认为文化程度与月收入有关系.3.独立性检验所采用的思路是:要研究A,B两类型变量彼此相关,首先假设这两类变量彼此无关,在此假设下构造随机变量K2,如果K2的观测值较大,那么在一定程度上说明假设不成立.4.在吸烟与患肺病是否相关的判断中,有下面的说法:①若K2的观测值k>6.635,则在犯错误的概率不超过0.01的前提下,认为吸烟与患肺病有关系,那么在100个吸烟的人中必有99人患有肺病;②从独立性检验可知在犯错误的概率不超过0.01的前提下,认为吸烟与患肺病有关系时,若某人吸烟,则他有99%的可能患有肺病;③从独立性检验可知在犯错误的概率不超过0.05的前提下,认为吸烟与患肺病有关系时,是指有5%的可能性使得推断错误.其中说法正确的是________.(填序号)解析:K2是检验吸烟与患肺病相关程度的量,是相关关系,而不是确定关系,是反映有关和无关的概率,故说法①不正确;说法②中对“确定容许推断犯错误概率的上界”理解错误;说法③正确.答案:③5.下面是高二年级统计案例的测验成绩统计表(单位:分)的一部分,试分析实验效果.70分及70分以下70分以上总计对照班32 18 50实验班12 38 50总计44 56 100附:P(K2≥k0) 0.025 0.010 0.005k0 5.024 6.635 7.879解:根据列联表中的数据,由公式得K2的观测值n ad-bc 2k=a+b c+d a+c b+d10032 × 38-18 × 12 2=≈16.234.50 × 50 × 44 × 56因为16.234>6.635,所以,在犯错误的概率不超过0.010的前提下认为高二年级统计案例的测试成绩与高一年级数学教学中增加统计思想的渗透有联系.一、选择题1.判断两个分类变量是彼此相关还是相互独立的常用的方法中,最为精确的是()A.2×2列联表B.独立性检验C.等高条形图D.其他解析:选B A、C只能直观地看出两个分类变量x与y是否相关,但看不出相关的程度;独立性检验通过计算得出相关的可能性,较为准确.2.对于分类变量X与Y的随机变量K2的观测值k,下列说法正确的是()A.k越大,“X与Y有关系”的可信程度越小B.k越小,“X与Y有关系”的可信程度越小C.k越接近于0,“X与Y没有关系”的可信程度越小D.k越大,“X与Y没有关系”的可信程度越大解析:选B k越大,“X与Y没有关系”的可信程度越小,则“X与Y有关系”的可信程度越大,即k越小,“X与Y有关系”的可信程度越小.3.利用独立性检验对两个分类变量是否有关系进行研究时,若有99.5%的把握认为事件A和B有关系,则具体计算出的数据应该是()A.k≥6.635B.k<6.635C.k≥7.879D.k<7.879解析:选C有99.5%的把握认为事件A和B有关系,即犯错误的概率为0.5%,对应的k0的值为7.879,由独立性检验的思想可知应为k≥7.879.4.(江西高考)某人研究中学生的性别与成绩、视力、智商、阅读量这4个变量的关系,随机抽查52名中学生,得到统计数据如表1至表4,则与性别有关联的可能性最大的变量是()表1成绩不及格及格总计性别男 6 14 20女10 22 32总计16 36 52表2视力好差总计性别男 4 16 20女12 20 32总计16 36 52表3智商偏高正常总计性别男8 12 20女8 24 32总计16 36 52表4阅读量丰富不丰富总计性别男14 6 20女 2 30 32总计16 36 52A.成绩B.视力C.智商D.阅读量解析:选D根据列联表中的数据,由公式得K2的观测值:52 × 6 × 22-14 × 10 2 52 × 82k1==,16 × 36 × 32 × 20 16 × 36 × 32 × 2052 × 4 × 20-16 × 12 2 52 × 1122k2==,16 × 36 × 32 × 20 16 × 36 × 32 × 2052 ×8 × 24-12 × 8 2 52 × 962k3==,16 × 36 × 32 × 20 16 × 36 × 32 × 2052 ×14 × 30-6 × 2 2 52 × 4082k4==,16 × 36 × 32 × 20 16 × 36 × 32 × 20则有k4>k2>k3>k1,所以阅读量与性别关联的可能性最大.5.通过随机询问110名性别不同的大学生是否爱好某项运动,得到如下的列联表:男女总计爱好40 20 60不爱好20 30 50总计60 50 110n ad-bc2由K2=算得,观测值a+b c+d a+c b+d110 ×40 × 30-20 × 20 2k=≈7.8.60 × 50 × 60 × 50附表:P(K2≥k0) 0.050 0.010 0.001k0 3.841 6.635 10.828参照附表,得到的正确结论是()A.有99%以上的把握认为“爱好该项运动与性别有关”B.有99%以上的把握认为“爱好该项运动与性别无关”C.在犯错误的概率不超过0.1%的前提下,认为“爱好该项运动与性别有关”D.在犯错误的概率不超过0.1%的前提下,认为“爱好该项运动与性别无关”解析:选A由k≈7.8及P(K2≥6.635)=0.010可知,在犯错误的概率不超过1%的前提下认为“爱好该项运动与性别有关”,也就是有99%以上的把握认为“爱好该项运动与性别有关”.二、填空题6.下列关于K2的说法中,正确的有________.2的值越大,两个分类变量的相关性越大;②K2的计算公式是n ad-bcK2=;a+b c+d a+c b+d③若求出K2=4>3.841,则有95%的把握认为两个分类变量有关系,即有5%的可能性使得“两个分类变量有关系”的推断出现错误;④独立性检验就是选取一个假设H0条件下的小概率事件,若在一次试验中该事件发生了,这是与实际推断相抵触的“不合理”现象,则作出拒绝H0的推断.解析:对于①,K2的值越大,只能说明我们有更大的把握认为二者有关系,却不能判断相关性大小,故①错;对于②,(ad-bc)应为(ad-bc)2,故②错;③④对.答案:③④7.某电视台在一次对收看文艺节目和新闻节目的观众抽样调查中,随机抽取了100名电视观众,相关的数据如下表所示.文艺节目新闻节目总计20岁至40岁40 18 58大于40岁15 27 42总计55 45 100由表中数据直观分析,收看新闻节目的观众是否与年龄有关:________(填“是”或“否”).解析:因为在20岁至40岁的58名观众中有18名观众收看新闻节目,而在大于40岁的42b 18 d 27名观众中有27名观众收看新闻节目,即=,=,两者相差较大,所以经直观分a+b 58 c+d 42析,收看新闻节目的观众与年龄是有关的.答案:是8.某班主任对全班30名男生进行了认为作业量多少的调查,数据如下表:认为作业多认为作业不多总计喜欢玩电脑游戏12 8 20不喜欢玩电脑游戏 2 8 10总计14 16 30 该班主任据此推断男生认为作业多与喜欢玩电脑游戏有关系,则这种推断犯错误的概率不超过________.解析:计算得K2的观测值为k30 ×12 × 8-2 × 82=≈4.286>3.841,则推断犯错误的概率不超过0.050.14 × 16 × 20 × 10答案:0.050三、解答题9.用两种检验方法对某食品做沙门氏菌检验,结果如下表:阳性阴性总计荧光抗体法160 5 165常规培养法26 48 74总计186 53 239附:P(K2≥k0) 0.010 0.005 0.001k0 6.635 7.879 10.828能否在犯错误的概率不超过0.001的前提下认为采用荧光抗体法与检验结果呈阳性有关系?n ad-bc2解:通过计算K2=≈113.184 6.而查表可知,因为a+b c+d a+c b+dP(K2≥10.828)≈0.001,而113.184 6远大于10.828,所以在犯错误的概率不超过0.001的前提下认为采用荧光抗体法与检验结果呈阳性有关系.10.某校在两个班进行教学方式对比实验,两个月后进行了一次检测,实验班与对照班成绩统计如下表所示(单位:人).80分及80分以上80分以下总计实验班35 15 50对照班20 m 50总计55 45 n(1)求m,n.(2)能否在犯错误的概率不超过0.005的情况下认为教学方式与成绩有关系?解:(1)m=45-15=30,n=50+50=100.(2)由表中的数据,得K2的观测值为100 ×35 × 30-15 × 20 2k=≈9.091.50 × 50 × 55 × 45因为9.091>7.879,所以能在犯错误的概率不超过0.005的前提下认为教学方式与成绩有关系.11.某旅行社为调查市民喜欢“人文景观”景点是否与年龄有关,随机抽取了55名市民,得到数据如下表:喜欢不喜欢总计大于40岁20 5 2520岁至40岁10 20 30总计30 25 55(1)判断能否在犯错误的概率不超过0.005的前提下认为喜欢“人文景观”景点与年龄有关.(2)用分层抽样的方法从喜欢“人文景观”景点的市民中随机抽取6人作进一步调查,将这6位市民作为一个样本,从中任选2人,求恰有1位“大于40岁”的市民和1位“20岁至40 岁”的市民的概率.55 ×20 × 20-10 × 5 2解:(1)由公式K2=30 × 25 × 25 × 30≈11.978>7.8709,所以在犯错误的概率不超过0.005的前提下认为喜欢“人文景观”景点与年龄有关.(2)设所抽样本中有m个“大于40岁”市民,m 6则=,得m=4人,20 30所以样本中有4个“大于40岁”的市民,2个“20岁至40岁”的市民,分别记作B1,B2,B3,B4,C1,C2,从中任选2人的基本事件有(B1,B2),(B1,B3),(B1,B4),(B1,C1),(B1,C2),(B2,B3),(B2,B4),(B2,C1),(B2,C2),(B3,B4),(B3,C1),(B3,C2),(B4,C1),(B4,C2),(C1,C2),共15个,其中恰有1名“大于40岁”和1名“20岁至40岁”之间的市民的事件有(B1,C1),(B1,C2),(B2,C1),(B2,C2),(B3,C1),(B3,C2),(B4,C1),(B4,C2),共8个,所以恰有1名“大于40岁”和1名“20岁至40岁”之间的市民的概率为P=8.15。

高中数学第三章统计案例独立性检验的基本思想及其初步应用知识导航学案

高中数学第三章统计案例独立性检验的基本思想及其初步应用知识导航学案

3.2独立性检验的基本思想及其初步应用知识梳理1.数据的表示方法(1)变量的不同值表示个体所属的不同类别,象这种变量称为分类____________变量。

(2)用图表列出两个变量的频数表,称为____________。

(3)与表格相比,____________和____________能更直观地反应出相关数据的总体状态;从列联表中能清晰地看出各个数据的相对大小;而等高条形图更能反应出每一类数据的相对特点.2。

独立性检验的方法(1)利用随机变量K2来确定在多大程度上可以认为“两个分类变量有关系”的方法称为两个分类变量的____________。

(2)在H0成立的情况下,统计学家估计出的概率为____________。

(3)独立性检验的基本思想类似于反证法。

要确认“两个分类变量有关系"这一结论成立的可信度,首先假设结论不成立,即假设结论____________成立,在该假设下构造的随机变量K2应该____________.如果由观测数据计算得到的K2的观测值k很大,则在一定程度上说明____________。

根据随机变量K2的含义,可以通过概率式____________评价该假设不合理的程度。

(4)一般地,假设有两个变量X和Y,它们的值域分别为{x1,x2},{y1,y2},若要推断的结论为:H1:“X和Y有关系”。

可以按照下列步骤判断结论H1成立的可能性: 1)通过____________和____________,可以粗略地判断两个分类变量是否有关系,但是这种判断无法精确地给出所得结论的可靠程度. ①在三维柱形图中,主对角线上两个柱形高度的乘积与副对角线上的两个柱形高度的乘积相差越大,H 1成立的可能性就____________。

②在二维条形图中,可以估计满足条件____________的个体中具有____________的个体所占的比例b a a+,也可以估计满足条件____________的个体中具有____________的个体的比例d c c+,两个比例的值相差越大,H 1成立的可能性____________. 2)可以利于独立性检验来考查两个分类变量是否有关系,并且能较精确地给出这种判断的可靠程度.具体做法是:根据观测数据计算随机变量K 2的值k,其值越大,说明“X 与Y 有关系”成立的可能性____________.知识导学要学好本节内容,首先要理解独立性检验的含义,为什么要进行独立性检验,要在实际问题中加深理解。

《数学人教A版高中选修2-3第三章 统计案例--3.2 独立性检验的基本思想及其初步应用》第三课时

《数学人教A版高中选修2-3第三章 统计案例--3.2 独立性检验的基本思想及其初步应用》第三课时

《独立性检验的基本思想及其初步应用》第三课时本节课是人教A版(选修)2—3第三章第二单元第二课时的内容.在本课之前,学生已经学习过事件的相互独立性、正态分布及回归分析的基本思想及初步应用。

本节课利用独立性检验进一步分析两个分类变量之间是否有关系,是高中数学知识中体现统计思想的重要课节。

在本节课的教学中,要把重点放在独立性检验的统计学原理上,理解独立性检验的基本思想,明确独立性检验的基本步骤。

在独立性检验中,通过典型案例的研究,介绍了独立性检验的基本思想、方法和初步应用。

独立性检验的基本思想和反证法类似,它们都是假设结论不成立,反证法是在假设结论不成立基础上推出矛盾从而证得结论成立,而独立性检验是在假设结论不成立基础上推出有利于结论成立的小概率事件发生,于是认为结论在很大程度上是成立的。

因为小概率事件在一次试验中通常是不会发生的,所以有利于结论成立的小概率事件的发生为否定假设提供了有力的证据。

学习独立性检验的目的是“通过典型案例介绍独立性检验的基本思想、方法及其初步应用,使学生认识统计方法在决策中的作用”。

这是因为,随着现代信息技术飞速发展,信息传播速度快,人们每天都会接触到影响我们生活的统计方面信息,所以具备一些统计知识已经成为现代人应具备的一种数学素养。

【知识与能力目标】通过生活中新闻案例的探究,理解独立性检验的基本思想,明确独立性检验的基本步骤,会对两个分类变量进行独立性检验,并能利用独立性检验的基本思想来解决实际问题。

【过程与方法目标】通过探究“玩电脑游戏与注意力集中是否有关系”引出独立性检验的问题,借助样本数据的列联表分析独立性检验的实施步骤。

利用上节课所学已经由数据直观判断出玩电脑游戏与注意力集中可能有关系。

这一直觉来自于观测数据,即样本。

问题是这种来自于样本的印象能够在多大程度上代表总体。

这节课就是为了解决这个问题,在学生亲身体验感受的基础上,提高学生的数据分析能力。

【情感态度价值观目标】通过本节课的学习,加强数学与现实生活的联系。

2018_2019年高中数学第三章统计案例3_2独立性检验的基本思想及其初步应用课件

2018_2019年高中数学第三章统计案例3_2独立性检验的基本思想及其初步应用课件

0.10 2.706
0.05 3.841
0.010 6.635
0.005 7.879
[解] 据.
4500 (1)300×15000=90,所以应收集 90 位女生的样本数
(2)由频率分布直方图得 2×(0.150+0.125+0.075+0.025)= 0.75, 所以该校学生每周平均体育运动时间超过 4 小时的概率的估 计值为 0.75.
包含的事件是从不低于 86 分的成绩中随机抽取两个包含的基本 事件是:(86,93),(86,96),(86,97),(86,99),(86,99),(93,96), (93,97), (93,99), (93,99), (96,97), (96,99), (96,99), (97,99), (97,99), (99,99),共有 15 种结果, 符合条件的事件数(93,96), (93,97), (93,99), (93,99), (96,97), (96,99),(96,99),(97,99),(97,99),(99,99),共有 10 种结果,根 10 2 据等可能事件的概率得到 P=15=3.
(1)在乙班样本的 20 个个体中, 从不低于 86 分的成绩中随机 抽取 2 个,求抽出的两个均“成绩优秀”的概率; (2)由以上统计数据作出列联表, 并判断能否在犯错误的概率 不超过 0.1 的前提下认为:“成绩优秀”与教学方式有关.
[解]
(1)由题意知本题是一个等可能事件的概率,试验发生
2 n ad - bc (2)利用 K2= 求出 K2 的观测值 k; a+bc+da+cb+d
2.列联表频率分析法、等高条形图可初步分析两分类变量 是否有关系, 而独立性检验中 K2 取值则可通过统计表从数据上说 明两分类变量的相关性的大小.( ) )

高中数学 第三章 统计案例 3.2 独立性检验的基本思想及其初步应用教材梳理素材 新人教A版选修23

高中数学 第三章 统计案例 3.2 独立性检验的基本思想及其初步应用教材梳理素材 新人教A版选修23

3.2独立性检验的基本思想及其初步应用庖丁巧解牛知识·巧学一、两个分类变量之间关系的定性分析 1.分类变量取不同的“值”表示个体所属不同类别的分量称为分类变量.这里的“变量”和值都应作为“广义”的变量和值进行理解.例如:对于性别变量,其取值为男和女两种.那么这里的变量指的是性别,同样这里的“值”指的是“男”和“女”,因此,这里所说的“变量”和值不一定取的是具体的数值.要点提示 注意此处空半格分类变量是大量存在的,例如:吸烟变量有吸烟与不吸烟两种类别,而国籍变量则有多种类别. 2.定性分析的方法 (1)频率分析通过对样本的每个分类变量的不同类别的事件发生的频率大小比较来分析分类变量之间是否有关联关系.通常通过列联表列出两个分类变量的占少数表来进行分析. (2)图形分析①三维柱形图.它可以清晰的看出各个频数的相对大小;②二维条形图.如本节引例中,可画叠在一起的二维条形图.浅色条高表示不患肺癌的人数,深色条高表示患肺癌的人数; ③频率分布条形图:为了更清晰的表示引例的特征,我们可用等高条形图表示两种情况下患肺癌的比例.方法归纳 注意此处空半格三维柱形图和二维条形图能更直观地反映出相关数据的总体状况.作三维柱形图时要注意选择恰当的视角,以使每个柱体都能被看到. 二、独立假设 1.2×2列联表种状态又分两种情况:吸烟,不吸烟以及患肺癌、未患肺癌.表中排成两列的数据是调查得来的结果,希望根据这4个数据来检验上述两种状态是否有关.这一检验就称为2×2列联表的独立性检验.2.独立性检验:利用随机变量K 2=))()()(()(2d b c a d c b a bc ad n ++++-(其中n=a+b+c+d为样本容量)来确定在多大程度上可以认为“两个分类变量有关系”的方法称为两个分类变量的独立性检验.要点提示 注意此处空半格上述表达式就是统计中重要的K 2统计量,用它的大小可以决定是否拒绝原来的统计假设H 1,如果算出的K 2值较大,就拒绝H 1,也就是拒绝事件“X 与Y 无关”,从而就认为它们是有关的了.深化升华 注意此处空半格独立性检验的基本思想类似于反证法.要确认“两个分类变量有关系”这一结论的可信程度,首先假设该结论不成立,即假设结论“两个分类变量没有关系”成立.在该假设下构造的随机变量K 2应该很小.如果由观测数据计算得到的K 2的观测值k很大,则在一定程度上说明假设不合理.根据随机变量K 2的含义,可以通过概率P(K 2≥k)的大小来评价该假设不合理的程度有多大,从而说明这“两个分类变量没有关系”这一结论成立的可信程度有多大.三、判断结论成立的可能性的方法 1.通过三维柱形图和二维条形图,可以粗略地判断两个分类变量是否有关系,但是这种判断无法精确地给出所得结论的可靠程度.(1)在三维柱形图中,主对角线上两个柱形高度的乘积ad与副对角线上的两个柱形高度的乘积bc相关越大,H 1成立的可能性就越大.(2)在二维条形图中,可以估计满足条件X=x 1的个体中具有Y=y 1的个体所占的比例ba a+,也可以估计满足条件X=x 2的个体中具有Y=y 2的个体所占的比例dc c+.两个比例的值相差越大,H 1成立的可能性就越大.2.利用独立性检验来考查两个分类变量是否有关系,并且能较精确地给出这种判断的可靠程度.具体做法是根据观测数据计算检验随机变量K 2的值k ,其值越大,说明H 1成立的可能性就越大.当得到的观测数据a、b、c、d都不小于5时,可以通过随机变量k 2来确定结论的可信程度.要点提示 注意此处空半格在计算得检验随机变量K 2的值时,要注意临界值 6.635,3.841和2.706.如果k 2>6.635,就有99%把握认为“X 与Y 有关系”.如果k 2>3.841,就有95%把握认为“X 与Y 有关系”.如果k 2>2.706,就有90%把握认为“X 与Y 有关系”.而如果k 2≤2.706,就认为没有充分的证据显示“X 与Y 有关系”.误区警示 注意此处空半格使用K 2统计量作2×2列联表的独立性检验时,要求表中的4个数据都要大于5,所以在选取样本容量时一定要注意这一点. 问题·探究问题1某聋哑研究机构对聋哑关系进行抽样调查,在耳聋的657人中有416人哑,而另外不聋的680人中有249人哑.你能运用这组数据得出相应结论吗? 思路:认真分析后,我们就是要在聋与哑有无关系上作出结论.于是可以运用独立性检验进行判断.一种方法可以根据题目所给数据得到2×2列联表,计算K 2的值,与临界值做比较;另一种方法可以用三维柱形图粗略估计得出结论.当然,我们也可以采用对照两组人群中哑的比例进行粗略估计,但精确度要相对低一些.根据列联表中数据得到:K 2=680657672665)241249431416(13372⨯⨯⨯⨯-⨯≈95.29>10.828,所以我们有99.9%的把握说聋与哑有关.方法二:我们可以把题目中的数据做出相应的三维柱形图(图),容易比较发现,底面副对角线两个柱体高度的乘积大些,可以在某种程度上认为聋与哑有关. 问题2如何进行独立性检验?试举一例说明之.思路:(1)作统计假设:假设H 0“事件A 与B 独立”;(2)根据公式K 2=))()()(()(2d b c a d c b a bc ad n ++++-,求出K 2;(3)作出统计判断:若K 2>6.635,则有99%的把握说事件A 与B 有关,若K 2>3.841,则有95%的把握说事件A 与B 有关.若K 2≤2.706,则认为没有充分的证据显示事件A 与B 有关.注意在此过程中要使表中的4个数据大于5.如“五一”黄金周前某地的一旅游景点票价上浮,黄金周过后,统计本地与外地来的游客人数,问票价上浮后游客人数与所处地区是否有关系?探究:按照独立性检验的基本步骤,假设票价上浮后游客人数与所处地区没有关系.因为k 2=4907273833964249)1331284220651407(76452⨯⨯⨯⨯-⨯⨯≈30.35>6.635.所以假设不成立,我们有99%的把握认为票价上浮后游客人数与所处地区有关系. 典题·热题例1为了研究人的性别与患色盲与否是否有关,某研究所进行了随机调查.发现在调查的480名男性中有39名患有色盲,520名女性中有6名患有色盲,试检验人的性别与患色盲与否有关?思路分析:由题意列出2×2列联表,由公式计算出K 2,与临界值做比较,得出事件成立的可信程度.解:由题意所得数据列2×2列联表得:由公式得K 2=52048095545)441651439(10002⨯⨯⨯⨯-⨯⨯≈28.23.因为28.23>10.828,所以有99.9%的把握认为患色盲与否与人的性别有关,男性患色盲的概率要比女性大很多.方法归纳 注意此处空半格独立性检验问题的基本步骤为:(1)找相关数据,作列联表;(2)求统计量K 2;(3)判断可能性,注意与临界值做比较,得出事件有关的确信度.例2某县对在职的71名高中数学教师就支持新的数学教材还是支持旧的数学教材做了调查,结果如下表所示:根据此资料,你是否认为教龄的长短与支持新的数学教材有关?思路分析:根据独立性检验思想,由公式计算出K 2,然后与两临界值比较得出结论.解:由公式得K 2=49223437)10252412(71))()()(()(22⨯⨯⨯⨯-⨯=++++-d b c a d c b a bc ad n ≈0.08.由K 2<2.706,我们没有充分的证据说明教龄的长短与支持新的数学教材有关.深化升华 注意此处空半格独立性检验能帮助我们对日常生活中的实际问题作出合理的推断和预测.因此要在学习中,应通过案例分析,理解和掌握独立性检验的方法,体会其基本思想在解决实际问题中的应用,以提高我们分析和处理问题的能力.例3在某医院,因为患心脏病而住院的665名男性病人中,有214人秃顶,而另外772名不是因为患心脏病而住院的男性病人中有175人秃顶.利用独立性检验方法判断秃顶与患心脏病是否有关系?你所得的结论是在什么范围内有效?思路分析:由题意列出2×2列联表,利用公式求得K 2后与临界值比较,得出结论后要注意这组数据是来自于住院的病人,而不是随机对全体人群采样.由公式得K 2=7726651048389)451175597214(14372⨯⨯⨯⨯-⨯⨯≈10.828.所以有99.9%的把握认为“秃顶与患心脏病有关”.误区警示 注意此处空半格在应用公式时,切忌误用公式为K 2=))()()(()(2d b c a d c b a bc ad n ++++-.这会使结果相差甚远.例4某校高三年级在一次全年级的大型考试中,数学成绩优秀和非优秀的学生中,物理、化学、总分也为优秀的人数如下表所示,则数学成绩优秀与物理、化学、总分也优秀哪个关系注:该年级此次考试中数学成绩优秀的有360人,非优秀的有880人.思路分析:分别列出两个量间的2×2列联表,将数据代入公式求得K 2,对照K 2与临界值及三个的大小关系得出结论.代入公式可得K =270.114 3.(3)列出数学与总分优秀的2×2列联表如下:由上面分析可知,数学成绩优秀与物理、化学、总分优秀都有关系.由计算K2的值都大于10.828,由此说明都有99.9%的把握认为数学优秀与物理、化学、总分优秀都有关系,但与总分优秀关系最大,物理次之.深化升华注意此处空半格本例中,我们利用2×2列联表的独立假设分析了数学与物理、化学、总分优秀是否有关系.由此发现,学好数学对总分及学好物理关联很大,因此我们要努力学好数学.其次,本例还告诉我们如何利用所学习的独立性假设的思想方法来分析多个分类变量之间关系的方法.。

2018-2019学年高中数学 第三章 统计案例 3.2 独立性检验的基本思想及其初步应用优质课件

2018-2019学年高中数学 第三章 统计案例 3.2 独立性检验的基本思想及其初步应用优质课件

②2×2 列联表.
一般地,假设有两个分类变量 X 和 Y,它们的取值
分别为x1,x2和y1,y2,其样本频数列联表(称为 2×2 列
联表)如下表所示:
Y
X
y1
y2
总计x1a源自ba+bx2
c
d
c+d
总计 a+c b+d a+b+c+d
2.等高条形图 等高条形图与表格相比,更能直观地反映出两个分类 变量间是否互相影响,常用等高条形图展示列联表数据的 频数特征.
答案:假设电离辐射的剂量与人体受损程度无关
5.某高校统计初步课程的教师随机调查了选该课的 一些学生的情况,具体数据如下表所示:
性别 男生 女生
非统计专业 13 7
统计专业 10 20
为了检验主修统计专业是否与性别有关系,根据表
中 的 数 据 得 到 随 机 变 量 K2 的 观 测 值 为 k =
“这两个班在这次测试中成绩的差异与实施课题实验有
关.”
归纳升华 (1)独立性检验在实际中有着广泛的应用,是对实际 生活中数据进行分析的一种方法,通过这种分析得出的结 论对实际生活或者生产都有一定的指导作用.
(2)近几年高考中较少单独考查独立性检验,经常与 统计、概率等知识综合,频率分布表、频率分布直方图与 独立性检验融合在一起是常见的考查形式,一般需要根据 条件列出 2×2 列联表,计算 K2 的观测值,从而解决问题.
第三章 统计案例
3.2 独立性检验的基本思 想及其初步应用
[学习目标] 1.了解独立性检验(只要求 2×2 列联表) 的基本思想、方法及其简单应用(重点、难点). 2.会判 断两个分类变量是否有关系(重点). 3.能够根据题目所 给数据列出 2×2 列联表及求 K2 的观测值(重点、难点).
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

3.2 立性检验的基本思想及其初步应用问题1:患色盲与性别有关系吗?提示:有.问题2:通过怎样比较看出患色盲与性别有关系?提示:通过患色盲的人数占性别类型的比例.1.分类变量变量的不同“值”表示个体所属的不同类别,像这样的变量称为分类变量.2.2×2列联表假设有两个分类变量X和Y,它们的取值分别为{x1,x2}和{y1,y2},其样本频数列联表(也称为2×2列联表)为:3.K2统计量为了使不同样本容量的数据有统一的评判标准,我们构造一个随机变量K2=n ad-bc 2a+b c+d a+c b+d,其中n=a+b+c+d为样本容量.4.独立性检验利用随机变量K2来确定是否能以给定把握认为“两个分类变量有关系”的方法,称为两个分类变量独立性检验.1.2×2列联表的特征2.在列联表中,如果两个分类变量没有关系,则应满足ad-bc≈0.因此|ad-bc|越小,说明两个分类变量之间的关系越弱;|ad-bc|越大,说明两个分类变量之间的关系越强.吸烟与患肺癌“列联表”中,事件A表示不吸烟,B表示不患肺癌.问题1:事件A,B发生的频率可求吗?提示:可以.问题2:通常情况下,为研究问题方便,常用什么近似于概率?提示:频率.问题3:事件A,B无关有怎样的概率公式?提示:P(AB)=P(A)P(B).独立性检验的思想:要确定“两个分类变量有关系”这一结论成立的可信程度,首先假设结论不成立,即假设结论“两个分类变量没有关系”成立.在该假设下我们构造的随机变量K2应该很小,如果由观测数据计算得到的K2观测值k很大,那么在一定程度上说明假设不合理,根据随机变量K2的含义,可以通过可信度表评价该假设不合理的程度,即“两个分类变量有关系”的可信程度.1.P(K2≥6.635)≈0.01表明H0成立的概率很小,是小概率事件,可以判断H0不成立,也就是“两个分类变量之间没有关系”错误地判断为“两个分类变量之间有关系”的概率不超过0.01,也可以理解为“有99%的把握认为两个分类变量之间有关系”.2.利用独立性检验解决问题的基本步骤:(1)根据相关数据作列联表;(2)求K2的观测值;(3)与临界值作比较,得出结论.426人中有332人在考前心情紧张,性格外向的学生594人中有213人在考前心情紧张.作出等高条形图,利用图形判断考前心情紧张与性格类别是否有关系.作列联表如下:相应的等高条形图如图所示:图中阴影部分表示考前心情紧张与考前心情不紧张中性格内向的比例.从图中可以看出考前心情紧张的样本中性格内向占的比例比考前心情不紧张样本中性格内向占的比例高,可以认为考前紧张与性格类型有关.进行独立性检验的前提是根据题中数据获得2×2列联表,常用等高条形图展示列联表数据的频率特征,即将aa +b 与cc +d(或ba +b 与dc +d)的值相比,由此能直观地反映出两个分类变量间是否相互影响,但是此方法较粗劣.为了研究子女吸烟与父母吸烟的关系,调查了一千多名青少年及其家长,数据如下:解:等高条形图如下:由图形观察可以看出父母吸烟者中子女吸烟的比例要比父母不吸烟者中子女吸烟的比例高,因此可以在某种程度上认为“子女吸烟与父母吸烟有关系”.某大学餐饮中心为了解新生的饮食习惯,在全校一年级学生中进行了抽样调查,调查结果如下表所示:生在选用甜品的饮食习惯方面有差异”.将2×2列联表中的数据代入公式计算,得k=n ad-bc 2a+b c+d a+c b+d=100× 60×10-20×10 270×30×80×20=10021≈4.762.由于4.762>3.841,故在犯错误的概率不超过0.05的前提下认为南方学生和北方学生在选用甜品的饮食习惯方面有差异.根据题意列出2×2列联表,计算K2的观测值,如果K2的观测值很大,说明两个分类变量有关系的可能性很大;如果K2的观测值比较小,则认为没有充分的证据显示两个分类变量有关系.这需要给出正确的计算,避免计算失误.在一次天气恶劣的飞机航程中,调查了男女乘客在飞机上晕机的情况:男乘客晕机的有24人,不晕机的有31人;女乘客晕机的有8人,不晕机的有26人.请你根据所给数据判定:在天气恶劣的飞机航程中,男乘客是否比女乘客更容易晕机?解:根据题意,列出2×2列联表如下:由公式可得K2的观测值k=n ad-bc 2a+b c+d a+c b+d=89 24×26-31×8 255×34×32×57≈3.689>2.706,故在犯错误的概率不超过0.10的前提下,认为“在天气恶劣的飞机航程中男乘客比女乘客更容易晕机”.4.独立性检验与统计的综合应用(12分)某工厂有工人1 000名,其中250名工人参加过短期培训(称为A类工人),另外750名工人参加过长期培训(称为B类工人).现用分层抽样的方法(按A类、B类分两层)从该工厂的工人中抽取100名工人,调查他们的生产能力(此处生产能力指一天加工的零件数),结果如下表.表1 A类工人生产能力的频数分布表表2 B类工人生产能力的频数分布表(2)完成下面2×2列联表,并回答能否在犯错误的概率不超过0.001的前提下认为工人的生产能力与工人的类别有关系.(1)∵从该工厂的工人中抽取100名工人,且该工厂中有250名A 类工人,750名B 类工人,∴要从A 类工人中抽取25名,从B 类工人中抽取75名,(2分)∴x =25-8-3-2=12,y =75-6-27-18=24.(4分)(2)根据所给的数据可以完成列联表,如下表所示:6分由列联表中的数据,得K 2的观测值为k =100× 20×45-5×30 225×75×50×50=12>10.828.(10分)因此,在犯错误的概率不超过0.001的前提下认为工人的生产能力与工人的类别有关系.(12分)要确定x ,y 的值,应先确定A 类工人及B 类工人中应各抽取多少人,此处易误认为x =25,y =75,从而导致解题错误.此处易犯错误有两点:①计算失误;②将公式中的数据搞错.某学生对其亲属30人的饮食进行了一次调查,并用如图所示的茎叶图表示30人的饮食指数.(说明:图中饮食指数低于70的人,饮食以蔬菜为主;饮食指数高于70的人,饮食以肉类为主)(1)根据以上数据完成下面2×2列联表:(2)能否在犯错误的概率不超过0.01的前提下认为其亲属的饮食习惯与年龄有关?请写出简要分析.解:(1)2×2列联表如下:(2)因为K 2=30× 8-128212×18×20×10=10>6.635,P (K 2>6.635)=0.01.所以可以在犯错误的概率不超过0.01的前提下认为其亲属的饮食习惯与年龄有关.1.下面是一个2×2列联表:则表中a ,b A .94,96 B .52,50 C .52,54D .54,52解析:选C 由⎩⎪⎨⎪⎧a +21=73,a +2=b ,得⎩⎪⎨⎪⎧a =52,b =54.2.某工厂为了调查工人文化程度与月收入的关系,随机抽取了部分工人,得到如下列联表:文化程度与月收入列联表(单位:人)由上表中数据计算得K 2的观测值k =105× 10×30-45×20255×50×30×75≈6.109,请估计有多少把握认为文化程度与月收入有关系( )A .1%B .99%C .2.5%D .97.5%解析:选D 由于6.109>5.024,所以在犯错误的概率不超过0.025的前提下,即有97.5%的把握认为文化程度与月收入有关系.3.独立性检验所采用的思路是:要研究A ,B 两类型变量彼此相关,首先假设这两类变量彼此无关,在此假设下构造随机变量K 2,如果K 2的观测值较大,那么在一定程度上说明假设不成立.4.在吸烟与患肺病是否相关的判断中,有下面的说法:①若K 2的观测值k >6.635,则在犯错误的概率不超过0.01的前提下,认为吸烟与患肺病有关系,那么在100个吸烟的人中必有99人患有肺病;②从独立性检验可知在犯错误的概率不超过0.01的前提下,认为吸烟与患肺病有关系时,若某人吸烟,则他有99%的可能患有肺病;③从独立性检验可知在犯错误的概率不超过0.05的前提下,认为吸烟与患肺病有关系时,是指有5%的可能性使得推断错误.其中说法正确的是________.(填序号)解析:K2是检验吸烟与患肺病相关程度的量,是相关关系,而不是确定关系,是反映有关和无关的概率,故说法①不正确;说法②中对“确定容许推断犯错误概率的上界”理解错误;说法③正确.答案:③5.下面是高二年级统计案例的测验成绩统计表(单位:分)的一部分,试分析实验效果.附:解:根据列联表中的数据,由公式得K2的观测值k=n ad-bc 2a+b c+d a+c b+d=100 32×38-18×12 250×50×44×56≈16.234.因为16.234>6.635,所以,在犯错误的概率不超过0.010的前提下认为高二年级统计案例的测试成绩与高一年级数学教学中增加统计思想的渗透有联系.一、选择题1.判断两个分类变量是彼此相关还是相互独立的常用的方法中,最为精确的是( ) A.2×2列联表B.独立性检验C.等高条形图 D.其他解析:选B A、C只能直观地看出两个分类变量x与y是否相关,但看不出相关的程度;独立性检验通过计算得出相关的可能性,较为准确.2.对于分类变量X与Y的随机变量K2的观测值k,下列说法正确的是( )A.k越大,“X与Y有关系”的可信程度越小B.k越小,“X与Y有关系”的可信程度越小C.k越接近于0,“X与Y没有关系”的可信程度越小D.k越大,“X与Y没有关系”的可信程度越大解析:选B k越大,“X与Y没有关系”的可信程度越小,则“X与Y有关系”的可信程度越大,即k越小,“X与Y有关系”的可信程度越小.3.利用独立性检验对两个分类变量是否有关系进行研究时,若有99.5%的把握认为事件A和B有关系,则具体计算出的数据应该是( )A.k≥6.635 B.k<6.635C.k≥7.879 D.k<7.879解析:选C 有99.5%的把握认为事件A和B有关系,即犯错误的概率为0.5%,对应的k0的值为7.879,由独立性检验的思想可知应为k≥7.879.4.(江西高考)某人研究中学生的性别与成绩、视力、智商、阅读量这4个变量的关系,随机抽查52名中学生,得到统计数据如表1至表4,则与性别有关联的可能性最大的变量是( )表1表2表3表4A .成绩B .视力C .智商D .阅读量解析:选D 根据列联表中的数据,由公式得K 2的观测值: k 1=52× 6×22-14×10 216×36×32×20=52×8216×36×32×20,k 2=52× 4×20-16×12 216×36×32×20=52×112216×36×32×20,k 3=52× 8×24-12×8 216×36×32×20=52×96216×36×32×20,k 4=52× 14×30-6×2 216×36×32×20=52×408216×36×32×20,则有k 4>k 2>k 3>k 1,所以阅读量与性别关联的可能性最大.5.通过随机询问110名性别不同的大学生是否爱好某项运动,得到如下的列联表:由K 2=n ad -bc 2a +bc +d a +c b +d算得,观测值k =110× 40×30-20×20 260×50×60×50≈7.8.附表:参照附表,得到的正确结论是( )A .有99%以上的把握认为“爱好该项运动与性别有关”B .有99%以上的把握认为“爱好该项运动与性别无关”C .在犯错误的概率不超过0.1%的前提下,认为“爱好该项运动与性别有关”D .在犯错误的概率不超过0.1%的前提下,认为“爱好该项运动与性别无关” 解析:选A 由k ≈7.8及P (K 2≥6.635)=0.010可知,在犯错误的概率不超过1%的前提下认为“爱好该项运动与性别有关”,也就是有99%以上的把握认为“爱好该项运动与性别有关”.二、填空题6.下列关于K 2的说法中,正确的有________. ①K 2的值越大,两个分类变量的相关性越大; ②K 2的计算公式是K 2=n ad -bca +bc +d a +c b +d;③若求出K 2=4>3.841,则有95%的把握认为两个分类变量有关系,即有5%的可能性使得“两个分类变量有关系”的推断出现错误;④独立性检验就是选取一个假设H 0条件下的小概率事件,若在一次试验中该事件发生了,这是与实际推断相抵触的“不合理”现象,则作出拒绝H 0的推断.解析:对于①,K 2的值越大,只能说明我们有更大的把握认为二者有关系,却不能判断相关性大小,故①错;对于②,(ad -bc )应为(ad -bc )2,故②错;③④对.答案:③④7.某电视台在一次对收看文艺节目和新闻节目的观众抽样调查中,随机抽取了100名电视观众,相关的数据如下表所示.填“是”或“否”).解析:因为在20岁至40岁的58名观众中有18名观众收看新闻节目,而在大于40岁的42名观众中有27名观众收看新闻节目,即ba +b =1858,dc +d =2742,两者相差较大,所以经直观分析,收看新闻节目的观众与年龄是有关的.答案:是8.某班主任对全班30名男生进行了认为作业量多少的调查,数据如下表:不超过________.解析:计算得K2的观测值为k=30× 12×8-2×8 214×16×20×10≈4.286>3.841,则推断犯错误的概率不超过0.050.答案:0.050三、解答题9.用两种检验方法对某食品做沙门氏菌检验,结果如下表:附:能否在犯错误的概率不超过0.001的前提下认为采用荧光抗体法与检验结果呈阳性有关系?解:通过计算K2=n ad-bc 2a+b c+d a+c b+d≈113.184 6.而查表可知,因为P(K2≥10.828)≈0.001,而113.184 6远大于10.828,所以在犯错误的概率不超过0.001的前提下认为采用荧光抗体法与检验结果呈阳性有关系.10.某校在两个班进行教学方式对比实验,两个月后进行了一次检测,实验班与对照班成绩统计如下表所示(单位:人).(1)求m ,n .(2)能否在犯错误的概率不超过0.005的情况下认为教学方式与成绩有关系? 解:(1)m =45-15=30,n =50+50=100. (2)由表中的数据,得K 2的观测值为 k =100× 35×30-15×20 250×50×55×45≈9.091.因为9.091>7.879,所以能在犯错误的概率不超过0.005的前提下认为教学方式与成绩有关系.11.某旅行社为调查市民喜欢“人文景观”景点是否与年龄有关,随机抽取了55名市民,得到数据如下表:(1)有关.(2)用分层抽样的方法从喜欢“人文景观”景点的市民中随机抽取6人作进一步调查,将这6位市民作为一个样本,从中任选2人,求恰有1位“大于40岁”的市民和1位“20岁至40岁”的市民的概率.解:(1)由公式K 2=55× 20×20-10×5230×25×25×30≈11.978>7.8709,所以在犯错误的概率不超过0.005的前提下认为喜欢“人文景观”景点与年龄有关.(2)设所抽样本中有m 个“大于40岁”市民,则m 20=630,得m =4人, 所以样本中有4个“大于40岁”的市民,2个“20岁至40岁”的市民,分别记作B 1,B 2,B 3,B 4,C 1,C 2,从中任选2人的基本事件有(B 1,B 2),(B 1,B 3),(B 1,B 4),(B 1,C 1),(B 1,C 2),(B 2,B 3),(B 2,B 4),(B 2,C 1),(B 2,C 2),(B 3,B 4),(B 3,C 1),(B 3,C 2),(B 4,C 1),(B 4,C 2),(C 1,C 2),共15个,其中恰有1名“大于40岁”和1名“20岁至40岁”之间的市民的事件有(B 1,C 1),(B 1,C 2),(B 2,C 1),(B 2,C 2),(B 3,C 1),(B 3,C 2),(B 4,C 1),(B 4,C 2),共8个,所以恰有1名“大于40岁”和1名“20岁至40岁”之间的市民的概率为P =815.。

相关文档
最新文档