3.2独立性检验的基本思想及其初步应用_课件(人教A版选修2-3)[1]
合集下载
高中数学 3.2独立性检验的基本思想及其初步应用课件 新人教A版选修23[1]
第十九页,共47页。
3.根据下面的列联表判断(pànduàn)患肝病与嗜酒有关系 的把握有( )
患肝病 未患肝病
总计
A.90% C.97.5% [答案] D
嗜酒 不嗜酒
7775
42
2099
49
9874
91
B.95% D.99.9%
合计 7817 2148 9965
第二十页,共47页。
[解析] 由 K2=a+bcn+add-ab+cc2b+d得其观测值 k= 996758×177×77251×484×9-9827049×9×91422≈56.6>10.828.故有 99.9%的把握 认为患肝病与嗜酒有关系,答案选 D.
k=a+bcn+add-ab+cc2b+d =100408×0×385×205×144-4×44925×6 62≈27.1.由于 k≈27.1>10.828, 所以我们有 99.9%的把握认为色盲与性别有关系.这个结论只 对所调查的 480 名男人和 520 名女人有效.
第三十二页,共47页。
[方法规律总结] 1.独立性检验的步骤: 第一步,确定分类变量,获取样本频数,得到列联表. 第二步,根据实际问题的需要确定容许推断“两个分类变 量有关系”犯错误概率的上界 α,然后查表确定临界值 k0. 第三步,利用公式 K2=a+bcn+add-ab+cc2b+d计算随机 变量 K2 的观测值 k0.
第二十九页,共47页。
独立性检验(jiǎnyàn)的应用
在调查的 480 名男人中有 38 名患有色盲,520 名女人中有 6 名患有色盲,通过图形判断色盲与性别是否有 关.利用独立性检验判断,是否能够以 99.9%的把握认为“色 盲与性别有关系”.你所得到的结论在什么范围内有效?
3.根据下面的列联表判断(pànduàn)患肝病与嗜酒有关系 的把握有( )
患肝病 未患肝病
总计
A.90% C.97.5% [答案] D
嗜酒 不嗜酒
7775
42
2099
49
9874
91
B.95% D.99.9%
合计 7817 2148 9965
第二十页,共47页。
[解析] 由 K2=a+bcn+add-ab+cc2b+d得其观测值 k= 996758×177×77251×484×9-9827049×9×91422≈56.6>10.828.故有 99.9%的把握 认为患肝病与嗜酒有关系,答案选 D.
k=a+bcn+add-ab+cc2b+d =100408×0×385×205×144-4×44925×6 62≈27.1.由于 k≈27.1>10.828, 所以我们有 99.9%的把握认为色盲与性别有关系.这个结论只 对所调查的 480 名男人和 520 名女人有效.
第三十二页,共47页。
[方法规律总结] 1.独立性检验的步骤: 第一步,确定分类变量,获取样本频数,得到列联表. 第二步,根据实际问题的需要确定容许推断“两个分类变 量有关系”犯错误概率的上界 α,然后查表确定临界值 k0. 第三步,利用公式 K2=a+bcn+add-ab+cc2b+d计算随机 变量 K2 的观测值 k0.
第二十九页,共47页。
独立性检验(jiǎnyàn)的应用
在调查的 480 名男人中有 38 名患有色盲,520 名女人中有 6 名患有色盲,通过图形判断色盲与性别是否有 关.利用独立性检验判断,是否能够以 99.9%的把握认为“色 盲与性别有关系”.你所得到的结论在什么范围内有效?
2020学年高中数学第3章统计案例3.2独立性检验的基本思想及其初步应用课件新人教A版选修2_3
返回目录
(2)独立性检验(精确判断) 具体实施步骤如下: ①根据实际问题需要的可信程度确定临界值 k0; ② 根 据 观 测 数 据 计 算 随 机 变 量 K2 = a+bcn+add-ab+cc2b+d的观测值 k,其中 n=a+b+c+ d 为样本容量;
返回目录
③查临界值表(以K2的观测值k的大小作为检验在多 大程度上可以认为“两个变量有关系”的标准),如果 k≥k0,就以(1-P(K2≥k0))×100%的把握认为“两分类 变量有关系”;否则,就认为根据样本数据没有充分的 理由说明“两分类变量有关系”.
返回目录
2.(独立性检验)有人发现,多看电视容易使人变冷 漠,下表是一个调查机构对此现象的调查结果.
冷漠 不冷漠 总计 多看电视 68 42 110 少看电视 20 38 58
总计 88 80 168
返回目录
则大约有多大的把握认为多看电视与人变冷漠有关
系( )
A.99%
B.97.5%
C.95%
D.90%
返回目录
要点三 独立性检验
定义 利用随机变量K2来判断“两个分类变量有关系” 的方法称为独立性检验 nad-bc2
公式 K2=_____a_+__b__c_+__d__a_+__c___b_+__d_____,其中n= ___a_+_b_+__c_+__d___
返回目录
①认真读题,取出相关数据,作出2×2列联表; 具体 ②根据2×2列联表中的数据,计算K2的观测值k; 步骤 ③通过观测值k与临界值k0比较,得出事件有关的
返回目录
P(K2≥k0) 0.100 0.050 0.010 k0 2.706 3.841 6.635
思维导引:根据列联表直接代入K2公式可得南方学 生和北方学生的差异与是否喜欢甜品的相关程度.
高中数学人教课标版选修2-3《独立性检验的基本思想及其初步应用(第2课时)》课件
但只可以粗略判断两个分类变量是否有关系,一般在通过图表判断后 还需要用独立性检验来确认.
知识回顾
问题探究
课堂小结
随堂检测
重点、难点知识★▲
探究二:什么是独立性检验?
利用独立性检验判断两个分类变量的是否有关系的一般过程是什么?
●活动一 理论学习,提升高度 1.定义: 利用随机变量 独立性检验. ●活动二 对比学习,提炼方法
检验方法判断秃顶与患心脏病是否有关系?你所得的结论在什么范围内有效?
解:根据题中所给数据列出列联表
பைடு நூலகம்
相应的等高条形图如图所示:
比较来说,秃顶的病人中患心脏病的比例大一些,可以在某种程 度上认为“秃顶与患心脏病有关”.
知识回顾
问题探究
课堂小结
随堂检测
探究一:我们主要从几个方面来研究两个分类变量之间有无关系?
●活动二 对比学习,提炼优缺点 根据数据有多大把握判断秃顶与患心脏病是否有关系? 在假设的前提下,
1437 (214 597 175 451) 2 k 16.373 6.635 389 1048 665 772
所以有99%的把握认为“秃顶与患心脏病有关”. 这里的数据来自于医院的住院病人,因此题目中的结论能够很好 地适用于住院的病人群体,而把这个结论推广到其他群体则可能会出 现错误,除非有其它的证据表明可以进行这种推广.
3.2 独立性检验的基本思想及其初步 应用(第2课时)
知识回顾
问题探究
课堂小结
随堂检测
变量的不同“值”表示个体所属的不同类别,像这样的变量
成为分类变量. 列出两个分类变量的频数表,称为列联表. 等高条形图是用来分析两个分类变量之间是否具有相关关系, 可以形象、直观地反映两个分类变量之间的总体状态和差异大小,
知识回顾
问题探究
课堂小结
随堂检测
重点、难点知识★▲
探究二:什么是独立性检验?
利用独立性检验判断两个分类变量的是否有关系的一般过程是什么?
●活动一 理论学习,提升高度 1.定义: 利用随机变量 独立性检验. ●活动二 对比学习,提炼方法
检验方法判断秃顶与患心脏病是否有关系?你所得的结论在什么范围内有效?
解:根据题中所给数据列出列联表
பைடு நூலகம்
相应的等高条形图如图所示:
比较来说,秃顶的病人中患心脏病的比例大一些,可以在某种程 度上认为“秃顶与患心脏病有关”.
知识回顾
问题探究
课堂小结
随堂检测
探究一:我们主要从几个方面来研究两个分类变量之间有无关系?
●活动二 对比学习,提炼优缺点 根据数据有多大把握判断秃顶与患心脏病是否有关系? 在假设的前提下,
1437 (214 597 175 451) 2 k 16.373 6.635 389 1048 665 772
所以有99%的把握认为“秃顶与患心脏病有关”. 这里的数据来自于医院的住院病人,因此题目中的结论能够很好 地适用于住院的病人群体,而把这个结论推广到其他群体则可能会出 现错误,除非有其它的证据表明可以进行这种推广.
3.2 独立性检验的基本思想及其初步 应用(第2课时)
知识回顾
问题探究
课堂小结
随堂检测
变量的不同“值”表示个体所属的不同类别,像这样的变量
成为分类变量. 列出两个分类变量的频数表,称为列联表. 等高条形图是用来分析两个分类变量之间是否具有相关关系, 可以形象、直观地反映两个分类变量之间的总体状态和差异大小,
( 人教A版)2017-2018学年高中数学选修2-3:3.2独立性检验的基本思想及其初步应用课件 (共28张PPT)
由于 9.967>6.635,所以在犯错误的概率不超过 0.01 的前提下认为该地区的老年人需 要志愿者提供帮助与性别有关.
独立性检验的综合应用 [典例] (本小题满分 12 分)调查某医院某段时间内婴儿出生的时间与性别的关系,得到 下面的数据:出生时间在晚上的男婴为 24 人,女婴为 8 人;出生时间在白天的男婴为 31 人,女婴为 26 人. (1)将下面的 2×2 列联表补充完整;
总计
426
594 1 020
相应的等高条形图如图所示:
图中阴影部分表示考前心情紧张与考前心情不紧张中性格内向的频率,从图中可以看 出考前心情紧张的样本中性格内向的频率比考前心情不紧张样本中性格内向的频率 高,因此可以认为考前心情紧张与性格内向有关.
探究二 独立性检验的应用 [典例 2] 在一次天气恶劣的飞行航程中,调查了男女乘客在飞机上晕机的情况:男 乘客晕机的有 24 人,不晕机的有 31 人;女乘客晕机的有 8 人,不晕机的有 26 人.请 你根据所给数据判断:在天气恶劣的飞行航程中,男乘客是否比女乘客更容易晕机.
出生时间 晚上 白天 总计
性别 男婴 女婴 总计
(2)能否在犯错误的概率不超过 0.1 的前提下认为婴儿性别与出生时间有关系?
[解析] (1)
出生时间 晚上 白天 总计
性别
男婴
24 31 55
女婴
8 26 34
总计
32 57 89
5分
(2)由所给数据计算 K2 的观测值 k=89×55×243×4×263-2×315×782≈3.689>2.706.8 分
课时作业
[自主梳理] 1.2×2 列联表 (1)分类变量的概念: 变量的不同“值”表示个体所属的 不同类别 ,像这样的变量称为分类变量.
高中数学人教课标版选修2-3《独立性检验的基本思想及其初步应用(第3课时)》课件
知识回顾
问题探究
课堂小结
随堂检测
探究二:利用独立性检验判断两个分类变量是否有关系的一般步骤 是什么?
1.独立性检验的基本步骤
重点、难点知识★▲
②利用公式
计算随机变量
的观测值
.
③如果 ,就推断“X与Y有关系”,这种推断犯错误的概率不超过 ; 否则,就认为在犯错误的概率不超过 的前提下不能推断“X与Y有关系”, 或者在样本数据中没有发现足够证据支持结论“X与Y有关系”. 2.独立性检验的基本思想 (1)利用 进行独立性检验,可以对推断的正确性的概率作出估 计,样本容量n越大,这个估计值越准确,如果抽取的样本容量很 小,那么利用 进行独立性检验的结果就不具有可靠性. (2)独立性检验的思想就是在假设 成立的条件下,如果出现一 个与 相矛盾的小概率事件,就推断 不成立,且该推断犯错误 的概率不超过这个小概率.
3.2 独立性检验的基本思想及其初步 应用(第3课时)
知识回顾
问题探究
课堂小结
随堂检测
变量的不同“值”表示个体所属的不同类别,像这样
的变量成为分类变量.
列出两个分类变量的频数表,称为列联表.
知识回顾
问题探究
课堂小结
随堂检测
独立性检验的基本思想类似于数学中的反证法,要确认两个分类
变量有关系这一结论成立的可信程度,首先假设该结论不成立,即
●活动一 回归旧知,巩固复习重点知识
例1.为了调查某生产线上,某质量监督员甲对产品质量好坏有无影响,现统 计数据如下:质量监督员甲在现场时,990件产品中合格品982件,次品87件;甲不 在现场时,510件产品中合格品493件,次品17件.试分别用列联表,等高条形图,独 立性检验的方法对数据进行分析.
3.2独立性检验的基本思想及其初步应用 课件(人教A版选修2-3)
3. 独立性检验临界值表
P(K2 ≥k 0 ) k0
0.50 0.40 0.25 0.15 0.10 0.05 0.025 0.010 0.005 0.001
0.455 0.708 1.323 2.072 2.706 3.841 5.024 6.635 7.879 10.828
想一想:在K2运算时,在判断变量相关时,若K2的观测值k= 56.632,则P(K2≥6.635)≈0.01和P(K2≥10.828)≈0.001, 哪种说法是正确的? 提示 两种说法均正确.
兴趣不浓厚的
总计
86
73
103
95
189
判断学生的数学成绩好坏与对学习数学的兴趣是否有关?
解 由公式得 K 的观测值
解 由公式得 K 的观测值 86×103×95×94
2
189× 64×73-22×30 k189 = ×64×73-22×302 ≈38.459. 86 × 103 × 95 × 94 k= ≈38.459.
想一想:如何理解分类变量?
提示
(1)这里的“变量”和“值”都应作为“广义”的变量和值
来理解.例如:对于性别变量,其取值有“男”和“女”两 种,这里的“变量”指的是“性别”,这里的“值”指的是“男”
或“女”.因此,这里说的“变量”和“值”不一定是取具体的
数值. (2)分类变量是大量存在的.例如:吸烟变量有吸烟与不 吸烟两种类别,而国籍变量则有多种类别.
2.独立性检验 利用随机变量K2来判断“两个分类变量有关系”的方法 定义 称为独立性检验
公式
n ad-bc2 a+bc+da+c b+d K2=_______________________ 其中n=___________ a+b+c+d
高中数学人教A版选修2-3课件:3.2独立性检验的基本思想及其初步应用
x
).
问题导学
当堂检测
一、用列联表和等高条形图分析两变量间的关系
活动与探究 问题 1:怎样从列联表判断两个分类变量有无关系? 提示:|ad-bc|越小,说明两个分类变量 x,y 之间的关系越弱;|ad-bc|越 大,说明 x,y 之间的关系越强.
x
问题 2:等高条形图对分析两个分类变量是否有关系,有何帮助? 提示:通过画等高条形图,我们可以通过观察两个变量的比例关系, 直观判断两个变量是否有关系.
问题导学
当堂检测
(1)利用列联表直接计算 分类变量之间有关系.
������ ������ 和 ,如果两者相差很大,就判断两个 ������+������ ������+������
(2)在等高条形图中展示列联表数据的频率特征,比较图中两个深 色条的高可以发现两者频率不一样而得出结论 ,这种直观判断的不足 之处在于不能给出推断“两个分类变量有关系”犯错误的概率.
问题导学
当堂检测
相应的等高条形图如图所示.
图中两个深色条的高分别表示甲在生产现场和甲不在生产现场样 本中次品数的频率.从图中可以看出,甲不在生产现场样本中次品数的 频率明显高于甲在生产现场样本中次品数的频率 .因此可以认为质量 监督员甲在不在生产现场与产品质量好坏有关系 .
问题导学
当堂检测
迁移与应用 某学校对高三学生作了一项调查发现:在平时的模拟考试中,性格 内向的学生 426 人中有 332 人在考前心情紧张,性格外向的学生 594 人 中有 213 人在考前心情紧张,作出等高条形图,利用图形判断考前心情 紧张与性格类别是否有关系. 解:作列联表如下:
2
其中 n=a+b+c+d 为样本容量.
).
问题导学
当堂检测
一、用列联表和等高条形图分析两变量间的关系
活动与探究 问题 1:怎样从列联表判断两个分类变量有无关系? 提示:|ad-bc|越小,说明两个分类变量 x,y 之间的关系越弱;|ad-bc|越 大,说明 x,y 之间的关系越强.
x
问题 2:等高条形图对分析两个分类变量是否有关系,有何帮助? 提示:通过画等高条形图,我们可以通过观察两个变量的比例关系, 直观判断两个变量是否有关系.
问题导学
当堂检测
(1)利用列联表直接计算 分类变量之间有关系.
������ ������ 和 ,如果两者相差很大,就判断两个 ������+������ ������+������
(2)在等高条形图中展示列联表数据的频率特征,比较图中两个深 色条的高可以发现两者频率不一样而得出结论 ,这种直观判断的不足 之处在于不能给出推断“两个分类变量有关系”犯错误的概率.
问题导学
当堂检测
相应的等高条形图如图所示.
图中两个深色条的高分别表示甲在生产现场和甲不在生产现场样 本中次品数的频率.从图中可以看出,甲不在生产现场样本中次品数的 频率明显高于甲在生产现场样本中次品数的频率 .因此可以认为质量 监督员甲在不在生产现场与产品质量好坏有关系 .
问题导学
当堂检测
迁移与应用 某学校对高三学生作了一项调查发现:在平时的模拟考试中,性格 内向的学生 426 人中有 332 人在考前心情紧张,性格外向的学生 594 人 中有 213 人在考前心情紧张,作出等高条形图,利用图形判断考前心情 紧张与性格类别是否有关系. 解:作列联表如下:
2
其中 n=a+b+c+d 为样本容量.
人教版A版高中数学选修2-3:独立性检验的基本思想及其初步应用_课件1(1)
要证明结论A
≈325.635.
因为 325.635>6.635,因此,在犯错误的概率不超过 0.01
的前提下认为官员在经济上是否清廉与他们寿命的长短之
间是有关系的.
(2011·湖南高考)通过随机询问110名性别不同的大学生 是否爱好某项运动,得到如下的列联表:
男 女 总计爱好40 Nhomakorabea2060
不爱好 20 30
据此资料是否认为男生比女生成绩差.
合计
100 100 200
[解题过程] 根据列联表中数据,由公式计算得 K2=20505××3104×5×751-002×5×107002≈0.627 ∵0.627<2.706,所以据目前的数据不能认为男生比女 生成绩差,即没理由说男生比女生成绩差.
[题后感悟] (1)给出的随机变量K2的值k,其值越大, 说明“X与Y有关系”成立的可能性越大,其值越小, 说明“X与Y有关系”成立的可能性越小.
解析: 结合K2临界值表可知, 当K2≥3.841时有95%的把握说事件A与B有关;
当K2≤2.706时认为没有充分的证据显示事件A与B是有 关的.
答案: K2≥3.841 K2≤2.706
4.巴西医生马廷恩收集犯有各种贪污、受贿罪的官员 与廉洁官员寿命的调查资料:500名贪官中有348人的 寿命小于平均寿命,152人的寿命大于或等于平均寿命; 590名廉洁官员中有93人的寿命小于平均寿命,497人 的寿命大于或等于平均寿命.这里,平均寿命是指 “当地人均寿命”.能否在犯错误的概率不超过0.01的 前提下认为官员在经济上是否清廉与他们寿命的长短 之间有关系?
[题后感悟] 解独立性检验问题的基本步骤
(1)认真读题,指出相关数据,得出2×2列联表;
人教版选修2-3第三章2独立性检验的基本思想及其初步应用 (共24张PPT)教育课件
人
的
一
生
说
白
了
,
也
就
是
三
万
余
天
,
贫
穷
与
富
贵
,
都
是
一
种
生
活
境
遇
。
懂
得
爱
自
己
的
人
,
对
生
活
从
来
就
没
有
过
高
的
奢
望
,
只
是
对
生
存
的
现
状
欣
然
接
受
。
漠
漠
红
尘
,
芸
芸
众
生
皆
是
客
,
时
光
深
处
,
流
年
似
水
,
转
瞬
间
,
光
阴
就
会
老
去
,
留
在
心
头
的
,
只
是
弥
留
在
时
光
深
处
的
无
边
落
寞
。
轻
拥
沧
桑
,
淡
看
流
年
,
掬
一
捧
岁
月
,
握
一
份
懂
得
,
红
尘
口
罗
不
–■
患其他病 175 597 772
总计 389 1048 1437
人教版高中数学选修2-3课件:3.2 独立性检验的基本思想及其初步应用(共38张PPT)
P(K2≥k0) 0.05 0.025 0.010 0.005 0.001
例如:
k0
3.841 5.024 6.635 7.879 10.828
①如果k≥10.828,就有99.9%的把握认为“X与Y有关系”;
②如果k≥7.879,就有99.5%的把握认为“X与Y有关系”;
③如果k≥6.635,就有99%的把握认为“X与Y有关系”;
≈7.8.
备课素材
附表:P(K2≥k0) k0
0.050 3.841
0.010 6.635
0.001 10.828
参照附表,得到的正确结论是 (A ) A.有99%以上的把握认为“爱好该项运动与性别有关” B.有99%以上的把握认为“爱好该项运动与性别无关” C.在犯错误的概率不超过0.1%的前提下,认为“爱好该项运动与性别有关” D.在犯错误的概率不超过0.1%的前提下,认为“爱好该项运动与性别无关”
表(称为2×2列联表)为
y1
y2
总计
x1
a
b
a+b
x2
c
d
c+d
总计 a+c
b+d a+b+c+d
若要推断的论述为H1:“X与Y有关系”,则可以按如下步骤判断H1成立的可能性:
预习探究
预习探究
P(K2≥k0) 0.50 0.40 0.25 0.15 0.10
k0
0.455 0.708 1.323 2.072 2.706
考点类析
考点一 两分类变量之间关联关系的定性分析
例1 为考察某种药物预防某种疾病的效果,进行了一 项动物试验,得到如下列联表:
服用药 未服用药
最新3.2独立性检验的基本思想及其初步应用(高中数学人教A版选修2-3)教学讲义ppt课件
进 入 夏 天 ,少 不了一 个热字 当头, 电扇空 调陆续 登场, 每逢此 时,总 会想起 那 一 把 蒲 扇 。蒲扇 ,是记 忆中的 农村, 夏季经 常用的 一件物 品。 记 忆 中 的故 乡 , 每 逢 进 入夏天 ,集市 上最常 见的便 是蒲扇 、凉席 ,不论 男女老 少,个 个手持 一 把 , 忽 闪 忽闪个 不停, 嘴里叨 叨着“ 怎么这 么热” ,于是 三五成 群,聚 在大树 下 , 或 站 着 ,或随 即坐在 石头上 ,手持 那把扇 子,边 唠嗑边 乘凉。 孩子们 却在周 围 跑 跑 跳 跳 ,热得 满头大 汗,不 时听到 “强子 ,别跑 了,快 来我给 你扇扇 ”。孩 子 们 才 不 听 这一套 ,跑个 没完, 直到累 气喘吁 吁,这 才一跑 一踮地 围过了 ,这时 母 亲总是 ,好似 生气的 样子, 边扇边 训,“ 你看热 的,跑 什么? ”此时 这把蒲 扇, 是 那 么 凉 快 ,那么 的温馨 幸福, 有母亲 的味道 ! 蒲 扇 是 中 国传 统工艺 品,在 我 国 已 有 三 千年多 年的历 史。取 材于棕 榈树, 制作简 单,方 便携带 ,且蒲 扇的表 面 光 滑 , 因 而,古 人常会 在上面 作画。 古有棕 扇、葵 扇、蒲 扇、蕉 扇诸名 ,实即 今 日 的 蒲 扇 ,江浙 称之为 芭蕉扇 。六七 十年代 ,人们 最常用 的就是 这种, 似圆非 圆 , 轻 巧 又 便宜的 蒲扇。 蒲 扇 流 传 至今, 我的记 忆中, 它跨越 了半个 世纪, 也 走 过 了 我 们的半 个人生 的轨迹 ,携带 着特有 的念想 ,一年 年,一 天天, 流向长
0 不吸烟
吸烟
从二维条形图能看出,吸烟者中
患肺癌的比例高于不患肺癌的比例。
4、等高条形图
1 0.9 0.8 0.7 0.6 0.5 0.4 0.3 0.2 0.1
0 不吸烟
吸烟
从二维条形图能看出,吸烟者中
患肺癌的比例高于不患肺癌的比例。
4、等高条形图
1 0.9 0.8 0.7 0.6 0.5 0.4 0.3 0.2 0.1
3.2独立性检验的基本思想及其初步应用 PPT课件
反证法原理与假设检验原理 反证法原理:
在一个已知假设 下,如果推出一 个矛盾,就证明 了这个假设不成 立。
假设检验原理:
在一个已知假设 下,如果一个与 该假设矛盾的小 概率事件发生, 就推断这个假设 不成立。
11 [普通高中课程数学选修2-3] 3.2独立性检验的基本思想及其初步应用
假设检验问题: 求解思路
列 联 表
不吸烟
吸烟 总计
91 在不吸烟者中患肺癌的比重是 0.54% 2.28% 在吸烟者中患肺癌的比重是
吸烟者和不吸烟者都可能患肺癌, 吸烟者患肺癌的可能性较大
3 [普通高中课程数学选修2-3] 3.2独立性检验的基本思想及其初步应用
通过图形直观判断两个分类变量是否相关:
等高条 形图
100% 90% 80% 70% 60% 50% 40% 30% 20% 10% 0% 不吸烟 吸烟
例 1. 在某医院 , 因为患心脏病而住院的 665 名男性病人 中 , 有 214 人秃顶 , 而另外 772 名不是因为患心脏病而住 院的男性病人中有175人秃顶.分别利用图形和独立性检 验方法判断是否有关?你所得的结论在什么范围内有效?
秃顶 不秃顶 总计 患心脏病 214 451 665 不患心脏病 175 597 772 总计 389 1048 1437
1 [普通高中课程数学选修2-3] 3.2独立性检验的基本思想及其初步应用
1.2独立性检验的基本思想 及其初步应用
2 [普通高中课程数学选修2-3] 3.2独立性检验的基本思想及其初步应用
分类变量
为了调查吸烟是否对肺癌有影响,某肿瘤研究所随 机地调查了9965人,得到如下结果(单位:人) 吸烟与肺癌列联表 不患肺癌 患肺癌 7775 42 2099 9874 49 总计 7817 2148 9965
《独立性检验的基本思想及其初步应用》人教版高中数学选修2-3PPT课件(第3.2课时)
新知探究
不吸烟 吸烟 总计
不患肺癌 7775 2099 9874
患肺癌 42 49 91
总计 7817 2148 9965
利用上述公式得
K2 = 9965(7775 49 - 42 2099)2 56.632 7817 2148 9874 91
这个值能告知我们什么呢?
新知探究
在H0成立的情况下,统计学家估算出如下的概率:
解答 根据题目所得数据得到列联表:
秃顶 不秃顶
总计
患心脏病 214 451 665
患其他病 175 597 772
总计 389 1048 1437
课堂练习
K2 =
n ad - bc2
a +bc +da +cb +d
其中n=a+b+c+d为样本容量
根据列联表中的数据,的K2的观测值为
1437 214 597 - 175 4512
两个分类变量的独立性检验. 知识要点 独立性检验的基本思想类似于数学上的反证法.
新知探究
注意 3. 反证法原理与独立性检验原理的比较 知识要点
反证法原理 独立性检验原理
在假设H0下,如果推出一个矛 盾,就证明了H0不成立. 在假设H0下,如果出现一个与 H0相矛盾的小概率事件,就推断H0 不成立,且该推断犯错误的概率不超
课堂练习
解答
分组
频数 频率
[500,900) [900,1100) [1100,1300) [1300,1500) [1500,1700) [1700,1900) [1900,+∞)
48 0.048
121 0.121
208 0.208
223 0.223
高中数学人教A版选修2-3课件:3-2 独立性检验的基本思想及其初步应用
2
=
89× (24×26-31×8) 55×34×32×57
2
≈3.689>2.706,因此,
可以在犯错误的概率不超过 0.1 的前提下认为“在天气恶劣的飞行 航程中,男乘客比女乘客更容易晕机”.
栏目 导引
第一章 典例透析三角函数
题型一 题型二 题型三 题型四
反思解独立性检验问题的基本步骤: (1)认真读题,根据相关数据,得出2×2列联表; (2)根据2×2列联表中的数据,计算K2的观测值k; (3)比较观测值k与临界值k0; (4)给出结论.
第一章 典例透析三角函数
题型一 题型二 题型三 题型四
解:由列联表中的数据求得 K2 的观测值为 k=
189× (54×63-40×32)2 94×95×86×103
≈10.759.
试画出列联表的等高条形图,分析铅中毒病人与对照组的尿棕色素 阳性数有无差别,并判断铅中毒病人与尿棕色素为阳性是否有关系?
栏目 导引
第一章 典例透析三角函数
题型一 题型二 题型三 题型四
解:等高条形图如图.
其中两个浅色条的高分别代表铅中毒病人和对照组样本中尿棕 色素为阳性的频率. 由图可以直观地看出铅中毒病人与对照组相比较尿棕色素为阳 性差异明显,因此铅中毒病人与尿棕色素为阳性存在相关关系.
栏目 导引
第一章 典例透析三角函数
题型一 题型二 题型三 题型四
【变式训练 2】某大型企业人力资源部为了研究企业员工工作 积极性和对待企业改革态度的关系,随机抽取了 189 名员工进行调 查,所得数据如下表所示:
积极支持企业改革 工作积极 工作一般 总计 54 32 86 不太赞成企业改革 40 63 103 总计 94 95 189
=
89× (24×26-31×8) 55×34×32×57
2
≈3.689>2.706,因此,
可以在犯错误的概率不超过 0.1 的前提下认为“在天气恶劣的飞行 航程中,男乘客比女乘客更容易晕机”.
栏目 导引
第一章 典例透析三角函数
题型一 题型二 题型三 题型四
反思解独立性检验问题的基本步骤: (1)认真读题,根据相关数据,得出2×2列联表; (2)根据2×2列联表中的数据,计算K2的观测值k; (3)比较观测值k与临界值k0; (4)给出结论.
第一章 典例透析三角函数
题型一 题型二 题型三 题型四
解:由列联表中的数据求得 K2 的观测值为 k=
189× (54×63-40×32)2 94×95×86×103
≈10.759.
试画出列联表的等高条形图,分析铅中毒病人与对照组的尿棕色素 阳性数有无差别,并判断铅中毒病人与尿棕色素为阳性是否有关系?
栏目 导引
第一章 典例透析三角函数
题型一 题型二 题型三 题型四
解:等高条形图如图.
其中两个浅色条的高分别代表铅中毒病人和对照组样本中尿棕 色素为阳性的频率. 由图可以直观地看出铅中毒病人与对照组相比较尿棕色素为阳 性差异明显,因此铅中毒病人与尿棕色素为阳性存在相关关系.
栏目 导引
第一章 典例透析三角函数
题型一 题型二 题型三 题型四
【变式训练 2】某大型企业人力资源部为了研究企业员工工作 积极性和对待企业改革态度的关系,随机抽取了 189 名员工进行调 查,所得数据如下表所示:
积极支持企业改革 工作积极 工作一般 总计 54 32 86 不太赞成企业改革 40 63 103 总计 94 95 189
相关主题
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
公式
n ad-bc2 a+bc+da+c b+d K2=_______________________ 其中n=___________ a+b+c+d
①根据实际问题的需要,确定容许推断“两个分类变量 临界值k0 有关系”犯错误概率的上界α.然后查表确定_________ 观测值k ②利用公式计算随机变量K2的_________ 具体 k≥k0 ,就推断“X与Y有关系”,这种推断 ③如果_______ 步骤 犯错误的概率 _____________不超过α,否则就认为在犯错误的概率不 超过α的前提下不能推断“X与Y有关系”,或者在样本 没有发现足够证据 数据中_________________ 支持结论“X与Y有关系”
两种变量:
定量变量:体重、身高、温度、考试成绩等等。 变量 分类变量:性别、是否吸烟、是否患肺癌、 宗教信仰、国籍等等。
在日常生活中,我们常常关心分类变量之间是否有关系: 例如,吸烟是否与患肺癌有关系? 性别是否对于喜欢数学课程有影响?等等。
研究两个变量的相关关系:
定量变量——回归分析(画散点图、相关系数r、 变量 相关指数R 2、残差分析) 分类变量—— 独立性检验
本节研究的是两个分类变量的独立性检验问题。
课前探究学习 课堂讲练互动 活页规范训练
自学导引
1. 分类变量和列联表 不同类别 , (1)分类变量:变量的不同“值”表示个体所属的_________ 像这样的变量称为分类变量. (2)列联表
频数表 ,称为列联表. ①定义:列出的两个分类变量的_______
来理解.例如:对于性别变量,其取值有“男”和“女”两 种,这里的“变量”指的是“性别”,这里的“值”指的是“男”
或“女”.因此,这里说的“变量”和“值”不一定是取具体的
数值. (2)分类变量是大量存在的.例如:吸烟变量有吸烟与不 吸烟两种类别,而国籍变量则有多种类别.
2.独立性检验 利用随机变量K2来判断“两个分类变量有关系”的方法 定义 称为独立性检验
课前探究学习 课堂讲练互动 活页规范训练
为了是不同样本容量的数据有一个统一的标准, 构造一个随即变量(a,b,c,d均必须大于5)
2 n ( ad bc ) 2 K ,其中n=a+b+c+d为样本容量 (a b)(c d )(a c)(b d )
在假设H 0成立的前提下,K 2的观测值k 应该比较小 因此,当k 很小时,说明在一定的可信程度上H 0成立; k 很大时,说明没有充分的证据说明H 0成立。
临界值表:
P( K 2 k0 ) 0.50 k0 0.44 5
0.40 0.70 8 0.25 1.32 3 0.15 2.07 2 0.10 2.70 6 0.05 3.84 1 0.02 5 5.02 4 0.01 0 6.63 5 0.00 5 7.87 9 0.001 10.828
课前探究学习
秃顶 不秃顶 总计
患心脏病 患其他病 214 175 451 597 665 772 总计 389 1048 1437
课前探究学习
课堂讲练互动
活页规范训练
通过图形直观判断
因此秃顶与患心脏病有关 不患病 比例
患病 比例 秃顶 不秃顶
课前探究学习 课堂讲练互动 活页规范训练
(2)根据列联表的数据,得到
列联表:
不吸烟 吸烟 总计
7775 2099 9874
那么吸烟是否会患肺癌有影响?
课前探究学习
课堂讲练互动
活页规范训练
通过图形直观判断
不患病 比例
患病 比例
课前探究学习
课堂讲练互动
活页规范训练
假设H0:吸烟与患肺癌没有关系
不患肺癌
不吸烟 吸烟 总计
患肺癌
总计
a c a+c
b d b+d
a+b c+d a+b+c+d
②2×2列联表:一般地,假设两个分类变量X和Y,它们的 取值分别为{x1,x2}和{y1,y2},其样本频数列联表(称2×2 列联表)为 x1 x2 总计 y1 a c a+c y2 b d b+d 总计 a+b c+ d a+b+c+d
想一想:如何理解分类变量?
提示
(1)这里的“变量”和“值”都ห้องสมุดไป่ตู้作为“广义”的变量和值
课堂讲练互动
活页规范训练
例1.在某医院,因为患心脏病而住院的665名男
性病人中,有214人秃顶,而另外772名不是因为患 心脏病而住院的男性病人中有175人秃顶。 (1)利用图形判断秃顶与患心脏病是否有关系。 (2)能否在犯错误的概率不超过0.01的前提下认为 秃顶与患心脏病有关系吗? 解:根据已知的数据得到如下列联表:
k大小的标准是什么呢?
临界值k0
课前探究学习 课堂讲练互动 活页规范训练
独立性检验
首先,假设结论不成立,即 H :两个分类变量没有关系
(在这种假设下k应该很小)
其次,由观测数据计算K 的观测值k,
(如果k很大,则在一定可信程度上说明H 不成 立,即两个分类变量之间有关系)
2
最后,根据k的值判断假设是否成立
判断学生的数学成绩好坏与对学习数学的兴趣是否有关?
解 由公式得 K 的观测值
解 由公式得 K 的观测值 86×103×95×94
2
189× 64×73-22×30 k189 = ×64×73-22×302 ≈38.459. 86 × 103 × 95 × 94 k= ≈38.459.
因此,在犯错误的概率不超过0.001 趣与数学成绩是有关的. 趣与数学成绩是有关的. 的前提下认为数学成绩好坏与对学习 数学的兴趣有关。
3.2
【课标要求】
独立性检验的基本思想 及其初步应用
1. 了解独立性检验的基本思想、方法及其简单应用; 2. 理解判断两个分类变量是否有关系的常用方法、独立性检 验中K2的含义及其实施步骤. 【核心扫描】 1.能够根据题目所给数据列出列联表及求K2.(重点) 2.独立性检验的基本思想和方法.(难点)
P(K2≥6.635)≈0.01的含义是在犯错误的概率不超过0.01的
前提下,认为两变量相关; 而P(K2≥10.828)≈0.001的含义是在犯错误的概率不超过 0.001的前提下,认为两变量相关.
为了调查吸烟是否对患肺癌有影响,某肿瘤研究所随 机的调查了9965人,得到结果如下(单位:人)
不患肺癌 患肺癌 42 49 91 总计 7817 2148 9965
3. 独立性检验临界值表
P(K2 ≥k 0 )
0.50 0.40 0.25 0.15 0.10 0.05 0.025 0.010 0.005 0.001
k0
0.455 0.708 1.323 2.072 2.706 3.841 5.024 6.635 7.879 10.828
想一想:在K2运算时,在判断变量相关时,若K2的观测值k= 56.632,则P(K2≥6.635)≈0.01和P(K2≥10.828)≈0.001, 哪种说法是正确的? 提示 两种说法均正确.
1437 (214 597 175 451) 2 k 16.373 6.635 389 1048 665 772
因此,在犯错误的概率不超过0.01的前提 下认为秃顶与患心脏病有关。
课前探究学习
课堂讲练互动
活页规范训练
【变式1】 为研究学生的数学成绩与对学习数学的兴趣是否有 关,对某年级学生作调查得到如下数据: 成绩优秀 兴趣浓厚的 兴趣不浓厚的 总计 64 22 86 成绩较差 30 73 103 总计 94 95 189
假设吸烟与患肺癌没有关系,那么吸烟者中不患肺癌 的比例应该与不吸烟者中相应的比例差不多即
a c ab cd ad bc 0
即
a (c d ) c ( a b )
因此 ad bc 越小说明吸烟与患肺癌之间关系越弱; 因此 ad bc 越大说明吸烟与患肺癌之间关系越强。
2
2
∵ 38.459 > 10.828 ,∴有 99.9% 的把握说学 ∵38.459>10.828,∴有 99.9%的把握说学生学