高二数学独立性检验
【高中数学】列联表与独立性检验(课件) 高二数学(人教A版2019选择性必修第三册)

这种利用 2的取值推断分类变量X和Y是否独立的方法称为 2独立性检验,
简称独立性检验 .
探究新知
下表为独立性检验中几个常用的小概率值和相应的临界值
α
xα
0.1
2.706
0.05
3.841
0.01
6.635
0.005
7.879
0.001
根据小概率值α=0.001的独立性检验,推断H0不成立,即认为吸烟与
患肺癌有关联,此推断犯错误的概率不大于0.001.
典型例题
根据表中数据计算,不吸烟者中不患肺癌和患肺癌的频率分别为
7775/7817≈0.9946 和 42/7817≈0.0054
吸烟者中不患肺癌和患肺癌的频率分别为
2099/2148≈0.9772 和 49/2148≈0.0228
中有 43 人的饮食以蔬菜为主,另外 27 人则以肉类为主;六十岁以下的人中有
21 人饮食以蔬菜为主,另外 33 人则以肉类为主.请根据以上数据作出饮食习
惯与年龄的列联表,并利用 P(Y=1|X=0)与 P(Y=1|X=1)判断二者是否有关系.
[解]
用 Ω 表示共调查了 124 人所构成的集合,定义一对分类变量 X 和 Y
性数有无差别,铅中毒病人与尿棕色素为阳性是否有关系?
探究新知
[解]
病人组中尿液为阳性和阴性的频率分别为:
29
7
≈0.805 6 和 ≈0.194 4.
36
36
对照组中尿液为阳性和阴性的频率分别为:
9
28
≈0.243 2 和 ≈0.756 8.
37
37
高二数学独立性检验

口服 注射 合计
有效 58 64 122
无效 40 31 71
合计 98 95 193
例题选讲 例2.气管炎是一种常见的呼吸道疾病,医药研究人员
对两种中草药治疗慢性气管炎的疗效进行对比,所 得数据如图所示,问:它们的疗效有无差异.
复方江剪刀草 胆黄片 合计
有效 184 91 275
无效 61 9 70
; SEO优化服务 搜索引擎排名服务
练习一 1.以下关于独立性检验的说法中,正确说法的序号
是—①——③—④——. ①独立性检验依赖于小概率原理;
②独立性检验得到的结论一定正确;
③样本不同,独立性检验的结论可能有差异;
④独立性检验不是判断两事物是否相关的唯一方法.
复习回顾 1.用χ2统计量来研究两个分类变量之间的相关关系的
方法称为—独——立—性——检—验——. 2.在2×2列联表中,计算卡方χ2统计量的公式是——.
3.一般地,对于两个研究对象Ⅰ和Ⅱ,Ⅰ和Ⅱ分别有两 类取值,要推断“Ⅰ和Ⅱ有关系”可按下面的步骤进 行: ①提出假设H0:—————————; ②根据2×2列联表与χ2公式计算χ2的值; ③查对————,作出判断.
练习二 3.调查者询问72名男女大学生在购买食品时是否看
营养说明,得到如表所示的数据,从表中的数据分析 大学生的性别与看不看营养说明之间有没有关系?
男大学生 女大学生
合计
看营养说 明
28 16 44
不看营养说 明 8
20 28
合计
36 36 72
Hale Waihona Puke 练习二 4.网络对现代人的生活影响较大,尤其是青少年.为了
复习回顾
4.①若观测值χ2—≥—10.828,则有99,9%的把握认为 “Ⅰ
8.3列联表与独立性检验课件-高二数学人教A版选择性必修第三册

自主学习
2. 2×2 列联表:
一般地,假设有两个分类变量 X 和 Y,它们的取值分别为{x1,x2}和{y1,y2},其
样本频数列联表(称为 2×2 列联表)为
y1
y2
合计
x1 x2 合计
a c a+c
b d b+d
a+b c+d a+b+c+d
自主学习
(1)列联表是两个或两个以上分类变量的汇总统计表,现阶段我们仅研究 两个分类变量的列联表,并且每个分类变量只取两个值,这样的列联表 称为2×2列联表. (2)列联表有助于直a 观地观测数据之间的关系,如a表示既满足x1,又满 足y1的样本量,a+b 表示在x1情况下,又满足y1条件的样本所占的频率.
课后作业
对应课后练习
经典例题
题型二 独立性检验
解: (1)2×2 列联表如表所示:
教师年龄
对新课程教学模式
赞同
不赞同
老教师
10
10
青年教师
24
6
合计
34
16
合计
20 30 50
经典例题
题型二 独立性检验
(2)零假设为 H0:对新课程教学模式的赞同情况与教师年龄无关.
由公式得
χ2=50×
10×6-24×10 34×16×20×30
63
117
180
女生
42
82
124
合计
105
199
304
根据表中数据,则下列说法正确的是________.(填序号) ①性别与知道想学专业有关; ②性别与知道想学专业无关; ③女生比男生更易知道所学专业.
当堂达标
② 解析:
χ2=304×1806×31×2842×-10452××119197
8.3.2独立性检验 课件—高二下数学人教A版(2019)选择性必修第三册

P( x )
2
临界值xα
的方法称为χ2独立性检验,
读作“卡方独立性检验”,
简称独立性检验.
概率值α越小,临界值xα越大.
这种利用χ2的取值推断分类变量X和Y是否独立的方法称为χ2独立
性检验,读作“卡方独立性检验”,简称独立性检验.
犯错误的
概率
例2: 依据小概率值α=0.1的χ2独立性检验,分析例1中的抽样数据,
甲校
乙校
合计
你认为“两校学生的数
学成绩优秀率存在差异”
这一结论是否有可能是
错误的?
因此,需要找到一种更为合理的推断方法,希望能对出现错误
判断的概率有一定的控制或估算。
本节课给到一个方法:独立性检验
独立性检验是一种“概率反证法”。依据是小概率原理(在一次实
验中几乎不可能发生)
找到了,假设不成立,嫌
疑人有罪。
例4 :为研究吸烟是否与肺癌有关,某肿瘤研究所采取有放回简单随机
抽样的方法,调查了9965人,得到成对样本观测数据的分类统计结果,
如下表所示. 依据小概率值α=0.001的独立性检验,分析吸烟是否会增加
患肺癌的风险.
解:零假设为H0: 吸烟与患肺癌之间
无关联,由表中数据可得
9965(7775 49 42 2099)
数学成绩
不优秀
优秀
合计
甲校
乙校
合计
解:零假设为H0:分类变量X与Y相互独立,即两校学生的数学成绩优
秀率无差异根据表中的数据,计算得到
2
88
(33
7
10
38)
2
0.837 2.706 x0.1
【教案】独立性检验(第一课时)教学设计高二下学期数学人教A版(2019)选择性必修第三册

课程名称高中数学选择性必修第三册第八章8.3.2独立性检验教学设计课时第一课时1.教材内容分析独立性检验是研究随机变量独立性的一种统计方法,为了解总体中两个分类变量是否相互独立,可以从总体中抽取简单随机样本,整理成一个2x2的列联表,独立性检验就是根据列联表检验两个分类变量是否相互独立。
独立性检验本质上是一种概率推断,是一种依据概率进行“二中选一”的方法,即根据样本数据,在“H0:无实质差异”与H1:有实质差异”这两种推断中选择其一,这是一种“概率反证法”,通过样本构造的小概率事件是否出现来判断总体假设的真伪。
独立性检验的数学基础是条件概率与独立事件概率的乘法公式,其推断步骤可分为:第一步,提出想验证的假设H0,称为零假设;第二步,若假设H0成立,构造一个只有在小概率α的情况下才能观察到的现象χ2;第三步,依据样本数据确认是否观察到了现象χ2;第四步,若能观察到现象χ2的情况下,则推断假设H0是错误的,此时便可以拒绝H0,而选择假设H1;第五步,若未能观察到现象χ2,则无法拒绝假设H0,可选择假设H0。
独立性检验是从样本数据中发现关系,是成对样本数据统计分析的重要内容,是依据数据进行合理推理的典型方法,体现了数学的理性精神,也是提升数据分析和逻辑推理素养的重要素材。
基于以上分析,确定本节课的重点:独立性检验的基本思想和独立性检验的基本方法。
2.学习者特征分析本节内容对学生来说难度较大,涉及的基础知识有古典概型、条件概率、频率稳定到概率的原理及分类变量独立性的概念,涉及的统计思想方法主要是假设检验的思想方法。
教科书结合丰富的实例,通过问题引导,采取了由易到难、逐步深人的处理方式,使学生了解独立性检验的基本思想。
在本节教学中,应通过具体案例渗透独立性检验的基本思想和方法,使学生了解统计推断可能犯错误的特点,避免单纯地记忆独立性检验的基本步骤和机械地套用公式解决问题。
应注重培养学生理论联系实际的意识,提高学生解决实际问题的能力.3.教学目标知识目标:基于2×2列联表,通过实例了解独立性检验的基本思想;能力目标:熟练掌握独立性检验的基本步骤;素养目标:会用独立性检验解决简单的实际问题,提升数据分析能力。
高二数学人选修课件第三章独立性检验的基本思想及其初步应用

Fisher确切概率法
定义
Fisher确切概率法是一种基于超几何分布的假设检验方法,用于检验两个分类变量之间 的独立性。
原理
Fisher确切概率法通过计算所有可能的表格排列组合中,比观察结果更极端或同样极端 的表格出现的概率之和,从而得到检验统计量的精确分布,并据此进行假设检验。
应用场景
适用于样本量较小或列联表中有格子期望频数过小的情况,此时卡方检验可能不再适用 。
自由度
在独立性检验中,自由度通常等于(行数-1)*(列 数-1),用于调整卡方统计量的分布。
显著性水平
用于判断拒绝原假设的可靠程度,通常取0.05或 0.01。
独立性检验的意义
80%
判断分类变量是否独立
通过独立性检验,可以判断两个 分类变量是否独立,从而进一步 分析它们之间的关系。
100%
为后续分析提供基础
05
实例分析:独立性检验的应用
实例一:医学研究中基因与疾病关联性的分析
01
02
03
04
研究目的
探讨特定基因与某种疾病之间 的关联性,为疾病的预防、诊 断和治疗提供依据。
数据收集
收集大量患者的基因数据和疾 病信息,以及健康人群的基因 数据作为对照。
独立性检验
利用独立性检验的方法,分析 基因与疾病之间是否存在统计 学上的显著关联。
结果解读
如果检验结果显示产品满意度与品牌忠诚度之间 存在显著关联,则企业可以针对提高产品满意度 来增强消费者的品牌忠诚度。
实例三
研究目的
数据收集
探讨教育水平与职业成功之间的关系,为 教育政策制定和职业规划提供依据。
收集大量个体的教育水平数据和职业成功 指标(如收入、职位等),以及可能影响 职业成功的其他因素数据。
独立性检验的基本思想及其初步应用参考模板范本

反证法原理与独立性检验原理
反证法原理:
在一个已知假设 下,如果推出一 个矛盾,就证明 了这个假设不成 立。
独立性检验原理:
在一个已知假设下, 如果一个与该假设 矛盾的小概率事件 发生,就推断这个 假设不成立。
患肺癌 42 0.54% 49 2.28% 91
总计 7817 2148 9965
100%
90%
等
80%
高
70%
条
60%
形
50%
图
40%
30%
20%10%0%源自不吸烟吸烟患肺癌 不患肺癌
不吸烟
吸烟 总计
不患肺癌 a
c a+c
患肺癌 b
d b+d
总计 a+b
c+d a+b+c+d
问3:a、b、c、d应该满足怎样的关系?
高二数学 选修 2-3
第三章 统计案例
3.2
独立性检验的
基本思想及其初步应用
视频
问题1 心脏病、肺癌、脑血管病等都与吸烟有关, 吸烟已成为继高血压之后的第二号全球杀手。 这些疾病与吸烟有关的结论是怎样得出的呢?
案 例:某肿瘤研究所为了研究吸烟是否对患肺癌 有影响,进行了一次随机抽样调查,共调查了9965 个成年人,其中吸烟者2148人,不吸烟者7817人。 调查结果如下表所示:
解:列出吸烟与是否患肺癌的2x2列联表如下
不吸烟 吸烟 总计
不患病 7775 2099 9874
患病 42 49 91
总计 7817 2148 9965
独立性检验(课件)高二数学(人教A版2019选修第三册)

|ad-bc|越大,说明玩电脑游戏与注意力集中之间的关系越强.
为了使不同样本容量的数据有统一的评判标准,我们构造一个随
机变量
n(ad-bc)2 χ2=
(a+b)(c+d)(a+c)(b+d)
这种利用χ2的取值推断分类变量X和Y是否独立的方法称为χ2独立性 检验,读作卡方独立性检验,简称独立性检验.
若H0成立,即玩电脑游戏与注意力集中没有关系,则χ2应该 很小;若H0不成立,即玩电脑游戏与注意力集中有关系,则χ2应 该很大.那么,究竟χ2大到什么程度,可以推断H0不成立呢?
2 88(33 7 10 38)2
43 45 7117
α
0.1 0.05 0.01 0.005
xα 2.706 3.841 6.635 7.879
学校
甲校(X=0) 乙校(X=1)
合计
数学成绩
不优秀(Y=0) 优秀(Y=1)
33
10
38
7
71
17
0.001 10.828
合计
43 45 88
0.837 2.706 x0.1.
于不同的小概率值α的检验规则,对应不同的临界值x0,其与χ2的大小关 系可能不同,相当于检验的标准发生变化,因此结论可能会不同.
3. 为考察某种药物A对预防疾病B的效果,进行了动物试验,根据105个有
放回简单随机样本的数据,得到如下列联表: 依据α=0.05的独立性检验,分析药物A对
药物A
疾病B 未患病 患病
解:根据题意,可得
xα 2.706 3.841 6.635 7.879 10.828
2 4.881 3.841 x0.05 .
根据小概率值α=0.05的χ2独立性检验,推断H0不成立,即认为两种疗 法的效果有差异,该推断犯错误的概率不超过0.05.
独立性检验

不
独立性检验的定义
上面这种利用随机变量K 上面这种利用随机变量 2来确定在多大程度上 可以认为“两个分类变量有关系”的方法, 可以认为“两个分类变量有关系”的方法,称为两 个分类变量的独立性检验 独立性检验。 个分类变量的独立性检验。
独立性检验的基本思想(类似反证法) 独立性检验的基本思想(类似反证法) 反证法
研究两个变量的相关关系:
定量变量——回归分析(画散点图、相关系数r ——回归分析 定量变量——回归分析(画散点图、相关系数r、 相关指数R 残差分析) 变量 相关指数R 2、残差分析) 分类变量—— 独立性检验 分类变量——
本节研究的是两个分类变量的独立性检验问题。
探究
列联表
为了调查吸烟是否对肺癌有影响, 为了调查吸烟是否对肺癌有影响,某肿瘤研究所随机 地调查了9965 9965人 得到如下结果(单位: 地调查了9965人,得到如下结果(单位:人)
二:求解假设检验问题
考虑假设检验问题: 考虑假设检验问题: H0:面包分量足 ←→ H1:面包分量不足 求解思路: 求解思路: 1. 在H0成立的条件下,构造与 0矛盾的小概 成立的条件下,构造与H 率事件; 率事件; 2. 如果样本使得这个小概率事件发生,就能 如果样本使得这个小概率事件发生, 以一定把握断言H 成立;否则, 以一定把握断言 1成立;否则,断言没有 发现样本数据与H 相矛盾的证据。 发现样本数据与 0相矛盾的证据。
的观测值k是大还是小呢 是大还是小呢? 怎样判断K2的观测值 是大还是小呢?
这仅需要确定一个正数 k0 ,当 k ≥ k0 时就认为K2的观测 的判断规则为: 值 k大。此时相应于 k0 的判断规则为: 大
0
就认为“两个分类变量之间有关系” 如果 k ≥ k0 ,就认为“两个分类变量之间有关系”;否则 就认为“两个分类变量之间没有关系” ----临界值 就认为“两个分类变量之间没有关系”。 临界值 k
高二数学(选修2-3人教B版)-独立性检验1

例4.在对人们的休闲方式的一次调查中,共调查了124人,其 中女性70人,男性54人.女性中有43人主要的休闲方式是看电 视,另外27人主要的休闲方式是运动;男性中有21人主要的休 闲方式是看电视,另外33人主要的休闲方式是运动. (1)根据以上数据建立一个2×2列联表; (2)判断性别与休闲方式是否有关系.
因为7.469 6.635,所以我们有99%的把握说,50岁以上的人
患慢性气管炎与吸烟习惯有关.
2 2列联表独立性检验的步骤: (1)根据样本数据制成 22 列联表;
2 2列联表独立性检验的步骤: (1)根据样本数据制成 22 列联表; (2)根据公式计算 的值;
2 2列联表独立性检验的步骤: (1)根据样本数据制成 22 列联表; (2)根据公式计算 的值; (3)比较 的值与临界值的大小关系作统计推断.
当事件A与B相互独立时,事件A 与B,A与 B , A 与 B 也独立.
例2 为了探究慢性气管炎是否与吸烟有关,调查了339 名50岁以上的人,调查结果如下表所示:
吸烟 不吸烟 合计
患慢性气管炎 未患慢性气管炎
43
162
13
121
56
283
合计 205 134 339
试问:50岁以上的人患慢性气管炎与吸烟习惯有关吗?
若 c = c d a c 成立,则可以认为 A与 B 独立. nn n
同理若 b = a b b d 成立,则可以认为A与 B 独立. nn n
若 c = c d a c 成立,则可以认为 A与 B 独立. nn n
若 d = c d b d 成立,则可以认为 A与 B 独立. nn n
计算统计量
2=
n(ad bc)2
高二数学独立性检验知识点

高二数学独立性检验知识点独立性检验是高中数学中的重要概念之一,用于判断两个或多个事件是否相互独立。
在数学考试中,独立性检验经常被应用于概率统计等相关题目。
本文将详细介绍高二数学中的独立性检验知识点,帮助同学们更好地理解和应用。
一、独立性的定义和特性在进行独立性检验之前,我们首先需要了解独立性的定义和特性。
在概率统计中,两个事件A和B的独立性表示事件A的发生与事件B的发生是互相独立的,即A的发生不影响B的发生,反之亦然。
独立性的特性包括以下几个方面:1. 互斥性:如果A和B互斥(即A和B不能同时发生),则A和B是相互独立的。
2. 互不影响性:如果A和B是相互独立的,那么A和B的补事件也是相互独立的。
即P(A) = 1 - P(A'),P(B) = 1 - P(B')。
3. 乘法法则:如果A和B是相互独立的,那么P(A∩B) = P(A) × P(B)。
二、独立性检验方法在实际应用中,我们需要通过数据分析或实验来判断两个事件是否独立。
针对不同情况,有不同的独立性检验方法。
1. 经验法:当数据较少或不能进行大样本实验时,我们可以使用经验法来判断独立性。
经验法主要是通过观察、比较和思考来判断两个事件是否独立。
2. 理论法:当数据比较充足并且满足一定的条件时,我们可以使用理论法来进行独立性检验。
理论法主要是基于概率计算和统计推断来判断独立性。
三、常见的独立性检验方法在高二数学中,常见的独立性检验方法包括以下几种:1. 卡方检验:卡方检验是一种针对频数资料的检验方法,用于检验两个事件是否独立。
通过计算观察频数和期望频数之间的差异来判断独立性。
2. 相关系数检验:相关系数检验可以用于判断两个事件之间是否存在线性相关性。
当两个事件呈现出线性相关性时,它们往往是不独立的。
3. 二项分布检验:二项分布检验可以用于判断两个事件的独立性。
当事件满足二项分布的条件时,可以通过计算观察值与理论值之间的差异来判断独立性。
8.3.2独立性检验(解析版)

独立性检验【学习目标】1.了解独立性检验的基本思想、方法及其简单应用2.理解判断两个分类变量是否有关系的常用方法、独立性检验中K2的含义及其实施步骤【自主学习】知识点独立性检验(1)定义:利用随机变量K2来判断“两个分类变量有关系”的方法称为独立性检验.(2)K2=n(ad-bc)2(a+b)(c+d)(a+c)(b+d),其中n=a+b+c+d.(3)独立性检验的具体做法①根据实际问题的需要确定容许推断“两个分类变量有关系”犯错误概率的上界α,然后查表确定临界值k0.②利用公式计算随机变量K2的观测值k.③如果k≥k0,就推断“X与Y有关系”,这种推断犯错误的概率不超过α,否则就认为在犯错误的概率不超过α的前提下不能推断“X与Y有关系”,或者在样本数据中没有发现足够证据支持结论“X与Y有关系”.【合作探究】探究一 有关“相关的检验”【例1】某校对学生课外活动进行调查,结果整理成下表:用你所学过的知识进行分析,能否在犯错误的概率不超过0.005的前提下,认为“喜欢体育还是文娱与性别有关系”?解 判断方法如下:假设H 0“喜欢体育还是喜欢文娱与性别没有关系”,若H 0成立,则K 2应该很小. ∵a =21,b =23,c =6,d =29,n =79, ∴K 2=n (ad -bc )2(a +b )(c +d )(a +c )(b +d )=79×(21×29-23×6)244×35×27×52≈8.106.且P (K 2≥7.879)≈0.005即我们得到的K 2的观测值k ≈8.106超过7.879,这就意味着:“喜欢体育还是文娱与性别没有关系”这一结论成立的可能性小于0.005,即在犯错误的概率不超过0.005的前提下认为“喜欢体育还是喜欢文娱与性别有关”.归纳总结:(1)利用K 2=n (ad -bc )2(a +b )(c +d )(a +c )(b +d )求出K 2的观测值k 的值.再利用临界值的大小来判断假设是否成立.(2)解题时应注意准确代数与计算,不可错用公式,准确进行比较与判断.【练习1】为研究学生的数学成绩与对学习数学的兴趣是否有关,对某年级学生作调查得到如下数据:判断学生的数学成绩好坏与对学习数学的兴趣是否有关? 解 由公式得K 2的观测值k =189×(64×73-22×30)286×103×95×94≈38.459.∵38.459>10.828,∴有99.9%的把握说学生学习数学的兴趣与数学成绩是有关的.探究二 有关“无关的检验”【例2】为了探究学生选报文、理科是否与对外语的兴趣有关,某同学调查了361名高二在校学生,调查结果如下:理科对外语有兴趣的有138人,无兴趣的有98人,文科对外语有兴趣的有73人,无兴趣的有52人.分析学生选报文、理科与对外语的兴趣是否有关? 解 列出2×2列联表代入公式得K 2的观测值k =361×(138×52-73×98)2236×125×211×150≈1.871×10-4.∵1.871×10-4<2.706,∴可以认为学生选报文、理科与对外语的兴趣无关.归纳总结:运用独立性检验的方法:(1)列出2×2列联表,根据公式计算K 2的观测值k . (2)比较k 与k 0的大小作出结论.【练习2】第16届亚运会于2010年11月12日至27日在中国广州进行,为了搞好接待工作,组委会招募了16名男志愿者和14名女志愿者,调查发现,男、女志愿者中分别有10人和6人喜爱运动,其余人不喜爱运动. (1)根据以上数据完成以下2×2列联表:(2)根据列联表的独立性检验,能否在犯错误的概率不超过0.10的前提下认为性别与喜爱运动有关? 解 (1)(2)假设是否喜爱运动与性别无关,由已知数据可求得: K 2=30×(10×8-6×6)2(10+6)(6+8)(10+6)(6+8)≈1.157 5<2.706,因此,在犯错误的概率不超过0.10的前提下不能判断喜爱运动与性别有关.探究三 独立性检验的基本思想【例3】某企业有两个分厂生产某种零件,按规定内径尺寸(单位:mm)的值落在(29.94,30.06)的零件为优质品.从两个分厂生产的零件中各抽出500件,量其内径尺寸,结果如下表: 甲厂乙厂(1)试分别估计两个分厂生产的零件的优质品率;(2)由以上统计数据填下面2×2列联表,并问是否有99%的把握认为“两个分厂生产的零件的质量有差异”.附:K 2=n (ad -bc )(a +b )(c +d )(a +c )(b +d ),解 (1)甲厂抽查的产品中有360件优质品,从而甲厂生产的零件的优质品率估计为360500=72%;乙厂抽查的产品中有320件优质品,从而乙厂生产的零件的优质品率估计为320500=64%.(2)K 2=1 000×(360×180-320×140)2500×500×680×320≈7.353>6.635,所以有99%的把握认为“两个分厂生产的零件的质量有差异”.归纳总结:(1)解答此类题目的关键在于正确利用K 2=n (ad -bc )2(a +b )(c +d )(a +c )(b +d )计算k 的值,再用它与临界值k 0的大小作比较来判断假设检验是否成立,从而使问题得到解决.(2)此类题目规律性强,解题比较格式化,填表计算分析比较即可,要熟悉其计算流程,不难理解掌握.【练习3】下表是某地区的一种传染病与饮用水的调查表:(1)这种传染病是否与饮用水的卫生程度有关,请说明理由;(2)若饮用干净水得病5人,不得病50人,饮用不干净水得病9人,不得病22人.按此样本数据分析这种疾病是否与饮用水有关,并比较两种样本在反映总体时的差异.解 (1)假设H 0:传染病与饮用水无关.把表中数据代入公式得:K 2的观测值k =830×(52×218-466×94)2146×684×518×312≈54.21,∵54.21>10.828,所以拒绝H 0.因此我们有99.9%的把握认为该地区这种传染病与饮用不干净水有关. (2)依题意得2×2列联表:此时,K 2的观测值k =86×(5×22-50×9)14×72×55×31≈5.785.由于5.785>5.024,所以我们有97.5%的把握认为该种疾病与饮用不干净水有关.两个样本都能统计得到传染病与饮用不干净水有关这一相同结论,但(1)中我们有99.9%的把握肯定结论的正确性,(2)中我们只有97.5%的把握肯定.课后作业A组基础题一、选择题1.经过对K2的统计量的研究,得到了若干个临界值,当K2的观测值k>3.841时,我们() A.在犯错误的概率不超过0.05的前提下可认为X与Y有关B.在犯错误的概率不超过0.05的前提下可认为X与Y无关C.在犯错误的概率不超过0.01的前提下可认为X与Y有关D.没有充分理由说明事件X与Y有关系【答案】A2.用独立性检验来考察两个分类变量x与y是否有关系,当统计量K2的观测值() A.越大,“x与y有关系”成立的可能性越小B.越大,“x与y有关系”成立的可能性越大C.越小,“x与y没有关系”成立的可能性越小D.与“x与y有关系”成立的可能性无关【答案】B3.在一个2×2列联表中,由其数据计算得K2的观测值k=7.097,则这两个变量间有关系的可能性为()A.99% B.99.5%C.99.9% D.无关系【答案】A解析K2的观测值6.635<k<7.879,所以有99%的把握认为两个变量有关系.4.对两个分类变量A,B的下列说法中正确的个数为()①A与B无关,即A与B互不影响;②A与B关系越密切,则K2的值就越大;③K2的大小是判定A与B是否相关的唯一依据A.0 B.1 C.2 D.3【答案】B解析①正确,A与B无关即A与B相互独立;②不正确,K2的值的大小只是用来检验A 与B是否相互独立;③不正确,例如借助三维柱形图、二维条形图等.故选B.5.考察棉花种子经过处理跟生病之间的关系得到下表数据:根据以上数据,可得出()A.种子是否经过处理跟是否生病有关B.种子是否经过处理跟是否生病无关C.种子是否经过处理决定是否生病D.以上都是错误的【答案】B解析由K2=407×(32×213-61×101)293×314×133×274≈0.164<2.706,即没有把握认为种子是否经过处理跟是否生病有关. 二、填空题 6.根据下表计算:K 2的观测值k ≈________(保留3位小数). 【答案】 4.514解析 k =300×(37×143-85×35)2122×178×72×228≈4.514.7.如果K 2的观测值为6.645,可以认为“x 与y 无关”的可信度是________. 【答案】 1%解析 查表可知可信度为1%.8.为了解高中生作文成绩与课外阅读量之间的关系,某研究机构随机抽取了60名高中生,通过问卷调查,得到以下数据:由以上数据,计算得到K 2的观测值k ≈9.643,根据临界值表,有________把握认为课外阅读量大与作文成绩优秀有关. 【答案】 99.5%解析根据临界值表,9.643>7.879,在犯错误的概率不超过0.005的前提下,认为课外阅读量大与作文成绩优秀有关,即有99.5%的把握认为课外阅读量大与作文成绩优秀有关.9.为研究某新药的疗效,给50名患者服用此药,跟踪调查后得下表中的数据:设H0:服用此药的效果与患者的性别无关,则K2的观测值k≈________(小数点后保留三位有效数字),从而得出结论:服用此药的效果与患者的性别有关,这种判断出错的可能性为________.【答案】 4.8825%解析由公式计算得K2的观测值k≈4.882,∵k>3.841,∴我们有95%的把握认为服用此药的效果与患者的性别有关,从而有5%的可能性出错.三、解答题10.高中流行这样一句话“文科就怕数学不好,理科就怕英语不好”.下表是一次针对高三文科学生的调查所得数据,试问:在出错概率不超过0.025的前提下,能否判断“文科学生总成绩不好与数学成绩不好有关系”?解依题意,计算随机变量K2的观测值:k =913×(478×24-399×12)2490×423×877×36≈6.233>5.024,所以在出错概率不超过0.025的前提下,可以判断“文科学生总成绩不好与数学成绩不好有关系”.11.吃零食是中学生中普遍存在的现象,吃零食对学生身体发育有诸多不利影响,影响学生的健康成长.下表是性别与吃零食的列联表:请问喜欢吃零食与性别是否有关?解K 2=n (ad -bc )2(a +b )(c +d )(a +c )(b +d ),把相关数据代入公式,得 K 2的观测值k =85×(5×28-40×12)217×68×45×40≈4.722>3.841.因此,在犯错误的概率不超过0.05的前提下,可以认为“喜欢吃零食与性别有关”. 12.在某校对有心理障碍学生进行测试得到如下列联表:试说明在这三种心理障碍中哪一种与性别关系最大?解 对于题中三种心理障碍分别构造三个随机变量K 21,K 22,K 23.其观测值分别为k 1,k 2,k 3.由表中数据列出焦虑是否与性别有关的2×2列联表可得k 1=110×(5×60-25×20)30×80×25×85≈0.863<2.706,同理,k 2=110×(10×70-20×10)230×80×20×90≈6.366>5.024,k 3=110×(15×30-15×50)230×80×65×45≈1.410<2.706.因此,在犯错误的概率不超过0.025的前提下,认为说谎与性别有关,没有充分的证据显示焦虑、懒惰与性别有关.B组能力提升一、选择题1.千百年来,我国劳动人民在生产实践中根据云的形状、走向、速度、厚度、颜色等的变化,总结了丰富的“看云识天气”的经验,并将这些经验编成谚语,如“天上钩钩云,地上雨淋淋”“日落云里走,雨在半夜后”……小波同学为了验证“日落云里走,雨在半夜后”,观察了所在地区A的100天日落和夜晚天气,得到如下2×2列联表:0010并计算得到219.05K≈,下列小波对地区A天气判断不正确的是()A. 夜晚下雨的概率约为1 2B. 未出现“日落云里走”夜晚下雨的概率约为5 14C. 有99.9%的把握认为“‘日落云里走’是否出现”与“当晚是否下雨”有关D. 出现“日落云里走”,有99.9%的把握认为夜晚会下雨【答案】:D【分析】把频率看作概率,即可判断,A B的正误;根据独立性检验可判断,C D的正误,即得【答案】.【详解】由题意,把频率看作概率可得:夜晚下雨的概率约为252511002+=,故A正确;未出现“日落云里走”夜晚下雨的概率约为255254514=+,故B正确;由219.0510.828K≈>,根据临界值表,可得有99.9%的把握认为“‘日落云里走’是否出现”与“当晚是否下雨”有关,故C正确;故D错误.故选:D.2.为了判断英语词汇量与阅读水平是否相互独立,某语言培训机构随机抽取了100位英语学习者进行调查,经过计算2K的观测值为7,根据这一数据分析,下列说法正确的()附:A. 有99%以上的把握认为英语词汇量与阅读水平无关B. 有99.5%以上的把握认为英语词汇量与阅读水平有关C. 有99.9%以上的把握认为英语词汇量与阅读水平有关D. 在犯错误的概率不超过1%的前提下,可以认为英语词汇量与阅读水平有关 【答案】:D 【分析】由题意()26.6350.01P K ≥=,由独立性检验的原理即可得解.【详解】由题意27K =,()26.6350.01P K ≥=,所以在犯错误的概率不超过1%的前提下,可以认为英语词汇量与阅读水平有关,有99%的把握认为英语词汇量与阅读水平有关. 故选:D.3.通过随机询问110名性别不同的大学生是否爱好某项运动,得到如下的22⨯列联表:由22()()()()()n ad bc a b c d a c b d χ-=++++算得,22110(40302020)7.860506050χ⨯⨯-⨯=≈⨯⨯⨯.附表:参照附表,得到的正确结论是()A. 在犯错误的概率不超过0.1%的前提下,认为“爱好该项运动与性别有关”;B. 在犯错误的概率不超过0.1%的前提下,认为“爱好该项运动与性别无关”;C. 有99%以上的把握认为“爱好该项运动与性别有关”;D. 有99%以上的把握认为“爱好该项运动与性别无关”.【答案】:C【分析】根据给定的2K的值,结合附表,即可得到结论.【详解】由22110(40302020)7.8 6.63560506050χ⨯⨯-⨯=≈>⨯⨯⨯,所以有99%以上的把握认为“爱好该项运动与性别有关.故选:C.4.在一次独立性检验中得到如下列联表:若这两个分类变量A和B没有关系,则a的可能值是() A. 200 B. 720C. 100D. 180【答案】:B 【分析】令2k 的观测值为零,解方程即得解.【详解】当a =720时,k =0,易知此时两个分类变量没有关系. 故【答案】为B5.(多选题)针对时下的“抖音热”,某校团委对“学生性别和喜欢抖音是否有关”作了一次调查,其中被调查的男女生人数相同,男生喜欢抖音的人数占男生人数的45,女生喜欢抖音的人数占女生人数35,若有95%的把握认为是否喜欢抖音和性别有关则调查人数中男生可能有( )人 附表:附:()()()()()22n ad bc K a b c d a c b d -=++++ A. 25 B. 45C. 60D. 75【答案】:BC 【分析】设男生的人数为()5n n N*∈,列出22⨯列联表,计算出2K 的观测值,结合题中条件可得出关于n 的不等式,解出n 的取值范围,即可得出男生人数的可能值.【详解】设男生的人数为()5n n N*∈,根据题意列出22⨯列联表如下表所示:则()221042310557321n n n n n n K n n n n ⨯⨯-⨯==⨯⨯⨯,由于有95%的把握认为是否喜欢抖音和性别有关,则23.841 6.632K ≤<,即103.841 6.63221n≤<,得8.066113.9272n ≤<, n N *∈,则n 的可能取值有9、10、11、12,因此,调查人数中男生人数的可能值为45或60. 故选:BC. 二、填空题6.某手机运营商为了拓展业务,现对该手机使用潜在客户进行调查,随机抽取国内国外潜在用户代表各100名,调查用户对是否使用该手机的态度,得到如图所示的等高条形图.根据等高图,______(填“有”或“没有”)99.5%以上的把握认为持乐观态度和国内外差异有关.(参考公式与数据:()()()()()22n ad bc K a b c d a c b d -=++++,其中n a b c d =+++)()20P K k ≥0.05 0.01 0.005 0.001 0k3.841 6.635 7.879 10.828【答案】:有依题意,可知国内代表乐观人数60人,不乐观人数40人,国外乐观人数40人,不乐观人数60人,总计乐观人数100人,不乐观人数100人,所以,而,所以有99.5%以上的把握认为持乐观态度和国内外差异有关.7.给给给给给给给 给线性回归方程y bx a =+必过点(),x y ;给相关系数r 越小,表明两个变量相关性越弱; ()22200606040408100100100100K ⨯-⨯==⨯⨯⨯87.879>给相关指数2R 越接近1,表明回归的效果越好;给在一个2×2列联表中,由计算得2K 的观测值k =13.079,则有99%以上的把握认为这两个变量之间没有关系;给设有一个线性回归方程35y x =-,则变量x 增加一个单位时,y 平均增加5个单位. 其中正确的说法有 (填序号).【答案】:给给对于给,应该是相关系数r 的绝对值越小,表明两个变量相关性越弱.所以它是错误的.对于给,应该是有99%以上的把握认为这两个变量之间有关系.对于给,应该是变量x 增加一个单位时,y 平均减少5个单位.故填给给.三、解答题8.随着现代教育技术的不断发展,我市部分学校开办智慧班教学,某校从甲乙两智慧班各随机抽取45名学生,调查两个班学生对智慧课堂的评价:“满意”与“不满意”,调查中发现甲班评价“满意”的学生人数比乙班评价“满意”的学生人数多9人,根据调查情况制成如下图所示的2×2列联表:(1)完成2×2列联表,并判断能否有97.5%的把握认为评价与班级有关系?(2)从甲乙两班调查评价为“不满意”的学生中按照分层抽样的方法随机抽取7人,现从这7人中选派3人到校外参加智慧课堂研究活动,求其中至少有2人选自乙班学生的概率. 附:22()()()()()n ad bc K a b c d a c b d -=++++,其中n a b c d =+++.【答案】:(1)表格见解析,有97.5%的把握认为评价与班级有关系;(2)67. 【分析】 (1)首先根据题意填写22⨯列联表,再计算2 5.031 5.024=>K 即可得到结论.(2)首先根据题意得到甲班选取2人,乙班选取5人,再计算概率即可.【详解】(1)完成列联表如下:2290(3915306)=5.031 5.024********⨯-⨯=>⨯⨯⨯K . 所以有97.5%的把握认为评价与班级有关系.(2)抽样比17213==,甲班选取2人,乙班选取5人,则1232553767C C CpC+==.9.盲盒里面通常装的是动漫、影视作品的周边,或者设计师单独设计出来的玩偶.由于盒子上没有标注,购买者只有打开才会知道自己买到了什么,因此这种惊喜吸引了众多年轻人,形成了“盲盒经济”.某款盲盒内可能装有某一套玩偶的A、B、C三种样式,且每个盲盒只装一个.(1)若每个盲盒装有A、B、C三种样式玩偶的概率相同.某同学已经有了A样式的玩偶,若他再购买两个这款盲盒,恰好能收集齐这三种样式的概率是多少?(2)某销售网点为调查该款盲盒的受欢迎程度,随机发放了200份问卷,并全部收回.经统计,有30%的人购买了该款盲盒,在这些购买者当中,女生占23;而在未购买者当中,男生女生各占50%.请根据以上信息填写下表,并分析是否有95%的把握认为购买该款盲盒与性别有关?参考公式:()()()()()22n ad bca b c d a c b dχ-=++++,其中n a b c d=+++.参考数据:(3)该销售网点已经售卖该款盲盒6周,并记录了销售情况,如下表:由于电脑故障,第二周数据现已丢失,该销售网点负责人决定用第4、5、6周的数据求线性回归方程,再用第1、3周数据进行检验.①请用4、5、6周的数据求出y关于x的线性回归方程y bx a=+;(注:()()()1122211n ni i i ii in ni ii ix x y y x y nx ybx x x nx====---==--∑∑∑∑,a y bx=-)②若由线性回归方程得到的估计数据与所选出的检验数据的误差均不超过2盒,则认为得到的线性回归方程是可靠的,试问①中所得的线性回归方程是否可靠?③如果通过②的检验得到的回归直线方程可靠,我们可以认为第2周卖出的盒数误差也不超过2盒,请你求出第2周卖出的盒数的可能取值;如果不可靠,请你设计一个估计第2周卖出的盒数的方案.【答案】:(1)29;(2)表格见解析,有95%把握认为购买该款盲盒与性别有关;(3)给2.514.5y x=+;给是可靠的;给第2周卖出的盒数的可能值为18、19、20、21.【分析】(1)用列举法写出所有基本事件,再从中找出满足要求的基本事件,用古典概型的公式即可求得结果;(2)通过计算,完成列联表,再计算出观测值2 4.714k ≈,比表中0.05所对应的数据3.841大,故得出结论“有95%把握认为购买该款盲盒与性别有关”;(3)给将第4、5、6周的数据代入公式,计算出b 和a ,写出回归直线方程;给将第1、3周的数据代入给所求出的回归直线方程进行检验,该方程可靠;给将2x =代入给所求出的回归直线方程,解得19.5y =,根据可靠性的要求,以及该应用题的实际要求,得出第2周卖出的盒数的可能取值.【详解】解:(1)由题意,基本事件空间为{}(,),(,),(,),(,),(,),(,),(,),(,),(,)A A A B A C B A B B B C C A C B C C Ω=,其中基本事件的个数为9,设事件D 为:“他恰好能收集齐这三种样式”,则()(){},,,D B C C B =,其中基本事件的个数为2, 则他恰好能收集齐这三种样式的概率29P =; (2)22200(40702070) 4.7141109060140k ⨯-⨯=≈⨯⨯⨯, 又因为4.714 3.841>,故有95%把握认为“购买该款盲盒与性别有关”;(3)给由数据,求得5x =,27y =,由公式求得 222(45)(2527)(55)(2627)(65)(3027)5(45)(55)(65)2b --+--+--==-+-+-, 527514.52a =-⨯=, 所以y 关于x 的线性回归方程为 2.514.5y x =+;给当1x =时, 2.5114.517y =⨯+=,17162-<,同样,当3x =时, 2.5314.522y =⨯+=,22232-<,所以,所得到的线性回归方程是可靠的;给由给可知回归直线方程可靠,2x =时 2.5214.519.5y =⨯+=,设第二周卖出的盒数为()n n N ∈,则19.52n -≤,≤≤,n17.521.5给n能取18、19、20、21,即第2周卖出的盒数的可能值为18、19、20、21.【点睛】本题考查了古典概型的概率计算,独立性检验的实际应用,线性回归直线方程的求解及实际应用问题,综合性较强.10.阿基米德是古希腊伟大的哲学家、数学家、物理学家,对几何学、力学等学科作出过卓越贡献.为调查中学生对这一伟大科学家的了解程度,某调查小组随机抽取了某市的100名高中生,请他们列举阿基米德的成就,把能列举阿基米德成就不少于3项的称为“比较了解”,少于三项的称为“不太了解”.他们的调查结果如下:(1)完成如下2×2列联表,并判断是否有99%的把握认为,了解阿基米德与选择文理科有关?(2)在抽取的100名高中生中,按照文理科采用分层抽样的方法抽取10人的样本. (i )求抽取的文科生和理科生的人数;(ii )从10人的样本中随机抽取3人,用X 表示这3人中文科生的人数,求X 的分布列和数学期望.参考数据:22()()()()()n ad bc k a b c d a c b d -=++++,n a b c d =+++. 【答案】:(1)见解析;(2) (i )文科生3人,理科生7人 (ii )见解析【分析】(1)写出列联表后可计算2K ,根据预测值表可得没有99%的把握认为,了解阿基米德与选择文理科有关.(2)(i )文科生与理科生的比为310,据此可计算出文科生和理科生的人数. (ii )利用超几何分布可计算X 的分布列及其数学期望.【详解】解:(1)依题意填写列联表如下:计算222()100(42182812) 3.382 6.635()()()()30705446n ad bc K a b c d a c b d -⨯-⨯==≈<++++⨯⨯⨯, ∴没有99%的把握认为,了解阿基米德与选择文理科有关.(2)(i )抽取的文科生人数是30103100⨯=(人),理科生人数是70107100⨯=(人). (ii )X 的可能取值为0,1,2,3,则0337310C C 7(0)C 24P X ===⋅, 1237310C C 21(1)C 40P X ===⋅, 17213307(2)40C C P X C ⋅===, 3037310C C 1(3)C 120P X ===⋅. 其分布列为所以72171369()01232440401204010E X =⨯+⨯+⨯+⨯==.31。
高二数学独立性检验2

P(Ⅹ2≥x0)
0.50 0.40 0.25 0.15
0.10
0.05 0.025 0.010 0.005 0.001
x0
0.455 0.708 1.323 2.072 2.706 3.841 5.024 6.635 7.879 10.828
因当H0成立时,χ2≥10.828的概率为0.001,故有99.9%的把握 认为,两种药物的疗效有差异。
课堂练习: 书 P 9
1 , 2 ,3
课堂作业: 书 P 11
1,2
; / 赢方国际 ;
松咯壹口气/心想谭妙彤敢如此说/那应该存在绝对の把握/|那壹方上官家族也不敢太过靠近/所以人烟最稀少/对方想要找到咱们存在难度/|谭妙彤说话の同时/带着马开改变方向/向着壹方快步而跑/马开和叶静云紧追而上/三人快步而跑/在三人离开の同时/上官敏达已经调动咯方圆の众多修 行者/壹群人拿着马开の画像/向着四面八方涌去/告知各方阻杀马开/第两百壹十六部分古魇禁地外第两百壹十六部分上官世家在这壹方の影响力相信巨大の/上官敏达下咯追杀令/这四周都为此而震动起来/铺天盖地の搜寻马开/但让它们疑惑の相信/并没存在发现马开の踪迹/上官敏达为此暴 怒/更相信派遣众多修行者四处找寻马开/大存在挖地三尺也要把马开找出来の意思/谭妙彤带路/正如谭妙彤说の那样/这条路人烟稀少/极少碰到人/壹路上马开也没存在碰到什么麻烦/偶尔存在找寻の修行者碰到马开/都被马开信手解决咯/|再往前就特别靠近古魇禁地咯/恁们壹定要小心壹些/ 跟着咱不要乱跑/要不然/步进其里本人都不知道/要相信正好碰到古魇禁地扩散の阵法/那就真の麻烦咯/|谭妙彤提醒马开和叶静云/|古魇禁
人教版高二下数学选择性必修第三册-8.3 列联表与独立性检验(第1课时)【课件】

d
c+d
合计
a+c
b+d
n=a+b+c+d
2×2 列联表给出了成对分类变量数据的交叉分类频数.
要点 3 独立性检验
(1)定义:利用随机变量 χ2 的取值推断___两__个_分__类_变__量_是__否_独__立_____的方法称为
独立性检验.
n(ad-bc)2
(2)χ2=____(_a_+__b_)_(__c_+_d_)__(__a+__c_)__(_b_+__d_)___,其中 n=a+b+c+d.
有关系.
【解析】 等高堆积条形图如图所ቤተ መጻሕፍቲ ባይዱ:
由图可以直观地看出铅中毒病人组与对照组相比,尿棕色素为阳性的频率差 异明显,因此铅中毒病人与尿棕色素为阳性有关系.
(2)为了了解某高校学生喜欢使用手机支付是否与 性别有关,随机抽取了部分学生,统计后作出如图所示 的等高堆积条形图,则下列说法正确的是( D )
思考题 2 下面是 2×2 列联表:
y1
y2
总计
x1
a
21
73
x2
22
25
47
总计
b
46
120
则表中 a,b 的值分别为( C )
1.两个分类变量之间关联关系的定性分析的方法 (1)频率分析法:通过对样本的每个分类变量的不同类别事件发生的频率大小 进行比较来分析分类变量之间是否有关联关系.如可以通过列联表中a+a b与c+c d 值的大小粗略地判断分类变量之间有无关系.一般其值相差越大,分类变量有关 系的可能性越大.
(2)图形分析法:与表格相比,图形能更直观地反映出两个分类变量间是否互 相影响,常用等高堆积条形图展示列联表数据的频率特征.
思考题 1 (1)观察下列等高堆积条形图,其中最有把握认为两个分类变量 X,Y 之间有关系的是( D )
8.3.2独立性检验教学设计-2023学年下学期高二数学教学人教A版(2019)选择性必修第三册

《8.3.2独立性检验》教学设计(一)教学内容独立性检验(二)教材分析1. 教材来源本节课选自《2019人教A版高中数学选择性必修第三册》,第八章《成对数据的统计相关性》2. 地位与作用独立性检验是从样本数据中发现关系,是成对样本数据统计分析的重要内容,是依据数据进行合理推理的典型方法,体现了数学的理性精神,也是提升数据分析和逻辑推理素养的重要素材。
(三)学情分析1.认知基础:前一节课已经学习了八两个分类变量整理成一个2×2的列联表。
2.认知障碍:独立性检验合理性的理解(四)教学目标1. 知识目标:通过实例了解独立性检验的基本思想2.能力目标:掌握独立性检验的基本步骤3.素养目标:会用独立性检验解决简单的实际问题,提升数据分析能力。
(五)教学重难点:1. 重点:独立性检验的思想方法2.难点:.χ2统计量的导出和意义(六)教学思路与方法教学过程分为问题呈现阶段、探索与发现阶段、应用知识阶段(七)课前准备电脑、投影机、三角板(八)教学过程教学环节:新课引入教学内容师生活动设计意图前面我们通过2×2列联表整理成对分类变量的样本观测数据,并根据随机事件频率稳定性推断两个变量之间是否有关联。
对于随机样本而言,因为频率具有随机性,频率与概率之间存在误差,所以我们推断可能犯错误,而且在样本容量较小时,犯错误的可能性会较大。
因此,需要找到一种更为合理的推断方法,同时页希望能对出现错误推断的概率有一定的控制或估算。
教学环节:新知探究教学内容师生活动 设计意图 虑以Ω为样本空间的古典概型,设X 和Y 为定义在Ω上,取值于{0,1}的成对分类变量,我们希望判断事件{X=1}和{Y=1}之间是否有关联。
注意到{X=0}和{X=1}, {Y=0}和{Y=1}都是互对立事件,与前面的讨论类似,我们需要判断下面的假定关系H 0:P (Y =1|X =0)=P (Y =1|X =1)是否成立,通常称H 0为零假设或原假设P(Y=1|X=0)表示从{X=0}中随机选取一个样本点,该样本点属于{X=0,Y=1}的概率; P(Y=1|X=1)表示从{X=1}中随机选取一个样本点,该样本点属于{X=1,Y=1}的概率。
数学高二-选修2-3知识导航 第三章2独立性检验

§2 独立性检验自主整理1.设A ,B 为两个变量,每一个变量都可以取两个值, 变量A :A 1,A 2=A 1; 变量B :B 1,B 2=B 1.其中,a 表示变量A 取A 1,且变量B 取B 1时的数据;b 表示变量A 取A 1,且变量B 取B 2时的数据;c 表示变量A 取A 2,且变量B 取B 1时的数据;d 表示变量A 取A 2,且变量B 取B 2时的数据.设n=a+b+c+d,用_______________估计P(A 1B 1), ______________估计P(A 1), __________估计P(B 1). 若有式子nca nb a n a +•+=, 则可以认为______________独立.同理,若n d b n b a n b +•+=,则可以认为______________独立;若nca n d c n c +•+=,则可以认为______________独立;若ndb n dc nd +•+=,则可以认为______________独立. 但是,在n c a n b a n a +•+=中,由于nca nb a n a ++,,表示的是______________,不同于概率,即使变量之间独立,式子两边也不一定恰好相等.但是当两边相差______________时,变量之间就不独立.2.选取χ2作统计量,用它的大小来检验变量之间是否独立.χ2=______________________________________________________________________ 当数据量较大时,在统计中,用以下结果对变量的独立性进行判断.(1)当χ2≤______________时,没有充分的证据判定变量A,B 有关联,可以认为变量A,B 是没有关联的;(2)当χ2>______________时,有90%的把握判定变量A,B 有关联; (3)当χ2>______________时,有95%的把握判定变量A,B 有关联; (4)当χ2>______________时,有99%的把握判定变量A,B 有关联. 高手笔记1.独立性检验的基本思想先假设两个分类变量X 与Y 无关系,即X 与Y 相互独立,计算χ2的观测值k,把k 与临界值进行比较,可以判断X 与Y 有关系的程度及无关系.在该假设下,构造的随机变量χ2应该很小,如果实际计算出的χ2的观测值很大,则在一定程度上说明假设不合理,根据χ2的含义可以利用统计估算出概率P(χ2≥6.635)≈0.01,即有1%的把握认为X 与Y 无关,也就是说有99%的把握认为X 与Y 有关联.2.独立性检验的一般步骤(1)假设两个分类变量X 与Y 无关联;(2)计算出χ2=;))()()(()(2d b c a d c b a bc ad n ++++- (3)把χ2的值与临界值比较确定X 与Y 有关联的程度或无关联. 名师解惑从教科书中,我们得到“有99%以上的把握认为吸烟与患肺癌是有关的”这一结论,有的同学认为这一结论应该这样理解:即100个抽烟的人中,有99个患有肺癌.请问这样理解是否正确? 剖析:不正确.首先要区别“事件发生的概率”与“独立性检验中X 与Y 有关联的概率”.(1)事件发生的概率.例如袋中有100个球,其中99个白球,1个黑球,随机取一个球,则取到白球的概率为99%.(2)两个变量X 与Y 有关系的概率.例如教科书中吸烟与患肺癌之间有关系的概率为99%,并非指吸烟者中有99%的人患肺癌,而是指我们有99%的把握认为“吸烟与患肺癌有关系”,(而在吸烟者中,只有 2.82%的人患肺癌)我们得到的结论是:吸烟者与不吸烟者患肺癌的可能性存在差异,这里所说的“吸烟与患肺癌有关系”是指统计上的关系,而非因果关系,至于吸烟者患不患肺癌,应该由医学检查来确定,而非统计学上的事了. 讲练互动【例1】在某医院,因为患心脏病而住院的665名男性病人中,有214人秃顶;而另外772名不是因为患心脏病而住院的男性病人中有175人秃顶,利用独立性检验的方法判断秃顶与患心脏病是否有关系.分析:计算χ2的值,然后与临界值进行比较.故χ2=7726651048389)451175597214(14372⨯⨯⨯⨯-⨯⨯≈16.373>6.635,所以有99%的把握认为“秃顶与患心脏病有关”.黑色陷阱:因为这组数据来自住院的病人,因此所得到的结论只适合住院的病人群体,不要脱离这个前提而将结论推广到一般人群.. 变式训练1.为考察高中生的性别与是否喜欢数学课程之间的关系,在某城市的某校高中生中随机抽取由表中的数据,你认为在多大程度上可以认为高中生的性别与是否喜欢数学课程之间有关系?为什么?解:χ2=17812222872)853514337(3002⨯⨯⨯⨯-⨯⨯≈4.513>3.841,在假设“性别与是否喜欢数学课程之间没有关系”的前提下,χ2应该很小,并且P (χ2>3.841)≈0.05,而我们所得到的χ2的观察值4.513超过3.841,这就意味着“性别与是否喜欢数学课程之间有关系”这一结论是错误的可能性约为0.05,即有95%的把握认为“性别与是否喜欢数学课程之间有关系”. 【例2】某地震观测站对地下水位的变化和发生地震的情况进行了n=1 700次观测,列联表如问观测结果是否说明地下水位的变化与地震的发生有关系?分析:判断两个分类变量是否相关,只须计算χ2的值然后与临界值比较即可.χ2=70010001520180)9028261898(17002⨯⨯⨯⨯-⨯⨯≈1.59<2.706,∴没有充分的证据显示地下水位的变化与地震的发生相关.绿色通道:当χ2≤2.706时,一般认为没有充分证据显示“X 与Y 有关系”.. 变式训练2.为了研究性格与血型的关系抽取80人测试,血型与性格汇总如下,试判断性格与血型是解:由列联表中的数据得到 χ2=46344535)17162918(802⨯⨯⨯⨯-⨯⨯≈2.030≤2.706.所以认为没有充分的证据显示血型与性格有关系.【例3】在一项有关医疗保健的社会调查中,发现调查的男性为530人,女性为670人,其中男性中喜欢吃甜食的为117人,女性中喜欢吃甜食的为492人,判断喜不喜欢甜食与性别是否有关系.分析:先由题目中的条件画出列联表,然后计算χ2.χ2=670530591609)413492178117(12002⨯⨯⨯⨯-⨯≈312.272>6.635,∴有99%的把握认为喜不喜欢甜食与性别有关系.绿色通道:统计方法是可能犯错误的,好的统计方法就是要降低犯错误的概率.. 变式训练试问:50岁以上的人患慢性气管炎与吸烟习惯有关吗? 解:根据列联表中的数据,得到χ2=28356134205)1316212143(3392⨯⨯⨯⨯-⨯⨯=7.469.因为7.469>6.635,所以我们有99%的把握说50岁以上的人患慢性气管炎与吸烟习惯有关.。
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
[单选]以下有关血肿处理方法中错误的是()。A.微量出血及针孔局部小块青紫,一般不必处理B.如局部血肿增长迅速,应立即于以热敷,促使消散C.出血停止后,可在局部轻轻按揉D.出血初期可用冷敷E.血止后可用热敷 [单选]关机及不可及转移的编码操作方式是()?A.**21*DN#发送键;B.**62*DN#发送键;C.**67*DN#发送键;D.**61*DN#发送键。 [单选,A1型题]决定化学物质毒性大小最主要的因素是()。A.接触途径B.剂量C.接触时间D.接触速率和频率E.接触期限 [填空题]在冶炼、浇铸和钢水凝固过程中产生或混入的非金属相,一般称为()。 [单选]连翘是哪个科得树种()A.杨柳B.木樨C.蔷薇D.松科 [单选]要建立良好的护际关系,沟通策略不包括A.管理沟通人性化A.B.形成互帮互助氛围B.C.实现年龄、学历各因素的互补C.D.遇到冲突时据理力争、坚守阵地D.E.构建和谐工作环境 [填空题]温度影响开花的原因是有些观赏植物必须经过一个低温周期才能形成花芽,这个低温周期叫()。 [单选,A2型题,A1/A2型题]不符合恶性肿瘤所致贫血的是()A.肿瘤未侵犯骨髓时,不会发生溶血B.主要与出血有关C.营养不良D.造血功能减低E.除贫血外,血象和骨髓象无特殊改变 [填空题]A级高度钢筋混凝土高层建筑结构平面布置时,平面宜()、()、()、()。 [单选]定额计算法的公式中R代表()。ABCD [单选]液氧中乙炔含量报警值为()A、0.5mg/l液氧B、1.0mg/l液氧C、0.4mg/l液氧D、0.1mg/l液氧 [单选]关于胃贲门区的超声解剖,叙述错误的是()。A.贲门位于食管下端与胃底交界处B.贲门位于肝左外侧叶后方C."鸟嘴征"是贲门及周围结构的长轴图像,鸟嘴尖端指向胃底D.贲门长轴图像呈上小下大的喇叭状结构E.短轴图像上贲门的食管端呈靶环样结构 [名词解释]接算站 [判断题]炭疽芽孢菌苗、EDS油佐剂灭活苗均属于死菌苗。()A.正确B.错误 [单选,A1型题]《执业医师法》规定,在医疗、预防、保健机构中试用期满一年,具有以下学历者,可以参加执业医师资格考试()A.高等学校医学专业本科以上学历B.高等学校医学专业专科学历C.取得助理执业医师执业证书后,具有高等学校医学专科学历D.中等专业学校医学专业学历E.取得助 [单选]为了达到管理优化的目的,提高管理效益,必须对管理进行充分的系统分析,这就是管理的()。A.系统原理B.人本原理C.整分合原理D.弹性原理E.排队论原理 [单选,A2型题,A1/A2型题]关于颅脑MRI技术叙述错误的是()A.增强检查,注射对比剂后行T2WI成像B.增强扫描常用对比剂为顺磁性对比剂Gd-DTPAC.常规颅脑扫描横断位成像应在正中矢状位像上定位D.层厚4~8mm,层间距取层厚的10%~50%E.血管性病变常做平扫加血管成像 [单选]心室颤动电除颤采用()A.非同步200J以上B.同步200J以上C.非同步150JD.同步150JE.交流电200J以上 [单选]注册资本最低限额为人民币五千万元的证券公司可以从事()业务。A.与证券交易、证券投资活动有关的财务顾问B.证券资产管理C.证券自营D.证券承销与保荐 [问答题,简答题]计算题:某常压精馏塔,用来分离甲醇-水液体混合物的获得纯度不低于98.49%的甲醇。已知塔的生产处理量为204kg/h的甲醇-水混合液,其中甲醇含量为69%,现要求塔釜残液中甲醇含量不大于1%。(以上均为质量百分数),试计算塔顶、塔釜的采出量。 [单选,A1型题]拔毒去腐力强,常配石膏使用的药是()A.雄黄B.升药C.硼砂D.轻粉E.炉甘石 [填空题]阿拉伯人在数学上的重要贡献,首先是创造了()。 [判断题]船员居住舱着火,应立即打开门窗,用水龙往内灌水,以防火势蔓延.A.正确B.错误 [多选]热拌沥青碎石的配合比设计包括()。A.目标配合比设计阶段B.生产配合比设计阶段C.生产配合比验证阶段D.目标配合比验证阶段 [单选]()施工项目管理规划是以整个建设项目的安装施工任务为对象编制的。A.单项工程B.单位工程C.分部分项工程D.群体工程 [问答题,简答题]问题成员的类型有哪些? [单选]心搏骤停复苏抢救的有效指征不包括()A.触到大动脉搏动B.上肢收缩压在8kPa以上C.自主呼吸恢复D.瞳孔散大E.颜面、口唇转红润 [单选]关于类风湿结节的特点错误的是()。A.直径数毫米至数厘米B.质硬C.有压痛D.常出现在关节伸侧受压部位的皮下组织E.对称性 [单选,A2型题,A1/A2型题]患者右面神经周围性瘫,双眼不能向右侧凝视,左侧偏瘫,左侧Babinski征阳性,病变在()。A.左侧内囊B.右侧内囊侧脑桥D.右侧脑桥E.内囊病变延及桥脑 [问答题,简答题]何为变温吸附? [填空题]露天开采有两种方法,即台阶式开采和条带剥离式开采,前者主要用于开采()以及其它();后者主要用于开采()。 [单选]下列关于仲裁程序与民事诉讼程序的说法,正确的是:()A.仲裁和民事诉讼都基于双方合意启动B.仲裁庭人员可以由仲裁委员会指定,民事诉讼中法官则是由法院指定C.仲裁员不能达成一致意见,以首席仲裁员意见为准,民事诉讼中的合议则以审判长意见为准D.仲裁与民事诉讼的立案审 [单选]在口岸检验检疫机构现场查验时,应截留旅客携带的水果、茄科蔬菜(茄子、辣椒、番茄等),出具《出入境人员携带物留验/处理凭证》,根据检验情况作()处理。A.退回B.封存C.销毁D.退回或销毁 [单选]拦水缘石设置的位置是()。A.路肩上B.边沟里C.涵洞前D.检查井中 [单选]在电路中,()起到把用电器与电源接通或断开的作用。A、电源B、导线C、电器D、开关 [单选]对人员密集场所实施消防监督检查时,尤其要注意检查员工()在场群众疏散的知识和技能。(易)A、督促B、号召C、跟随D、组织引导 [名词解释]中有虚象 [填空题]在相同的工作环境下,()执行机构响应速度较慢。 [单选]在正常情况下,Water位X线片上颌窦密度与眼眶密度相比()A.上颌窦密度高于眼眶密度B.上颌窦密度高于眼眶密度C.上颌窦密度等于眼眶密度D.上颌窦密度低于或等于眼眶密度E.因个体差异,无法相比 [单选]下列对于性病性淋巴肉芽肿的诊断有意义,但除了()A.有不洁性交史或配偶感染史B.衣原体培养阳性C.男性龟头、包皮处可见小丘疹、疱疹,无自觉症状D.低丙种球蛋白血症