高中数学第四章典型统计案例4.3列联表独立性分析案例课件
【高二统计案例(2)】独立性检验
独立性检验1. 在2013年某大学生运动会期间,某网站针对是否观看大学生运动会的情况进行了一项问卷调查,得出如下表格:(附:K 2=n(ad−bc)2(a+b)(c+d)(a+c)(b+d) 则K 2=( )A. 700B. 750C. 800D. 8502. 春节期间,“厉行节约,反对浪费”之风悄然吹开,某市通过随机询问100名性别不同的居民是否能做到“光盘”行动,得到如下的列联表:附:K 2=n(ad−bc)2(a+b)(c+d)(a+c)(b+d)参照附表,得到的正确结论是( )A. 在犯错误的概率不超过1%的前提下,认为“该市居民能否做到‘光盘’与性别有关”B. 在犯错误的概率不超过1%的前提下,认为“该市居民能否做到‘光盘’与性别无关”C. 有90%以上的把握认为“该市居民能否做到‘光盘’与性别有关”D. 有90%以上的把握认为“该市居民能否做到‘光盘’与性别无关”3.附表:由K 2=n(ad−bc)2(a+b)(c+d)(a+c)(b+d),计算得K 2=____________ 参照附表,得到的正确结论为( )A. 在犯错误的概率不超过5%的前提下,认为“是否爱吃零食与性别有关”B. 在犯错误的概率不超过5%的前提下,认为“是否爱吃零食与性别无关”C. 有97.5%以上的把握认为“是否爱吃零食与性别有关”D. 有97.5%以上的把握认为“是否爱吃零食与性别无关”第2页,共7页4.由表中数据计算得到K 的观测值k ≈5.059,于是(填“能”或“不能”)在犯错误的概率不超过0.01的前提下认为喜欢玩电脑游戏与认为作业多有关.5. 101目的110名观众,得到如下列联表:则有 的把握认为“喜爱该节目与性别有关”.6. 如图是一个2×2列联表,则m+n 的值为 .7. 某新闻媒体为了解观众对《创造101》节目的喜爱与性别是否有关,随机调查了观看该节目的110名观众,得则有 的把握认为“喜爱该节目与性别有关”.8. 在西非肆虐的“埃博拉病毒”的传播速度很快,这已经成为全球性的威胁,为了考察某种埃博拉病毒疫苗的效果,现随机抽取100只小鼠进行试验,得到如下列联表:参照附表,K 2=n(ad−bc)2(a+b)(c+d)(a+c)(b+d).在犯错误的概率不超过______的前提下,认为“小动物是否被感染与有没有服用疫苗有关”.独立性检验一、选择题(本大题共3小题,共15.0分)9.在2013年某大学生运动会期间,某网站针对是否观看大学生运动会的情况进行了一项问卷调查,得出如下表格:)(附:K2=n(ad−bc)2(a+b)(c+d)(a+c)(b+d)则K2=()A. 700B. 750C. 800D. 850【答案】B【解析】【分析】即可求解;本题考查独立性检验,属于基础题型,代入K2=n(ad−bc)2(a+b)(c+d)(a+c)(b+d)【解答】解:由题意得K2=n(ad−bc)2(a+b)(c+d)(a+c)(b+d)=750.=12000×(6000×2000−2000×2000)28000×4000×8000×4000故选B.10.春节期间,“厉行节约,反对浪费”之风悄然吹开,某市通过随机询问100名性别不同的居民是否能做到“光盘”行动,得到如下的列联表:附:K2=n(ad−bc)2参照附表,得到的正确结论是()(a+b)(c+d)(a+c)(b+d)A. 在犯错误的概率不超过1%的前提下,认为“该市居民能否做到‘光盘’与性别有关”B. 在犯错误的概率不超过1%的前提下,认为“该市居民能否做到‘光盘’与性别无关”C. 有90%以上的把握认为“该市居民能否做到‘光盘’与性别有关”D. 有90%以上的把握认为“该市居民能否做到‘光盘’与性别无关”【答案】C第4页,共7页【解析】【分析】本题考查独立性检验,基础题由公式可计算K 2的观测值k ,与临界值表中的临界值进行比较,即可得答案.【解答】解:由公式可计算K 2的观测值 k =n(ad−bc)2(a+b)(c+d)(a+c)(b+d)=100(45×15−30×10)255×45×75×25≈3.03>2.706,所以有90%以上的把握认为“该市居民能否做到‘光盘’与性别有关”, 故选C .11.附表:由K 2=n(ad−bc)2(a+b)(c+d)(a+c)(b+d),计算得K 2=100(10×30−20×40)250×50×30×70≈4.762.参照附表,得到的正确结论为( )A. 在犯错误的概率不超过5%的前提下,认为“是否爱吃零食与性别有关”B. 在犯错误的概率不超过5%的前提下,认为“是否爱吃零食与性别无关”C. 有97.5%以上的把握认为“是否爱吃零食与性别有关”D. 有97.5%以上的把握认为“是否爱吃零食与性别无关” 【答案】A【解析】【分析】本题主要考查独立性检验知识,属于基础题.独立性检验是在犯错的概率不超过多少时认为“是否爱吃零食与性别有关” K 2≈4.762>3.841而P(K 2≥3.841)=0.05,即可得到答案. 【解答】解:因为K 2≈4.762>3.841,P(K 2>3.841)=0.05.所以在犯错误的概率不超过5%的前提下,认为“是否爱吃零食与性别有关”, 故选A .二、填空题(本大题共8小题,共40.0分)12. 公元五世纪张丘建所著《张丘建算经》卷中第22题为:“今有女善织,日益功疾,初日织五尺,今一月日织九匹三丈,问日益几何”.题目的意思是:有个女子善于织布,一天比一天织得快(每天增加的数量相同),已知第一天织布5尺,一个月(30天)共织布9匹3丈,则该女子每天织布的增加量为 尺.(1匹=4丈,1丈=10尺) 【答案】1629【解析】【分析】本题考查了等差数列的求和.设每天织布的尺数成等差数列{a n },公差为d ,利用等差数列的求和公式即可得出.【解答】解:设每天织布的尺数成等差数列{a n},公差为d,d=390,则5×30+30×292解得d=16.29.故答案为162913.在平面直角坐标系xOy中,抛物线y2=8x的焦点坐标为________.【答案】(2,0)【解析】【分析】本题考查抛物线的几何性质,是容易题.=2即可得解.根据题意,确定抛物线的对称轴和开口方向,求出p2【解答】解:在y2=8x中,2p=8,即p=4,=2.所以,p2又抛物线的焦点在x轴上,且开口向右,故抛物线的焦点坐标为(2,0).答案为(2,0).14.设向量a⃗=(1,−4),b⃗ =(−1,x),c⃗=a⃗+3b⃗ .若a⃗//c⃗,则实数x的值是.【答案】4【解析】【分析】本题考查了平面向量共线的充要条件和平面向量的坐标运算.先计算c→的坐标,根据a→//c→,利用向量平行的条件列出关于x的方程,即可求得x.【解答】解:向量a→=(1,−4),c→=a→+3b→=(−2,−4+3x),因为a⃗//c⃗,所以(−4+3x)−(−4)×(−2)=0,解得x=4.故答案为4.15.第6页,共7页由表中数据计算得到K 的观测值k ≈5.059,于是(填“能”或“不能”)在犯错误的概率不超过0.01的前提下认为喜欢玩电脑游戏与认为作业多有关.【答案】不能【解析】【分析】本题考查独立性检验,属于基础题.查表知若要在犯错误的概率不超过0.01的前提下认为喜欢玩电脑游戏与认为作业多有关,则临界值k 0=6.635.本题中,k ≈5.059<6.635,由此即可得到答案. 【解答】解:查表知若要在犯错误的概率不超过0.01的前提下认为喜欢玩电脑游戏与认为作业多有关,则临界值k 0=6.635.本题中,k ≈5.059<6.635,所以不能在犯错误的概率不超过0.01的前提下认为喜欢玩电脑游戏与认为作业多有关.16. 某新闻媒体为了解观众对《创造101》节目的喜爱与性别是否有关,随机调查了观看该节目的110名观众,得到如下列联表:则有 的把握认为“喜爱该节目与性别有关”. 【答案】99%【解析】【分析】本题主要考查独立性检验,属于基础题. 代入独立性检验公式即可求解.【解答】解:由列联表中数据,可得: χ2=110×(40×30−20×20)260×50×60×50≈7.822>6.635,所以有99%的把握认为“喜爱该节目与性别有关”.17. 的值为 .【答案】【解析】【分析】本题主要考查了2×2列联表的数据关系,属于基础题.由a +35=45,可求得a ,则m =a +7,再由b +35=73可得b ,则7+b =n ,即可求解.【解答】解:根据2×2列联表可知a +35=45,解得a =10,则m =a +7=17, 又由35+b =73,解得b =38,则n =7+b =45, 则m +n =62.18. 某新闻媒体为了解观众对《创造101》节目的喜爱与性别是否有关,随机调查了观看该节目的110名观众,得则有 的把握认为“喜爱该节目与性别有关”.【答案】99% 【解析】【分析】本题考查了独立性检验,考查了运算能力,属于基础题.由列联表中数据,代入计算公式可得K 2的值,再判断是否有99%的把握认为“喜爱该节目与性别有关”. 【解答】解:由列联表中数据,可得K 2=110×(40×30−20×20)260×50×60×50≈7.822>6.635,所以有99%的把握认为“喜爱该节目与性别有关”.19. 在西非肆虐的“埃博拉病毒”的传播速度很快,这已经成为全球性的威胁,为了考察某种埃博拉病毒疫苗的效果,现随机抽取100只小鼠进行试验,得到如下列联表:参照附表,K 2=n(ad−bc)2(a+b)(c+d)(a+c)(b+d).在犯错误的概率不超过______的前提下,认为“小动物是否被感染与有没有服用疫苗有关”.【答案】0.05【解析】【分析】本题考查独立性检验的应用,属于基础题.计算观测值,与题目中的观测值表进行比较,即可得出预测结论. 【解答】解:由题意算得,K 2= 100(10×30−20×40)250×50×30×70 ≈4.762>3.841,参照附表,可得:在犯错误的概率不超过5%的前提下,认为“小动物是否被感染与有没有服用疫苗有关”. 故答案为0.05.。
数学选修2-3 列联表独立性分析 精PPT课件
7
独立性检验
通过数据和图表分析,得到 结论是:吸烟与患病有关
用χ2统计量研究 这类问题的方法
步骤
结论的可靠 程度如何?
第一步:H0: 假设吸烟和患病之间没有关系 第二步:列出2×2列联表
吸烟 不吸烟
总计
患病
不患病
a
b
c
d
a+c
b+d
精选ppt课件2021
总计 a+b c+d a+b+c+d
8
第三步:引入一个随机变量:卡方统计量
n n n n n n
n1 n2
n2 n2
nn
nn
来衡量独立性的大小
可以化简为 2 n(n11n22 n12n21)2
n1 n2 n1n2
精选ppt课件2021
6
怎样描述实际观测值与估计值的差异呢?
统计学中采用
用 卡 方 统 计 量 :2
(观 测 值 预 期 值 )2 预 期 值
来 刻 画 实 际 观 测 值 与 估 计 值 的 差 异 .
未感冒
感冒
合计
使用血清
258
242
500
未使用血清
216
284
500
合计
474
526
1000
解:设H0:感冒与是否使用该血清没有关系。
2 1000258 284 242 2162 7.075
474 526 500 500
因当H0成立时,χ2≥6.635的概率约为0.01,故有99%的把握认
现在的 2 =7.307的观测值远大于6.635,出 现这样的观测值的概率不超过0.010。
故有99%的把握认为H0不成立,即有99%的把 握认为“患病与吸烟有关系”。
【高中数学】列联表与独立性检验(课件) 高二数学(人教A版2019选择性必修第三册)
这种利用 2的取值推断分类变量X和Y是否独立的方法称为 2独立性检验,
简称独立性检验 .
探究新知
下表为独立性检验中几个常用的小概率值和相应的临界值
α
xα
0.1
2.706
0.05
3.841
0.01
6.635
0.005
7.879
0.001
根据小概率值α=0.001的独立性检验,推断H0不成立,即认为吸烟与
患肺癌有关联,此推断犯错误的概率不大于0.001.
典型例题
根据表中数据计算,不吸烟者中不患肺癌和患肺癌的频率分别为
7775/7817≈0.9946 和 42/7817≈0.0054
吸烟者中不患肺癌和患肺癌的频率分别为
2099/2148≈0.9772 和 49/2148≈0.0228
中有 43 人的饮食以蔬菜为主,另外 27 人则以肉类为主;六十岁以下的人中有
21 人饮食以蔬菜为主,另外 33 人则以肉类为主.请根据以上数据作出饮食习
惯与年龄的列联表,并利用 P(Y=1|X=0)与 P(Y=1|X=1)判断二者是否有关系.
[解]
用 Ω 表示共调查了 124 人所构成的集合,定义一对分类变量 X 和 Y
性数有无差别,铅中毒病人与尿棕色素为阳性是否有关系?
探究新知
[解]
病人组中尿液为阳性和阴性的频率分别为:
29
7
≈0.805 6 和 ≈0.194 4.
36
36
对照组中尿液为阳性和阴性的频率分别为:
9
28
≈0.243 2 和 ≈0.756 8.
37
37
2025年高考数学一轮复习-第十章-第三节-数据分析-列联表与独立性检验【课件】
育改革态度的关系,随机抽取了392名成年人进行调查,所得数据如下表所示:
积极支持教育改革
不太赞成教育改革
合计
大学专科以上学历
39
157
196
大学专科以下学历
29
167
196
合计
68
324
392
对于教育机构的研究项目,根据上述数据能得出什么结论?
5
2
5
2
4−5 25−27 + 5−5 26−27 + 6−5 30−27
4−5 2 + 5−5 2 + 6−5 2
= ,ො = 27 − × 5 = 14.5,所以关于的经验回归方程为ො = 2.5 + 14.5.
②若由经验回归方程得到的估计数据与所选出的检验数据的误差均不超过2盒,则认为
有关的结论.
规律方法
独立性检验的关注点
在2 × 2列联表中,如果两个分类变量没有关系,那么应满足 − ≈ 0,因此 −
越小,关系越弱; − 越大,关系越强.
题型三 独立性检验与回归分析的综合
典例4 盲盒里面通常装的是动漫、影视作品的周边,或者设计师单独设计出来的玩偶.
周数
1
2
3
4
5
6
盒数
16
—
23
25
26
30
由于电脑故障,第二周数据现已丢失,该销售网点负责人决定用第4,5,6周的数据求经验
回归方程,再用第1,3周的数据进行检验.
+ .
①请用第4,5,6周的数据求出关于的经验回归方程ො =
【高质量】列联表独立性分析案例PPT文档
40
35 30 25 20 15 10
5 0
患肺癌
不患肺癌
三维 柱状图
不吸烟 吸烟
吸烟 不吸烟
设计意图:通过图形直观判断两个分类变量是否相关:
2) 通过图形直观判断两个分类变量是否相关:
60 推出矛盾,意味着结论A成立
并且在高一学习必修三概率统计时已经初步了解变量间的相关关系问题;
二维
(4)学生对利用计算机上数学课比较感兴趣,并能掌握计算机的基本操作;
列联表独立性分析案例
优选列联表独立性分析案例
教材分析 目标分析 特征分析 策略分析
过程分析
教材分析 目标分析 过特程征分析 教策法略分析 过评程价分析
教材分析
一)、教材的地位和作用 本节课是湘教版普通高中课程标准实验教科书选修1-2第
四章第三节第一课时的内容。主要内容是:列联表独立性分 析案例。独立性检验是《课程标准》中要求学生体验的重要 统计模型之一,该模型的教育价值:让学生在必修3课程学习 到的变量间的相关关系和选修1-2事件的独立性的基础上, 利用独立性检验进一步分析两个分类变量之间是否有关系, 为下一节学习一元线性回归案例和今后学习统计理论奠定基 础。
❖ 2)通过对具体问题作出独立性检验,明确独 立性检验的基本步骤,并能用其基本思想解 决实际问题。
目标分析
❖ 2、过程与方法 ❖ 1)通过探究“吸烟是否与患肺癌有关系”引出独
立性检验的问题,借助样本数据,列联表、柱形 图和条形图,使学生直观感觉到吸烟和患肺癌可能 有关系.这一直觉来自于观测数据,即样本问题是 这种来自于样本的印象能够在多大程度上代表总 体,这节课就是为了解决这个问题,让学生亲身 体验直观感受的基础上,提高学生的数据分析能 力. ❖ 2)经历判断“X与Y是否有关系”的一般步骤和利 用独立性检验来考察两个分类变量是否有关系, 获得较准确地给出这种判断的可靠程度的具体做
8.4列联表独立性分析案例课件-湘教版数学选修2-3
列联表
为了调查吸烟是否患呼吸道疾病有影响,某医疗研究 所随机地调查了515人,得到如下结果(单位:人)
吸烟与呼吸道疾病列联表
患病 不患病 总计
吸烟
37
183
220
不吸烟
21274Fra bibliotek295
总计
58
457
515
在不吸烟者中患呼吸道疾病的比重是 7.12% 在吸烟者中患呼吸道疾病的比重是 16.82%
用 统计量研究这类问题的方法称为独立性检验。
一般地,对于两个研究对象Ⅰ和Ⅱ,Ⅰ有两类 取值,即类A和B(如吸烟与不吸烟);Ⅱ也有两类 取值,即类1和2(如患病与不患病)。于是得到 下列联表所示的抽样数据:
类1 类2
总计
类A
a
b
a+b
类B
c
d
c+d
总计
a+c
b+d
a+b+c+d
要推断“Ⅰ和Ⅱ有关系”,可按下面的步骤进行:
患病 不患病 总计
吸烟
37
183
220
不吸烟 21
274
295
总计
58
457
515
通过公式计算
独立性检验
已知在 H0成立的情况下,
即在H0 成立的情况下, 2大于6.635概率非常小, 近似为0.01 现在的 2=11.8634的观测值远大于6.635, 出现这样的观测值的概率不超过0.01。 故有99%的把握认为H0不成立,即有99%的把 握认为“患呼吸道疾病与吸烟有关系”。
列联表独立性分析案例
某医疗机构为了了解呼吸道疾病与吸烟是否 有关,进行了一次抽样调查,共调查了515个 成年人,其中吸烟者220人,不吸烟者295人, 调查结果是:吸烟的220 人中37人患呼吸道 疾病, 183人不患呼吸道疾病;不吸烟的295 人中21人患呼吸道疾病, 274人不患呼吸道 疾病。
人教B版高中数学选择性必修第二册精品课件 第4章 概率与统计 独立性与条件概率的关系.ppt
得1分,比赛进行到一方比另一方多2分为止,且多得2分的一方胜出.现甲、
1
乙两人分在同一组,两人都参与每一次抢题,每次抢到的概率都为 2 .若甲、
2
1
乙正确回答每道题的概率分别为 3 和 2 ,每道题回答是否正确相互独立.
(1)求第1题答完甲得1分的概率;
(4)A,B恰有一个发生为事件 A + B.
(5)A,B中至多有一个发生为事件 A + + .
它们之间的概率关系如表所示:
概率
A,B 互斥
A,B 相互独立
P(A+B)
P(A)+P(B)
1-P()P()
P(AB)
0
P(A)P(B)
P()
1-[P(A)+P(B)]
P()P()
A 与 B 相互独
重难探究·能力素养速提升
探究点一
事件独立性的判断
【例1】 [北师大版教材例题]口袋中有4个黑球和3个白球,这7个球除颜色
外完全相同,连摸两次,每次摸一球.记事件A表示“第一次摸得黑球”,事件B
表示“第二次摸得黑球”.在放回摸球和不放回摸球两种情况下,事件A与事
件B是否独立?
解 ①放回摸球:
故系统N1正常工作的概率为0.648.
(2)依题意知P2=P(A)P(B)P( )+P(A)P( )P(C)+P(A)P(B)P(C)
=0.80×0.90×0.10+0.80×0.10×0.90+0.80×0.90×0.90=0.792.
故系统N2正常工作的概率为0.792.
学以致用·随堂检测促达标
数学(选修12)练习4.3列联表独立性分析案例活页作业3
活页作业(三) 列联表独立性分析案例1.对于分类变量X 与Y 的统计量χ2的值说法正确的是( ) A .χ2越大,“X 与Y 有关系”的把握性越小 B .χ2越小,“X 与Y 有关系”的把握性越小 C .χ2越接近于0,“X 与Y 无关系”的把握性越小 D .χ2越接近于0,“X 与Y 无关系”的把握性越大解析 χ2越大,X 与Y 越不独立,所以关联越大;相反,χ2越小,关联越小. 答案:B2.在2×2列联表中,两个比值________相差越大,两个分类变量之间的关系越强( ) A .a a +b 与c c +dB .a c +d 与c a +bC .a a +d 与c b +cD .a b +d 与c a +c解析a a +b 与c c +d相差越大,说明ad 与bc 相差越大,两个分类变量之间的关系越强. 答案:A3.对两个分类变量进行独立性检验的主要作用是( ) A .判断模型的拟合效果 B .对两个变量进行相关分析C .给出两个分类变量有关系的可靠程度D .估计预报变量的平均值解析 独立性检验的目的就是明确两个分类变量有关系的可靠程度. 答案:C4.为了了解高中生作文成绩与课外阅读量之间的关系,某研究机构随机选取了60名高中生,通过问卷调查,得到以下数据:作文成绩优秀作文成绩一般总计 课外阅读量较大 22 10 32 课外阅读量一般8 20 28 总计3030602>7.879时,有99.5%的把握判定两个变量有关联)( )A .没有充足的理由认为课外阅读量大与作文成绩优秀有关B .有0.5%的把握认为课外阅读量大与作文成绩优秀有关C .有99.9%的把握认为课外阅读量大与作文成绩优秀有关D .有99.5%的把握认为课外阅读量大与作文成绩优秀有关 解析 χ2≈9.643>7.879,P (χ2≈9.643>7.879)=0.005.∴在犯错误的概率不超过0.005的前提下认为作文成绩优秀与课外阅读量大有关. 答案:D5.已知某校文理科教师与性别的列联表如下:解析χ2=300×(37×143-85×35)2122×178×72×228≈4.513 9.答案:4.513 96.为了研究高中学生对乡村音乐的态度(喜欢和不喜欢两种态度)与性别的关系,运用2×2列联表进行独立性检验,经计算χ2=8.01,则认为“喜欢乡村音乐与性别有关系”的把握性约为________.解析 ∵χ2=8.01>6.635,∴有99%的把握说学生性别与喜欢乡村音乐有关系. 答案:99%7.某次全国性会议在北京召开.为了做好对外宣传工作,会务组选聘了16名男记者和14名女记者担任对外翻译工作,调查发现,男、女记者中分别有10人和6人会俄语.(1)根据以上数据完成以下2×2列联表:(2) 解 (1)对应的2×2列联表如下:(2)χ2=n(ad-bc)2(a+b)(c+d)(a+c)(b+d)=30×(10×8-6×6)2 16×14×16×14≈1.157 5<2.706.∴不能在犯错的概率不超过0.10的前提下认为性别与会俄语有关.8.某校对高三部分学生的数学质检成绩作相对分析.(1)按一定比例进行分层抽样抽取了20名学生的数学成绩,并用茎叶图(图1)记录,但部分数据不小心丢失了,已知数学成绩[70,90)的频率是0.2,请补全表格并绘制相应频率分布直方图(图2).分数段(分)[50,70)[70,90)[90,110)[110,130)[130,150]频率理成绩进行比较,得到统计数据如下表:物理成绩优秀物理成绩一般合计数学成绩优秀15318数学成绩一般51722合计202040时,有99.9%的把握判定两个变量有关联)解(1)填表如下:分数段(分)[50,70)[70,90)[90,110)[110,130)[130,150]频率0.10.20.40.20.1(2)假设学生的物理成绩优秀与数学成绩优秀没有关系, 则χ2=40×(15×17-5×3)220×20×22×18≈14. 55>10.828.∴有99.9%的把握认为物理成绩优秀与数学成绩优秀有关系.1.两个分类变量X 和Y 的值域分别为{x 1,x 2}和{y 1,y 2},其样本频数分别是a =10,b =21,c +d =35.若X 与Y 有关系的可信程度不小于97.5%,则c 等于(已知当χ2>5.024时,则有97.5%的把握认为变量X 与Y 有关系)( )A .3B .4C .5D .6解析χ2=66×[10(35-c )-21c ]231×35×(10+c )(56-c )>5.024,把选项A ,B ,C ,D 代入验证可知选A .答案:A2.在打鼾与患心脏病之间的关系研究中,通过收集数据、整理分析数据得“打鼾与患心脏病有关”的结论,并且有99%以上的把握认为这个结论是成立的.下列说法中正确的是( )A .100个心脏病患者中,至少有99人打鼾B .1个人患心脏病,则这个人有99%的概率打鼾C .在100个心脏病患者中,一定有打鼾的人D .在100个心脏病患者中,可能1个打鼾的都没有解析 由题意知,“打鼾与患心脏病有关”的结论有99%以上的把握正确,而不是心脏病患者打鼾的概率为99%,故选D .答案:D3.独立性检验中,若两个分类变量“X 和Y 有关系”的可信程度是95%,则随机变量χ2的取值范围是________________.解析 当χ2>3.841时,有95%的把握判定X 与Y 有关系,当χ2>6.635时,有99%的把握判定X 与Y 有关系,∴3.841<χ2≤6.635.答案:(3.841,6.635]4.假设有两个分类变量X 与Y ,它们的可能取值分别为{x 1,x 2}和{y 1,y 2},其中2×2列联表如下:________.(填序号)①a =5,b =4,c =3,d =2; ②a =5,b =3,c =4,d =2; ③a =2,b =3,c =4,d =5; ④a =2,b =3,c =5,d =4.解析 四个选项中a +b +c +d 的值与(a +b )(a +c )(c +d )(b +d )的值分别相等,则由χ2的计算公式,可知只需计算(ad -bc )2.经计算,知其值最大的一组是④.答案:④5.某城市随机抽取一年内100天的空气质量指数API 的监测数据,统计结果如下表:(1)ω)的关系式为S =⎩⎪⎨⎪⎧0(0≤ω≤100),4ω-400(100<ω≤300),2 000(ω>300).试估计在本年内随机抽取一天,该天经济损失S 大于200元且不超过600元的概率. (2)若本次抽取的样本数据有30天是在供暖季,其中有8天为重度污染,完成下面2×2列联表,并判断能否有95%的把握认为该市本年空气重度污染与供暖有关.解 (1)设“600元”为事件A ,由200<S ≤600,得150<ω≤250,频数为39. ∴P (A )=39100.(2)根据已知数据得到如下列联表:χ2=100×(22×7-63×8)85×15×30×70≈4.575>3.841.所以有95%的把握认为空气重度污染与供暖有关.6.目前,在“互联网+”和“大数据”浪潮的推动下,在线教育平台如雨后春笋般蓬勃发展,与此同时,很多学生家长和相关专家对在线教学也产生了质疑,主要原因就是对在线教学,学生是否能认真听讲存在疑虑.在这种情况下,某市教育主管部门在该市各中小学采用分层抽样的方式抽出15周岁以下和15周岁以上各200人进行调查研究,其中15周岁以下的能认真听讲的有150人,不能做到认真听讲的有50人,15周岁以上的170人能认真听讲,不能做到认真听讲的有30人.(1)完成下列2×2列联表:97.5%的把握判定两个变量有关联)(3)现用分层抽样的方法,从15周岁以下的人中抽取8人,在这8人中任取2人进行座谈,求抽到的人中至少有1人能认真听讲的概率.解 (1)填表如下:(2)χ2=400×(50×170-30×150)280×320×200×200=6.25.因为6.25>5.024,所以有97.5%的把握认为能否认真听讲与年龄有关.(3)由题意可知,从15周岁以下抽8人,其中能认真听讲的为6人,不能认真听讲的为2人.设能认真听讲的人为a 1,a 2,a 3,a 4,a 5,a 6,不能认真听讲的人为b 1,b 2,于是,在8人中任意抽取2人有(a 1,a 2),(a 1,a 3),(a 1,a 4),(a 1,a 5),(a 1,a 6),(a 2,a 3),(a 2,a 4),(a 2,a 5),(a 2,a 6),(a 3,a 4),(a 3,a 5),(a 3,a 6),(a 4,a 5),(a 4,a 6),(a 5,a 6),(b 1,a 1)(b 1,a 2),(b 1,a 3),(b 1,a 4)(b 1,a 5),(b 1,a 6),(b 2,a 1),(b 2,a 2)(b 2,a 3),(b 2,a 4),(b 2,a 5),(b 2,a 6),(b 1,b 2)共28种,其中,至少有1人能认真听讲的对立事件是2人都不能认真听讲,只有(b 1,b 2)一种情况.于是,设事件A =“至少有一人认真听讲”, 则P (A )=1-P (A -)=2728.。
8.3列联表与独立性检验课件-高二数学人教A版选择性必修第三册
自主学习
2. 2×2 列联表:
一般地,假设有两个分类变量 X 和 Y,它们的取值分别为{x1,x2}和{y1,y2},其
样本频数列联表(称为 2×2 列联表)为
y1
y2
合计
x1 x2 合计
a c a+c
b d b+d
a+b c+d a+b+c+d
自主学习
(1)列联表是两个或两个以上分类变量的汇总统计表,现阶段我们仅研究 两个分类变量的列联表,并且每个分类变量只取两个值,这样的列联表 称为2×2列联表. (2)列联表有助于直a 观地观测数据之间的关系,如a表示既满足x1,又满 足y1的样本量,a+b 表示在x1情况下,又满足y1条件的样本所占的频率.
课后作业
对应课后练习
经典例题
题型二 独立性检验
解: (1)2×2 列联表如表所示:
教师年龄
对新课程教学模式
赞同
不赞同
老教师
10
10
青年教师
24
6
合计
34
16
合计
20 30 50
经典例题
题型二 独立性检验
(2)零假设为 H0:对新课程教学模式的赞同情况与教师年龄无关.
由公式得
χ2=50×
10×6-24×10 34×16×20×30
63
117
180
女生
42
82
124
合计
105
199
304
根据表中数据,则下列说法正确的是________.(填序号) ①性别与知道想学专业有关; ②性别与知道想学专业无关; ③女生比男生更易知道所学专业.
当堂达标
② 解析:
χ2=304×1806×31×2842×-10452××119197
【高中数学】列联表与独立性检验课件 2022-2023学年高二下学期人教A版2019选择性必修第三册
假设我们通过简单随机抽样得到了 X 和 Y 的抽样数据列联表,如下所示.
X
X=0 X=1 合计
Y
Y=0
Y=1
a
b
c
d
a+c
b+d
合计
a+b c+d n=a+b+c+d
思考:如何基于上面的四个等式及列联表中的数据,构造适当的统计量,
对成对分类变量 X 和 Y 是否相互独立作出判断?
在零假设 H0 成立的条件下,根据频率稳定于概率的原理,由②式中
考虑以 Ω 为样本空间的古典概型. 设 X 和 Y 为定义在 Ω 上,取值于 {0,1}的成对分类变量. 我们希望判断事件{ X = 1}和{ Y = 1}之间是否有 关联. 注意到{ X = 0}和{ X = 1},{ Y = 1}和{ Y = 1}都是互为对立事件, 与前面的讨论类似,我们需要判断下面的假定关系
在实践中,由于保存原始数据的成本较高,人们经常按照研究问题 的需要,将数据分类统计,并做成表格加以保存. 我们将上例中的数据统 计表称为 2×2 列联表. 2×2 列联表给出了成对分类变量的交叉分类频数. 它包含了 X 和 Y 的如下信息:最后一行的前两个数分别是事件{Y = 0}和 {Y = 1}中样本点的个数;最后一列的前两个数分别是事件{X = 0}和 {X = 1}中样本点的个数;中间的四个数是表格的核心部分,给出了事件{X = x,Y = y}(x,y=0,1)中样本点的个数;右下角格中的数是样本空间中 样本点的总数.
我们用{ X = 0,Y = 1}表示事件{ X = 0}和{ Y = 1}的积事件,用{ X =
1,Y = 1}表示事件{ X = 1}和{ Y = 1}的积事件. 根据古典概型和条件概率
高中数学 第四章 典型统计案例 4.2 事件的独立性课件 湘教版选修1-2
方法技巧 如何求相互独立事件概率
【例4】 某田径队有三名短跑运动员,根据平时训练情况
统计甲、乙、丙三人100米跑(互不影响)的成绩在13 s内
(称为合格)的概率分别为
2 5
,
3 4
,
1 3
,若对这三名短跑运
动员的100 m跑的成绩进行一次检测,则
(1)三人都合格的概率;
(2)三人都不合格的概率;
(3)出现几人合格的概率最大.
解 记元件A、B、C正常工作的事件分别为A、B、C,由已 知条件P(A)=0.80,P(B)=0.90,P(C)=0.90. (1)因为事件A、B、C是相互独立的,所以,系统N1正常工作 的 概 率 是 P1 = P(ABC) = P(A)P(B)P(C) = 0.80×0.90×0.90 = 0.648. 故系统N1正常工作的概率为0.648.
(1)“甲第三次试跳才成功”为事件 A 1·A 2·A3,且三次试跳 相互独立, ∴P( A 1 A 2A3)=P( A 1)P( A 2)P(A3) =0.3×0.3×0.7=0.063. 故甲第三次试跳才成功的概率为0.063.
(2)“甲、乙两人在第一次试跳中至少有一人成功”为事件 C. 法一 ∵C=A1 B 1+ A 1B1+A1B1,且A1 B 1, A 1B1,A1B1彼 此互斥, P(C)=P(A1 B )+P( A 1B1)+P(A1B1) =P(A1)P( B 1)+P( A 1)P(B1)+P(A1)P(B1) =0.7×0.4+0.3×0.6+0.7×0.6 =0.88.
个试验是相互独立的,就称这些试验的全集Ω1,Ω2,…,
Ωn是相互独立的.则对A1⊆Ω1,A2⊆Ω2,…,An⊆Ωn,有
P(A1∩A2∩…∩An)
独立性检验(课件)高二数学(人教A版2019选修第三册)
|ad-bc|越大,说明玩电脑游戏与注意力集中之间的关系越强.
为了使不同样本容量的数据有统一的评判标准,我们构造一个随
机变量
n(ad-bc)2 χ2=
(a+b)(c+d)(a+c)(b+d)
这种利用χ2的取值推断分类变量X和Y是否独立的方法称为χ2独立性 检验,读作卡方独立性检验,简称独立性检验.
若H0成立,即玩电脑游戏与注意力集中没有关系,则χ2应该 很小;若H0不成立,即玩电脑游戏与注意力集中有关系,则χ2应 该很大.那么,究竟χ2大到什么程度,可以推断H0不成立呢?
2 88(33 7 10 38)2
43 45 7117
α
0.1 0.05 0.01 0.005
xα 2.706 3.841 6.635 7.879
学校
甲校(X=0) 乙校(X=1)
合计
数学成绩
不优秀(Y=0) 优秀(Y=1)
33
10
38
7
71
17
0.001 10.828
合计
43 45 88
0.837 2.706 x0.1.
于不同的小概率值α的检验规则,对应不同的临界值x0,其与χ2的大小关 系可能不同,相当于检验的标准发生变化,因此结论可能会不同.
3. 为考察某种药物A对预防疾病B的效果,进行了动物试验,根据105个有
放回简单随机样本的数据,得到如下列联表: 依据α=0.05的独立性检验,分析药物A对
药物A
疾病B 未患病 患病
解:根据题意,可得
xα 2.706 3.841 6.635 7.879 10.828
2 4.881 3.841 x0.05 .
根据小概率值α=0.05的χ2独立性检验,推断H0不成立,即认为两种疗 法的效果有差异,该推断犯错误的概率不超过0.05.
湘教版高中数学选修2-2《列联表独立性分析案例》教案3
列联表独立性分析案例(3)一、教学目标(一)知识目标通过对典型案例(如“色弱与性别是否有关”“中学生物理考试成绩和吃早点是否相关”)的探究,了解独立性检验(只要求2×2列联表)的基本思想、方法及初步应用。
(二)能力目标让学生经历数据处理的过程,会用所学知识对具体案例进行检验,提高探索解决问题的能力。
(三)情感目标从实例中发现问题,提高学习兴趣,激发学习积极性和主动性,不断自我完善,养成不断探求知识完善自我的良好态度。
二、教学重点进一步理解独立性检验的实施步骤三、教学难点对临界值的理解作出判断四、教学过程(一)引入课题独立性检验的步骤。
1.若要推断的论述为H1:“X与Y有关系”。
可按如下步骤判断H1成立的可能性。
A通过三维柱形图和二维条形图,粗略判断两个分类变量是否有关系。
B可以利用独立性检验来考察两个分类变量是否有关系。
并能精确判断可靠程度。
2.由观测数据算2 ,其值越大,说明“X与Y有关系”成立的可能性越大。
3.由临界值表确定可靠程度。
(二)案例讲解有300人按性别和是否色弱分类如表问色弱与性别是否有关?分析:设从表格中提供的统计数据,可以计算得到如下数值:男性所占百分比:132120.48300+=;女性所占百分比:15150.52300+= 在这300人的样本中,男性色弱患者的百分比:120.04300≈;女性色弱的百分比:50.017300≈ 直观上看,300人中男性色弱的比例高于女性(0.040.017>)。
色弱应该与性别有关。
下面进一步运用独立性的概念进行检验。
从300人中随机选取一人,设1A 表示男性,2A 表示女性,1B 表示色觉正常,2B 表示色弱。
则:1()0.48P A =,2()0.52P A =,2125()0.06300P B +=≈ P (此人为男性且色弱)=12()0.04P A B = 而12()()0.480.060.028P A P B =⨯= 显然1212()()()P A B P A P B ≠P (此人为女性且色弱)=22()0.017P A B =,22()()0.520.060.031P A P B =⨯= 显然2222()()()P A B P A P B ≠因此,1A 与2B 、2A 与2B 都不是独立的。
2023届高考数学复习 第48讲 数据分析 —— 列联表与独立性检验(共39张PPT)
研题型 ·融会贯通
分类解析
独立性检验
某高中学校为了解高二年级学生在 2021 年高考和中考期间居家学习的自制
力,随机抽取了 100 名学生,请他们的家长(每名学生请一位家长)对学生打分,满分为
10 分.下表是家长所打分数 x 的频数统计:
分数 x
5
6
7
8
9
10
频数
5
15
20
25
20
15
(1) 求家长所打分数的平均值 x ;
0.001
xα
3.841
以下结论中正确的是( C )
6.635
10.828
A. 在犯错误的概率不超过 0.1%的前提下,认为“生育意愿与城市级别有关”
B. 在犯错误的概率不超过 0.1%的前提下,认为“生育意愿与城市级别无关”
C. 有 99%以上的把握认为“生育意愿与城市级别有关”
D. 有 99%以上的把握认为“生育意愿与城市级别无关”
愿,某机构用简单随机抽样方法从不同地区调查了 100 位育龄妇女,结果如下表:
非一线
一线
总计
愿生
45
20
65
不愿生
13
22
35
总计
58
42
100
由 χ2=a+bcn+add-ab+cc2b+d,
得 χ2=100×65×453×5×225-8×204×2132≈9.616.
参照下表,
α
0.050
0.010
男性
30
15
45
女性
45
10
55
总计
75
25
100
附:
α
0.15
高中数学《统计与统计案例》课件
设施投资额的变化规律呈线性增长趋势,利用 2010 年至 2016 年的数据建立的线性模型y =99+17.5t 可以较好地描述 2010 年以后的环境基础设施投资额的变化趋势,因此利用 模型②得到的预测值更可靠.
13
考点整合
1.抽样方法 抽样方法包括简单随机抽样、系统抽样、分层抽样,三种抽样方法都是等概率抽样, 体现了抽样的公平性,但又各有其特点和适用范围.
位,则该校阅读过《西游记》的学生人数与该校学生总数比值的估计值为( )
A.0.5
B.0.6
C.0.7
D.0.8
解析 法一 设调查的 100 位学生中阅读过《西游记》的学生人数为 x,则 x+80-60
=90,解得 x=70,所以该校阅读过《西游记》的学生人数与该校学生总数比值的估计
值为17000=0.7.故选 C.
解 (1)由调查数据,男顾客中对该商场服务满意的比率为4500=0.8,因此男顾客对该商场
服务满意的概率的估计值为 0.8.女顾客中对该商场服务满意的比率为3500=0.6,因此女顾
客对该商场服务满意的概率的估计值为 0.6.
8
(2)K2 的观测值 k=100×5(0×405×0×207-0×303×010)2≈4.762. 由于4.762>3.841,故有95%的把握认为男、女顾客对该商场服务 的评价有差异.
^
利用模型②,该地区 2018 年的环境基础设施投资额的预测值为y=99+17.5×9=256.5(亿 元).
12
(2)利用模型②得到的预测值更可靠. 理由如下: 从折线图可以看出,2000 年至 2016 年的数据对应的点没有随机散布在直线 y=-30.4+ 13.5t 上下,这说明利用 2000 年至 2016 年的数据建立的线性模型①不能很好地描述环境 基础设施投资额的变化趋势.2010 年相对 2009 年的环境基础设施投资额有明显增加, 2010 年至 2016 年的数据对应的点位于一条直线的附近,这说明从 2010 年开始环境基础
数学优秀课件 列联表独立性分析案例
思考 如果K 2 6答.635:,就判断断定H出0不错成立的,概这种率判为断出0.错01的。可能性有多大?
现在观测值k 9965(7775 49 42 2099)2 56.632太大了, 7817 2148987491
在H
成立的情况下能够出现这样的观测值的概率不超过0.01,
0
因此我们有99%的把握认为H
求解思路:
1. 在H0成立的条件下,构造与H0矛盾的小概 率事件;
2. 如果样本使得这个小概率事件发生,就能 以一定把握断言H1成立;否则,断言没有 发现样本数据与H0相矛盾的证据。
课题:选修2-3 8.4独立性检验
两种变量:
再冷的石头,坐上三年也会暖 !
定量变量:体重、身高、温度、考试成绩等等。
那么这个值到底能告诉我们什么呢?
课题:选修2-3 8.4独立性检验
再冷的石头,坐上三年也会暖 !
在H0成立的情况下,统计学家估算出如下的概率
P(K 2 6.635) 0.01.
(2)
即在H0成立的情况下,K2的值大于6.635的概率非常小,近似 于0.01。
也就是说,在H0成立的情况下,对随机变量K2进行多次观 测,观测值超过6.635的频率约为0.01。
再冷的石头,坐上三年也会暖 !
独立性检验
随机变量-----卡方统计量 K 2
n(ad bc)2
,
(a b)(c d )(a c)(b d )
临界值表
其中n a b c d为样本容量。
P(K2 k0 ) 0.50
k0 0.455
0.40 0.708
0.25 1.323
0.15 2.072
例2:为研究不同的给药方式(口服与注射)和药的效果(有效 与无效)是否有关,进行了相应的抽样调查,调查的结果列 在表中,根据所选择的193个病人的数据,能否作出药的效果 和给药方式有关的结论?
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
所以,有99%的把握认为语文、数学、英语、综合科目上线 与总分上线有关系,数学上线与总分上线关系最大.
方法点评
在掌握了独立性检验的基本思想后我们一般通过
计算 χ2 的值,然后比较 χ2 值与临界值的大小来较精确地给出
“两个分类变量”的可靠程度.
【训练2】 某校高三年级在一次全年级的大型考试中 ,数学
典例剖析 题型一 两个事件的独立性检验 【例1】 某推销商为某保健药品做广告,在广告中宣传“在
服用该药品的105人中有100人未患A疾病”.经调查发现,
在不服用该药品的 418 人中仅有 18 人患 A 疾病 , 请用所学 知识分析该药品对患A疾病是否有效?
解 将问题中的数据写成2×2列联表:
患A疾病 服用该药品 不服用该药品 合计 5 18 23 不患A疾病 100 400 500 合计 105 418 523
[错因分析] 提出统计假设H0:种子是否经过处理与是否生
2 407 × 32 × 213 - 101 × 61 病无关.χ2= ≈0.164<3.841,所 133×274×93×314
以种子是否经过处理与是否生病无关.
[正解] B
纠错心得
本题是利用 χ2 公式求出 χ2 的值,再利用与临界值
所以有99%的把握认为“秃顶与患心脏病有关”.
题型二 独立性检验的综合应用
【例2】 某市对该市一重点中学2010年高考上线情况进行统 计,随机抽查244名学生,得到如下表格:
语文 上线 总分 上线 201人 不上 线
数学
英语 不上 线
综合科目 上 线 不 上 线
上线 不上线 上线
174
27
178
23
物理非优秀 132
合计 360
数学非优秀 合计
143 371
737 869
880 1 240
将表中数据代入公式χ2得χ2≈270.114.
(2)列出数学与化学优秀的2×2列联表如下:
化学优秀 数学优秀 数学非优秀 合计 225 156 381 化学非优秀 135 724 859 合计 360 880 1 240
4.3 列联表独立性分析案例
【课标要求】 1.通过典型案例的探究,了解独立性检验(只要求2×2列联 表)的基本思想、方法及其简单应用.
2 .本节的重点和难点是独立性检验的思想、方法及其初步
应用.
自学导引 1.在 2× 2 列联表中,χ2 统计量的计算公式为 nad-bc2 a+bc+da+cb+d 2 χ= , n= a+b+c+d .
答案 2×2列联表 5
4.下面是一个2×2列联表:
y1 x1 x2 总 计 a 6 b
y2 25 32 57
总计 45 38
则表中a、b处的值分别为______、______. 解析 a+25=45,∴a=20,又a+6=b,∴b=26. 答案 20 26
名师点睛 1.两个事件A与B独立的含义 如果事件A与B的发生彼此互不影响,或者影响可以忽略 不计,就可以认为它们是独立的.如果把事件A,B同时 发生记作AB,那么就有P(AB)=P(A)P(B),此时还有P( A B)=P( A )P(B),P(A B )=P(A)P( B ),P( A P( A )P( B ). B )=
成绩优秀和非优秀的学生中,物理、化学也为优秀的人 数如下表所示,则数学成绩优秀与物理、化学也优秀哪 个关系较大?
物理 数学优秀 数学非优秀 228 143
化学 225 156
注:该年级此次考试中数学成绩优秀的有 360人,非优秀
的有880人.
解 (1)列出数学与物理优秀的2×2列联表如下:
物理优秀 数学优秀 228
176
25
175
26
续表
总分不上 线43人 总计
30
204
13
40
23
201
20
43
24
200
19
44
26
201
17
43
试求各科上线与总分上线之间的关系,并求出哪一科目与总 分上线关系最大?
解
2 对于上述四个科目,分别构造四个随机变量χ 2 1 ,χ 2 ,
2 χ2 , χ 3 4.
由表中数据可以得到
的大小关系来判断假设是否成立,解题时应注意准确代数与
计算,不可错用公式,要准确进行比较与判断.
2 244 × 174 × 13 - 27 × 30 语文:χ2 ≈7.294>6.635, 1= 201×43×204×40
2 244 × 178 × 20 - 23 × 23 数学:χ2 ≈30.008>6.635, 2= 201×43×201×43 2 244 × 176 × 19 - 25 × 24 英语:χ2 ≈24.155>6.635, 3= 201×43×200×44 2 244 × 175 × 17 - 26 × 26 综合科目:χ 2 ≈17.264>6.635, 4= 201×43×201×43
答案 A
2.在一个2×2列联表中,由其数据计算得χ2=13.097,则其 两个变量间有关系的可能性为 ( ).
A.99%
C.90% 解析
B.95%
D.无关系
因为 χ2 = 13.097,13.097>6.635 ,所以两个变量间有
关系的可能性为99%. 答案 A
3.用χ2统计量进行独立性检验时,使用的表称为________, 要求表中的四个数据均大于________.
2 n ad - bc 将上述数据代入公式χ2= 中,计算 a+bc+da+cb+d
可得χ2≈0.041 4,因为0.0414<3.841,故没有充分理由认为 该保健药品对预防A疾病有效.
方法点评
(1)利用独立性假设可以帮助我们定量分析两个分
类变量之间是否有关系,因此利用它可以帮助我们理性地看 待广告中的某些数字,从而不被某些虚假广告所蒙骗. (2)独立性检验的一般步骤:
①根据样本数据制成2×2列联表;
②根据公式,计算χ2的值; ③比较χ2与临界值3.841与6.635的大小,作统计推断.
【训练1】 在某医院,因为患心脏病而住院的665名男性病人 中,有214人秃顶,而另外772名不是因为患心脏病而住 院的男性病人中有175人秃顶.请用独立性检验方法判 断秃顶与患心脏病是否有关系?
一般地,如果事件A1、A2、…,An相互独立,那么这n个事件 同时发生的概率等于每个事件发生的概率的乘积,即
P(A1A2…An)=P(A1)P(A2)…P(An).
2.χ2(读作“卡方”)统计量 统计学中有一个非常有用的χ2统计量,它的表达式是:
2 n ad - bc χ2= ,用它的大小可以决定是 a+bc+da+cb+d
95% 的 把 2.当根据具体的数据算出的χ2>3.841时,有 99% 握说事件A与B 有关 ;当χ2>6.635时,有 的把握说事 有关χ2≤3.841时,认为事件A与B是 件A与B ,当 的. 无关
自主探究 什么是独立性检验的基本思想? 提示 独立性检验的基本思想类似于反证法, 要确认“两个 分类变量有关系”这一结论成立的可信度,首先假设该结论
解 根据题目所给数据得到如下列联表:
秃顶与患心脏病列联表 患心脏病 秃 顶 不秃顶 214 451 患其他病 175 597 总 计 389 1 048
总 计
665
772
1 437
根据列联表中的数据,得到
2 1 437 × 214 × 597 - 175 × 451 χ2= ≈16.373>6.635. 389×1 048×665×772
种子经过处理 种子未经过处理
生病 不生病 合计 32 61 93 101 213 314
合计
133 274 407
根据以上数据可以判断
A.种子是否经过处理跟是否生病有关 B.种子是否经过处理跟是否生病无关 C.种子是否经过处理决定是否生病 D.以上都是错误的
(
).
[错解]
因为种子经过处理后,生病的可能性会变小,故选A.
件A与B有关;当χ2≤3.841时,认为事件A与B是无关的.
3.反证法原理与独立性检验原理的比较
反证法原理—— 在假设 H0 下,如果推出一个矛盾 ,就证明
了H0不成立. 独立性检验原理 —— 在假设H0 下,如果出现一个与 H0 相矛 盾的小概率事件 , 就推断 H0 不成立 , 且该推断犯错误的 概率不超过小概率.
否拒绝原来的统计假设H0.如果算出的χ2值较大,就拒 绝H0,也就是拒绝“事件A与B无关”,从而就认为它 们是有关的了.
经过对χ2统计量分布的研究,已经得到了两个临界值: 3.841与6.635.当根据具体的数据算出的 χ2>3.841时,有95% 的把握说事件 A 与 B有关;当 χ2>6.635 时 ,有 99% 的把握说事
将表中数据代入公式计算得χ2≈240.611. 由上面分析可知,数学成绩优秀与物理、化学优秀都有关系, 由计算χ2的值都大于 6.635,可以说明都有 99%的把握认为数 学优秀与物理、化学优秀有关系,但与物理关系最大,化学
其次.
误区警示 不能准确理解两个变量相关的统计
含义导致错误 【例3】 考察棉花种子是否经过处理跟生病之间的关系没有关系”成立,在该
假设下构建的随机变量χ2应该很小.如果由观测数据计算得 到的χ2的观测值很大,则在一定程度上说明假设不合理.
预习测评 1.若事件 A 与事件 B 相互独立,则下列各式不正确的是 ( A.P( A B )=P( A )+P( B ) B.P( A B)=P( A )P(B) C.P(A B )=P(A)P( B ) D.P(AB)=P(A)P(B) ).