北师大版高中数学选修1-2:独立性检验
北师版数学高二-选修1-2独立性检验典型题例解析
独立性检验典型题例解析所谓独立性检验,就是要把采集样本的数据,利用公式计算2χ的值,比较与临界值的大小关系,来判定事件A 与B 是否无关的问题。
具体步骤:(1)采集样本数据。
(2)由()21212211222112+++++++-=n n n n n n n n n χ计算2χ的值。
(3)统计推断,当2χ>3.841时,有95%的把握说事件A 与B 有关;当2χ>6.635时,有99%的把握说事件A 与B 有关;当2χ≤3.841时,认为事件A 与B 是无关的。
下面我们通过几个典型例题对独立性检验问题进行剖析,使同学们进一步掌握这类问题的研究方法。
例1、为了研究色盲与性别的关系,调查了1000人,调查结果如下表所示:根据上述数据试问色盲与性别是否是相互独立的? 分析:问题归结为二元总体的独立性检验问题。
【解析】由已知条件可得下表依据公式()21212211222112+++++++-=n n n n n n n n n χ得2χ=()5204804495651438644210002⨯⨯⨯⨯-⨯=27.139。
由于27.139>6.635,所以有99%的把握认为色盲与性别是有关的,从而拒绝原假设,可以认为色盲与性别不是相互独立的。
评注:根据假设检验的思想,比较计算出的2χ与临界值的大小,选择接受假设还是拒绝假设。
变式引申1:为了研究患慢性气管炎与吸烟量的关系,调查了228人,其中每天的吸烟支数在10支以上20支以下的调查者中,患者人数有98人,非患者人数有89人;每天的吸烟支数在20支以上的调查者中,患者人数有25人,非患者人数有16人。
试问患慢性气管炎是否与吸烟量互相独立?分析:即求独立性检验问题。
【解析】由已知条件得出下表:由公式()21212211222112+++++++-=n n n n n n n n n χ得2χ=()4118710512325891698228⨯⨯⨯⨯-⨯=0.994。
北师大版高中数学选修1-2课件1.2.2-1.2.4独立性检验独立性检验的基本思想独立性检验的应用
学习脉络
-2-
2.2 2.3 2.4
1
独立性检验 独立性检验的基本思想 独立性检验的应用
2
首 页
J 基础知识 Z 重点难点
ICHU ZHISHI
HONGDIAN NANDIAN
S 随堂练习
UITANG LIANXI
1.2×2 列联表 设 A,B 为两个变量,每一个变量都可以取两个值, 变量 A:A1,A2=������1 ;变量 B:B1,B2=������1 . 若用 a 表示变量 A 取 A1,且变量 B 取 B1 时的数据;用 b 表示变量 A 取 A1,且变量 B 取 B2 时的数据;用 c 表示变量 A 取 A2,且变量 B 取 B1 时的数据; 用 d 表示变量 A 取 A2,且变量 B 取 B2 时的数据,则会得到 A,B 之间的 2×2 列联表:
B A A1 A2 总计 a c a+c b d b+d a+b c+d n=a+b+c+d B1 B2 总计
-8-
2.2 2.3 2.4
1
独立性检验 独立性检验的基本思想 独立性检验的应用
2
首 页
J 基础知识 Z 重点难点
ICHU ZHISHI
HONGDIAN NANDIAN
北师大版数学选修第1章 §2 2.2 独立性检验 2.3 独立性检验的基本思想 2.4 独立性检验的应用
2.为了研究高中学生对乡村音乐的态度(喜欢和不喜欢两种态度)与
性别的关系,运用2×2列联表进行独立性检验,经计算χ2≈8.01,则认为
“喜欢乡村音乐与性别有关系”的把握性约为( )
χ2≥k
0.100
0.050
0.025
0.010
0.001
k
2.706
A.0.1%
3.841
5.024
B.1%
栏目导航
利用2×2列联表的关键及注意事项 1.作2×2列联表时,关键是对涉及的变量分清类别.注意应该是4 行4列,计算时要准确无误. 2.利用2×2列联表分析两变量间的关系时,首先要根据题中数据获 得2×2列联表,然后根据频率特征,即将a+a b与c+c d或a+b b与c+d d的值 相比,直观地反映出两个分类变量间是否相互影响,但方法较粗劣.
随机抽取了100名电视观众,相关的数据如下表所示:
文艺节目
新闻节目
总计
20至40岁
40
18
58
大于40岁
15
27
42Leabharlann 总计5545
100
由表中数据直观分析,收看新闻节目的观众是否与年龄有关:
________(填“是”或“否”).
栏目导航
是 [因为在20至40岁的58名观众中有18名观众收看新闻节目,而大 于40岁的42名观众中有27名观众收看新闻节目,即a+b b=5188,c+d d= 2472,两者相差较大,所以,经直观分析,收看新闻节目的观众与年龄是 有关的.]
栏目导航
【例3】 为了解某市创建文明城市过程中,学生对创建工作的满意 情况,相关部门对某中学的100名学生进行调查,其中有50名男生对创建 工作表示满意,有15名女生对创建工作表示不满意.已知在全部100名学 生中随机抽取1人,其对创建工作表示满意的概率为45.是否有充足的证据 说明,学生对创建工作的满意情况与性别有关?
高中数学 第一章 统计案例 独立性检验的基本思想及初步应用素材 北师大版选修1-2
独立性检验的基本思想及初步应用一.基础概念的梳理与理解1.分类变量的描述性说明:对于宗教信仰来说,其取值为信宗教信仰与不信宗教信仰两种.象这样的变量的不同值表示个体所属的不同类别的变量称为分类变量.例如性别变量其取值为男女两种,吸烟变量其取值为吸烟与不吸烟两种;2.两个分类变量:是否吸烟与患肺癌于否,性别男和女与是否喜欢数学课程等等,这是我们所要关心的;3.22⨯列联表:列出的两个分类变量X 和Y ,它们的取值分别为12{,}x x 和12{,}y y 的样本频数表称为22⨯列联表1二.两个分类变量是否有关的粗略估计1.三维柱形图:如果列联表1的三维柱形图如下图 由各小柱形表示的频数可见,对角线上的 频数的积的差的绝对值||ad bc -较大,说明两 分类变量X 和Y 是有关的,否则的话是无关的.重点:一方面考察对角线频数之差,更重要的一方面是提供了构造随机变量进行独立性检验的思路方法。
2.二维条形图(相应于上面的三维柱形图而画)图1由深、浅染色的高可见两种情况下所占比例,由数据可知a a b+要比c c d +小得多,由于差距较大,因此,说明两分类变量X 和Y 有关系的可能性较大,两个比值相差越大两分类变量X 和Y 有关的可能性也越的.否则是无关系的.重点:通过图形以及所占比例直观地粗略地观察是否有关,更重要的一方面是提供了构造随机变量进行独立性检验的思想方法。
3.等高条形图(相应于上面的条形图而画)由深、浅染色的高可见两种情况下的百分比;另一方面,数据aa b+00要比c c d+小得多,因此,说明两分类变量X 和Y 有关系的可能性较大,否则是无关系的.重点:直观地看出在两类分类变量频数相等的情况下,各部分所占的比例情况,是在图2的基础上换一个角度来理解。
三.独立性检验的基本思想上面通过分析数据与图形,,得出这个估计是粗略的,因为我们说的“大得多”、“小图2图3得多”,到底是有多大的差距?也就是说得到的结论是直观上的印象,其实与是否有关还是有较大的差距的.但是上面的分析给了我们一种重要的思想方法.下面从理论上说明两类分类变量是否有关,请同学们从中体会其思想方法 1.基本思想与图形的联系假设两类分类变量是无关的,由上面的条形图2可知如下的比应差不多。
高中数学北师大版选修1-2第一章《独立性检验》ppt课件
一:假设检验问题的原理
假设检验问题由两个互斥的假设构成,其中一个 叫做原假设,用H0表示;另一个叫做备择假设, 用H1表示。
例如,在前面的例子中, 原假设为: H0:面包分量足, 备择假设为 H1:面包分量不足。 这个假设检验问题可以表达为: H0:面包分量足 ←→ H1:面包分量不足
② 根据自己预习时理解过的逻辑结构抓住老师的思路。老师讲课在多数情况下是根据教材本身的知识结构展开的,若把自己预习时所理解过的知识 逻辑结构与老师的讲解过程进行比较,便可以抓住老师的思路。
③ 根据老师的提示抓住老师的思路。老师在教学中经常有一些提示用语,如“请注意”、“我再重复一遍”、“这个问题的关键是····”等等,这些 用语往往体现了老师的思路。来自:学习方法网
④ 紧跟老师的推导过程抓住老师的思路。老师在课堂上讲解某一结论时,一般有一个推导过程,如数学问题的来龙去脉、物理概念的抽象归纳、语 文课的分析等。感悟和理解推导过程是一个投入思维、感悟方法的过程,这有助于理解记忆结论,也有助于提高分析问题和运用知识的能力。
⑤ 搁置问题抓住老师的思路。碰到自己还没有完全理解老师所讲内容的时候,最好是做个记号,姑且先把这个问题放在一边,继续听老师讲后面的 内容,以免顾此失彼。来自:学习方法网
⑥ 利用笔记抓住老师的思路。记笔记不仅有利于理解和记忆,而且有利于抓住老师的思路。
2019/8/29
最新中小学教学课件
20
谢谢欣赏!
2019/8/29
最新中小学教学课件
21
问题: 数学家庞加莱每天都从一家
面包店买一块1000g 的面包,并记录 下买回的面包的实际质量。一年后, 这位数学家发现,所记录数据的均 值为950g。于是庞加莱推断这家面 包店的面包分量不足。
高中北师大版数学选修1-2第一章统计案例2第2课时独立性检验的基本思想及其初步应用课件5
(1)独立性检验原理只能解决“包含两个对象,且每个对象有两类属性”这一类的问题,所以对于一个 实际问题,我们要第一看能不能用独立性检验的思想加以解决.
(2)如果确实属于这类问题,要科学地抽取样本,样本容量要适当,特别是不 可太小,要保证每个数据都大于 5.
[思路分析] (1)由表格统计出甲、乙两个班的总人数和优秀人数,求出优秀率; (2)依统计数据填写列联表,代入公式计算K2的估计值,查表下结论.
[解析] (1)由题意知,甲、乙两班均有学生 50 人, 甲班优秀人数为 30 人,优秀率为3500=60%, 乙班优秀人数为 25 人,优秀率为2550=50%, 所以甲、乙两班的优秀率分别为 60%和 50%.
同期相比,结果如下:
本地 外地 合计 去年 1 407 2 842 4 249 能否在犯错误的概率不超过0.01的今前年提下认1为33票1价上2浮0后65游客3人3数96与所处地区有关系? 合计 2 738 4 907 7 645
[解析] 按照独立性检验的基本步骤,假设票价上浮后游客人数与所处地区 没有关系.
如果k≥k0,就推断“X与Y有关系”,这种推断犯错误的概率不超过α,否则就认为在犯错误的概率不超 过α的前提下不能推断“X与Y有关系”,或者在样本数据中没有发现足够证据支持结论“X与Y有关 系”.
2.由于独立性检验计算量大,要细致,避免计算失误.
〔跟踪练习1〕 “十一”黄金周前某地的一旅游景点票价上浮,黄金周过后,统计本地与外地来的游客人数,与去年
〔跟踪练习2〕
为了比较注射A,B两种药物后产生的皮肤疱疹的面积,选200只家兔做实验,将这200只家兔随机地分 成两组,每组100只,其中一组注射药物A,另一组注射药物B.
北师大版高中数学选修1-2课时训练独立性检验独立性检验的基本思想独立性检验的应用
课堂练习(三)(建议用时:60分钟)[基础达标练]一、选择题1.某医疗研究所为了检验某种血清预防感冒的作用,把500名使用血清的人与另外500名未使用血清的人一年中的感冒记录作比较,提出假设H:“这种血清不能起到预防感冒的作用”,利用2×2列联表计算的χ2≈3.918,经查临界值表知P(χ2>3.841)≈0.05,则下列表述中正确的是( )A.有95%的把握认为“这种血清能起到预防感冒的作用”B.若有人未使用该血清,那么他一年中有95%的可能性得感冒C.这种血清预防感冒的有效率为95%D.这种血清预防感冒的有效率为5%A[因χ2≈3.918>3.841,故有95%的把握认为“这种血清能起到预防感冒的作用”.] 2.有两个分类变量X与Y的一组数据,由其列联表计算得χ2≈4.523,则认为“X与Y 有关系”犯错误的概率为( )A.95% B.90%C.5% D.10%C[χ2≈4.523>3.841.这表明认为“X与Y有关系”是错误的可能性约为0.05,即认为“X与Y有关系”犯错误的概率为5%.]3.在调查中发现480名男人中有38名患有色盲,520名女人中有6名患有色盲.下列说法正确的是( )A.男、女患色盲的频率分别为0.038,0.006B.男、女患色盲的概率分别为19240,3260C.男人中患色盲的比例比女人中患色盲的比例大,患色盲与性别是有关的D.调查人数太少,不能说明色盲与性别有关C[男人中患色盲的比例为38480,要比女人中患色盲的比例6520大,其差值为⎪⎪⎪⎪⎪⎪38480-6520≈0.0676,差值较大.]4.某卫生机构对366人进行健康体检,其中某项检测指标阳性家族史者糖尿病发病的有16人,不发病的有93人;阴性家族史者糖尿病发病的有17人,不发病的有240人,有多少的把握认为糖尿病患者与遗传有关系.( )A.99.9% B.90%C.99% D.95%D [可以先作出如下列联表(单位:人):糖尿病患者与遗传列联表:χ2=366×(16×240-17×93)2109×257×33×333≈6.067>3.841.故我们有95%的把握认为糖尿病患者与遗传有关系.]5.假设有两个分类变量X 与Y ,它们的可能取值分别为{x 1,x 2}和{y 1,y 2},其2×2列联表为:A .a =5,b =4,c =3,d =2B .a =5,b =3,c =4,d =2C .a =2,b =3,c =4,d =5D .a =2,b =3,c =5,d =4 D [比较⎪⎪⎪⎪⎪⎪a a +b -c c +d .选项A 中,⎪⎪⎪⎪⎪⎪59-35=245;选项B 中,⎪⎪⎪⎪⎪⎪58-46=124;选项C 中,⎪⎪⎪⎪⎪⎪25-49=245;选项D 中,⎪⎪⎪⎪⎪⎪25-59=745.故选D.]二、填空题6.调查者通过随机询问72名男女中学生喜欢文科还是理科,得到如下列联表(单位:名):性别与喜欢文科还是理科列联表:有 [通过计算χ2=72×(16×8-28×20)236×36×44×28≈8.42>6.635.故我们有99%的把握认为中学生的性别和喜欢文科还是理科有关系.]7.某高校“统计初步”课程的教师随机调查了选该课的一些学生情况,具体数据如下表:χ2=50×(13×20-10×7)223×27×20×30≈4.844,因为χ2>3.841,所以判定主修统计专业与性别有关系,那么这种判断出错的可能性为________.5% [∵χ2>3.841,所以有95%的把握认为主修统计专业与性别有关,出错的可能性为5%.]8.在吸烟与患肺病是否相关的判断中,有下面的说法:①若统计量χ2>6.635,则在犯错误的概率不超过0.01的前提下,认为吸烟与患肺病有关系,那么在100个吸烟的人中必有99人患有肺病;②由独立性检验可知在犯错误的概率不超过0.01的前提下,认为吸烟与患肺病有关系时,若某人吸烟,则他有99%的可能患有肺病;③由独立性检验可知在犯错误的概率不超过0.05的前提下,认为吸烟与患肺病有关系时,是指有5%的可能性使得推断错误.其中说法正确的是________.(填序号)③ [统计量χ2是检验吸烟与患肺病相关程度的量,是相关关系,而不是确定关系,是反映有关和无关的概率,故说法①错误;说法②中对“确定容许推断犯错误概率的上界”理解错误;说法③正确.]三、解答题9.在研究某种新措施对猪白痢防治效果问题中,得到以下数据:[解] 由列联表,可知a =132,b =18,c =114,d =36,n =a +b +c +d =300.由以上数据可得,χ2=300×(132×36-18×114)2(132+18)(114+36)(36+18)(114+132)≈7.32.因为7.32>6.635.因此我们有99%的把握认为新措施对预防猪白痢是有效的.10.某班主任对班级22名学生进行了作业量多少的调查,数据如下表:在喜欢玩电脑游戏的12人中,有10人认为作业多,2人认为作业不多;在不喜欢玩电脑游戏的10人中,有3人认为作业多,7人认为作业不多.(1)根据以上数据建立一个2×2列联表;(2)试问喜欢电脑游戏与认为作业多少是否有关系? [解] (1)由题意列出2×2列联表:χ2=22×(10×7-3×2)212×10×13×9≈6.418,∵6.418>3.841,∴有95%的把握认为玩电脑游戏与认为作业多少有关系.[能力提升练]1.通过随机询问110名性别不同的大学生是否爱好某项运动,得到如下的列联表:由χ2=(a +b )(c +d )(a +c )(b +d )算得,χ2=110×(40×30-20×20)260×50×60×50≈7.8.附表:A .在犯错误的概率不超过0.1%的前提下,认为“爱好该项运动与性别有关”B .在犯错误的概率不超过0.1%的前提下,认为“爱好该项运动与性别无关”C .有99%以上的把握认为“爱好该项运动与性别有关”D .有99%以上的把握认为“爱好该项运动与性别无关” C [根据独立性检验的思想方法,正确选项为C.]2.某班主任对全班50名学生进行了作业量的调查,数据如下表:A .0.01B .0.025C .0.10D .0.050D [χ2=50×(18×15-8×9)226×24×27×23≈5.059>3.841,因为P (χ2>3.841)=0.050,所以这种推断犯错误的概率不超过0.050.]3.某研究小组为了研究中学生的身体发育情况,在某中学随机抽出20名15至16周岁的男生,将他们的身高和体重制成2×2列联表,根据列联表中的数据,可以在犯错误的概率不超过________的前提下认为该学校15至16周岁的男生的身高和体重之间有关系.0.050 [根据公式χ2=(a +b )(c +d )(a +c )(b +d )得,χ2=5×15×7×13≈5.934,因为χ2>3.841,因此在犯错误的概率不超过0.050的前提下认为该学校15至16周岁的男生的身高和体重之间有关系.]4.为了探究电离辐射的剂量与人体的受损程度是否有关,用两种不同剂量的电离辐射照射小白鼠,在照射后14天的结果如下表所示:小白鼠的死亡与剂量无关[根据独立性检验的基本思想,可知类似反证法,即要确认“两个分类变量有关系”这一结论成立的可信程度,首先假设该结论不成立,即假设结论“两个分类变量没有关系”成立.对本题进行统计分析时的统计假设应是“小白鼠的死亡与剂量无关”.]5.为了研究“教学方式”对教学质量的影响,某高中数学老师分别用两种不同的教学方式对入学数学平均分数和优秀率都相同的甲、乙两个高一新班进行教学(勤奋程度和自觉性都一样).以下茎叶图为甲、乙两班(每班均为20人)学生的数学期末考试成绩.少有一名被抽中的概率;(2)学校规定:成绩不低于75分的为优秀.请填写下面的2×2列联表,并判断有多大把握认为“成绩优秀与教学方式有关”.⎝⎛⎭⎪⎫参考公式:χ2=n (ad -bc )2(a +b )(c +d )(a +c )(b +d )[解] (1)记成绩为87分的同学为A ,B ,其他不低于80分的同学为C ,D ,E ,“从甲班数学成绩不低于80分的同学中随机抽取两名同学”的一切可能结果组成的基本事件有(A ,B ),(A ,C ),(A ,D ),(A ,E ),(B ,C ),(B ,D ),(B ,E ),(C ,D ),(C ,E ),(D ,E ),共10个.“至少有一个87分的同学被抽到”所组成的基本事件有(A ,B ),(A ,C ),(A ,D ),(A ,E ),(B ,C ),(B ,D ),(B ,E ),共7个,所以P =710.(2)2×2列联表如下:χ2=20×20×20×20=6.4>5.024,因此,我们有97.5%的把握认为成绩优秀与教学方式有关.。
高中数学北师大选修1-2课件:第一章 2.2、2.3、2.4 独立性检验的应用
2.为调查某地区老年人是否需要志愿者提供帮助,用简单随机抽样方法从该地区调查了
500 位老年人,结果如下:
是否需要志愿者
性别
男
女
需要
40
30
不需要
160
270
(1)估计该地区老年人中,需要志愿者提供帮助的老年人的比例;
(2)能否有 99%的把握认为该地区的老年人是否需要志愿者提供帮助与性别有关?
Y1
Y2
X1
a
b
X2
c
d
总计
a+c
b+d
A.ad-bc 越小,说明 X 与 Y 的关系越弱
B.ad-bc 越大,说明 X 与 Y 的关系越强
C.(ad-bc)2越大,说明 X 与 Y 的关系越强
D.(ad-bc)2越接近于 0,说明 X 与 Y 的关系越强
总计 a+b c+d a+b+c+d
解析:∵χ2=a+bnc+add-ab+cc2b+d,∴(ad-bc)2越大,χ2越大,说明 X 与 Y 的关系越 强
根据 2×2 列联表中的数据判断两个变量 A,B 是否独立的问题称为 2×2 列联表的独立性
检验. 若na=___a_+__c_n_2a_+__b_____,则可以认为 A1与 B1独立; 若nb=____a_+__bn_2_b_+__d____,则可以认为 A1与 B2独立;
a+cc+d 若nc=________n_2_______,则可以认为 A2与 B1独立;
1.某学校对高三学生作一项调查后发现:在平时的模拟考试中,性格内向的 426 名学生
中有 332 名在考前心情紧张,性格外向的 594 名学生中在考前心情紧张的有 213 人.试
作出 2×2 列联表. 解析:列联表如下:
高中数学北师大版选修1-2教案-§2 独立性检验_教学设计_教案
教学准备1. 教学目标1、知识与技能:通过典型案例的探究,了解独立性检验的基本思想,会对两个分类变量进行独立性检验,明确独立性检验的基本步骤,并能利用独立性检验的基本思想来解决实际问题.2、过程与方法:通过探究“吸烟是否与患肺癌有关系”引出独立性检验的问题。
通过列联表、等高条形图,使学生直观感觉到吸烟和患肺癌可能有关系.这一直觉来自于观测数据,即样本.问题是这种来自于样本的印象能够在多大程度上代表总体?这节课就是为了解决这个问题,让学生亲身体验直观感受的基础上,提高学生的数据分析能力.3、情感态度价值观:通过本节课的学习,加强数学与现实生活的联系。
以科学的态度评价两个分类变量有关系的可能性。
培养学生运用所学知识,解决实际问题的能力。
对问题的自主探究,提高学生独立思考问题的能力;让学生对统计方法有更深刻的认识,体会统计方法应用的广泛性,进一步体会科学的严谨性。
教学中适当地利用学生合作与交流,使学生在学习的同时,体会与他人合作的重要性。
2. 教学重点/难点教学重点理解独立性检验的基本思想及实施步骤.教学难点1.了解独立性检验的基本思想;2.了解随机变量K2的含义,K2的观测值很大,就认为两个分类变量是有关系的。
3. 教学用具4. 标签教学过程课下预习,搜集有关分类变量有无关系的一些实例。
情境引入、提出问题:1、吸烟与患肺癌有关系吗?2、你有多大程度把握吸烟与患肺癌有关?变量有定量变量、分类变量,定量变量—回归分析;分类变量—独立性检验,引出课题。
问题1、我们在研究“吸烟与患肺癌的关系”时,需要关注哪一些量呢?列联表:分类变量的汇总统计表(频数表). 一般我们只研究每个分类变量只取两个值,这样的列联表称为2*2列联表 . 如吸烟与患肺癌的列联表:问题2:由以上列联表,我们估计吸烟是否对患肺癌有影响?①在不吸烟者中患肺癌的比例为________;②在吸烟者中患肺癌的比例为________.问题3:我们还能够从图形中得到吸烟与患肺癌之间的关系吗?小结:根据列联表和等高条形图判断的标准是什么?思考:1:差异大到什么程度才能作出“吸烟与患肺癌有关”的判断?2:能否用数量刻画出“有关”的程度?前置铺垫:问题4:我们能够从多大程度上认为吸烟与患肺癌之间有关系呢?为了解决上述问题,我们先假设H0:吸烟与患肺癌没有关系。
高二数学北师大版选修1-2《独立性检验》教案
例
精
讲
正确应用独立性检验判断两个事件的相关性
例1、某医疗机构为了了解呼吸道疾病与吸烟是否有关,进行了一次抽样调查,共调查了339个成年人,其中吸烟者205人,不吸烟者134人,调查结果是:吸烟的205人中43人患呼吸道疾病,162人不患呼吸道疾病;不吸烟的134人中13人患呼吸道疾病,121人不患呼吸道疾病。利用独立性检验方法判断吸烟与呼吸道疾病是否有关系?
例2、在某医院,因为患心脏病而住院的665名男性病人
中,有214人秃顶;而另外772名不是因为患心脏病而住
院的男性病人中有175秃顶.利用独立性检验方法
判断秃顶与患心脏病是否有关系?
课堂检测内容
P27练习
课后作业布置
课本第28页习题1---2 4,5,6
预习内容布置
完成《统计案例》综合测试题
总计
a+c
b+d
n=a+b+c+d
二、卡方计算
二、查表
(1) >6.635,表示有99%的把握认为”A与B”有关系;
(2) >3.841,表示有95%的把握认为”A与B”有关系;
(3) >2.706,表示有90%的把握认为”A与B”有关系;
(4) ≤2.706,就认为没有充分的证据显示”A与B”有关系.
情
境
导
入
了解现实生活中的一些相关性问题
日常生活中我们关心这样一些问题:
1.吸烟与患呼吸道疾病有无关系?
2.数学成绩与物理成绩之间有无关系?
3.性别与喜欢数学课之间有无关系?
以上问题用什么知识来解决呢?
点
拨
精
讲Hale Waihona Puke 掌握对两个事件进行独立性检验的基本方法
北师大版高中数学选修1-2 独立性检验 课件(54张)
1.独立性检验的理论依据
独立性检验的基本思想类似于数学中的反证法,要确认两个变
量A,B是否独立,首先假设“两个变量相互独立”成立,在该
假设下我们构造的随机变量χ2应该很小,如果由观测数据计 算得到的χ2数值很大,说明变量之间不独立,则在一定程度 上说明假设不合理,根据随机变量χ2的含义,由实际计算出 χ2>6.635,说明假设不合理的程度约为99%,也就是两个变 量A,B有99%的把握有关联.
总计 70 54 124
124 43 33 27 21 70 54 64 60
6.201 3.841 ,
a ab ac 第5步:比较 与 并作出判断. n n n
【典例训练】 1.在一项有关医疗保健的社会调查中,调查的男性为530人, 女性为670人,其中男性中喜欢吃甜食的为117人,女性中喜欢 吃甜食的为492人,请作出性别与喜欢吃甜食的列联表.
2.打鼾不仅影响别人休息,而且可能与患某种疾病有关,调查
(2)判断休闲方式与性别是否有关系?
【解析】1.由于χ2>3.841时,有95%的把握认为两个变量之
间相关,所以有95%的把握认为选修统计专业与性别有关 . 答案:95%
2.(1)依据题意得“性别与休闲方式”2×2列联表如下:
看电视 女 男 总计 (2)计算 2 43 21 64
2
运动 27 33 60
2.独立性检验中的统计假设就是假设相关事件A,B _____.
【解析】根据独立性检验的基本思想知独立性检验中的统计假 设就是假设相关事件A,B相互独立. 答案:相互独立
3.下面是一个2×2列联表,则表中a,b处的值分别为______. B
北师大版数学选修1-2练习(第1章)独立性检验(含答案)
独立性检验 同步练习【选择题】1、事件A 、B 是相互独立的,下列有四个式子:①P(AB)=P(A)P(B);②)()()(B P A P B A P ⋅=③)()()(B P A P B A P ⋅=④)()()(B P A P B A P ⋅=⋅.其中正确的有( )A 、1个B 、2个C 、3个D 、4个2、温州市正在全面普及数字电视,某住宅小区有2万住户,从中随机抽取200户,调查是否安装数字电视,调查结果如下表,则该住宅小区已经安装数字电视的用户数为A 、8 000B 、5 000C 、5 500D 、9 500【填空题】3、设A ,B 为两个变量,每一个变量都可以取两个值, 变量A :21,A A ,1A = 变量B :21,B B ,1B =若有式子nd b n b a n b +⋅+=,则认为____________________独立. 4、为调查吸烟是否对患肺癌有影响,某肿瘤研究所随机地调查了9965人,得到如下结果(单位:人);吸烟与患肺癌列联表不患肺癌 患肺癌 总计 不吸烟者 7775 42 7817吸烟 2099 49 2148总计 9874 91 9965 在不吸烟者中,有0.54%患有肺癌, 在吸烟者中,有2.28%患有肺癌,由此可以得到结论:吸烟者和不吸烟者患肺癌的可能性存在着差异 你可以进一步得到什么结论_____________________ 【解答题】5、为调查吸烟是否对患肺癌有影响,某肿瘤研究所随机地调查了9965人,得到如下结果(单位:人); 吸烟与患肺癌列联表不患肺癌 患肺癌 总计 不吸烟者 4567 23 4590吸烟 1932 56 1988总计 6499 79 6578通过计算说明,患肺癌与吸烟是有关系的.参考答案1、D2、A3、1A 2B4、患肺癌与吸烟是有关系的5、解:在不吸烟者中,有0.50%患有肺癌,在吸烟者中,有2.82%患有肺癌,即:吸烟者和不吸烟者患肺癌的可能性存在着差异.。
高二数学北师大版高中数学选修1-2 独立性检验的基本思想及其初步应用 课件
442 则正常人中男性的比例为956≈0.46;色盲的人中男性的比 38 例为44≈0.86.显然 0.46 与 0.86 差距较大, 这说明色盲与性别有 关系. [方法规律总结 ]
日常生活中,两个分类变量之间的关系
常用百分比来说明.
甲、乙两校体育达标抽样测试,其数据见下表: 两校体育达标情况抽检 达标人数 甲校 乙校 48 52 未达标人数 62 38 合计 110 90
第一章ห้องสมุดไป่ตู้
统计案例
第一章
§2 独立性检验
第2课时 独立性检验的基本思想及其初步应用
自主预习学案
通过对案例的探究,了解独立性检验的基本思想、方法及
初步应用.
重点:理解独立性检验的基本思想及实施步骤.
难点:独立性检验基本思想的理解及应用.
独立性检验的基本思想 思维导航 日常生活及生产、科研中,经常需要考虑某个量的变化是
否由某种因素引起,与这种因素的相关程度有多大?怎样判断
呢?
新知导学 1.分类变量 分类变量也称为属性变量或定性变量,分类变量的取值是 不同类别 ,除了起 离散的,其不同的取值仅表示个体所属的__________
分类作用外,无其他含义,有时也把分类变量的不同取值用数
区分 作用,无数值意义. 字表示,但这些数字只起_______
B.
5.为了探究电离辐射的剂量与人体的受损程度是否有关, 用两种不同剂量的电离辐射照射小白鼠. 在照射后 14 天内的结 果如下表所示: 死亡 第一种剂量 第二种剂量 合计 14 6 20 存活 11 19 30 合计 25 25 50
进行统计分析时的统计假设是________.
[答案] 假设电离辐射的剂量与人体受损程度无关.
北师大版选修1-2--第一章-2-2.2-独立性检验--2.3-独立性检验的基本思想----课件
说较大,但并不是A发生B就一定发生,故④错误.故选A.
答案:A
知识梳理
【做一做3】 考察棉花种子是否经过处理与得病之间的关系,得
到如下表所示的数据(单位:株):
处理情况
得病情况
得病
不得病
总计
种子处理
种子未处理
总计
32
61
93
101
213
5
穿新防护服工人的发病率为 × 100%≈6.7%,而穿旧防护服工人的
75
10
发病率为 28 × 100%≈35.7%,说明新防护服对预防皮肤病有一定效
果.
解法二通过计算χ2知,
χ=
2
(- )2
(+)(+)( +)(+)
=
103×(5×18-70×10)2
75×28×15×88
28
40
17
68
85
的把握认为喜欢吃零食与性别有关系.
2
(-)
(+)(+)(+)(+)
=
2
85(140-480)
≈4.722>3.841.
17×68×45×40
故有95%的把握认为喜欢吃零食与性别有关.
答案:95%
1
2
3
4
4.为了研究休闲方式是否与性别有关,共调查了120人,其中女性68
68
30
b
54
表中a,b处的值分别为(
)
A.108,42
B.26,34
C.26,44
解析:由表可知a=68-42=26.
所以b=a+18=26+18=44.
北师大版高中数学选修1-2课件2.2独立性检验2.3独立性检验的基本思想2.4独立性检验的应用
3.如果>3.841,有95%的把握判定变量A,B有关联; 4.如果>6.635,有99%的把握判定变量A,B有关联.
对于吸烟和患肺癌的问题
患肺癌情况 吸烟情况
患肺癌B1
未患肺癌B2
吸烟A1
56
1932
不吸烟A2
23
4567
总计
79
6499
【变式练习】
为了了解高中生是否喜欢参加体育锻炼与性别之间 的关系,调查者随机调查了500名高中生的情况, 调查结果如下(单位:人):
性别
参加体育锻炼情况 喜欢参加 体育锻炼
不喜欢参加 体育锻炼
男
197
48
女
135
120
试问:高中生是否喜欢参加体育锻炼与性别之
间有关系吗?
解:根据表中的数据得 a=197,b=48,c=135,d=120
绩是否优秀与所在的班级有关.
1.下面是一个2×2列联表:
x
y
y1
y2
x1
a
21
x2
2
25
总计
b
46
总计 73 27
n
则表中a,b的值分别为( C )
A.94,96
B.52,50
C.52,54
D.54,52
2.分类变量X和Y的列联表如下,则( C )
X
Y
Y1
Y1
X1
X2
A.ad-bc越小,说明X与Y的关系越弱 B.ad-bc越大,说明X与Y的关系越强 C.(ad-bc)2越大,说明X与Y的关系越强 D.(ad-bc)2越接近于0,说明X与Y的关系越强
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
nn n
nn
n
示的是频率,不同于概率,即使变量之间独立,式子两
边也不一定恰好相等,但是当两边相差很大时,变量
之间就不独立.
【练一练】 考察棉花种子经过处理跟棉花生病之间的关系,
得到数据如下:
种子处理情况 得病情况
则判断种子处理与得病之间的独立性.
解:由题意可知a=32,b=101,c=61,d=213,从而
我们假设吸烟与患肺癌是独立的,即吸烟不影响患 肺癌.根据直观的经验,我们把吸烟人群中患肺癌的 人所占百分比,与不吸烟人群中患肺癌的人所占百 分比作比较.如果吸烟不影响患肺癌,就意味着,无 论吸烟与否,患肺癌的人所占的百分比应该是基本 一样的,就此题而言:
通过表格中的数据计算可得 吸烟人群中患肺癌的人所占百分比是: 56 2.82%
2
n(ad bc)2
(a b)(c d)(a c)(b d)
500 (197 120 135 48)2 245 255 332168
42.252 4 6.635.
所以有99%以上的把握认为高中生是否喜欢参加体 育锻炼与性别之间是有关的.
探究点3 独立性检验的应用
56
1932
不吸烟A2
23
4567
总计
79
6499
总计 1988 4590 6578
2
n(ad bc)2
(a b)(c d)(a c)(b d)
6578 (56 4567 1932 23)2 62.698 6.635. 1988 4590 79 6499
总计
男青年
46
30
76
女青年
20
50
70
总计
66
80
146
2 146 (4650 30 20)2 15.021 6.635.
76 70 6680
所以有99%以上的把握认为是否喜爱古典音乐与青 年的性别有关.
例2.容易生气的人更有可能患心脏病吗?某机构随机 调查了2 796人,下表给出了调查的结果(单位:人):
c
,b
n
a
n
b
b
n
d
,c n
c
n
d
a
n
c
,d n
c
d n
b
n
d
当上面的值较大时,变量A,B不独立.
思考 :当这些量多大时才能说明变量间不独立呢? 我们能不能选择一个量,用它的大小来检验变量之 间是否独立呢?
统计学家选取以下统计量,用它的大小来检验变
量之间是否独立:
所以有99%以上的把握认为吸烟与患肺癌是有关的.
思考:在进行χ 2运算,判断变量相关时, 若χ 2=56.632,P(χ 2>6.635)≈0.01和 P(χ 2>3.841)≈0.05,哪种说法是正确的? 提示:两种说法均正确. P(χ2>6.635)≈0.01的含 义是有99%以上的把握认为两变量相关;而 P(χ2>3.841)≈0.05的含义是有95%以上的把握认为 两变量相关.
因为0.653<2.706,所以没有充分的证据认为成
绩是否优秀与所在的班级有关.
1.下面是一个2×2列联表:
x
y
y1
y2
x1
a
21
x2
2
25
总计
b
46
总计 73 27
n
则表中a,b的值分别为( C )
A.94,96
B.52,50
C.52,54
D.54,52
2.分类变量X和Y的列联表如下,则( C )
探究点1 独立性检验
2×2 列联表
为了调查吸烟与患肺癌是否有联系,某机构随机调
查了6 578人,得到表中的数据(单位:人)
患肺癌情况 吸烟情况
吸烟
不吸烟
患肺癌 56 23
不患肺癌 1 932 4 567
这一问题称为2×2列联表的独立性检验.
思考:如何根据表格中的数据来判断吸烟与患肺
癌是否有联系?
另一方面,如果吸烟与患肺癌是独立的,那么有
P( A1B1 ) P( A1 )P(B1 ) P( A1B2 ) P( A1 )P(B2 )
P( A2 B1 ) P( A2 )P(B1 ) P( A2 B2 ) P( A2 )P(B2 )
都成立,由上表数据可得:
患肺癌情况 吸烟情况
既吸烟又患肺癌的人频率为: 56 0.85% 6578
解:根据表中的数据计算得下表(单位:人):
头发颜色
眼睛虹膜颜色
红∕金黄色
黑色
总计
蓝色
156 20 176
棕色
12 24 36
总计
168 44 n=212
2 212 (156 24 12 20)2 55.576.
168 4417636 因为55.576>6.635,所以有99%以上的把握认为 头发的颜色与眼睛虹膜的颜色有关.
392 (39167 157 29)2 1.78. 196196 68324
5.下表是某地区的一种传染病与饮用水的调查表:
得病情况 饮用水卫生程度
试问:这种传染病与饮用水的卫生程度有关吗?
解:根据表中的数据计算得下表
得病情况
饮用水卫生程度
2 830 (52 218 466 94)2 54.21 6.635. 146 684 518 312
当χ 2较大
[(a a b a c)2 (b a b b d )2
2 n
nn n abac
nn n abbd
时,说明 变量之间
nn
nn
不独立.
] ( c c d a c )2 (d c d b d )2
n n n n n n
cd ac
cd bd
nn
nn
2
n(ad bc)2
. (n a b c d)
(a b)(c d )(a c)(b d )
当数据量较大时,在统计中,用以下结果对变量的独 立性进行判断.
1.如果 2≤2.706,没有充分的证据判定变量A,B有关联,
变量A: A1,A 2= A1; 变量B: B1 ,B2= B1.
B
B1
A
A1
a
A2
c
总计
a+c
B2
b d _b_+_d_
总计
_a_+_b_ c+d n=_a_+_b_+_c_+_d_
a
ab
设 n a b c d ,用 ac
n
估计 P( A1B1 ) ,
n
估计 P( A1 ) , n 估计P(B1 ).
2.2 独立性检验 2.3 独立性检验的基本思想
2.4 独立性检验的应用
1
人们都认可“吸烟具有危害性”,那么,人们认 可这个观点,有什么根据么?吸烟是否对患肺癌有影 响呢?下面我们用数学知识来分析一下,这个观点是 否具有科学根据……
1.掌握利用2×2列联表进行独立性检验,会用2×2 列联表解决实际问题.(重点) 2.了解独立性检验的基本思想及实施步骤.(重点) 3. 掌握独立性检验的简单应用.(难点)
1 988
不吸烟人群中患肺癌的人所占百分比是: 23 0.50%
4 590
结论:吸烟人群中患肺癌的人所占的百分比,与不吸 烟人群中患肺癌的人所占百分比不等,且相差较大. 由此我们可以推断,开始的假设是不成立的.也就是 说,患肺癌与吸烟是有关系的.由吸烟人群中患肺癌 的人所占的百分比较多,我们认为吸烟会对肺癌的发 病率造成一定的影响.
【总结】
要推断“Ⅰ和Ⅱ是否有关系”,可按下面的步骤进行:
(1)根据2×2列联表得出合计总表;
(2)用公式计算 2的值;
(3)查对临界值,作出判断. 由于抽样的随机性,由样本得到的推断有可能正
确,也有可能错误.利用 2 进行独立性检验,可以
对推断的正确性作出估计,样本量n越大,估计越准确.
【变式练习】
若有式子
a n
a
n
b
a
n
c
,则可认为
A1与
B1 独立.
同理,若 b a b b d , 则可认为A1与B2独立;若
nn n
c cd ac, nn n
则可认为A2与B1独立;若
d n
cd n
bd n
,
则可认为A2与B2独立.
在 a a b a c 中,由于 a ,a b ,a c 表
为了讨论的方便,我们引入以下记号:
变量A:A1=吸烟,A2 A1 不吸烟;
变量B:B1=患肺癌,B2 B1 未患肺癌.
计算得如下表格:
患肺癌情况 吸烟情况
吸烟A1
不吸烟A2
总计
患肺癌B1 56 23 79
未患肺癌B2 1 932 4 567 6 499
总计 1 988 4 590 6 578
那么有__9_5_%__的把握认为两个变量有关联
解:因为 2 =4.013>3.841.所以有95%的把握判定
两个变量有关联.
4.根据下表计算 ≈2 _1_._7_8_.
手术情况
发病情况
解:由 2的计算公式,得
2
n(ad bc)2
(a b)(c d)(a c)(b d)
X
Y
Y1
Y1