高中数学人教A版选修2-3练习:3.2 独立性检验的基本思想及其初步应用 Word版含解析

合集下载

数学人教A版选修2-3教学设计:3.2独立性检验的基本思想及其初步应用 Word版含解析

数学人教A版选修2-3教学设计:3.2独立性检验的基本思想及其初步应用 Word版含解析

教学设计3.2独立性检验的基本思想及其初步应用整体设计教材分析1.教材的地位和作用独立性检验是一种重要的统计方法,也是统计学中很常用的方法,更是高中数学新教材的新增内容.本节内容将反证法与独立性检验进行了合理整合,将假设检验的思想应用到实际生活中去.教材的设计还原了数学的本源、本质,是对“观察发现、抽象概括、感性到理性”等数学认知规律的提炼与总结,能让学生充分体会数学的发生、发展.2.课时划分独立性检验的基本思想及其初步应用的教学分三个课时完成:第1课时内容为直观判断两个分类变量是否有关系的基本方法;第2课时内容为独立性检验的基本思想;第3课时内容为独立性检验的初步应用.第一课时教学目标知识与技能结合生活实例了解分类变量的概念,了解直观判断分类变量相关性的方法,了解列联表和等高条形图的特点.过程与方法通过探索、研究、总结等方式使判断分类变量是否有关系的方法呈现在学生面前,使学生体会用样本来研究总体的思想.情感、态度与价值观通过学习本节课培养学生思维的批判性,深化学生对数学意义的理解,激发学习兴趣,认识数学的科学价值、应用价值和文化价值;通过探究学习培养学生互助合作的学习习惯,形成良好的思维品质和锲而不舍的钻研精神.重点难点教学重点:直观判断分类变量是否有关系的方法.教学难点:如何根据列联表和等高条形图来判断分类变量是否有关系.教学过程引入新课提出问题:在现实生活中,会遇到各种各样的变量,并需要研究它们之间的关系,观察下面两组变量,分析在取不同的“值”时表示的个体有何差异?(1)国籍、宗教信仰、性别、吸烟与患病是否有关;(2)成绩、身高、年龄、某班学生的百米成绩.学生活动:先独立思考,然后相互讨论交流认识统一看法.教师逐步引导学生发现分类变量的特点,分类变量的取值一定是离散的,而且不同的取值仅表示个体所属的类别.学情预测:(1)中的变量每取不同的“值”时,表示不同的类别;(2)中的变量每取不同的“值”时,表示不同的个体.教师:分类变量:变量的不同“值”表示个体所属的不同类别的变量称为分类变量.分类变量的取值一定是离散的,而且不同的取值仅表示个体所属的类别,如性别变量,只取男、女两个值,商品的等级变量只取一级、二级、三级等等.分类变量的取值有时可用数字来表示,但这时的数字除了分类以外没有其他的含义,如用“0”表示“男”,用“1”表示“女”.注意分类变量的取值一定是离散的.在我们的日常生活中,存在着大量的分类变量,如何判断两个分类变量是否有关系也是我们需要解决的一个重要问题.设计意图:从大量的生活实例出发,让学生充分体会分类变量的含义和分类变量的特点,使分类变量概念的形成水到渠成,同时也为判断分类变量的必要性做好铺垫.探究新知5月31日是世界无烟日.有关医学研究表明,许多疾病,例如:心脏病、癌症、脑血管病、慢性阻塞性肺病等都与吸烟有关,吸烟已成为继高血压之后的第二号全球杀手.这些疾病与吸烟有关的结论是怎样得出的呢?我们来看下面的问题:某医疗机构为了了解呼吸道疾病与吸烟是否有关,进行了一次抽样调查,共调查了515个成年人,其中吸烟者220人,不吸烟者295人.调查结果是:吸烟的220人中有37人患呼吸道疾病(简称患病),183人未患呼吸道疾病(简称未患病);不吸烟的295人中有21人患病,274人未患病.问题:根据这些数据能否断定“患呼吸道疾病与吸烟有关”?学生活动:先让学生独立思考,然后小组交流,教师巡视指导,并注意与学生交流,为了研究这个问题,(1)引导学生将上述数据用下表来表示:(2)估计吸烟者与不吸烟者患病的可能性差异.问题:由上述结论能否得出患病与吸烟有关?把握有多大?学情预测:在吸烟的人中,有37220≈16.82%的人患病,在不吸烟的人中,有21295≈7.12%的人患病.由上可以看出,吸烟者中患病的比例与不吸烟者中患病的比例相比有很大的差异,故“患呼吸道疾病与吸烟可能有关”.教师:类似于上面的表格,我们称分类变量的汇总统计表(频数表)为列联表,一般我们只研究每个分类变量只取两个值,这样的列联表称作2×2列联表.在日常生活中,为了直观显示两个分类变量之间的关系,还可以画出两个分类变量的等高条形图.观察下面的图形,能得到什么结论?(教师在课堂上用Excel 软件演示等高条形图,引导学生观察这类图形的特征,并分析由图形得出的结论)等高条形图学生活动:观察给出的图形,相互讨论,沟通认识.学情预测:通过上面的等高条形图可以直观看出,吸烟者中患病的比例与不吸烟者中患病的比例相比有很大的差异,故“患呼吸道疾病与吸烟可能有关”.设计目的:自然合理地提出问题,并通过不同的手段,让学生学会根据不同的方法来分析两个分类变量是否有关系.理解新知提出问题:一般地,假设有两个分类变量X 和Y ,它们的值域分别为{x 1,x 2}和{y 1,y 2},其2×2列联表和等高条形图如下表所示,试说明如何根据图表来判断分类变量X 和Y是否可能有关系?学生活动:分组讨论,合作交流,教师引导学生回顾上面问题的解决过程并加以适当的提示.学情预测:根据列联表,可估计满足条件X =x 1的个体中具有Y =y 1的个体所占比例a a +b ,也可以估计满足条件X =x 2的个体中具有Y =y 1的个体所占比例c c +d ,两个比例的值相差越大,就意味着X 和Y 有关系的可能越大.由a a +b -c c +d =ad -bc (a +b)(c +d)可知,两个比例的值相差越大即ad 与bc 相差越大,就意味着X 和Y 有关系的可能越大.由于等高条形图的纵轴是频率,故通过等高条形图可以直观展示比例差距的相对大小,进而判断分类变量是否存在关系.提出问题:上面给出的两种判断分类变量是否可能有关系的方法各有什么特点? 学生活动:独立思考,然后再相互交流.学情预测:列联表有助于直观地观测数据之间的关系,与表格相比,等高条形图更能直观地反映出相关数据的总体状况.但这两种方法都仅能粗略地判断两个分类变量是否可能有关系,但无法精确地给出得出结论的可靠程度.设计意图:通过引导学生对三种直观方法进行分析和总结,使学生掌握如何根据列联表、等高条形图来判断两个分类变量是否有关系,并了解两种方法的局限性,同时为下一节课的学习打好基础.运用新知例1某学校对在校部分学生课外活动内容进行调查,结果整理成下表:学生课外活动的类别与性别有关吗?试用学过的等高条形图进行分析.分析:根据题设条件中的列联表,画出等高条形图进行直观分析.解:等高条形图如下图所示:由图可以直观看出喜欢体育的在男生中占有较高比例,喜欢文娱的在女生中占有较高比例,故学生课外活动的类别在性别上有较大差异,说明课外活动的类别与性别在某种程度上有关系.点评:在画等高条形图时,在有条件的情况下,可引导学生利用Excel软件进行作图.【变练演编】例2在调查的480名男人中有38人患色盲,520名女人中有6名患色盲,试利用图形来判断色盲与性别是否有关?分析:根据数据列出列联表,然后画出等高条形图,来分析色盲与性别是否有关.解:根据题目给出的数据作出如下的列联表:根据列联表作出相应的等高条形图:从等高条形图来看在男人中患色盲的比例要比在女人中患色盲的比例大得多,因而,我们认为性别与患色盲是有关系的.设计意图:通过例题以及变式的学习,进一步学习利用图形直观判断分类变量是否有关系的要领,并能够画出大致的直观图形.【达标检测】1.下列不是分类变量的是()A.是否吸烟B.成绩C.宗教信仰D.国籍2.假设两个分类变量X和Y,它们的值域分别为{x1,x2}和{y1,y2},其中2×2列联表如下:对于以下数据,对同一样本能说明X与Y有关的可能性最大的一组为()A.a=5,b=4,c=3,d=2 B.a=5,b=3,c=4,d=2C.a=2,b=3,c=4,d=5 D.a=2,b=3,c=5,d=43.服用某种维生素对婴儿头发稀疏或稠密的影响调查如下:服用维生素的婴儿有60人,头发稀疏的有5人;不服用维生素的婴儿有60人,头发稀疏的有46人.试根据以上数据作出列联表.答案:1.B 2.D 3.列联表如下课堂小结(给学生1~2分钟的时间默写本节的主要基础知识、方法、例题、题目类型、解题规律等;然后用精炼的、准确的语言概括本节的知识脉络、思想方法、解题规律) 1.知识收获:直观判断分类变量是否有关系的方法.2.方法收获:借助于图形的直观特征分析数据间的关系.设计意图:让学生自己小结,这是一个多维整合的过程,是一个高层次的自我认识过程.补充练习【基础练习】1.下列关于等高条形图说法正确的是()A.等高条形图表示高度相对的条形图B.等高条形图表示的是分类变量的频数C.等高条形图表示的是分类变量的比例D.等高条形图表示的是分类变量的实际高度2.下面是一个2×2列联表:则表中a,b处的值分别为()A.94,96 B.52,50 C.52,54 D.54,523.以下说法正确的是()A.分类变量是表示个体所属的不同类别的变量B.分类变量是表示个体所属的不同类别的两个以上的变量C.分类变量是表示个体所属的不同类别的一个变量D.以上答案均不正确答案:1.C 2.C 3.A【拓展练习】4.从发生交通事故的司机中抽取2 000名司机的随机样本,根据他们的血液中是否含有酒精以及他们是否对事故负有责任将数据整理如下:试结合等高条形图分析血液中含有酒精与对事故负责有关系吗?解:由等高条形图可以看出,血液中含酒精的司机中负交通事故责任的比例要大于血液中不含酒精的司机,由此我们可以在某种程度上认为“血液中含有酒精与对事故负责”有关系.设计说明本节课在数学教材的选取上,力求贴近生活实际,如吸烟与患病、性别与课外活动的类型等,就地取材,创设学生熟悉的感兴趣的问题情境,使学生能在轻松、愉快的教学情境中学习有用的数学知识,同时也能运用数学知识来分析问题和解决问题.教案的设计“以人为本,以学定教”,教师始终扮演的是组织者、引导者、参与者的角色,通过问题教学法,变“教的课堂”为“学的课堂”,学生成为课堂学习真正的主人.倡导合作式学习,通过学生小组合作设计问题、小组交流解决问题的方式,不但提高了学生合作学习、主动探究的能力,而且大大促进了学生对知识的理解和灵活运用.备课资料用Excel软件画等高条形图用Excel软件画等高条形图的步骤.(1)在Excel软件中输入列联表的数据(也可以直接复制粘贴).(2)画柱形图.选中已输入的数据部分,然后单击工具栏上的“插入”,在下拉菜单中选择“图表”.然后在图表菜单中选择图表类型(如柱形图).按照提示依次进行下一步操作,就可以得到等高条形图了.(设计者:杨雪峰田宗臣)第二课时教学目标知识与技能通过实例,让学生了解独立性检验的基本思想及其初步应用,能对两个分类变量是否有关做出明确的判断,会对具体问题做出独立性检验.过程与方法经历概念的探索、反思、建构这一过程,让学生进一步体会独立性检验思想的基本原理,培养学生归纳、概括等合情推理能力.通过实际应用,培养学生把实际问题抽象成数学问题的能力和学以致用的数学应用意识.情感、态度与价值观通过创设情境激发学生学习数学的兴趣,培养其严谨治学的态度.在学生分析问题、解决问题的过程中培养其积极探索的精神,从而实现自我的价值.重点难点教学重点:独立性检验基本思想的初步应用; 教学难点:对独立性检验基本思想的理解.教学过程引入新课有甲、乙两个班级进行数学考试,按学生考试及格和不及格统计成绩后,得到如下列联表:试判断成绩不及格与班级是否有关?学生活动:回顾上一节课的学习内容,选择合适的方法进行判断.学情预测:根据列联表可知甲班学生中不及格的比例为1045,乙班学生中不及格的比例为745,相差345;画出等高条形图:有的学生可能说有关系,因为从等高条形图来看,可以发现甲、乙两班的及格率有明显差异;有的学生可能会说没有关系,因为不及格率相差345,应该不算大,所以说及格与班级没有关系.教师:由上面的问题可以看出,虽然利用图表来判断两个分类变量是否有关比较直观,但缺少精确性和可靠性,如何精确地刻画两个分类变量的有关性,我们必须找到一个进行精确判断的方法.设计意图:充分认识独立性检验的必要性,创设悬念,激发斗志,让学生跃跃欲试.探究新知提出问题:为了解决上面的问题,我们可以先假设H 0:不及格与班级无关.设A 表示事件“在甲班”,B 表示事件“不及格”,AB 表示“在甲班且不及格”,则“不及格与班级无关”等价于事件A 与B 相互独立,则有P(AB)=P(A)P(B),否则,应该有A 与B 不独立,即“不及格与班级有关”.那么,如何验证P(AB)=P(A)P(B)呢?学生活动:学生先独立思考,然后分小组讨论,老师加以适当的引导.学情预测:根据概率的统计定义可知,上面各个事件的概率可以用相应的频率来估计,则P(A)=4590=12,P(B)=1790,P(A)P(B)=17180,P(AB)=1090=19=20180,因为P(AB)≠P(A)P(B),故A 与B 不独立,即“不及格与班级有关”.提出问题:由P(AB)≠P(A)P(B)一定有“不及格与班级有关”吗?如果不是,那么如何根据P(A),P(B),P(AB)的值来判断其相关性?学生活动:小组协作讨论,然后说出对这个问题的认识.学情预测:P(AB)≠P(A)P(B)不一定有“不及格与班级有关”,因为在数据上我们是采用频率来估计概率,另外,在实际问题中我们也仅是用样本来估计总体,这些因素都会造成数值上的偏差.但是,应该肯定的是P(AB)与P(A)P(B)越接近,A 与B 独立的可能性就越大,即“不及格与班级有关”的可能性就越小.设计目的:通过实例的分析,为引入和理解独立性检验的基本思想做好铺垫.理解新知提出问题:若将表中“观测值”用字母表示,则得下表:令n =a +b +c +d ,如何判断不及格与班级是否有关系?试加以说明.学生活动:分组讨论,协作完成,教师引导学生类比上面的分析过程,将数字换成字母加以说明.学情预测:假设H 0:不及格与班级无关.设A 表示事件“在甲班”,B 表示事件“不及格”,AB 表示“在甲班且不及格”,则P(A)=a +b n ,P(B)=a +c n ,P(A)P(B)=a +b n ×a +c n ,P(AB)=an ,若“不及格与班级无关”,则a +b n ×a +c n 与an应非常接近. 教师:若a +b n ×a +c n 与a n 非常接近,则a +b n ×a +c n ≈an ,从而ad≈bc ,因此||ad -bc 越小,说明不及格与班级的关系越弱,||ad -bc 越大,说明不及格与班级的关系越强.而且我们还可以发现,当a +b n ×a +c n 与a n 非常接近时,a +b n ×b +d n 与b n 也应该非常接近…或者说(a n -a +b n×a +c n )2,(b n -a +b n ×b +d n )2,(c n -c +d n ×a +c n )2,(d n -c +d n ×b +d n)2应该比较小,从而 (a n -a +b n ×a +c n )2a +b n ×a +c n +(b n -a +b n ×b +d n )2a +b n ×b +d n +(c n -c +d n ×a +c n )2c +d n ×a +c n +(d n -c +d n ×b +d n)2c +d n ×b +dn =n(ad -bc)2(a +b)(a +c)(b +d)(c +d)也应该很小.构造随机变量K 2=n(ad -bc)2(a +b)(a +c)(b +d)(c +d),若H 0成立,即“不及格与班级无关”,则K 2应该很小.在H 0成立的情况下,统计学家估算出如下的概率P(K 2≥6.635)≈0.01.即在H 0成立的情况下,K 2的观测值大于6.635的概率非常小,近似于0.01,也就是说,在H 0成立的情况下对随机变量K 2进行多次观测,观测值超过6.635的频率约为0.01.从而,也说明我们把“H 0成立”错判成“H 0不成立”的概率不会超过0.01.这样,我们就可以通过计算K 2的观测值k 来判断H 0是否成立.我们把这种方法称为独立性检验.提出问题:独立性检验的基本思想是什么?学生活动:反思上面的过程,进行归纳总结,然后小组间交换意见.学情预测:独立性检验的基本思想是:要判断“两个分类变量有关系”这一结论的可信程度,首先假设结论不成立,即假设“两个分类变量没有关系”成立,在该假设下构造的随机变量K 2应该很小.如果由观测数据计算得到的K 2的观测值k 很大,则在一定程度上说明假设不合理,即认为“两个分类变量有关系”;如果观测值k 很小,则说明在样本数据中没有发现足够证据拒绝H 0.独立性检验的基本思想类似于反证法.教师:当确定“两个分类变量有关系”的可信程度时,需要确定一个正数k 0与随机变量K 2的观测值k 比较大小,如果k≥k 0,就认为“两个分类变量之间有关系”,否则就认为“两个分类变量之间没有关系”.我们称这样的k 0为一个判断规则的临界值.按照这种规则,把“两个分类变量之间没有关系”错误地判断为“两个分类变量有关系”的概率不超过P(K 2≥k 0).独立性检验的具体做法是:(1)根据实际问题的需要确定容许推断“两个分类变量有关系”犯错误概率的上界α,然后查表确定临界值k 0.(2)利用公式计算K 2的观测值k.(3)如果k≥k 0,就推断“X 与Y 有关系”,这种推断犯错误的概率不超过α;否则,就认为在犯错误的概率不超过α的前提下不能推断“X 与Y 有关系”,或者在样本数据中没有发现足够证据支持结论“X 与Y 有关系”.设计目的:以问题为驱动,引领学生在积极的思考、探究中,理解独立性检验的基本思想,理解随机变量K 2的构造过程.运用新知提出问题:根据独立性检验的基本思想,判断“不及格与班级是否有关”? 学生活动:类比公式,用计算器进行运算比较.活动结果:由题意知a =10,b =35,c =7,d =38,a +b =45,c +d =45,a +c =17,b +d =73,n =90.代入公式得K 2的观测值为:k =n(ad -bc)2(a +b)(a +c)(b +d)(c +d)=90×(10×38-7×35)245×45×17×73≈0.65.因为0.65>0.455,所以我们在犯错误的概率不超过0.5的前提下可认为“不及格与所在班级有关”.设计目的:通过问题的解决,既照应了开头提出的问题,同时也是对公式应用的一个巩固.【变练演编】题为了探究吸烟习惯与患慢性气管炎是否有关,调查了339名50岁以上的人,获数据如下:吸烟习惯与患慢性气管炎是否相关?试用独立性检验的思想说明理由. 分析:根据公式求出随机变量K 2的观测值k ,然后和已知结论数值进行比较. 解:根据列联表的数据得到K 2的观测值:k =n(ad -bc)2(a +b)(a +c)(b +d)(c +d)=339×(43×121-162×13)2205×56×283×134≈7.469>6.635,所以,在犯错误的概率不超过0.01的前提下认为“吸烟习惯与患慢性气管炎有关”. 提出问题:请解答下列问题:1.已知两个分类变量X 与Y ,你有哪些办法判断它们是否有关系?(把你知道的办法都写出来)2.已知K 2的观测值 k =6.635,你能得到哪些结论?(把你能得到的结论都写出来) 活动设计:学生先独立探索,允许互相交流成果.然后全班交流. 学情预测:1.列联表、等高条形图、独立性检验等.2.P(K 2≥6.635)≈0.01;我们判断“X 与Y 有关系”的出错概率不超过0.01;在犯错误的概率不超过0.01的前提下,可以认为“X 与Y 有关系”.设计意图:设置本组开放性问题,旨在增加问题的多样性、有趣性、探索性和挑战性,训练学生思维的发散性、收敛性、灵活性和深刻性,长期坚持,不仅会加深学生对数学的理解、掌握,而且会潜移默化地学会编题、解题.课堂小结(给学生1~2分钟的时间泛读教材,用精确的语言概括本节的知识脉络、思想方法、解题规律)1.独立性检验的思想方法以及它与反证法的关系. 2.独立性检验的一般操作步骤.设计意图:让学生自己小结,这是一个多维整合的过程,是一个高层次的自我认识过程.补充练习【基础练习】1.下面说法正确的是()A.统计方法的特点是统计推断准确、有效B.独立性检验的基本思想类似于数学上的反证法C.任何两个分类变量有关系的可信度都可以通过查表得到D.不能从等高条形图中看出两个分类变量是否相关2.经过对K2的统计量的研究,得到了若干个临界值,当K2的观测值k>3.841时,我们()A.在犯错误的概率不超过0.05的前提下可认为A与B有关B.在犯错误的概率不超过0.05的前提下可认为A与B无关C.在犯错误的概率不超过0.01的前提下可认为A与B有关D.没有充分理由说明事件A与B有关系3.利用独立性检验来考虑两个分类变量与是否有关系时,通过查阅下表来确定“X和Y 有关系”的可信度.如果k>6.635,那么认为“X和Y有关系”犯错误的概率不超过…()A.99%B.1%C.5%D.97.5%4.独立性检验所采用的思路是:要研究A,B两类分类变量是否彼此相关,首先假设这两类变量彼此__________,在此假设下构造随机变量K2,如果K2的观测值较大,那么在一定程度上说明假设__________.答案:1.B 2.A 3.B 4.无关不成立【拓展练习】5.某聋哑研究机构,对聋哑关系进行抽样调查,在耳聋的657人中有416人哑,而另外不聋的680人中有249人哑,你能运用这组数据判断,在犯错误的概率不超过0.1%的前提下,能否认为聋哑有关系?解:根据题目所给数据,得到如下列联表:根据列联表数据得到K2的观测值K=1 337×(416×431-249×241)2665×672×657×680≈95.29>10.828,∴在犯错误的概率不超过0.1%的前提下,可以认为聋哑有关系.设计说明本设计以问题驱动为指导,通过不断提出问题、研究问题、解决问题,使学生获得知识,完成教学.以学生熟悉的例子为载体,引导他们提炼、概括独立性检验的方法,自然合理地提出问题,让学生体会“数学来源于生活”.创造和谐积极的学习气氛,让学生通过直观感知、观察分析,形成由浅入深、由易到难、由感性到理性的思维飞跃,并借助例题具体说明在数学发现的过程中应用假设检验的过程.备课资料假设检验与反证法独立性检验的基本思想是假设检验,假设检验类似于反证法,但二者是不同的.下表列出了二者之间的关系:从上面的对比中,可以看出假设检验与反证法的不同之处有二:其一是在假设检验用有利于H1的小概率事件的发生代替了反证法中的矛盾;其二是假设检验中接受原假设的结论相当于反证法没有找到矛盾.(设计者:杨雪峰田宗臣)第三课时教学目标知识与技能理解独立性检验的基本思想,会根据K2的观测值的大小判断两个分类变量有关的可信度,培养学生的自主探究的学习能力,并能应用数学知识解决实际问题.过程与方法通过主动探究、自主合作、相互交流,从具体实例中归纳出进行独立性检验的基本步骤,使学生充分体会知识的发现过程,并渗透统计的基本思想和方法.情感、态度与价值观使学生体会数学的理性与严谨,了解数学来源于实际,应用于实际的唯物主义思想,培养学生对新知识的科学态度,勇于探索和敢于创新的精神.重点难点教学重点:利用独立性检验的基本思想解决实际问题以及处理步骤;教学难点:对独立性检验思想的理解.教学过程引入新课提出问题:在某医院,因为患心脏病而住院的665名男性病人中,有214人秃顶;而另外772名不是因为患心脏病而住院的男性病人中有175名秃顶.(1)利用图形判断秃顶与患心脏病是否有关系;(2)能否在犯错误的概率不超过0.01的前提下认为秃顶与患心脏病有关系?学生活动:小组合作完成.活动结果:根据题目所给的数据画出列联表:相应的等高条形图如图所示:。

【三维设计】人教A版数学选修2-3全册练习:3.2 独立性检验的基本思想及其初步应用(含答案解析)

【三维设计】人教A版数学选修2-3全册练习:3.2 独立性检验的基本思想及其初步应用(含答案解析)

[课时达标检测]一、选择题1.判断两个分类变量是彼此相关还是相互独立的常用的方法中,最为精确的是() A.2×2列联表B.独立性检验C.等高条形图D.其他解析:选B A、C只能直观地看出两个分类变量x与y是否相关,但看不出相关的程度;独立性检验通过计算得出相关的可能性,较为准确.2.假设有两个分类变量X和Y,它们的值域分别为{x1,x2}和{y1,y2},其2×2列联表为() A.a=5,b=4,c=3,d=2 B.a=5,b=3,c=4,d=2C.a=2,b=3,c=4,d=5 D.a=3,b=2,c=4,d=5解析:选D对于同一样本,|ad-bc|越小,说明x与y相关性越弱,而|ad-bc|越大,说明x与y相关性越强,通过计算知,对于A,B,C都有|ad-bc|=|10-12|=2;对于选项D,有|ad-bc|=|15-8|=7,显然7>2.3.对于分类变量X与Y的随机变量K2的观测值k,下列说法正确的是()A.k越大,“X与Y有关系”的可信程度越小B.k越小,“X与Y有关系”的可信程度越小C.k越接近于0,“X与Y没有关系”的可信程度越小D.k越大,“X与Y没有关系”的可信程度越大解析:选B k越大,“X与Y没有关系”的可信程度越小,则“X与Y有关系”的可信程度越大.即k越小,“X与Y有关系”的可信程度越小.4.利用独立性检验对两个分类变量是否有关系进行研究时,若有99.5%的把握认为事件A和B有关系,则具体计算出的数据应该是()A.k≥6.635B.k<6.635C.k≥7.879D.k<7.879解析:选C有99.5%的把握认为事件A和B有关系,即犯错误的概率为0.5%,对应的k0的值为7.879,由独立性检验的思想可知应为k≥7.879.5.通过随机询问110名性别不同的大学生是否爱好某项运动,得到如下的列联表:男 女 总计 爱好 40 20 60 不爱好 20 30 50 总计6050110由K 2=n ad -bc 2a +bc +d a +cb +d算得,观测值k =110×40×30-20×20260×50×60×50≈7.8.附表:P(K 2≥k 0) 0.050 0.010 0.001 k 03.8416.63510.828A .有99%以上的把握认为“爱好该项运动与性别有关”B .有99%以上的把握认为“爱好该项运动与性别无关”C .在犯错误的概率不超过0.1%的前提下,认为“爱好该项运动与性别有关”D .在犯错误的概率不超过0.1%的前提下,认为“爱好该项运动与性别无关”解析:选A 由k≈7.8及P(K 2≥6.635)=0.010可知,在犯错误的概率不超过1%的前提下认为“爱好该项运动与性别有关”,也就是有99%以上的把握认为“爱好该项运动与性别有关”.二、填空题6.下列关于K 2的说法中,正确的有________. ①K 2的值越大,两个分类变量的相关性越大; ②K 2的计算公式是K 2=n ad -bca +bc +d a +cb +d;③若求出K 2=4>3.841,则有95%的把握认为两个分类变量有关系,即有5%的可能性使得“两个分类变量有关系”的推断出现错误;④独立性检验就是选取一个假设H 0条件下的小概率事件,若在一次试验中该事件发生了,这是与实际推断相抵触的“不合理”现象,则作出拒绝H 0的推断.解析:对于①,K 2的值越大,只能说明我们有更大的把握认为二者有关系,却不能判断相关性大小,故①错;对于②,(ad -bc)应为(ad -bc)2,故②错;③④对.答案:③④7.某电视台在一次对收看文艺节目和新闻节目观众的抽样调查中,随机抽取了100名电视观众,相关的数据如下表所示:文艺节目 新闻节目 总计 20至40岁 40 18 58 大于40岁 15 27 42 总计5545100由表中数据直观分析,收看新闻节目的观众是否与年龄有关:________(填“是”或“否”). 解析:因为在20至40岁的58名观众中有18名观众收看新闻节目,而在大于40岁的42名观众中有27名观众收看新闻节目,即b a +b =1858,dc +d =2742,两者相差较大,所以经直观分析,收看新闻节目的观众与年龄是有关的.答案:是8.某工厂为了调查工人文化程度与月收入的关系,随机抽取了部分工人,得到如下列联表(单位:人):月收入2 000元以下 月收入2 000元及以上 总计 高中文化以上 10 45 55 高中文化及以下20 30 50 总计3075105k =105×10×30-45×20255×50×30×75≈6.109,请估计在犯错误的概率不超过________的情况下认为文化程度与月收入有关系.解析:由于6.109>5.024,所以在犯错误的概率不超过0.025的前提下认为文化程度与月收入有关系.答案:0.025 三、解答题9.用两种检验方法对某食品做沙门氏菌检验,结果如下表.阳性 阴性 总计 荧光抗体法 160 5 165 常规培养法 26 48 74 总计18653239附:P(K 2≥k 0)0.0100.0050.001k 0 6.635 7.879 10.828(1)利用图形判断采用荧光抗体法与检验结果呈阳性是否有关系;(2)能否在犯错误的概率不超过0.001的前体下认为采用荧光抗体法与检验结果呈阳性有关系?解:(1)作出等高条形图如图所示,由图知采用荧光抗体法与检验结果呈阳性有关系.(2)通过计算可知K 2=n ad -bc 2a +bc +d a +cb +d≈113.184 6.而查表可知,因为P(K 2≥10.828)≈0.001,而113.184 6远大于10.828,所以在犯错误的概率不超过0.001的前提下认为采用荧光抗体法与检验结果呈阳性有关系.10.某校在两个班进行教学方式对比试验,两个月后进行了一次检测,试验班与对照班成绩统计如下表所示(单位:人):80及80分以上80分以下总计 试验班 35 15 50 对照班 20 m 50 总计5545n(1)求m ,n ;(2)能否在犯错误的概率不超过0.005的情况下认为教学方式与成绩有关系? 解:(1)m =45-15=30,n =50+50=100. (2)由表中的数据,得K 2的观测值为 k =100×35×30-15×20250×50×55×45≈9.091.因为9.091>7.879,所以能在犯错误的概率不超过0.005的前提下认为教学方式与成绩有关系.。

2019-2020学年高中数学人教A版选修2-3同步训练:3.2 独立性检验的基本思想及其初步应用 Word版含答案

2019-2020学年高中数学人教A版选修2-3同步训练:3.2 独立性检验的基本思想及其初步应用 Word版含答案

3.2 独立性检验的基本思想及其初步应用1、在对某小学的学生进行性别与吃零食的调查中,得到下表数据:根据上述数据分析可得出的结论是( )A.认为男女学生与吃零食与否有关系B.认为男女学生与吃零食与否没有关系C.性别不同决定了吃零食与否D.以上都是错误的2、通过随机询问110名性别不同的大学生是否爱好某项运动,得到如下的列联表:由22()()()()()n ad bcKa b c d a c b d-=++++算得,22110(40302020)7.860506050K⨯⨯-⨯=≈⨯⨯⨯附表:参照附表,得到的正确结论是( )A.在犯错误的概率不超过0.1%的前提下,认为"爱好该项运动与性别有关"B.在犯错误的概率不超过0.1%的前提下,认为"爱好该项运动与性别无关"C.有99%以上的把握认为"爱好该项运动与性别有关"D.有99%以上的把握认为"爱好该项运动与性别无关"3、观察下列各图,其中两个分类变量,x y之间关系最强的是( )A. B.C. D.4、下列关于等高条形图的叙述正确的是( )A.从等高条形图中可以精确地判断两个分类变量是否有关系B.从等高条形图中可以看出两个变量频数的相对大小C.从等高条形图中可以粗略地看出两个分类变量是否有关系D.以上说法都不对列联表总计5、下列是一个22则表中,a b处的值分别为( )A.94、96B.52、50C.52、54D.54、526、通过随机询问110名性别不同的大学生是否爱好某项运动,得到如下的列联表:参照附表(公式及数据见卷首),得到的正确结论是( )A.在犯错误的概率不超过0.1%的前提下,认为"爱好该项运动与性别有关"B.在犯错误的概率不超过0.1%的前提下,认为"爱好该项运动与性别无关"C.有99%以上的把握认为"爱好该项运动与性别有关"D.有99%以上的把握认为"爱好该项运动与性别无关"7、为了解高中生作文成绩与课外阅读量之间的关系,某研究机构随机抽取60名高中生做问卷调查,得到以下数据:由以上数据,计算得到2K 的观测值9.643k ,根据临界值表,以下说法正确的是( ) A.在样本数据中没有发现足够证据支持结论"作文成绩优秀与课外阅读量大有关" B.在犯错误的概率不超过0.001的前提下,认为作文成绩优秀与课外阅读量大有关 C.在犯错误的概率不超过0.05的前提下,认为作文成绩优秀与课外阅读量大有关 D.在犯错误的概率不超过0.005的前提下,认为作文成绩优秀与课外阅读量大有关 8、某班主任对全班50名学生进行了作业量的调查,数据如下表:则学生的性别与认为作业量的大小有关系的把握大约为( )A.99%B.95%C.90%D.无充分根据 9、对服用某种维生素对婴儿头发稀疏与稠密的影响调查如下:服用的60人中头发稀疏的有5人,不服用的60人中头发稀疏的有46人,作出如下列联表:则表中,a b 的值分别为( )A.9,14B.55,14C.55,24D.69,14 10、对两个分类变量,A B 的下列说法中正确的个数为( ) ①A 与B 无关,即A 与B 互不影响;②A 与B 关系越密切,则2K 的观测值就越大;③2K 的观测值大小是判定A 与B 是否相关的唯一依据.A.1B.2C.3D.0 11、独立性检验所采用的思路是:要研究,A B 两类型变量彼此相关,首先假设这两类变量彼此__________,在此假设下构造随机变量2K ,如果2K 的观测值较大,那么在一定裎度上说明假设__________.12、以下结论正确的序号有__________(1)根据22⨯列联表中的数据计算得出20.635K ≥, 而2( 6.635)0.01p K ≥≈,则有99% 的把握认为两个分类变量有关系.(2)在残差图中,残差点比较均匀落在水平的带状区域中即可说明选用的模型比较合适,与带状区域的宽度无关.(3)在线性回归分析中,相关系数为r ,r 越接近于1,相关程度越大; r 越小,相关程度越小.(4)在回归直线0.585y x =-中,变量200x =时,变量y 的值一定是15.13、某电视台在一次对收看文艺节目和新闻节目观众的抽样调査中,随机抽取了 100名电视观众,相关的数据如下表所示:由表中数据直观分析,收看新闻节目的观众是否与年龄有关:__________(填“是”或“否”).14、为了了解司机开车时礼让斑马线行人的情况,交警部门调查了100名机动车司机,得到以下统计数据:若以2x 为统计量进行独立性检验,则2x 的值是__________(结果保留2位小数)参考公式()()()()()22n ad bc x a b c d a c b d -=++++15、期末考试后,某校对甲、乙两个文科班的数学成绩进行统计,规定:大于或等于120分的为优秀, 120以下的为非优秀.统计结束后,得到如下22⨯列联表.已知在甲、乙两个文科班的110人中随机抽取1人为优秀的概率为311.()()()()()22n ad bc K k a b c d a c b d -==++++1.请完成22⨯列联表.2.是否有99.9%的把握认为“成绩优秀与班级有关”?答案以及解析1答案及解析:答案:A解析:∵2 289(2426318)32575534χ⨯⨯-⨯=⨯⨯⨯125824643.69 2.7063410880=≈>.∴有90%的把握认为男女学生与吃零食与否有关系.2答案及解析:答案:C解析:由22110(40302020)7.860506050K⨯⨯-⨯=≈⨯⨯⨯及2( 6.635)0.010P k≥=可知,在犯错误的概率不超过1%的前提下,认为“爱好该项运动与性别有关”,也就是有99%以上的把握认为“爱好该项运动与性别有关”,故选.C3答案及解析:答案:D解析:在四个选项中,D选项中的图中两个深色条的高度相差最明显,说明两个分类变量之间关系最强,故选D.4答案及解析:答案:C解析:在等高条形图中仅能粗略地判断两个分类变量的关系,故A错.在等高条形图中仅能够找出频率,无法找出频数,故B错.5答案及解析:解析:根据所给的列连表可以得到,综上可知,所以C 选项是正确的.6答案及解析: 答案:C 解析:7答案及解析: 答案:D解析:根据临界值表, 9.6437.879>,在犯错误的概率不超过0.005的前提下,认为作文成绩优秀与课外阅读量大有关.8答案及解析: 答案:B 解析:由于随机变量2K 的观测值()250181598k 5.059 3.84127232624⨯⨯-⨯=≈>⨯⨯⨯,所以在犯错误概率不超过0.05的前提下,可认为学生的性别与认为作业量的大小有关系,即有95%的把握,故选B.9答案及解析: 答案:B根据列联表知a60555,b604614=-==-=.10答案及解析:答案:A解析:①正确,A与B无关即A与B相互独立;②不正确,2K的观测值的大小只是用来检验A 与B是否相互独立;③不正确,也可借助等高条形图等.故选A.11答案及解析:答案:无关;不成立解析:12答案及解析:答案:(1)(3)解析:13答案及解析:答案:是解析:因为在20至40岁的58名观众中有18名观众收看新闻节目,而大于40岁的42名观众中有27名观众收看新闻节目,即1827,5842b da b c d==++两者相差较大,所以经直观分析,收看新闻节目的观众与年龄是有关的.14答案及解析:答案:8.25解析:填写22⨯列联表,如下:根据数表,计算()22210040252015()8.25()()()()55456040n ad bcxa b c d a c b d⨯⨯-⨯-==≈++++⨯⨯⨯15答案及解析:答案:1.2.()22110103050207.48610.82830806050K k⨯⨯-⨯==≈<⨯⨯⨯所以没有99.9%的把握认为“成绩优秀与班级有关”解析:。

人教版数学高二A版选修2-3知识必备3.2独立性检验的基本思想及其初步应用

人教版数学高二A版选修2-3知识必备3.2独立性检验的基本思想及其初步应用

3.2独立性检验的基本思想及其初步应用知识梳理1.数据的表示方法(1)变量的不同值表示个体所属的不同类别,象这种变量称为分类____________变量.(2)用图表列出两个变量的频数表,称为____________.(3)与表格相比, ____________和____________能更直观地反应出相关数据的总体状态;从列联表中能清晰地看出各个数据的相对大小;而等高条形图更能反应出每一类数据的相对特点.2.独立性检验的方法(1)利用随机变量K 2来确定在多大程度上可以认为“两个分类变量有关系”的方法称为两个分类变量的____________.(2)在H 0成立的情况下,统计学家估计出的概率为____________.(3)独立性检验的基本思想类似于反证法.要确认“两个分类变量有关系”这一结论成立的可信度,首先假设结论不成立,即假设结论____________成立,在该假设下构造的随机变量K 2应该____________.如果由观测数据计算得到的K 2的观测值k 很大,则在一定程度上说明____________.根据随机变量K 2的含义,可以通过概率式____________评价该假设不合理的程度.(4)一般地,假设有两个变量X 和Y,它们的值域分别为{x 1,x 2},{y 1,y 2},若要推断的结论为: H 1:“X 和Y 有关系”.可以按照下列步骤判断结论H 1成立的可能性:1)通过____________和____________,可以粗略地判断两个分类变量是否有关系,但是这种判断无法精确地给出所得结论的可靠程度.①在三维柱形图中,主对角线上两个柱形高度的乘积与副对角线上的两个柱形高度的乘积相差越大,H 1成立的可能性就____________.②在二维条形图中,可以估计满足条件____________的个体中具有____________的个体所占的比例ba a +,也可以估计满足条件____________的个体中具有____________的个体的比例dc c +,两个比例的值相差越大,H 1成立的可能性____________. 2)可以利于独立性检验来考查两个分类变量是否有关系,并且能较精确地给出这种判断的可靠程度.具体做法是:根据观测数据计算随机变量K 2的值k,其值越大,说明“X 与Y 有关系”成立的可能性____________.知识导学要学好本节内容,首先要理解独立性检验的含义,为什么要进行独立性检验,要在实际问题中加深理解.对于三维柱形图和二维条形图,首先要理解这两个图表的数据意义,另外,还要知道从三维柱形图和二维条形图可以较直观地看出变量之间的某种关系,得出基本的结论,同时要进一步判断这个关系的可信度.这就是引入独立性检验的意义.独立性检验主要是对分类变量之间是否有关系,以及分类变量之间关系的可信程度,即概率进行检验,这就需要建立一个随机变量,对随机变量的大小进行判断,得出相应的结论.它主要体现两个方面的内容,一是两个变量之间有什么样的关系,二是这种关系有多大的可信度. 对于两个分类变量X 和Y 之间的关系进行判断的方法类似于反证法,也即是首先假设两个变量没有关系,再根据所设的随机变量对应概率的大小得出多大程度上变量X 和Y 存在某种关系.疑难突破1.理解独立性检验的基本思想剖析:独立性检验是对两个分类变量之间是否具有某种关系的研究.一般是先画出对应数据的三维柱形图或二维条形图,首先从直观上对它们之间的关系有一个初步的认识,但是这种认识还需要理论上的证明,其证明类似于反证法,首先假设两个分类变量之间没有关系,然后构造某分类变量,通过对分类变量概率的讨论不仅能证明它们之间具有的关系,还能计算出它们之间存在这种关系的可能性,也就是在数字上认识它们的这种关系.2.独立性检验在实际中的重要作用剖析:独立性检验是数理统计的一种方法,是数学中的一种基本理论,是数学体系中对数据关系进行探索的一种基本思想.当然,对数据的统计分析得出的结论只能是在一定程度上对某种关系进行判断,而不是一种确定性的关系,这也是统计思想与确定性思维的差异所在.独立性检验在实际中也有着广泛的应用,是对实际生活中数据进行分析的一种方法,通过这种分析得出的结论对实际生活或者生产都有一定的指导作用.例如,通过研究吸烟和患肺癌关系的研究可以让我们认识吸烟的危害,及时预防吸烟对人体的危害;通过对水稻产量和施肥量关系的研究可以帮助人们正确施肥,提高水稻的产量,从而提高生活的质量等.。

高中人教A数学选修2-3学案:3.2 独立性检验的基本思想及其初步应用 含答案

高中人教A数学选修2-3学案:3.2 独立性检验的基本思想及其初步应用 含答案

3.2独立性检验的基本思想及其初步应用自主预习·探新知情景引入饮用水的质量是人类普遍关心的问题.据统计,饮用优质水的518人中,身体状况优秀的有466人,饮用一般水的312人中,身体状况优秀的有218人.人的身体健康状况与饮用水的质量之间有关系吗?新知导学1.与列联表相关的概念(1)分类变量:变量的不同“__值__”表示个体所属的__不同类别__,像这样的变量称为分类变量.(2)列联表:①列出__两个__分类变量的__频数表__,称为列联表.②一般地,假设有两个分类变量X和Y,它们的取值分别为{x1,x2}和{y1,y2},其样本频数列联表(称为2×2列联表)为:Yy1y2总计Xx1 a b __a+b__x2 c d __c+d__总计__a+c____b+d__a+b+c+d 2.等高条形图等高条形图与表格相比,图形更能直观地反映出两个分类变量间是否__相互影响__,常用等高条形图展示列表数据的__频率特征__.3.独立性检验的基本思想(1)定义:利用随机变量__K 2__来判断“两个分类变量__有关系__”的方法称为独立性检验.(2)公式:K 2=__n (ad -bc )2(a +b )(c +d )(a +c )(b +d )__,其中n =__a +b +c +d __.(3)独立性检验的具体做法:①根据实际问题的需要确定容许推断“两个分类变量有关系”犯错误概率的上界α,然后查表确定__临界值__k 0.②利用公式计算随机变量K 2的__观测值__k .③如果__k ≥k 0__,就推断“X 与Y 有关系”,这种推断犯错误的概率不超过α;否则,就认为在__犯错误的概率__不超过α的前提下不能推断“X 与Y 有关系”,或者在样本数据中__没有发现足够证据__支持结论“X 与Y 有关系”.预习自测1.下表是一个2×2列联表:y 1 y 2 总计 x 1 a 21 73 x 2 2 25 27 总计b46100则表中a 、b A .94,96 B .52,50 C .52,54D .54,52[解析] 由⎩⎪⎨⎪⎧a +21=73,a +2=b ,得⎩⎪⎨⎪⎧a =52,b =54.2.通过随机询问110名性别不同的大学生是否爱好某项运动,得到如下的列联表:男 女 总计 爱好 40 20 60 不爱好 20 30 50 总计6050110由K 2=n (ad -bc )(a +b )(c +d )(a +c )(b +d )算得K 2=110×(40×30-20×20)260×50×60×50≈7.8.附表:A .有99%以上的把握认为“爱好该项运动与性别有关”B .有99%以上的把握认为“爱好该项运动与性别无关”C .在犯错误的概率不超过0.1%的前提下,认为“爱好该项运动与性别有关”D .在犯错误的概率不超过0.1%的前提下,认为“爱好该项运动与性别无关”[解析] 根据独立性检验的定义,由K 2≈7.8>6.635可知,有99%以上把握认为“爱好该项运动与性别有关”.3.(2020·泸州模拟)某中学兴趣小组为调查该校学生对学校食堂的某种食品喜爱与否是否与性别有关,随机询问了100名性别不同的学生,得到如下的2×2列联表:附K 2=n (ad -bc )(a +b )(c +d )(a +c )(b +d )( C ) A .99%以上 B .97.5%以上 C .95%以上 D .85%以上[解析]K 2=100×(30×30-20×20)250×50×50×50=4>3.841,∴该数学兴趣小组有95%以上把握认为“喜爱该食品与性别有关”. 故选C .4.某班主任对全班50名学生进行了作业量多少的调查,数据如下表所示:则认定喜欢玩电脑游戏与认为作业量的多少有关系的把握为( B ) A .99%B .95%C .90%D .以上都不对[解析] K 2=50×(18×15-8×9)227×23×26×24≈5.059>3.841.因而有95%的把握认定喜欢玩电脑游戏与认为作业量的多少有关.互动探究·攻重难互动探究解疑 命题方向❶利用等高条形图判断两个分类变量是否相关典例1 为了解铅中毒病人与尿棕色素为阳性是否有关系,分别对病人组和对照组的尿液作尿棕色素定性检查,结果如下:组别 阳性数 阴性数 总计 铅中毒病人 29 7 36 对照组 9 28 37 总计383573中毒病人与尿棕色素为阳性是否有关系.[解析] 等高条形图如图所示:其中两个浅色条的高分别代表铅中毒病人和对照组样本中尿棕色素为阳性的频率. 由图可以直观地看出铅中毒病人与对照组相比较尿棕色素为阳性差异明显,因此铅中毒病人与尿棕色素为阳性有关系.『规律总结』 1.判断两个分类变量是否有关系的两种常用方法(1)利用数形结合思想,借助等高条形图来判断两个分类变量是否相关是判断变量相关的常见方法.(2)一般地,在等高条形图中,a a +b 与c c +d相差越大,两个分类变量有关系的可能性就越大.2.利用等高条形图判断两个分类变量是否相关的步骤独立性检验的计算公式⇒K2=n(ad-bc)2(a+b)(c+d)(a+c)(b+d)┃┃跟踪练习1__■(1)假设两个变量x与y的2×2列联表如下表:对于以下数据,对同一样本能说明x与y有关系的可能性最大的一组为(B)A.a=2,b=3,c=4,d=5B.a=5,b=3,c=3,d=4C.a=3,b=6,c=2,d=5D.a=5,b=3,c=4,d=3[解析]根据观测值求解的公式可以知道,当ad与bc差距越大,两个变量有关的可能性就越大,检验四个选项中所给的ad与bc的差距:A:ad-bc=10-12=-2,B:ad-bc=20-9=11,C:ad-bc=15-12=3,D:ad-bc=15-12=3.显然B中|ad-bc|最大,故选B.(2)某生产线上,质量监督员甲在生产现场时,990件产品中有合格品982件,次品8件;不在生产现场时,510件产品中有合格品493件,次品17件.试利用列联表和等高条形图判断监督员甲在不在生产现场对产品质量好坏有无影响.[解析]根据题目所给数据得如下2×2列联表:所以ad-bc质量好坏有关系.相应的等高条形图如图所示.图中两个阴影部分的高分别表示甲在生产现场和甲不在生产现场时样品中次品数的频率.从图中可以看出,甲不在生产现场时样本中次品数的频率明显高于甲在生产现场时样本中次品数的频率.因此可以认为质量监督员甲在不在生产现场与产品质量好坏有关系.命题方向❷独立性检验的应用典例2某中学对高二甲、乙两个同类班级,进行“加强‘语文阅读理解’训练,对提高‘数学应用题’得分率的作用”的试验,其中甲班为试验班(加强语文阅读理解训练),乙班为对比班(常规教学,无额外训练),在试验前的测试中,甲、乙两班学生在数学应用题上的得分率基本一致,试验结束后,统计几次数学应用题测试的平均成绩(均取整数)如下表所示:60分以下61-70分71-80分81-90分91-100分甲班(人数)31161218乙班(人数)78101015现规定平均成绩在80分以上(不含80分)的为优秀.(1)试分析估计两个班级的优秀率;(2)由以上统计数据填写下面2×2列联表,根据以上数据,能否有95%的把握认为加强“语文阅读理解”训练对提高“数学应用题”得分率有帮助?优秀人数非优秀人数合计甲班乙班合计参考公式及数据:K2=n(ad-bc)2(a+b)(c+d)(a+c)(b+d).P(K2≥k0)0.500.400.250.150.100.050.0250.0100.0050.001 k00.4550.708 1.323 2.072 2.706 3.841 5.024 6.6357.87910.828 [思路分析](1)由表格统计出甲、乙两个班的总人数和优秀人数,求出优秀率;(2)依统计数据填写列联表,代入公式计算K2的估计值,查表下结论.[解析] (1)由题意知,甲、乙两班均有学生50人, 甲班优秀人数为30人,优秀率为3050=60%,乙班优秀人数为25人,优秀率为2550=50%,所以甲、乙两班的优秀率分别为60%和50%. (2)因为K 2=100(25×30-25×20)255×45×50×50≈1.010<3.841,所以由参考数据知,没有95%的把握认为有帮助. 『规律总结』 1.独立性检验的步骤:第一步,确定分类变量,获取样本频数,得到列联表.第二步,根据实际问题的需要确定允许推断“两个分类变量有关系”犯错误概率的上界α,然后查表确定临界值k 0.第三步,利用公式K 2=n (ad -bc )2(a +b )(c +d )(a +c )(b +d )计算随机变量K 2的观测值K 0.第四步,作出判断.如果k ≥k 0,就推断“X 与Y 有关系”,这种推断犯错误的概率不超过α,否则就认为在犯错误的概率不超过α的前提下不能推断“X 与Y 有关系”,或者在样本数据中没有发现足够证据支持结论“X 与Y 有关系”.2.由于独立性检验计算量大,要细致,避免计算失误. ┃┃跟踪练习2__■为了探究学生选报文、理科是否与对外语的兴趣有关,某同学调查了361名高二在校学生,调查结果如下:理科对外语有兴趣的有138人,无兴趣的有98人,文科对外语有兴趣的有73人,无兴趣的有52人.能否在犯错误的概率不超过0.1的前提下,认为“学生选报文、理科与对外语的兴趣有关”?[解析] 根据题目所给的数据得到如下联系:总计236 125 361k =361×(138×52-73×98)2211×150×236×125≈1.871×10-4.因为1.871×10-4<2.706,所以,在犯错误的概率不超过0.1的前提下,不能认为“学生选报文、理科与对外语的兴趣有关”.学科核心素养 独立性检验的综合应用独立性检验的思想来自统计上的假设检验思想,它与反证法类似.假设检验和反证法都是先假设结论不成立,然后根据是否能够推出“矛盾”来断定结论是否成立.但二者“矛盾”的含义不同,反证法中的“矛盾”是指一个不符合逻辑的事情发生,而假设检验中的“矛盾”是指一个小概率事件发生,即在结论不成立的假设下,推出有利于结论成立的小概率事件发生.我们知道小概率事件在一次试验中通常是不会发生的,若在实际中这个事件发生了,说明保证这个事件为小概率事件的条件有问题,即结论在很大的程度上应该成立.典例3 某工厂有工人1 000名,其中250名工人参加过短期培训(称为A 类工人),另外750名工人参加过长期培训(称为B 类工人).现用分层抽样的方法(按A 类、B 类分两层)从该工厂的工人中抽取100名工人,调查他们的生产能力(此处生产能力指一天加工的零件数),结果如下表:表1:A 类工人生产能力的频数分布表 生产能力分组[110,120)[120,130)[130,140)[140,150)人数 8x32表2:B 类工人生产能力的频数分布表 生产能力分组[110,120)[120,130)[130,140) [140,150) 人数 6y2718(1)确定x 、y 的值;(2)完成下面2×2列联表,并回答能否在犯错误的概率不超过0.001的前提下认为工人的生产能力与工人的类别有关系?生产能力分组工人类别[110,130)[130,150)总计附:K 2=n (ad -bc )2(a +b )(c +d )(a +c )(b +d ),[思路分析] (1)确定x 、y 的值,可用分层抽样解决;(2)判断在规定条件下工人的生产能力与工人的类别是否有关系可通过独立性检验解决.由已知工厂中A 、B 类工人的人数和抽取工人数,进行分层抽样,可直接计算A 、B 类工人样本数;由表1、表2可得列联表,计算K 2的观测值k 与临界值可比较.[解析] (1)∵从该工厂的工人中抽取100名工人,且该工厂中有250名A 类工人,750名B 类工人,∴要从A 类工人中抽取25名,从B 类工人中抽取75名, ∴x =25-8-3-2=12,y =75-6-27-18=24. (2)根据所给的数据可以完成列联表,如下表所示:由列联表中的数据,得K 2的观测值为 k =100×(20×45-5×30)225×75×50×50=12>10.828,因此,在犯错误的概率不超过0.001的前提下认为工人的生产能力与工人的类别有关系. 『规律总结』 两个分类变量相关关系的判断(1)等高条形图法:在等高条形图中,可以估计满足条件X =x 1的个体中具有Y =y 1的个体所占的比例a a +b ,也可以估计满足条件X =x 2的个体中具有Y =y 1的个体所占的比例c c +d .两个比例的值相差越大,X 与Y 有关系成立的可能性就越大.(2)观测值法:通过2×2列联表,先计算K 2的观测值k ,然后借助k 的含义判断“两个分类变量有关系”这一结论成立的可信程度.┃┃跟踪练习3__■某高校共有15 000人,其中男生10 500人,女生4 500人,为调查该校学生每周平均体育运动时间的情况,采用分层抽样的方法,收集300位学生每周平均体育运动时间的样本数据(单位:小时).(1)应收集多少位女生的样本数据?(2)根据这300个样本数据,得到学生每周平均体育运动时间的频率分布直方图(如图所示),其中样本数据的分组区间为:[0,2],(2,4],(4,6],(6,8],(8,10],(10,12].在样本数据中,有60位女生的每周平均体育运动时间超过4个小时.请完成每周平均体育运动时间与性别列联表,并判断是否有95%的把握认为“该校学生的每周平均体育运动时间与性别有关”.P (K 2≥k 0)0.10 0.05 0.010 0.005 k 02.7063.8416.6357.879附:K 2=n (ad -bc )2(a +b )(c +d )(a +c )(b +d )[解析] (1)300×4 50015 000=90,所以应收集90位女生的样本数据. (2)由频率分布直方图得1-2×(0.100+0.025)=0.75,所以该校学生每周平均体育运动时间超过4小时的概率的估计值为0.75.300位学生中有300×0.75=225人的每周平均体育运动时间超过4小时,75人的每周平均体育运动时间不超过4小时,又因为样本数据中有210份是关于男生的,90份是关于女生的,所以每周平均体育运动时间与性别列联表如下:每周平均体育运动时间与性别列联表男生 女生 总计 每周平均体育运动时间不超过4小时 45 30 75 每周平均体育运动时间超过4小时165 60 225 总计21090300综合列联表可算得K 2=300×(45×60-165×30)275×225×210×90=10021≈4.762>3.841. 所以,有95%的把握认为“该校学生的每周平均体育运动时间与性别有关.”易混易错警示因对独立性检验的基本思想不理解而致错典例4已知两个分类变量X和Y的取值分别为{x1,x2},{y1,y2},若其列联表为y1y2x1515x24010则(D)A.X与Y之间有关系的概率为0.001B.X与Y之间有关系的概率为0.999 C.认为X与Y有关系,犯错误的概率为0.999D.认为X与Y有关系,犯错误的概率不超过0.001[错解]独立性检验的基本思想是指某件事发生在犯错概率不超过某个非常小的数据的前提下,我们有把握认为有关.理解有误会致误.[辨析] 1.在求K2的过程中,弄混a,b,c,d而致错或者因运算量大而致错.2.没有理解好独立性检验的基本思想而致错.[正解]K2的观测值为k=(5+15+40+10)×(5×10-40×15)2(5+15)×(40+10)×(5+40)×(15+10)≈18.822.查表知P(K2≥10.828)=0.001,所以在犯错误的概率不超过0.001的前提下,我们认为X与Y有关.课堂达标·固基础1.在某次飞行航程中遭遇恶劣气候,55名男乘客中有24名晕机,34名女乘客中有8名晕机,在检验这些乘客晕机是否与性别有关时,采用的数据分析方法应是(C) A.频率分布直方图B.回归分析C.独立性检验D.用样本估计总体[解析]根据题意,结合题目中的数据,列出2×2列联表,求出K2观测值,对照数表可得出概率结论,这种分析数据的方法是独立性检验.2.如表是一个2×2列联表:则表中a,b的值分别为(C)y1y2总计x1 a 2173x2222547总计 b 46120A.94,72B.52,50C.52,74D.74,52[解析]a=73-21=52,b=a+22=52+22=74.3.利用独立性检验来考虑两个分类变量X和Y是否有关系时,通过查阅下表来确定“X 和Y有关系”的可信度.如果K2的观测值k>5.024,那么在犯错误的概率不超过______的前提下认为“X和Y有关系”(D)P(K2≥k0)0.500.400.250.150.10k00.4550.708 1.323 2.072 2.706P(K2>k0)0.050.0250.0100.0050.001k0 3.841 5.024 6.6357.87910.828 A.0.25C.0.1D.0.025[解析]因为K2的观测值k>5.025,而在临界值表中对应于5.024的是0.025,所以可以在犯错误的概率不超过0.025的前提下认为“X和Y有关系”.4.为考察某种药物对预防禽流感的效果,在四个不同的实验室取相同的个体进行动物试验,根据四个实验室得到的列联表画出如下四个等高条形图,最能体现该药物对预防禽流感有显著效果的图形是(D)[解析]分析四个等高条形图得选项D中,不服用药物患病的概率最大,服用药物患病的概率最小,所以最能体现该药物对预防禽流感有显著效果,故选D.5.(2020·济南高二检测)分类变量X和Y的列表如下,则下列说法判断正确的是(C)y1y2总计x1 a b a+bx2 c d c+d总计a+c b+d a+b+c+dA.ad-bcB.ad-bc越大,说明X和Y关系越强C.(ad-bc)2越大,说明X与Y关系越强D.(ad-bc)2越接近于0,说明X与Y关系越强[解析]列联表可以较为准确地判断两个变量之间的相关关系程度,由K2=(a+b+c+d)(ad-bc)2(a+b)(a+c)(b+d)(c+d),当(ad-bc)2越大,K2越大,表明X与Y的关系越强.(ad-bc)2越接近0,说明两个分类变量X和Y无关的可能性越大.即所给说法判断正确的是C.。

高中数学人教A版选修2-3课件:3.2独立性检验的基本思想及其初步应用

高中数学人教A版选修2-3课件:3.2独立性检验的基本思想及其初步应用
x
).
问题导学
当堂检测
一、用列联表和等高条形图分析两变量间的关系
活动与探究 问题 1:怎样从列联表判断两个分类变量有无关系? 提示:|ad-bc|越小,说明两个分类变量 x,y 之间的关系越弱;|ad-bc|越 大,说明 x,y 之间的关系越强.
x
问题 2:等高条形图对分析两个分类变量是否有关系,有何帮助? 提示:通过画等高条形图,我们可以通过观察两个变量的比例关系, 直观判断两个变量是否有关系.
问题导学
当堂检测
(1)利用列联表直接计算 分类变量之间有关系.
������ ������ 和 ,如果两者相差很大,就判断两个 ������+������ ������+������
(2)在等高条形图中展示列联表数据的频率特征,比较图中两个深 色条的高可以发现两者频率不一样而得出结论 ,这种直观判断的不足 之处在于不能给出推断“两个分类变量有关系”犯错误的概率.
问题导学
当堂检测
相应的等高条形图如图所示.
图中两个深色条的高分别表示甲在生产现场和甲不在生产现场样 本中次品数的频率.从图中可以看出,甲不在生产现场样本中次品数的 频率明显高于甲在生产现场样本中次品数的频率 .因此可以认为质量 监督员甲在不在生产现场与产品质量好坏有关系 .
问题导学
当堂检测
迁移与应用 某学校对高三学生作了一项调查发现:在平时的模拟考试中,性格 内向的学生 426 人中有 332 人在考前心情紧张,性格外向的学生 594 人 中有 213 人在考前心情紧张,作出等高条形图,利用图形判断考前心情 紧张与性格类别是否有关系. 解:作列联表如下:
2
其中 n=a+b+c+d 为样本容量.

人教A版选修2-3选修2-3 3.2 独立性检验的基本思想及其初步应用.docx

人教A版选修2-3选修2-3  3.2 独立性检验的基本思想及其初步应用.docx

高中数学学习材料马鸣风萧萧*整理制作选修2-3 3.2 独立性检验的基本思想及其初步应用一、选择题1.统计假设H0:P(AB)=P(A)·P(B)成立时,有以下判断:①P(A B)=P(A)P(B);②P(A B)=P(A)P(B);③P(A B)=P(A)P(B).其中真命题个数是()A.1B.2C.3D.4[答案] C2.在对吸烟与患肺病这两个分类变量的计算中,下列说法正确的是()A.若随机变量K2的观测值k>6.635,我们有99%的把握说明吸烟与患肺病有关,则若某人吸烟,那么他有99%的可能患有肺病B.若由随机变量求出有99%的把握说吸烟与患肺病有关,则在100个吸烟者中必有99个人患有肺病C.若由随机变量求出有95%的把握说吸烟与患肺病有关,那么有5%的可能性使得推断错误D.以上说法均不正确[答案] C[解析]K2的意义与概率不能混淆.3.对两个分类变量A、B的下列说法中正确的个数为()①A与B无关,即A与B互不影响;②A与B关系越密切,则K2的值就越大;③K 2的大小是判定A 与B 是否相关的唯一依据 A .1 B .2 C .3D .4[答案] A[解析] ①正确,A 与B 无关即A 与B 相互独立;②不正确,K 2的值的大小只是用来检验A 与B 是否相互独立;③不正确,例如借助三维柱形图、二维条形图等.故选A.4.以下关于独立性检验的说法中,错误的是( ) A .独立性检验依据小概率原理 B .独立性检验得到的结论一定正确 C .样本不同,独立性检验的结论可能有差异D .独立性检验不是判定两分类变量是否相关的唯一方法 [答案] B[解析] 独立性检验得到的结论不一定正确,如我们得出有90%的把握认为A 与B 有关,只是说这种判断的正确性为90%,具体问题中A 与B 可能有关,可能无关,故答案选B.5.根据下面的列联表判断患肝病与嗜酒有关系的把握有( )嗜酒 不嗜酒 合计 患肝病 7775 42 7817 未患肝病 2099 49 2148 总计9874919965A.90%B .95%C .97.5%D .99.9%[答案] D[解析] 由K 2=n (ad -bc )2(a +b )(c +d )(a +c )(b +d )得其观测值k =9965×(7775×49-2099×42)27817×2148×9874×91≈56.6>10.828.故有99.9%的把握认为患肝病与嗜酒有关系,答案选D.二、填空题6.吃零食是中学生中普遍存在的现象.吃零食对学生身体发育有诸多不利影响,影响学生的健康成长.下表给出性别与吃零食的列联表男 女 总计 喜欢吃零食 5 12 17 不喜欢吃零食40 28 68 合计454085试回答吃零食与性别有关系吗?(答有或没有)____________. [答案] 有[解析] k =n (ad -bc )2(a +b )(c +d )(a +c )(b +d )=85(140-480)217×68×45×40=98260002080800≈4.700>3.841. 故约有95%的把握认为“吃零食与性别”有关.7.根据下表,计算K 2的观测值k ≈________.(保留两位小数)又发病 未发病 作移植手术 39 157 未作移植手术29167[答案] 1.78[解析] k =392×(39×167-157×29)2196×196×68×324≈1.78.8.假设有两个分类变量X 和Y ,它们的可能取值分别为{x 1,x 2}和{y 1,y 2},其2×2列联表如下:y 1 y 2 总计 x 1 a b a +b x 2 c d c +d 总计a +cb +da +b +c +d对于以下数据,对同一样本能说明X 与Y 有关的可能性最大的一组的序号为________. ①a =9,b =8,c =7,d =6 ②a =9,b =7,c =6,d =8 ③a =8,b =6,c =9,d =7 ④a =6,b =7,c =8,d =9 [答案] ②[解析] 对于同一样本|ad -bc |越小,说明X 与Y 之间的关系越弱,|ad -bc |越大,说明X 与Y 之间的关系越强.|ad -bc |越大,K 2越大,|ad -bc |越小,则K 2越小.三、解答题9.调查339名50岁以上有吸烟习惯与患慢性气管炎的人的情况,获数据如下患慢性气管炎未患慢性气管炎总计 吸烟 43 162 205 不吸烟 13 121 134 合计56283339试问:(1)有吸烟习惯与患慢性气管炎病是否有关? (2)用假设检验的思想给予说明. [解析] (1)根据列联表的数据,得到k =n (ad -bc )2(a +b )(c +d )(a +c )(b +d )=339×(43×121-162×13)2205×56×283×134=6.674>6.635.所以有99%的把握认为“吸烟与患慢性气管炎病有关”.(2)假设“吸烟与患病之间没有关系”,由于事件A ={K 2≥6.635}的概率P (A )≈0.01,即A 为小概率事件,而小概率事件发生了,进而得假设错误,这种推断出错的可能性约有1%.10.某大型企业人力资源部为了研究企业员工工作积极性和对待企业改革态度的关系,随机抽取了189名员工进行调查,所得数据如下表所示:积极支持企业改革 不太赞成企业改革 合计 工作积极 54 40 94 工作一般 32 63 95 合计86103189对于人力资源部的研究项目进行分析,根据上述数据能得出什么结论? [解析] 由公式k =189×(54×63-40×32)294×95×86×103≈10.76.因为10.76>7.879,所以有99.5%的把握说:员工“工作积极”与“积极支持企业改革”有关,可以认为企业的全体员工对待企业改革的态度与其工作的积极性是有关的.11.考察小麦种子经过灭菌与否跟发生黑穗病的关系,经试验观察,得到数据如下表所示.种子灭菌 种子未灭菌合计 有黑穗病 26 184 210 无黑穗病 50 200 250 合计76384460试按照原试验目的作统计推断.[解析] 由公式得,k =460×(26×200-184×50)2210×250×76×384≈4.804.由于4.804>3.841,所以我们有95%的把握认为种子灭菌与发生黑穗病是有关系的. 12.打鼾不仅影响别人休息,而且可能与患有某种疾病有关.下表是一次调查所得的数据,试问:每一晚都打鼾与患心脏病有关吗?患心脏病 未患心脏病合计 每一晚都打鼾30224254不打鼾 24 1355 1379 合计5415791633[解析] 由公式②,k =1633×(30×1355-224×24)21379×254×54×1579≈68.33.因为68.33>6.635,所以有99%的把握说,每一晚都打鼾与患心脏病有关.。

高中数学人教A版选修2-3课时训练:3.2独立性检验的基本思想及其初步应用总结

高中数学人教A版选修2-3课时训练:3.2独立性检验的基本思想及其初步应用总结

课时训练15独立性检验的基本思想及其初步应用一、选择题1.通过对K2的统计量的研究得到了若干个临界值,当K2≤2.706时,我们认为().A.在犯错误的概率不超过0.05的前提下认为X与Y有关系B.在犯错误的概率不超过0.01的前提下认为X与Y有关系C.没有充分理由认为X与Y有关系D.不能确定答案:C解析:∵K2≤2.706,∴没有充分理由认为X与Y有关系.2.班级与成绩2×2列联表:优秀不优秀总计甲班10 35 45乙班7 38 p总计m n q表中数据m,n,p,q的值应分别为().A.70,73,45,188B.17,73,45,90C.73,17,45,90D.17,73,45,45答案:B解析:m=10+7=17,n=35+38=73,p=7+38=45,q=45+p=90.故B正确.3.(2014江西高考)某人研究中学生的性别与成绩、视力、智商、阅读量这4个变量的关系,随机抽查52名中学生,得到统计数据如表1至表4,则与性别有关联的可能性最大的变量是().表1成绩不及格及格总计性别男 6 14 20女10 22 32总计16 36 52表2视力好差总计性别男 4 16 20女12 20 32总计16 36 52表3智商偏高正常总计性别男8 12 20女8 24 32总计16 36 52表4阅读量丰富不丰富总计性别男14 6 20女 2 30 32总计16 36 52A.成绩B.视力C.智商D.阅读量答案:D解析:根据K2=,代入题中数据计算得D选项K2最大.故选D.4.下面是调查某地区男女中学生喜欢理科的等高条形图,阴影部分表示喜欢理科的百分比,从图可以看出().A.性别与喜欢理科无关B.女生中喜欢理科的比为80%C.男生比女生喜欢理科的可能性大些D.男生不喜欢理科的比为60%答案:C解析:由图知女生中喜欢理科的比为20%,男生不喜欢理科的比为40%,故B,D不正确.由图知,男生比女生喜欢理科的可能性大些.5.有人发现,多看电视容易使人变冷漠,下表是一个调查机构对此现象的调查结果:冷漠不冷漠总计多看电视68 42 110少看电视20 38 58总计88 80 168则认为多看电视与人变冷漠有关系的把握大约为().A.99.9%B.97.5%C.95%D.90%答案:A解析:可计算K2的观测值k≈11.377>10.828.二、填空题6.某电视台在一次对收看文艺节目和新闻节目观众的抽样调查中,随机抽取了100名电视观众,相关的数据如下表所示:文艺节目新闻节目总计20至40岁40 18 58大于40岁15 27 42总计55 45 100由表中数据直观分析,收看新闻节目的观众是否与年龄有关:(填“是”或“否”).答案:是解析:因为在20至40岁的58名观众中有18名观众收看新闻节目,而大于40岁的42名观众中有27名观众收看新闻节目,即,两者相差较大,所以,经直观分析,收看新闻节目的观众与年龄是有关的.7.某中学2013年共910人参加高考,统计数据如下:城镇考生农村考生录取310 240未录取190 170则考生的户口形式和高考录取的关系是.(填无关或多大把握有关)答案:无关解析:2×2列联表如下:城镇考生农村考生合计录取310 240 550未录取190 170 360合计500 410 910统计假设H0:考生的户口形式对高考录取没有影响.计算K2的观测值k=≈1.13.由于1.13<2.706,所以我们接受统计假设,故考生的户口形式和高考录取无关.8.为了判断高中三年级学生是否选修文科与性别的关系,现随机抽取50名学生,得到如下2×2列联表:理科文科男13 10女7 20已知P(K2≥3.841)≈0.05,P(K2≥5.024)≈0.025.根据表中数据,得到k=≈4.844.则认为选修文科与性别有关系出错的可能性为.答案:5%解析:∵k≈4.844,这表明小概率事件发生.根据假设检验的基本原理,应该断定“是否选修文科与性别之间有关系”成立,并且这种判断出错的可能性约为5%.三、解答题9.为了解某班关注NBA是否与性别有关,对该班48人进行了问卷调查得到如下的列联表:关注NBA 不关注NBA 合计男生 6女生10合计48已知在全班48人中随机抽取1人,抽到关注NBA的学生的概率为.(1)请将上面的表补充完整(不用写计算过程),并判断是否有95%的把握认为关注NBA与性别有关?(2)现记不关注NBA的6名男生中某两人为a,b,关注NBA的10名女生中某3人为c,d,e,从这5人中选取2人进行调查,求:至少有一人不关注NBA的被选取的概率.下面的临界值表,供参考P(K2≥k) 0.10 0.05 0.010 0.005k2.706 3.841 60.635 7.879(参考公式:K2=,其中n=a+b+c+d)解:(1)列联表补充如下:关注NBA 不关注NBA 合计x男生22 6 28女性10 10 20合计32 16 48由上表数据,可得K2=≈4.286.因为4.286>3.841,故有95%的把握认为关注NBA与性别有关.(2)从5人中选2人的基本事件有ab,ac,ad,ae,bc,bd,be,cd,ce,de共10种,其中至少有一人不关注NBA的有ab,ac,ad,ae,bc,bd,be共7种,故至少有一人不关注NBA的概率为.10.某校对学生课外活动内容进行调查,结果整理成下表:性别课外活动内容合计体育文娱男生21 23 44女生 6 29 35合计27 52 79试用你所学过的知识进行分析,能否在犯错误的概率不超过0.005的前提下认为“喜欢体育还是喜欢文娱与性别有关系”?解:其等高条形图如图:由图可以直观地看出喜欢体育还是喜欢文娱与性别在某种程度上有关系,但只能作粗略的判断,要想搞清两个量在多大程度上有关系,可用下面的方法:假设“喜欢体育还是喜欢文娱与性别没有关系”,因为a=21,b=23,c=6,d=29,n=79,所以K2的观测值k==≈8.106,且P(K2≥7.879)≈0.005,因为K2的观测值k≈8.106>7.879,所以在犯错误的概率不超过0.005的前提下认为“喜欢体育还是喜欢文娱与性别有关”.11.某企业有两个分厂生产某种零件,按规定内径尺寸(单位:mm)的值落在[29.94,30.06)的零件为优质品.从两个分厂生产的零件中各抽出了500件,量其内径尺寸,得结果如下表:甲厂:分组[29.86,29.90) [29.90,29.94) [29.94,29.98) [29.98,30.02)频数12 63 86 182分组[30.02,30.06) [30.06,30.10) [30.10,30.14)频数92 61 4乙厂:分组[29.86,29.90) [29.90,29.94) [29.94,29.98) [29.98,30.02)频数29 71 85 159分组[30.02,30.06) [30.06,30.10) [30.10,30.14)频数76 62 18(1)分别估计两个分厂生产的零件的优质品率;(2)由以上统计数据填写2×2列联表,并问能否在犯错误的概率不超过0.01的前提下认为两个分厂生产的零件的质量有差异.甲厂乙厂总计优质品非优质品总计解:(1)甲厂抽查的产品中有360件优质品,从而甲厂生产的零件的优质品率估计为=72%;乙厂抽查的产品中有320件优质品,从而乙厂生产的零件的优质品率估计为=64%.(2)填写表格如下表:甲厂乙厂总计优质品360 320 680非优质品140 180 320总计500 500 1000由列联表中的数据,得K2的观测值为k=≈7.353>6.635.因此,在犯错误的概率不超过0.01的前提下,认为两个分厂生产的零件的质量有差异.。

高中数学(A版)选修2-3 3.2独立性检验的基本思想

高中数学(A版)选修2-3 3.2独立性检验的基本思想
观测数据a、b、c、d都不小于5的独立性检验
中。
对于上节吸烟与患肺癌的问题,计算可得:
6578 (56 4567 1932 23) 2 2 62.698 1988 4590 79 6499
2 因为: 6.635
所以:有99%以上的把握认为吸烟与患肺癌是有关
当等式两边相差很大时, 变量间就不独立。
b ab bd 如当 很大时,A 1 与 B2 就不独立。 n n n
新课讲解
? ?
那么,这些量究竟要达到什么样的程度,
才能够说明变量之间不独立呢??能否选择
一个量,用它来检验变量之间的独 的大小来检验 变量间是否独 立,称它为卡 方统计量。
的,即吸烟与患肺癌不是相互独立的。
例题分析
某地震观测站对地下水位的变化和发生地震的情 况进行了1700次观测,数据如下:
试问观测结果是否说明地下水位的变化与地震的
发生有关系??
分析: 根据列联表的数据,可得:
2 1.59 2.706
所以,没有充分的证据显示地下水位的变化与 地震的发生相关。
(3)当 2 3.841 时,有95%的把握判定变量A、B
有关联; (4)当 2 6.635 时,有99%的把握判定变量A、B 有关联。
由于抽样的随机性,由样本得到的推断有
可能正确,也有可能错误。利用 2进行独立性
检验,可以对推断的正确性的概率作出估计,
样本量n越大,估计越准确。此法一般适用于
2
A、B有关联; (2)当 2 2.706 时,有90%的把握判定变量A、B
有关联; (3)当 2 3.841 时,有95%的把握判定变量A、B
有关联;

数学人教A版选修2-3自我小测:3.2 独立性检验的基本思

数学人教A版选修2-3自我小测:3.2 独立性检验的基本思

自我小测1.下列关于等高条形图的叙述正确的是()A.从等高条形图中可以精确地判断两个分类变量是否有关系D.从等高条形图中可以看出两个变量频数的相对大小C.从等高条形图可以粗略地看出两个分类变量是否有关系D.以上说法都不对2.某班主任对全班50名学生进行了作业量的调查,数据如表.() A.0.01 B.0.005 C.0.025 D.0.0013.利用独立性检验来考察两个分类变量X和Y是否有关系时,通过查阅下表来确定“X 与Y有关系”的可信程度.如果k≥5.024,那么就有把握认为“X与Y有关系”的百分比为()A.4.关于分类变量x与y的随机变量K2的观测值k,下列说法正确的是()A.k的值越大,“X和Y有关系”可信程度越小D.k的值越小,“X和Y有关系”可信程度越小C.k的值越接近于0,“X和Y无关”程度越小D.k的值越大,“X和Y无关”程度越大5.某工厂为了调查工人文化程度与月收入的关系,随机抽取了部分工人,得到如下列联表:文化程度与月收入列联表(单位:人)由上表中数据计算得K 2的观测值k =105×(10×30-20×45)55×50×30×75≈6.109,请估计认为“文化程度与月收入有关系”的把握是( )A .1%B .99%C .2.5%D .97.5%6.中国医药学院周医师从事原住民痛风流行率的研究,周医师发现原住民342人中,患有痛风的有40人,其中17位TG(三酸甘油酯)超出正常值160,而非痛风组302人中有66位TG 超出正常值.通过计算犯错误的概率认为“TG 超出正常值与痛风________关.(填“有”或“无”)7.为了判断高中三年级学生是否选修文科与性别的关系,现随机抽取50名学生,得到如下2×2列联表:根据表中数据,得k =8.某卫生机构对366人进行健康体检,有阳性家族史者糖尿病发病的有16例,不发病的有93例,有阴性家族史者糖尿病发病的有17例,不发病的有240例,认为糖尿病患者与遗传有关系的概率为________.9.第16届亚运会于2010年11月12日至27日在中国广州进行,为了搞好接待工作,组委会招募了16名男志愿者和14名女志愿者,调查发现,男、女志愿者中分别有10人和6人喜爱运动,其余人不喜爱运动.(1)根据以上数据完成以下2×2列联表:(2)爱运动有关?参考答案1.解析:在等高条形图中仅能粗略判断两个分类变量的关系,故A 错.在等高条形图中仅能够找出频率,无法找出频数.答案:C2.解析:k =50×(18×15-8×9)226×24×27×23≈5.059>5.024.∵P (K 2≥5.024)=0.025, ∴犯错误的概率不超过0.025. 答案:C3.解析:k =5.024对应的0.025是“X 和Y 有关系”不合理的程度,因此两个分类变量有关系的可信程度约为97.5%.答案:D4.解析:k 的值越大,X 和Y 有关系的可能性就越大,也就意味着X 与Y 无关系的可能性就越小.答案:B5.解析:由于6.109>5.024,故在犯错误的概率不超过0.025的前提下,即有97.5%的把握认为“文化程度与月收入有关系”.答案:D6.解析:列出2×2列联表;计算K 2的观测值k 这说明在犯错误的概率不超过0.005的前提下认为“TG 超出正常值与痛风有关”. 答案:有7.解析:k =50×(13×20-10×7)223×27×20×30≈4.844.答案:4.8448.解析:列出2×2列联表:所以随机变量K 2的观测值为k =366×(16×240-17×93)109×257×33×333≈6.067>5.024,所以在犯错误的概率不超过0.025的前提下,认为糖尿病患者与遗传有关. 答案:0.975 9.解:(1)(2)k =30×(10×8-6×6)216×14×16×14≈1.157 5<2.706,因此,在犯错误的概率不超过0.10的前提下不能判断喜爱运动与性别有关.。

高二数学人教A版选修2-3文档第3章 3.2 独立性检验的基本思想及其初步应用 Word版含答案

高二数学人教A版选修2-3文档第3章 3.2 独立性检验的基本思想及其初步应用 Word版含答案

独立性检验的基本思想及其初步应用
.了解分类变量、×列联表、随机变量的意义.
.通过对典型案例的分析,了解独立性检验的基本思想方法.(重点)
.通过对典型案例的分析,了解两个分类变量的独立性检验的应用.(难点)
[基础·初探]
教材整理列联表和等高条形图
阅读教材~,完成下列问题.
.分类变量和列联表
()分类变量
变量的不同“值”表示个体所属的不同类别,像这样的变量称为分类变量.
()列联表
①定义:列出的两个分类变量的频数表称为列联表.
②×列联表
一般地,假设有两个分类变量和,它们的取值分别为{,}和{,},其样本频数列联表(称为×列联表)为
.
()等高条形图与表格相比,更能直观地反映出两个分类变量间是否相互影响,常用等高条形图展示列联表数据的频率特征.
()观察等高条形图发现和相差很大,就判断两个分类变量之间有关系.
.下面是×列联表:
【解析】∵+=,∴=.
又∵+=,∴=.
【答案】
.下面的等高条形图可以说明的问题是(填序号).
图--

“心脏搭桥”手术和“血管清障”手术对“诱发心脏病”的影响是绝对不同的;

“心脏搭桥”手术和“血管清障”手术对“诱发心脏病”的影响没有什么不同;
③此等高条形图看不出两种手术有什么不同的地方;

“心脏搭桥”手术和“血管清障”手术对“诱发心脏病”的影响在某种程度上是不同的,但是没有的把握.
【答案】④
.下列说法正确的有(填序号).
①分类变量的取值仅表示个体所属的类别,它们的取值一定是离散的;
②。

(新人教A版选修2-32独立性检验的基本思想及其初步应用同步练习(含参考答案)

(新人教A版选修2-32独立性检验的基本思想及其初步应用同步练习(含参考答案)

(新人教A版选修2-32独立性检验的基本思想及其初步应用同步练习(含参考答案)高中新课标选修(2-3)3.2测试题一、选择题1.下列说法正确的有()①最小二乘法指的是把各个离差加起来作为总离差,并使之达到最小值的方法;②最小二乘法是指把各离差的平方和作为总离差,并使之达到最小值的方法;③线性回归就是由样本点去寻找一条直线,贴近这些样本点的数学方法;④因为由任何一观测值都可以求得一个回归直线方程,所以没有必要进行相关性检验.A.1个B.2个C.3个D.4个答案:B2.设有一个回归直线方程,则变量增加1个单位时()A.y平均增加1.5个单位B.y平均增加2个单位C.y平均减少1.5个单位D.y平均减少2个单位答案:C3.线性回归直线方程必过定点()A.B.C.D.答案:D4.下列变量关系是相关关系的是()①学生的学习态度与学习成绩之间的关系;②教师的执教水平与学生的学习成绩之间的关系;③学生的身高与学生的学习成绩之间的关系;④家庭的经济条件与学生的学习成绩之间的关系.A.①②B.①③C.②③D.②④答案:A5.下列变量关系是函数关系的是()A.三角形的边长与面积之间的关系B.等边三角形的边长与面积之间的关系C.四边形的边长与面积之间的关系D.菱形的边长与面积之间的关系答案:B二、填空题6.线性回归模型中,,.答案:,7.我们可用相关指数来刻画回归的效果,其计算公式为.答案:8.我们常利用随机变量来确定在多大程度上可以认为“两个分类变量有关系”的方法称为两个分类变量的独立性检验,其思想类似于数学上的.答案:反证法9.从散点图上看,点散布在从左下角到右上角的区域内,两个变量的这种相关关系称为.答案:正相关10.为了调查患慢性气管炎是否与吸烟有关,调查了339名50岁以上的人,调查结果如下表患慢性气管炎未患慢性气管炎合计吸烟43162205不吸烟13121134合计56283339根据列联表数据,求得.答案:7.469三、解答题11.在7块面积相同的试验田上进行施化肥量对水稻产量影响的试验,得到如下表所示的一组数据(单位:kg)施化肥量15202530354045水稻产量330345365405445450455(1)试求对的线性回归方程;(2)当施化肥量kg时,预测水稻产量.解:(1);(2)389.79kg12.某大型企业人力资源部为了研究企业员工工作积极性和对企业改革态度的关系,随机抽取了189名员工进行调查,所得数据如下表所示:积极支持企业改革不赞成企业改革合计工作积极544094工作一般326395合计86103189对于人力资源部的研究项目,根据上述数据能得出什么结论?解:根据列联表中的数据,得到.因,所以有99.5%的把握说:员工“工作积极”与“积极支持企业改革”是有关的,可以认为企业的全体员工对待企业改革的态度与其工作积极性是有关的.13.某10名同学的数学、物理、语文成绩如下表:数学3612512287108113111709474物理107919276938582787873语文86114104109100106112104599试分别研究他们的数学成绩与物理成绩的关系、数学成绩与语文成绩的关系,你能发现什么规律?解:可求出物理成绩与数学成绩的相关系数,从而认为物理成绩与数学成绩之间具有很强的线性相关关系.而由语文成绩与数学成绩的相关系数远小于0.75,说明语文成绩与数学成绩不具有线性相关关系.因此,数学成绩好的同学,一般来说物理成绩也较好,它们之间的联系较紧密,而数学成绩好的同学,语文成绩也可能好,也可能差,它们之间的关系不大.。

高中数学人教A版选修2-3同步辅导与检测3.2独立性检验的基本思想及其初步应用

高中数学人教A版选修2-3同步辅导与检测3.2独立性检验的基本思想及其初步应用

根据列联表中数据由公式计算得 2 361 × 138 × 52 - 73 × 98 K2= ≈1.871×10-4. 236×125×211×150 因为1.871×10- 4<2.706,所以据目前的数据不能认为学 生选报文、理科与对外语的兴趣有关,即可以认为学生选报 文、理科与对外语的兴趣无关. 点评:
跟踪练习 1.为研究不同的给药方式(口服与注射)和药的效果(有效 与无效)是否有关,经调查后结果列在下表中: 有效 口服 注射 合计 58 64 122 无效 40 31 71 合计 98 95 193
请根据统计数据,作出合适的判断分析.
解析:由公式得
2 193 × 58 × 31 - 40 × 64 K2= ≈ 1.390. 122×71×98×95
统计案例
3.2 独立性检验的基本思想及其初步应用
3.2 独立性检验的基本思想及其初步应用
学 习 目 标
预 习 导 学
典 例 精 析
课 堂 导 练
方 法 总 结
1.通过对典型案例(如“肺癌与吸烟有关吗”等)的探究, 了解独立性检验 ( 只要求 2×2 列联表 ) 的基本思想、方法及初 步应用. 2 .通过对典型案例 ( 如“质量控制”、“新药是否有效” 等)的探究,了解实际推断原理和假设检验的基本思想、方法 及初步应用.
自测自评
1.对变量x,y有观测数据(xi,yi)(i= 1,2,…,10),得散点图(1);'对变量μ,ν 有观测数据(μi,νi)(i=1,2,…,10),得散 点图(2),由这两个散点图可以判断( ) C A.变量 x与y正相关,μ与ν正相关
B.变量x与y正相关,μ与ν负相关
C.变量x与y负相关,μ与ν正相关
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

学业分层测评
(建议用时:45分钟)
[学业达标]
一、选择题
1.通过对K2的统计量的研究得到了若干个临界值,当K2≤2.706时,我们认为()
A.在犯错误的概率不超过0.05的前提下认为X与Y有关系
B.在犯错误的概率不超过0.01的前提下认为X与Y有关系
C.没有充分理由认为X与Y有关系
D.不能确定
【解析】∵K2≤2.706,∴没有充分理由认为X与Y有关系.
【答案】 C
2.下列关于等高条形图的叙述正确的是()
A.从等高条形图中可以精确地判断两个分类变量是否有关系
B.从等高条形图中可以看出两个变量频数的相对大小
C.从等高条形图中可以粗略地看出两个分类变量是否有关系
D.以上说法都不对
【解析】在等高条形图中仅能粗略判断两个分类变量的关系,故A错.在等高条形图中仅能够找出频率,无法找出频数,故B错.
【答案】 C
3.分类变量X和Y的列联表如下:
A.ad-bc越小,说明X与Y关系越弱
B.ad-bc越大,说明X与Y关系越弱
C.(ad-bc)2越大,说明X与Y关系越强
D.(ad-bc)2越接近于0,说明X与Y关系越强
【解析】对于同一样本,|ad-bc|越小,说明X与Y之间关系越弱;|ad-bc|越大,说明X与Y之间的关系越强.
【答案】 C
4.利用独立性检验对两个分类变量是否有关系进行研究时,若有99.5%的把握认为事件A和B有关系,则具体计算出的数据应该是()
A.k≥6.635B.k<6.635
C.k≥7.879 D.k<7.879
【解析】有99.5%的把握认为事件A和B有关系,即犯错误的概率为0.5%,对应的k0的值为7.879,由独立性检验的思想可知应为k≥7.879.
【答案】 C
5.通过随机询问110名性别不同的大学生是否爱好某项运动,得到如下表的列联表:
由K2=n(ad
(a+b)(c+d)(a+c)(b+d)
算得,
k=110×(40×30-20×20)2
60×50×60×50
≈7.8.
附表:
A.在犯错误的概率不超过0.1%的前提下,认为“爱好该项运动与性别有关”
B.在犯错误的概率不超过0.1%的前提下,认为“爱好该项运动与性别无关”
C.有99%以上的把握认为“爱好该项运动与性别有关”
D.有99%以上的把握认为“爱好该项运动与性别无关”
【解析】由k≈7.8及P(K2≥6.635)=0.010可知,在犯错误的概率不超过1%的前提下认为“爱好该项运动与性别有关”,也就是有99%以上的把握认为“爱好该项运动与性别有关”.
【答案】 C
二、填空题
6.在对某小学的学生进行吃零食的调查中,得到如下表数据:
【导学号:97270063】
【解析】由公式可计算得k=102×(27×29-34×12)2
39×63×61×41
≈2.334.
【答案】 2.334
7.为了探究电离辐射的剂量与人体的受损程度是否有关,用两种不同剂量的电离辐射照射小白鼠,在照射14天内的结果如表所示:
【解析】根据独立性检验的基本思想,可知类似于反证法,即要确认“两个分量有关系”这一结论成立的可信程度,首先假设该结论不成立.对于本题,进行统计分析时的统计假设应为“小白鼠的死亡与电离辐射的剂量无关”.【答案】小白鼠的死亡与电离辐射的剂量无关
8.在吸烟与患肺病是否相关的判断中,有下面的说法:
①若K2的观测值k>6.635,则在犯错误的概率不超过0.01的前提下,认为吸烟与患肺病有关系,那么在100个吸烟的人中必有99人患有肺病;
②从独立性检验可知在犯错误的概率不超过0.01的前提下,认为吸烟与患肺病有关系时,若某人吸烟,则他有99%的可能患有肺病;
③从独立性检验可知在犯错误的概率不超过0.05的前提下,认为吸烟与患肺病有关系时,是指有5%的可能性使得推断错误.
其中说法正确的是________.(填序号)
【解析】 K 2是检验吸烟与患肺病相关程度的量,是相关关系,而不是确定关系,是反映有关和无关的概率,故说法①不正确;说法②中对“确定容许推断犯错误概率的上界”理解错误;说法③正确.
【答案】 ③ 三、解答题
9.用两种检验方法对某食品做沙门氏菌检验,结果如下表.
附:
(1)
(2)能否在犯错误的概率不超过0.001的前提下认为采用荧光抗体法与检验结果呈阳性有关系?
【解】 (1)作出等高条形图如图所示,由图知采用荧光抗体法与检验结果呈阳性有关系.
(2)通过计算可知K 2
=n (ad -bc )2
(a +b )(c +d )(a +c )(b +d )
≈113.184 6.而查表可知,因
为P (K 2≥10.828)≈0.001,而113.184 6远大于10.828,所以在犯错误的概率不超
过0.001的前提下认为采用荧光抗体法与检验结果呈阳性有关系.10.有人发现一个有趣的现象,中国人的邮箱里含有数字比较多,而外国人邮箱名称里含有数字比较少,为了研究国籍和邮箱名称里含有数字的关系,他收集了124个邮箱名称,其中中国人的64个,外国人的60个,中国人的邮箱中有43个含数字,外国人的邮箱中有27个含数字.
(1)根据以上数据建立2×2列联表;
(2)他发现在这组数据中,外国人邮箱里含数字的也不少,他不能断定国籍和邮箱名称里含有数字是否有关,你能帮他判断一下吗?
【解】(1)2×2的列联表:
(2)假设“
由表中数据得k=124×(43×33-27×21)2
70×54×64×60
≈6.201.
因为k>5.024,所以有理由认为假设“国籍和邮箱名称里与是否含有数字无关”是不合理的,即在犯错误的概率不超过0.025的前提下认为“国籍和邮箱名称里与是否含有数字有关”.
[能力提升]
1.对两个分类变量A,B,下列说法中正确的个数为()
①A与B无关,即A与B互不影响;
②A与B关系越密切,则K2的值就越大;
③K2的大小是判定A与B是否相关的唯一依据.
A.1B.2C.3D.0
【解析】①正确,A与B无关即A与B相互独立;②不正确,K2的值的大小只是用来检验A与B是否相互独立;③不正确,也可借助等高条形图等.故选A.
【答案】 A
2.(2016·晋江市季延中学期中)某研究所为了检验某血清预防感冒的作用,
把500名使用了该血清的志愿者与另外500名未使用该血清的志愿者一年中的感冒记录作比较,提出假设H:“这种血清不能起到预防感冒的作用”,利用2×2列联表计算得K2≈3.918,经查临界值表知P(K2≥3.841)≈0.05.则下列叙述中正确的是()
A.有95%的把握认为“这种血清能起到预防感冒的作用”
B.若有人未使用该血清,那么他一年中有95%的可能性得感冒
C.这种血清预防感冒的有效率为95%
D.这种血清预防感冒的有效率为5%
【解析】K2≈3.918>3.841,因此有95%的把握认为“这种血清能起到预防感冒的作用”,故选A.
【答案】 A
3.为研究某新药的疗效,给100名患者服用此药,跟踪调查后得下表中的数据:
设H k≈________(小数点后保留一位有效数字),从而得出结论:服用此药的效果与患者的性别有关,这种判断出错的可能性为________.
【解析】由公式计算得K2的观测值k≈4.9.∵k>3.841,∴我们有95%的把握认为服用此药的效果与患者的性别有关,从而有5%的可能性出错.【答案】 4.95%
4.(2016·潍坊高二检测)为了研究玉米品种对产量的影响,某农科院对一块试验田种植的一批玉米共10 000株的生长情况进行研究,现采用分层抽样方法抽取50株作为样本,统计结果如下:
(1)6株玉米,再从这6株玉米中随机选出2株,求这2株之中既有高茎玉米又有矮茎玉米的概率;
(2)根据对玉米生长情况作出的统计,是否有95%的把握认为玉米的圆粒与玉米的高茎有关?
【解】(1)依题意,取出的6株圆粒玉米中含高茎2株,记为a,b;矮茎4株,记为A,B,C,D,从中随机选取2株的情况有如下15种:aA,aB,aC,aD,bA,bB,bC,bD,ab,AB,AC,AD,BC,BD,CD.
其中满足题意的共有aA,aB,aC,aD,bA,bB,bC,bD,共8种,则所
求概率为P=8 15.
(2)根据已知列联表,
得k=50×(11×7-13×19)2
30×20×24×26
≈3.860>3.841,即有95%的把握认为玉米的圆
粒与玉米的高茎有关.。

相关文档
最新文档