2014年人教A版选修2-3教案 3.2 独立性检验的基本思想及其初步应用

合集下载

数学人教A版选修2-3教学设计:3.2独立性检验的基本思想及其初步应用 Word版含解析

数学人教A版选修2-3教学设计:3.2独立性检验的基本思想及其初步应用 Word版含解析

教学设计3.2独立性检验的基本思想及其初步应用整体设计教材分析1.教材的地位和作用独立性检验是一种重要的统计方法,也是统计学中很常用的方法,更是高中数学新教材的新增内容.本节内容将反证法与独立性检验进行了合理整合,将假设检验的思想应用到实际生活中去.教材的设计还原了数学的本源、本质,是对“观察发现、抽象概括、感性到理性”等数学认知规律的提炼与总结,能让学生充分体会数学的发生、发展.2.课时划分独立性检验的基本思想及其初步应用的教学分三个课时完成:第1课时内容为直观判断两个分类变量是否有关系的基本方法;第2课时内容为独立性检验的基本思想;第3课时内容为独立性检验的初步应用.第一课时教学目标知识与技能结合生活实例了解分类变量的概念,了解直观判断分类变量相关性的方法,了解列联表和等高条形图的特点.过程与方法通过探索、研究、总结等方式使判断分类变量是否有关系的方法呈现在学生面前,使学生体会用样本来研究总体的思想.情感、态度与价值观通过学习本节课培养学生思维的批判性,深化学生对数学意义的理解,激发学习兴趣,认识数学的科学价值、应用价值和文化价值;通过探究学习培养学生互助合作的学习习惯,形成良好的思维品质和锲而不舍的钻研精神.重点难点教学重点:直观判断分类变量是否有关系的方法.教学难点:如何根据列联表和等高条形图来判断分类变量是否有关系.教学过程引入新课提出问题:在现实生活中,会遇到各种各样的变量,并需要研究它们之间的关系,观察下面两组变量,分析在取不同的“值”时表示的个体有何差异?(1)国籍、宗教信仰、性别、吸烟与患病是否有关;(2)成绩、身高、年龄、某班学生的百米成绩.学生活动:先独立思考,然后相互讨论交流认识统一看法.教师逐步引导学生发现分类变量的特点,分类变量的取值一定是离散的,而且不同的取值仅表示个体所属的类别.学情预测:(1)中的变量每取不同的“值”时,表示不同的类别;(2)中的变量每取不同的“值”时,表示不同的个体.教师:分类变量:变量的不同“值”表示个体所属的不同类别的变量称为分类变量.分类变量的取值一定是离散的,而且不同的取值仅表示个体所属的类别,如性别变量,只取男、女两个值,商品的等级变量只取一级、二级、三级等等.分类变量的取值有时可用数字来表示,但这时的数字除了分类以外没有其他的含义,如用“0”表示“男”,用“1”表示“女”.注意分类变量的取值一定是离散的.在我们的日常生活中,存在着大量的分类变量,如何判断两个分类变量是否有关系也是我们需要解决的一个重要问题.设计意图:从大量的生活实例出发,让学生充分体会分类变量的含义和分类变量的特点,使分类变量概念的形成水到渠成,同时也为判断分类变量的必要性做好铺垫.探究新知5月31日是世界无烟日.有关医学研究表明,许多疾病,例如:心脏病、癌症、脑血管病、慢性阻塞性肺病等都与吸烟有关,吸烟已成为继高血压之后的第二号全球杀手.这些疾病与吸烟有关的结论是怎样得出的呢?我们来看下面的问题:某医疗机构为了了解呼吸道疾病与吸烟是否有关,进行了一次抽样调查,共调查了515个成年人,其中吸烟者220人,不吸烟者295人.调查结果是:吸烟的220人中有37人患呼吸道疾病(简称患病),183人未患呼吸道疾病(简称未患病);不吸烟的295人中有21人患病,274人未患病.问题:根据这些数据能否断定“患呼吸道疾病与吸烟有关”?学生活动:先让学生独立思考,然后小组交流,教师巡视指导,并注意与学生交流,为了研究这个问题,(1)引导学生将上述数据用下表来表示:(2)估计吸烟者与不吸烟者患病的可能性差异.问题:由上述结论能否得出患病与吸烟有关?把握有多大?学情预测:在吸烟的人中,有37220≈16.82%的人患病,在不吸烟的人中,有21295≈7.12%的人患病.由上可以看出,吸烟者中患病的比例与不吸烟者中患病的比例相比有很大的差异,故“患呼吸道疾病与吸烟可能有关”.教师:类似于上面的表格,我们称分类变量的汇总统计表(频数表)为列联表,一般我们只研究每个分类变量只取两个值,这样的列联表称作2×2列联表.在日常生活中,为了直观显示两个分类变量之间的关系,还可以画出两个分类变量的等高条形图.观察下面的图形,能得到什么结论?(教师在课堂上用Excel 软件演示等高条形图,引导学生观察这类图形的特征,并分析由图形得出的结论)等高条形图学生活动:观察给出的图形,相互讨论,沟通认识.学情预测:通过上面的等高条形图可以直观看出,吸烟者中患病的比例与不吸烟者中患病的比例相比有很大的差异,故“患呼吸道疾病与吸烟可能有关”.设计目的:自然合理地提出问题,并通过不同的手段,让学生学会根据不同的方法来分析两个分类变量是否有关系.理解新知提出问题:一般地,假设有两个分类变量X 和Y ,它们的值域分别为{x 1,x 2}和{y 1,y 2},其2×2列联表和等高条形图如下表所示,试说明如何根据图表来判断分类变量X 和Y是否可能有关系?学生活动:分组讨论,合作交流,教师引导学生回顾上面问题的解决过程并加以适当的提示.学情预测:根据列联表,可估计满足条件X =x 1的个体中具有Y =y 1的个体所占比例a a +b ,也可以估计满足条件X =x 2的个体中具有Y =y 1的个体所占比例c c +d ,两个比例的值相差越大,就意味着X 和Y 有关系的可能越大.由a a +b -c c +d =ad -bc (a +b)(c +d)可知,两个比例的值相差越大即ad 与bc 相差越大,就意味着X 和Y 有关系的可能越大.由于等高条形图的纵轴是频率,故通过等高条形图可以直观展示比例差距的相对大小,进而判断分类变量是否存在关系.提出问题:上面给出的两种判断分类变量是否可能有关系的方法各有什么特点? 学生活动:独立思考,然后再相互交流.学情预测:列联表有助于直观地观测数据之间的关系,与表格相比,等高条形图更能直观地反映出相关数据的总体状况.但这两种方法都仅能粗略地判断两个分类变量是否可能有关系,但无法精确地给出得出结论的可靠程度.设计意图:通过引导学生对三种直观方法进行分析和总结,使学生掌握如何根据列联表、等高条形图来判断两个分类变量是否有关系,并了解两种方法的局限性,同时为下一节课的学习打好基础.运用新知例1某学校对在校部分学生课外活动内容进行调查,结果整理成下表:学生课外活动的类别与性别有关吗?试用学过的等高条形图进行分析.分析:根据题设条件中的列联表,画出等高条形图进行直观分析.解:等高条形图如下图所示:由图可以直观看出喜欢体育的在男生中占有较高比例,喜欢文娱的在女生中占有较高比例,故学生课外活动的类别在性别上有较大差异,说明课外活动的类别与性别在某种程度上有关系.点评:在画等高条形图时,在有条件的情况下,可引导学生利用Excel软件进行作图.【变练演编】例2在调查的480名男人中有38人患色盲,520名女人中有6名患色盲,试利用图形来判断色盲与性别是否有关?分析:根据数据列出列联表,然后画出等高条形图,来分析色盲与性别是否有关.解:根据题目给出的数据作出如下的列联表:根据列联表作出相应的等高条形图:从等高条形图来看在男人中患色盲的比例要比在女人中患色盲的比例大得多,因而,我们认为性别与患色盲是有关系的.设计意图:通过例题以及变式的学习,进一步学习利用图形直观判断分类变量是否有关系的要领,并能够画出大致的直观图形.【达标检测】1.下列不是分类变量的是()A.是否吸烟B.成绩C.宗教信仰D.国籍2.假设两个分类变量X和Y,它们的值域分别为{x1,x2}和{y1,y2},其中2×2列联表如下:对于以下数据,对同一样本能说明X与Y有关的可能性最大的一组为()A.a=5,b=4,c=3,d=2 B.a=5,b=3,c=4,d=2C.a=2,b=3,c=4,d=5 D.a=2,b=3,c=5,d=43.服用某种维生素对婴儿头发稀疏或稠密的影响调查如下:服用维生素的婴儿有60人,头发稀疏的有5人;不服用维生素的婴儿有60人,头发稀疏的有46人.试根据以上数据作出列联表.答案:1.B 2.D 3.列联表如下课堂小结(给学生1~2分钟的时间默写本节的主要基础知识、方法、例题、题目类型、解题规律等;然后用精炼的、准确的语言概括本节的知识脉络、思想方法、解题规律) 1.知识收获:直观判断分类变量是否有关系的方法.2.方法收获:借助于图形的直观特征分析数据间的关系.设计意图:让学生自己小结,这是一个多维整合的过程,是一个高层次的自我认识过程.补充练习【基础练习】1.下列关于等高条形图说法正确的是()A.等高条形图表示高度相对的条形图B.等高条形图表示的是分类变量的频数C.等高条形图表示的是分类变量的比例D.等高条形图表示的是分类变量的实际高度2.下面是一个2×2列联表:则表中a,b处的值分别为()A.94,96 B.52,50 C.52,54 D.54,523.以下说法正确的是()A.分类变量是表示个体所属的不同类别的变量B.分类变量是表示个体所属的不同类别的两个以上的变量C.分类变量是表示个体所属的不同类别的一个变量D.以上答案均不正确答案:1.C 2.C 3.A【拓展练习】4.从发生交通事故的司机中抽取2 000名司机的随机样本,根据他们的血液中是否含有酒精以及他们是否对事故负有责任将数据整理如下:试结合等高条形图分析血液中含有酒精与对事故负责有关系吗?解:由等高条形图可以看出,血液中含酒精的司机中负交通事故责任的比例要大于血液中不含酒精的司机,由此我们可以在某种程度上认为“血液中含有酒精与对事故负责”有关系.设计说明本节课在数学教材的选取上,力求贴近生活实际,如吸烟与患病、性别与课外活动的类型等,就地取材,创设学生熟悉的感兴趣的问题情境,使学生能在轻松、愉快的教学情境中学习有用的数学知识,同时也能运用数学知识来分析问题和解决问题.教案的设计“以人为本,以学定教”,教师始终扮演的是组织者、引导者、参与者的角色,通过问题教学法,变“教的课堂”为“学的课堂”,学生成为课堂学习真正的主人.倡导合作式学习,通过学生小组合作设计问题、小组交流解决问题的方式,不但提高了学生合作学习、主动探究的能力,而且大大促进了学生对知识的理解和灵活运用.备课资料用Excel软件画等高条形图用Excel软件画等高条形图的步骤.(1)在Excel软件中输入列联表的数据(也可以直接复制粘贴).(2)画柱形图.选中已输入的数据部分,然后单击工具栏上的“插入”,在下拉菜单中选择“图表”.然后在图表菜单中选择图表类型(如柱形图).按照提示依次进行下一步操作,就可以得到等高条形图了.(设计者:杨雪峰田宗臣)第二课时教学目标知识与技能通过实例,让学生了解独立性检验的基本思想及其初步应用,能对两个分类变量是否有关做出明确的判断,会对具体问题做出独立性检验.过程与方法经历概念的探索、反思、建构这一过程,让学生进一步体会独立性检验思想的基本原理,培养学生归纳、概括等合情推理能力.通过实际应用,培养学生把实际问题抽象成数学问题的能力和学以致用的数学应用意识.情感、态度与价值观通过创设情境激发学生学习数学的兴趣,培养其严谨治学的态度.在学生分析问题、解决问题的过程中培养其积极探索的精神,从而实现自我的价值.重点难点教学重点:独立性检验基本思想的初步应用; 教学难点:对独立性检验基本思想的理解.教学过程引入新课有甲、乙两个班级进行数学考试,按学生考试及格和不及格统计成绩后,得到如下列联表:试判断成绩不及格与班级是否有关?学生活动:回顾上一节课的学习内容,选择合适的方法进行判断.学情预测:根据列联表可知甲班学生中不及格的比例为1045,乙班学生中不及格的比例为745,相差345;画出等高条形图:有的学生可能说有关系,因为从等高条形图来看,可以发现甲、乙两班的及格率有明显差异;有的学生可能会说没有关系,因为不及格率相差345,应该不算大,所以说及格与班级没有关系.教师:由上面的问题可以看出,虽然利用图表来判断两个分类变量是否有关比较直观,但缺少精确性和可靠性,如何精确地刻画两个分类变量的有关性,我们必须找到一个进行精确判断的方法.设计意图:充分认识独立性检验的必要性,创设悬念,激发斗志,让学生跃跃欲试.探究新知提出问题:为了解决上面的问题,我们可以先假设H 0:不及格与班级无关.设A 表示事件“在甲班”,B 表示事件“不及格”,AB 表示“在甲班且不及格”,则“不及格与班级无关”等价于事件A 与B 相互独立,则有P(AB)=P(A)P(B),否则,应该有A 与B 不独立,即“不及格与班级有关”.那么,如何验证P(AB)=P(A)P(B)呢?学生活动:学生先独立思考,然后分小组讨论,老师加以适当的引导.学情预测:根据概率的统计定义可知,上面各个事件的概率可以用相应的频率来估计,则P(A)=4590=12,P(B)=1790,P(A)P(B)=17180,P(AB)=1090=19=20180,因为P(AB)≠P(A)P(B),故A 与B 不独立,即“不及格与班级有关”.提出问题:由P(AB)≠P(A)P(B)一定有“不及格与班级有关”吗?如果不是,那么如何根据P(A),P(B),P(AB)的值来判断其相关性?学生活动:小组协作讨论,然后说出对这个问题的认识.学情预测:P(AB)≠P(A)P(B)不一定有“不及格与班级有关”,因为在数据上我们是采用频率来估计概率,另外,在实际问题中我们也仅是用样本来估计总体,这些因素都会造成数值上的偏差.但是,应该肯定的是P(AB)与P(A)P(B)越接近,A 与B 独立的可能性就越大,即“不及格与班级有关”的可能性就越小.设计目的:通过实例的分析,为引入和理解独立性检验的基本思想做好铺垫.理解新知提出问题:若将表中“观测值”用字母表示,则得下表:令n =a +b +c +d ,如何判断不及格与班级是否有关系?试加以说明.学生活动:分组讨论,协作完成,教师引导学生类比上面的分析过程,将数字换成字母加以说明.学情预测:假设H 0:不及格与班级无关.设A 表示事件“在甲班”,B 表示事件“不及格”,AB 表示“在甲班且不及格”,则P(A)=a +b n ,P(B)=a +c n ,P(A)P(B)=a +b n ×a +c n ,P(AB)=an ,若“不及格与班级无关”,则a +b n ×a +c n 与an应非常接近. 教师:若a +b n ×a +c n 与a n 非常接近,则a +b n ×a +c n ≈an ,从而ad≈bc ,因此||ad -bc 越小,说明不及格与班级的关系越弱,||ad -bc 越大,说明不及格与班级的关系越强.而且我们还可以发现,当a +b n ×a +c n 与a n 非常接近时,a +b n ×b +d n 与b n 也应该非常接近…或者说(a n -a +b n×a +c n )2,(b n -a +b n ×b +d n )2,(c n -c +d n ×a +c n )2,(d n -c +d n ×b +d n)2应该比较小,从而 (a n -a +b n ×a +c n )2a +b n ×a +c n +(b n -a +b n ×b +d n )2a +b n ×b +d n +(c n -c +d n ×a +c n )2c +d n ×a +c n +(d n -c +d n ×b +d n)2c +d n ×b +dn =n(ad -bc)2(a +b)(a +c)(b +d)(c +d)也应该很小.构造随机变量K 2=n(ad -bc)2(a +b)(a +c)(b +d)(c +d),若H 0成立,即“不及格与班级无关”,则K 2应该很小.在H 0成立的情况下,统计学家估算出如下的概率P(K 2≥6.635)≈0.01.即在H 0成立的情况下,K 2的观测值大于6.635的概率非常小,近似于0.01,也就是说,在H 0成立的情况下对随机变量K 2进行多次观测,观测值超过6.635的频率约为0.01.从而,也说明我们把“H 0成立”错判成“H 0不成立”的概率不会超过0.01.这样,我们就可以通过计算K 2的观测值k 来判断H 0是否成立.我们把这种方法称为独立性检验.提出问题:独立性检验的基本思想是什么?学生活动:反思上面的过程,进行归纳总结,然后小组间交换意见.学情预测:独立性检验的基本思想是:要判断“两个分类变量有关系”这一结论的可信程度,首先假设结论不成立,即假设“两个分类变量没有关系”成立,在该假设下构造的随机变量K 2应该很小.如果由观测数据计算得到的K 2的观测值k 很大,则在一定程度上说明假设不合理,即认为“两个分类变量有关系”;如果观测值k 很小,则说明在样本数据中没有发现足够证据拒绝H 0.独立性检验的基本思想类似于反证法.教师:当确定“两个分类变量有关系”的可信程度时,需要确定一个正数k 0与随机变量K 2的观测值k 比较大小,如果k≥k 0,就认为“两个分类变量之间有关系”,否则就认为“两个分类变量之间没有关系”.我们称这样的k 0为一个判断规则的临界值.按照这种规则,把“两个分类变量之间没有关系”错误地判断为“两个分类变量有关系”的概率不超过P(K 2≥k 0).独立性检验的具体做法是:(1)根据实际问题的需要确定容许推断“两个分类变量有关系”犯错误概率的上界α,然后查表确定临界值k 0.(2)利用公式计算K 2的观测值k.(3)如果k≥k 0,就推断“X 与Y 有关系”,这种推断犯错误的概率不超过α;否则,就认为在犯错误的概率不超过α的前提下不能推断“X 与Y 有关系”,或者在样本数据中没有发现足够证据支持结论“X 与Y 有关系”.设计目的:以问题为驱动,引领学生在积极的思考、探究中,理解独立性检验的基本思想,理解随机变量K 2的构造过程.运用新知提出问题:根据独立性检验的基本思想,判断“不及格与班级是否有关”? 学生活动:类比公式,用计算器进行运算比较.活动结果:由题意知a =10,b =35,c =7,d =38,a +b =45,c +d =45,a +c =17,b +d =73,n =90.代入公式得K 2的观测值为:k =n(ad -bc)2(a +b)(a +c)(b +d)(c +d)=90×(10×38-7×35)245×45×17×73≈0.65.因为0.65>0.455,所以我们在犯错误的概率不超过0.5的前提下可认为“不及格与所在班级有关”.设计目的:通过问题的解决,既照应了开头提出的问题,同时也是对公式应用的一个巩固.【变练演编】题为了探究吸烟习惯与患慢性气管炎是否有关,调查了339名50岁以上的人,获数据如下:吸烟习惯与患慢性气管炎是否相关?试用独立性检验的思想说明理由. 分析:根据公式求出随机变量K 2的观测值k ,然后和已知结论数值进行比较. 解:根据列联表的数据得到K 2的观测值:k =n(ad -bc)2(a +b)(a +c)(b +d)(c +d)=339×(43×121-162×13)2205×56×283×134≈7.469>6.635,所以,在犯错误的概率不超过0.01的前提下认为“吸烟习惯与患慢性气管炎有关”. 提出问题:请解答下列问题:1.已知两个分类变量X 与Y ,你有哪些办法判断它们是否有关系?(把你知道的办法都写出来)2.已知K 2的观测值 k =6.635,你能得到哪些结论?(把你能得到的结论都写出来) 活动设计:学生先独立探索,允许互相交流成果.然后全班交流. 学情预测:1.列联表、等高条形图、独立性检验等.2.P(K 2≥6.635)≈0.01;我们判断“X 与Y 有关系”的出错概率不超过0.01;在犯错误的概率不超过0.01的前提下,可以认为“X 与Y 有关系”.设计意图:设置本组开放性问题,旨在增加问题的多样性、有趣性、探索性和挑战性,训练学生思维的发散性、收敛性、灵活性和深刻性,长期坚持,不仅会加深学生对数学的理解、掌握,而且会潜移默化地学会编题、解题.课堂小结(给学生1~2分钟的时间泛读教材,用精确的语言概括本节的知识脉络、思想方法、解题规律)1.独立性检验的思想方法以及它与反证法的关系. 2.独立性检验的一般操作步骤.设计意图:让学生自己小结,这是一个多维整合的过程,是一个高层次的自我认识过程.补充练习【基础练习】1.下面说法正确的是()A.统计方法的特点是统计推断准确、有效B.独立性检验的基本思想类似于数学上的反证法C.任何两个分类变量有关系的可信度都可以通过查表得到D.不能从等高条形图中看出两个分类变量是否相关2.经过对K2的统计量的研究,得到了若干个临界值,当K2的观测值k>3.841时,我们()A.在犯错误的概率不超过0.05的前提下可认为A与B有关B.在犯错误的概率不超过0.05的前提下可认为A与B无关C.在犯错误的概率不超过0.01的前提下可认为A与B有关D.没有充分理由说明事件A与B有关系3.利用独立性检验来考虑两个分类变量与是否有关系时,通过查阅下表来确定“X和Y 有关系”的可信度.如果k>6.635,那么认为“X和Y有关系”犯错误的概率不超过…()A.99%B.1%C.5%D.97.5%4.独立性检验所采用的思路是:要研究A,B两类分类变量是否彼此相关,首先假设这两类变量彼此__________,在此假设下构造随机变量K2,如果K2的观测值较大,那么在一定程度上说明假设__________.答案:1.B 2.A 3.B 4.无关不成立【拓展练习】5.某聋哑研究机构,对聋哑关系进行抽样调查,在耳聋的657人中有416人哑,而另外不聋的680人中有249人哑,你能运用这组数据判断,在犯错误的概率不超过0.1%的前提下,能否认为聋哑有关系?解:根据题目所给数据,得到如下列联表:根据列联表数据得到K2的观测值K=1 337×(416×431-249×241)2665×672×657×680≈95.29>10.828,∴在犯错误的概率不超过0.1%的前提下,可以认为聋哑有关系.设计说明本设计以问题驱动为指导,通过不断提出问题、研究问题、解决问题,使学生获得知识,完成教学.以学生熟悉的例子为载体,引导他们提炼、概括独立性检验的方法,自然合理地提出问题,让学生体会“数学来源于生活”.创造和谐积极的学习气氛,让学生通过直观感知、观察分析,形成由浅入深、由易到难、由感性到理性的思维飞跃,并借助例题具体说明在数学发现的过程中应用假设检验的过程.备课资料假设检验与反证法独立性检验的基本思想是假设检验,假设检验类似于反证法,但二者是不同的.下表列出了二者之间的关系:从上面的对比中,可以看出假设检验与反证法的不同之处有二:其一是在假设检验用有利于H1的小概率事件的发生代替了反证法中的矛盾;其二是假设检验中接受原假设的结论相当于反证法没有找到矛盾.(设计者:杨雪峰田宗臣)第三课时教学目标知识与技能理解独立性检验的基本思想,会根据K2的观测值的大小判断两个分类变量有关的可信度,培养学生的自主探究的学习能力,并能应用数学知识解决实际问题.过程与方法通过主动探究、自主合作、相互交流,从具体实例中归纳出进行独立性检验的基本步骤,使学生充分体会知识的发现过程,并渗透统计的基本思想和方法.情感、态度与价值观使学生体会数学的理性与严谨,了解数学来源于实际,应用于实际的唯物主义思想,培养学生对新知识的科学态度,勇于探索和敢于创新的精神.重点难点教学重点:利用独立性检验的基本思想解决实际问题以及处理步骤;教学难点:对独立性检验思想的理解.教学过程引入新课提出问题:在某医院,因为患心脏病而住院的665名男性病人中,有214人秃顶;而另外772名不是因为患心脏病而住院的男性病人中有175名秃顶.(1)利用图形判断秃顶与患心脏病是否有关系;(2)能否在犯错误的概率不超过0.01的前提下认为秃顶与患心脏病有关系?学生活动:小组合作完成.活动结果:根据题目所给的数据画出列联表:相应的等高条形图如图所示:。

高二数学 (人教a版)选修2-3教案:3.2独立性检验的基本思想及其应用第2课时

高二数学     (人教a版)选修2-3教案:3.2独立性检验的基本思想及其应用第2课时

§3.2独立性检验的基本思想及其应用(2)【教学过程设计】:同步练习: (基础题)试问新措施对猪白痢的防治效果如何?解:由公式得:()230013236114187.31715015024654k ⨯⨯-⨯=≈⨯⨯⨯,由于7.317>6.635,所以我们有99%的把握认为新措施对猪白痢的防治是有效的。

2、调查某医院某段时间内婴儿出生的时间与性别的关系,得到下面的数据表,试问能以多解:由公式得: 3.689 3.84155343257k =≈<⨯⨯⨯,所以没有充分的证据显示婴儿的性别与出生时间有关。

3、为了解决初二平面几何入门难的问题,某校在初中一年级代数教学中加强概念和推理教学,并设有对照班,下列是初中二年级平面几何期中测验成绩统计表的一部分,试分析研究解:由公式得:()21003238181216.23410.82850504456k ⨯⨯-⨯=≈>⨯⨯⨯,所以有99.9 %的把握认为在初中一年级代数教学中加强概念和推理教学,与初中二年级平面几何期中测验成绩有关。

解:由公式得:()21003616840 1.458 3.84144562476k ⨯⨯-⨯=≈<⨯⨯⨯,所以这两种教学方法对学生成绩的效果是相互独立的。

5、为了确定居民的头发颜色与居地的依赖关系,分别在两个地区A 、B 调查了两组人群,其结果如下表:由调查得到的结果,能否证实居民的发色与他们的居地有关?解:由公式得:()2100243863210.019 6.63544567030k ⨯⨯-⨯=≈>⨯⨯⨯,所以有99 %的把握认为居民的发色与他们的居地有关。

6、研究某特殊药物有无副作用(比如恶心),给50个患者服用此药,给另外50个患者服用安慰剂,记录每类样本中出现恶心的数目如下表,试问此药有无恶心副作用?解:由公式得:7.86 6.63550501981k =≈>⨯⨯⨯,所以有99 %的把握认为此药有恶心副作用。

人教版高中数学选修2-3第三章统计案例3.2独立性检验的基本思想及其初步应用教案(2)

人教版高中数学选修2-3第三章统计案例3.2独立性检验的基本思想及其初步应用教案(2)

回归分析与独立性检验教材分析(一)地位与作用:本节课是一节高三文科复习课,复习内容为新课标人教版高中数学课本选修1-2第一章《统计案例》p1-19页的内容,是在《必修3》概率统计的基础上,通过研究一些典型案例进一步介绍回归分析、独立性检验的基本思想、方法及初步应用。

(二)学情分析:1、学生已经初步掌握概率统计的相关知识;2、学生已经具备了一定的抽象思维能力和演绎推理能力;3、学生整体基础比较薄弱,但求学意识浓厚,高考压力大。

目标分析通过对典型案例的探究,了解回归与独立性检验的基本思想、方法及其初步应用。

(一)教学目标:1、了解回归的基本思想、方法及其简单应用。

2、了解独立性检验(只要求列联表)的基本思想、方法及其简单应用。

(二)重点难点:重点是了解回归分析的方法步骤,独立性检验的基本思想及实施步骤;难点是独立性检验的基本思想及K2的含义。

(三)情感态度与价值观:教材案例典型,方案设计、数据的处理与分析、结论的形成主要通过学生的自主研究来完成,强化了学生的相互协作、合作交流的能力。

知识体系构建本节内容重在线性相关和列联表,最终体现在应用。

教法分析、学法分析(一)教法分析:基于本节课的内容特点和高三学生的年龄特征,在本节课中我采用启发式教学法和合作探究法,突出学生的主体地位,培养学生的自主意识和合作意识。

1、从学生熟悉的实际问题引入课堂,创设情境,引导学生温故知新。

尤其注重以典型案例引领学生探索、发现、掌握方法。

2、教师介绍高考要求和最新动态,学生相互补充复习要点,以起到明确目标、互动交流的作用。

3、合理安排例题讲解与习题巩固,以达到精讲多练、以练为主的目的。

4、合理采用多媒体手段,扩容增效,强化教学效果。

(二)学法分析:学习过程始终贯穿自主学习,通过分组协作,分工配合,协同完成学习。

教学过程分析一、考纲解读1、会作两个变量的散点图,判断两变量之间是否具有相关关系;2、了解最小二乘法的思想,能根据给出的线性回归方程系数公式建立线性回归方程;3、了解常见的统计方法,并能应用这些方法解决一些常见问题:①了解独立性检验(只要求列联表)的基本思想、方法及其简单应用;②了解回归的基本思想、方法及其简单应用.③了解假设检验的基本思想、方法及其简单应用.二、高考预测近几年全国高考个别省市对本部分内容考查有加强趋势,大部分地区以容易题为主。

人教版高中数学选修2-3 教学案:3.2 独立性检验的基本思想及其初步应用

人教版高中数学选修2-3 教学案:3.2 独立性检验的基本思想及其初步应用

独立性检验的基本思想及其初步应用预习课本P91~96,思考并完成以下问题1.分类变量与列联表分别是如何定义的?2.独立性检验的基本思想是怎样的?3.独立性检验的常用方法有哪些?[新知初探]1.与列联表相关的概念(1)分类变量:变量的不同“值”表示个体所属的不同类型,像这样的变量称为分类变量.(2)列联表:①列出的两个分类变量的频数表,称为列联表.②一般地,假设有两个分类变量X和Y,它们的取值分别为{x1,x2}和{y1,y2},其样本频数列联表(称为2×2列联表)为:在2×2列联表中,如果两个分类变量没有关系,则应满足ad-bc≈0, 因此|ad-bc|越小,关系越弱;|ad-bc|越大,关系越强.2.等高条形图等高条形图与表格相比,图形更能直观地反映出两个分类变量间是否相互影响,常用等高条形图展示列表数据的频率特征.3.独立性检验的基本思想(1)定义:利用随机变量K2来判断“两个分类变量有关系”的方法称为独立性检验.(2)公式:K2=n ad-bc2a+b c+d a+c b+d,其中n=a+b+c+d为样本容量.[小试身手]1.判断下列命题是否正确.(正确的打“√”,错误的打“×”)(1)分类变量中的变量与函数中的变量是同一概念.()(2)列联表频率分析法、等高条形图可初步分析两分类变量是否有关系,而独立性检验中K2取值则可通过统计表从数据上说明两分类变量的相关性的大小.()(3)独立性检验的方法就是反证法.()答案:(1)×(2)√(3)×2.与表格相比,能更直观地反映出相关数据总体状况的是()A.列联表B.散点图C.残差图D.等高条形图答案:D3.如果有99%的把握认为“X与Y有关系”,那么具体算出的数据满足()附表:A.k>6.635 B.k>5.024C.k>7.879 D.k>3.841答案:A4.下面是一个2×2列联表:则表中a,b的值分别为________.答案:52, 54[典例]液作尿棕色素定性检查,结果如下:铅中毒病人与尿棕色素为阳性是否有关系?[解]等高条形图如图所示:其中两个浅色条的高分别代表铅中毒病人和对照组样本中尿棕色素为阳性的频率.由图可以直观地看出铅中毒病人与对照组相比,尿棕色素为阳性的频率差异明显,因此铅中毒病人与尿棕色素为阳性有关系.,在等高条形图中,可以估计满足条件X=x1的个体中具有Y=y1的个体所占的比例aa+b.两个比例的值相差也可以估计满足条件X=x2的个体中具有Y=y1的个体所占的比例cc+d越大,X与Y有关系成立的可能性就越大.[活学活用]某学校对高三学生作了一项调查发现:在平时的模拟考试中,性格内向的学生426人中有332人在考前心情紧张,性格外向的学生594人中有213人在考前心情紧张,作出等高条形图,利用图形判断考前心情紧张与性格类别是否有关系.解:作列联表如下:相应的等高条形图如图所示:图中阴影部分表示考前心情紧张与考前心情不紧张中性格内向的比例,从图中可以看出考前紧张的样本中性格内向占的比例比考前心情不紧张样本中性格内向占的比例高,可以认为考前紧张与性格类型有关.两个变量的独立性检验[典例]为了探究学生选报文、理科是否与对外语的兴趣有关,某同学调查了361名高二在校学生,调查结果如下:理科对外语有兴趣的有138人,无兴趣的有98人,文科对外语有兴趣的有73人,无兴趣的有52人.能否在犯错误的概率不超过0.1的前提下,认为“学生选报文、理科与对外语的兴趣有关”?[解]根据题目所给的数据得到如下列联表:理科文科总计有兴趣13873211无兴趣9852150总计236125361根据列联表中数据由公式计算得随机变量K2的观测值k=361××52-73×2211×150×236×125≈1.871×10-4.因为1.871×10-4<2.706,所以在犯错误的概率不超过0.1的前提下,不能认为“学生选报文、理科与对外语的兴趣有关”.独立性检验的步骤(1)确定分类变量,获取样本频数,得到列联表.(2)根据实际问题的需要确定容许推断“两个分类变量有关系”犯错误概率的上界α,然后查表确定临界值k0.(3)利用公式K2=n ad-bc2a+b c+d a+c b+d计算随机变量K2的观测值k0.(4)作出判断.如果k≥k0,就推断“X与Y有关系”,这种推断犯错误的概率不超过α,否则就认为在犯错误的概率不超过α的前提下不能推断“X与Y的关系”,或者在样本数据中没有发现足够证据支持结论“X与Y有关系”.[活学活用]在对人们的休闲方式的一次调查中,共调查了124人,其中女性70人,男性54人.女性中有43人主要的休闲方式是看电视,另外27人主要的休闲方式是运动;男性中有21人主要的休闲方式是看电视,另外33人主要的休闲方式是运动.(1)根据以上数据建立一个2×2的列联表;并估计,以运动为主的休闲方式的人的比例;(2)能否在犯错误的概率不超过0.025的前提下,认为性别与休闲方式有关系?附表:P(K2≥k0)0.500.400.250.150.100.050.0250.0100.0050.001k00.4550.7081.3232.0722.7063.8415.0246.6357.87910.8 28K2=n() ad-bc2()a+b()c+d()a+c()b+d.解:(1)由所给的数据得到列联表休闲方式性别看电视运动总计女432770男213354总计6460124 所以以运动为主要的休闲方式的人的比例为15∶31.(2)根据列联表中的数据计算得随机变量K2的观测值,k=124××33-27×270×54×64×60≈6.201,因为k>5.024,所以在犯错误的概率不超过0.025的前提下认为休闲方式与性别有关.独立性检验的综合应用[典例]某中学将100名高一新生分成水平相同的甲、乙两个“平行班”,每班50人.陈老师采用A,B两种不同的教学方式分别在甲、乙两个班级进行教改实验.为了解教学效果,期末考试后,陈老师分别从两个班级中各随机抽取20名学生的成绩进行统计,作出茎叶图如图.记成绩不低于90分者为“成绩优秀”.(1)在乙班样本的20个个体中,从不低于86分的成绩中随机抽取2个,求抽出的两个均“成绩优秀”的概率;(2)由以上统计数据作出列联表,并判断能否在犯错误的概率不超过0.1的前提下认为:“成绩优秀”与教学方式有关.[解](1)由题意知本题是一个等可能事件的概率,试验发生包含的事件是从不低于86分的成绩中随机抽取两个包含的基本事件是:(86,93), (86,96), (86,97), (86,99), (86,99), (93,96),(93,97), (93,99), (93,99), (96,97), (96,99), (96,99),(97,99),(97,99),(99,99),共有15种结果,符合条件的事件数(93,96),(93,97),(93,99),(93,99),(96,97),(96,99),(96,99),(97,99),(97,99),(99,99),共有10种结果,根据等可能事件的概率得到P=1015=2 3.(2)由已知数据得甲班乙班总计成绩优秀15 6成绩不优秀191534总计202040 根据列联表中的数据,计算得随机变量K2的观测值k=-26×34×20×20≈3.137,由于3.137>2.706,所以在犯错误的概率不超过0.1的前提下认为:“成绩优秀”与教学方式有关.(1)独立性检验问题是常与统计、概率相结合,解题时一定要认真审题,找出各数据的联系.(2)解决独立性检验的应用问题,一定要按照独立性检验的步骤得出结论.[活学活用]某市教育局邀请教育专家深入该市多所中小学,开展听课、访谈及随堂检测等活动,他们把收集到的180节课分为三类课堂教学模式,教师主讲的为A 模式,少数学生参与的为B 模式,多数学生参与的为C 模式,A ,B ,C 三类课的节数比例为3∶2∶1.(1)为便于研究分析,教育专家将A 模式称为传统课堂模式,B ,C 统称为新课堂模式,根据随堂检测结果,把课堂教学效率分为高效和非高效,根据检测结果统计得到如下2×2列联表(单位:节)请根据统计数据回答:有没有99%的把握认为课堂教学效率与教学模式有关?并说明理由.(2)教育专家采用分层抽样的方法从收集到的180节课中选出12节课作为样本进行研究,并从样本中的B 模式和C 模式课堂中随机抽取2节课,求至少有一节课为C 模式课堂的概率.参考临界值有:参考公式:K 2=n ad -bc 2a +bc +d a +cb +d,其中n =a +b +c +d .解:(1)由列联表中的统计数据计算随机变量K 2的观测值为: ∵k =180××50-40×2100×80×90×90=9>6.635,由临界值表P (K 2≥6.635)≈0.010,∴有99%的把握认为课堂效率与教学模式有关.(2)样本中的B 模式课堂和C 模式课堂分别是4节和2节.从中任取两节有C 26=15种取法,其中至少有一节课为C 模式课堂取法有C 26-C 24=9种,∴至少有一节课为C 模式课堂的概率为915=35.层级一 学业水平达标1.以下关于独立性检验的说法中, 错误的是( ) A .独立性检验依赖于小概率原理 B .独立性检验得到的结论一定准确C .样本不同,独立性检验的结论可能有差异D .独立性检验不是判断两事物是否相关的唯一方法解析:选B 根据独立性检验的原理可知得到的结论是错误的情况是小概率事件,但并不一定是准确的.2.观察下列各图,其中两个分类变量之间关系最强的是( )解析:选D 在四幅图中,D 图中两个阴影条的高相差最明显,说明两个分类变量之间关系最强,故选D .3.在列联表中,下列哪两个比值相差越大,两个分类变量有关系的可能性就越大( ) A .a a +b 与d c +d B .c a +b 与a c +dC .a a +b 与c c +dD .a a +b 与c b +c解析:选C 由等高条形图可知a a +b 与cc +d的值相差越大,|ad -bc |就越大,相关性就越强.4.对于分类变量X 与Y 的随机变量K 2的观测值k ,下列说法正确的是( ) A .k 越大,“X 与Y 有关系”的可信程度越小 B .k 越小,“X 与Y 有关系”的可信程度越小 C .k 越接近于0,“X 与Y 没有关系”的可信程度越小 D .k 越大,“X 与Y 没有关系”的可信程度越大解析:选B K 2的观测值k 越大,“X 与Y 有关系”的可信程度越大.因此,A 、C 、D 都不正确.5.考察棉花种子经过处理跟生病之间的关系得到下表数据:A.种子是否经过处理跟是否生病有关B.种子是否经过处理跟是否生病无关C.种子是否经过处理决定是否生病D.以上都是错误的解析:选B由K2=407××213-61×293×314×133×274≈0.164<2.706,即没有把握认为是否经过处理跟是否生病有关.6.在一项打鼾与患心脏病的调查中,共调查了1 671人,经过计算K2的观测值k=27.63,根据这一数据分析,我们有理由认为打鼾与患心脏病是________的.(填“有关”或“无关”)解析:∵K2的观测值k=27.63,∴k>10.828,∴在犯错误的概率不超过0.001的前提下认为打鼾与患心脏病是有关的.答案:有关7.如果根据性别与是否爱好运动的列联表得到K2≈3.852>3.841,则判断性别与是否爱好运动有关,那么这种判断犯错的可能性不超过________.解析:∵P(K2≥3.841)≈0.05.∴判断性别与是否爱好运动有关,出错的可能性不超过5%.答案:5%8.统计推断,当________时,在犯错误的概率不超过0.05的前提下认为事件A与B 有关;当________时,认为没有充分的证据显示事件A与B是有关的.解析:当k>3.841时,就有在犯错误的概率不超过0.05的前提下认为事件A与B 有关,当k≤2.706时认为没有充分的证据显示事件A与B是有关的.答案:k>3.841k≤2.7069.为了调查胃病是否与生活规律有关,在某地对540名40岁以上的人进行了调查,结果是:患胃病者生活不规律的共60人,患胃病者生活规律的共20人,未患胃病者生活不规律的共260人,未患胃病者生活规律的共200人.(1)根据以上数据列出2×2列联表;(2)在犯错误的概率不超过0.01的前提下认为40岁以上的人患胃病与否和生活规律有关系吗?为什么?解:(1)由已知可列2×2列联表:(2)k =540××260-200×2220×320×80×460≈9.638.∵9.638>6.635,因此,在犯错误的概率不超过0.01的前提下认为40岁以上的人患胃病与否和生活规律有关.10.为了解某班学生喜爱打篮球是否与性别有关,对本班50人进行了问卷调查得到了如下的列联表:已知在全部50人中随机抽取1人抽到爱打篮球的学生的概率为35.(1)请将上面的列联表补充完整;(2)是否有99.5%的把握认为喜爱打篮球与性别有关;请说明理由. 附参考公式:K 2=n ad -bc 2a +bc +d a +cb +d,其中n =a +b +c +d .解:(1)列联表补充如下:(2)∵K 2=50××15-10×230×20×25×25≈8.333>7.879,∴有99.5%的把握认为喜爱打篮球与性别有关.层级二 应试能力达标1.在第29届北京奥运会上,中国健儿取得了51金、21银、28铜的好成绩,稳居金牌榜榜首,由此许多人认为中国进入了世界体育强国之列,也有许多人持反对意见,有网友为此进行了调查,在参加调查的2 548名男性中有1 560名持反对意见,2 452名女性中有1 200名持反对意见,在运用这些数据说明性别对判断“中国进入了世界体育强国之列”是否有关系时,用什么方法最有说服力()A.平均数与方差B.回归直线方程C.独立性检验D.概率解析:选C由于参加调查的人按性别被分成了两组,而且每一组又被分成了两种情况,判断有关与无关,符合2×2列联表的要求,故用独立性检验最有说服力.2.对于独立性检验,下列说法正确的是()A.K2>3.841时,有95%的把握说事件A与B无关B.K2>6.635时,有99%的把握说事件A与B有关C.K2≤3.841时,有95%的把握说事件A与B有关D.K2>6.635时,有99%的把握说事件A与B无关解析:选B由独立性检验的知识知:K2>3.841时,有95%的把握认为“变量X与Y 有关系”;K2>6.635时,有99%的把握认为“变量X与Y有关系”.故选项B正确.3.想要检验是否喜欢参加体育活动是不是与性别有关,应该检验()A.H0:男性喜欢参加体育活动B.H0:女性不喜欢参加体育活动C.H0:喜欢参加体育活动与性别有关D.H0:喜欢参加体育活动与性别无关解析:选D独立性检验假设有反证法的意味,应假设两类变量(而非变量的属性)无关,这时的K2应该很小,如果K2很大,则可以否定假设,如果K2很小,则不能够肯定或者否定假设.4.春节期间,“厉行节约,反对浪费”之风悄然吹开,某市通过随机询问100名性别不同的居民是否能做到“光盘”,得到如下的列联表:由此表得到的正确结论是()A.在犯错误的概率不超过0.01的前提下,认为“该市居民能否做到‘光盘’与性别有关”B.在犯错误的概率不超过0.01的前提下,认为“该市居民能否做到‘光盘’与性别无关”C.在犯错误的概率不超过0.1的前提下,认为“该市居民能否做到‘光盘’与性别有关”D.在犯错误的概率不超过0.1的前提下,认为“该市居民能否做到‘光盘’与性别无关”解析:选C由2×2列联表得到a=45,b=10,c=30,d=15.则a+b=55,c+d=45,a+c=75,b+d=25,ad=675,bc=300,n=100.代入K2=n ad-bc2a+b c+d a+c b+d,得K2的观测值k=100×-255×45×75×25≈3.030.因为2.706<3.030<3.841.所以在犯错误的概率不超过0.1的前提下认为“该市居民能否做到‘光盘’与性别有关”.5.若两个分类变量X与Y的列联表为:则“X与Y之间有关系”这个结论出错的可能性为________.解析:由题意可得K2的观测值k=+15+40+××16-40×2+×+×+×+≈7.227,∵P(K2≥6.635)≈1%, 所以“x与y之间有关系”出错的可能性为1%.答案:1%6.对196个接受心脏搭桥手术的病人和196个接受血管清障手术的病人进行了3年的跟踪研究,调查他们是否又发作过心脏病,调查结果如下表所示:差别的结论________(填“能”或“不能”).解析:根据列联表中的数据,可以求得K2的观测值k=392××167-29×2 68×324×196×196≈1.779.K2<2.072的概率为0.85.作出这两种手术对病人又发作心脏病的影响有差别的结论.答案:1.779不能7.甲、乙两机床加工同一种零件,抽检得到它们加工后的零件尺寸x(单位:cm)及个数y,如下表:由表中数据得y关于x的线性回归方程为y=-91+100x(1.01≤x≤1.05),其中合格零件尺寸为1.03±0.01(cm).完成下面列联表,并判断是否有99%的把握认为加工零件的质量与甲、乙有关?解:x=1.03,y=a+495,由y^=-91+100x知,a+495=-91+100×1.03,所以a=11,由于合格零件尺寸为1.03±0.01 cm,故甲、乙加工的合格与不合格零件的数据表为:所以K2=n ad-bca+b c+d a+c b+d=60××18-6×230×30×36×24=10,因K2=10>6.635,故有99%的把握认为加工零件的质量与甲、乙有关.8.某大学餐饮中心为了解新生的饮食习惯,在全校一年级学生中进行了抽样调查,调查结果如下表所示:(1)习惯方面有差异”;(2)已知在被调查的北方学生中有5名数学系的学生,其中2名喜欢甜品.现在从这5名学生中随机抽取3人,求至多有1人喜欢甜品的概率.解:(1)将2×2列联表中的数据代入公式计算,得 K 2=100××10-20×270×30×80×20=10021≈4.762. 由于4.762>3.841,所以有95%的把握认为“南方学生和北方学生在选用甜品的饮食习惯方面有差异”.(2)从5名数学系学生中任取3人的一切可能结果所组成的基本事件空间Ω={(a 1,a 2,b 1),(a 1,a 2,b 2),(a 1,a 2,b 3),(a 1,b 1,b 2),(a 1,b 1,b 3),(a 1,b 2,b 3),(a 2,b 1,b 2),(a 2,b 1,b 3),(a 2,b 2,b 3),(b 1,b 2,b 3)}.(其中a i 表示喜欢甜品的学生,i =1,2.b j 表示不喜欢甜品的学生,j =1,2,3)Ω由10个基本事件组成,且这些基本事件的出现是等可能的.用A 表示“3人中至多有1人喜欢甜品”这一事件,则A ={(a 1,b 1,b 2),(a 1,b 1,b 3),(a 1,b 2,b 3),(a 2,b 1,b 2),(a 2,b 1,b 3),(a 2,b 2,b 3),(b 1,b 2,b 3)}.事件A 是由7个基本事件组成,因而P (A )=710.(时间120分钟 满分150分)一、选择题(本大题共12小题,每小题5分,共60分.在每小题给出的四个选项中,只有一项是符合题目要求的)1.对有线性相关关系的两个变量建立的回归直线方程y ^=a ^+b ^x 中,回归系数b ^( ) A .可以小于0 B .大于0 C .能等于0D .只能小于0解析:选A ∵b ^=0时,则r =0,这时不具有线性相关关系,但b ^可以大于0也可以小于0.2.每一吨铸铁成本y (元)与铸件废品率x %建立的回归方程y ^=56+8x ,下列说法正确的是( )A .废品率每增加1%,成本每吨增加64元B .废品率每增加1%,成本每吨增加8%C .废品率每增加1%,成本每吨增加8元D .如果废品率增加1%,则每吨成本为56元解析:选C 根据回归方程知y 是关于x 的单调增函数,并且由系数知x 每增加一个单位,y 平均增加8个单位.3.下表显示出样本中变量y 随变量x 变化的一组数据,由此判断它最可能是( )A .线性函数模型B .二次函数模型C .指数函数模型D .对数函数模型解析:选A 画出散点图(图略)可以得到这些样本点在某一条直线上或该直线附近,故最可能是线性函数模型.4.试验测得四组(x ,y )的值为(1,2),(2,3),(3,4),(4,5),则y 与x 之间的回归直线方程为( )A .y ^=x +1B . y ^=x +2 C .y ^=2x +1 D .y ^=x -1解析:选A 由题意发现,(x ,y )的四组值均满足y ^=x +1,故y ^=x +1为回归直线方程.5.下列关于等高条形图说法正确的是( ) A .等高条形图表示高度相对的条形图 B .等高条形图表示的是分类变量的频数 C .等高条形图表示的是分类变量的百分比 D .等高条形图表示的是分类变量的实际高度 解析:选C 由等高条形图的特点及性质进行判断.6.根据一组样本数据(x 1,y 1),(x 2,y 2),…,(x n ,y n )的散点图分析存在线性相关关系,求得其回归方程y ^=0.85x -85.7,则在样本点(165,57)处的残差为( )A .54.55B .2.45C .3.45D .111.55解析:选B 把x =165代入y ^=0.85x -85.7,得y =0.85×165-85.7=54.55,由57-54.55=2.45,故选B .7.有甲、乙两个班级进行数学考试,按照大于等于85分为优秀,85分以下为非优秀统计成绩,得到如下所示的列联表:已知在全部105人中随机抽取1人,成绩优秀的概率为27,则下列说法正确的是( )A .列联表中c 的值为30,b 的值为35B .列联表中c 的值为15,b 的值为50C .根据列联表中的数据,若按95%的可靠性要求,能认为“成绩与班级有关系”D .根据列联表中的数据,若按95%的可靠性要求,不能认为“成绩与班级有关系” 解析:选C 由题意知,成绩优秀的学生数是30,成绩非优秀的学生数是75,所以c =20,b =45,选项A 、B 错误.根据列联表中的数据,得到K 2=105××30-20×255×50×30×75≈6.109>3.841,因此有95%的把握认为“成绩与班级有关系”,选项C 正确.8.某考察团对全国10大城市进行职工人均工资水平x (千元)与居民人均消费水平y (千元)统计调查,y 与x 具有相关关系,回归方程为y ^=0.66x +1.562,若某城市居民人均消费水平为7.675千元,估计该城市人均消费额占人均工资收入的百分比约为( )A .83%B .72%C .67%D .66%解析:选A 将y =7.675代入回归方程,可计算得x ≈9.262,所以该城市人均消费额占人均工资收入的百分比约为7.675÷9.262≈0.83≈83%,即约为83%.9.为了研究男子的年龄与吸烟的关系,抽查了100个男子,按年龄超过和不超过40岁,吸烟量每天多于和不多于20支进行分组,如下表:则在犯错误的概率不超过__________的前提下认为吸烟量与年龄有关( ) A .0.001 B .0.01 C .0.05 D .没有理由解析:选A K 2=100××25-10×265×35×60×40≈22.16>10.828,所以我们在犯错误的概率不超过0.001的前提下认为吸烟量与年龄有关.10.为了考察两个变量x 和y 之间的线性相关性,甲、乙两个同学各自独立做了10次和15次试验,并且利用线性回归方法,求得回归直线为l1和l2,已知在两人的试验中发现对变量x的观测数据的平均值恰好相等,都为s,对变量y的观测数据的平均值也恰好相等,都为t,那么下列说法正确的是()A.直线l1和直线l2有交点(s,t)B.直线l1和直线l2相交,但交点未必是点(s,t)C.直线l1和直线l2由于斜率相等,所以必定平行D.直线l1和直线l2必定重合解析:选A l1与l2都过样本中心(x,y).11.假设有两个分类变量X和Y,它们的可能取值分别为{x1,x2}和{y1,y2},其2×2列联表如下:() A.a=9,b=8,c=7,d=6B.a=9,b=7,c=6,d=8C.a=8,b=6,c=9,d=7D.a=6,b=7,c=8,d=9解析:选B对于同一样本|ad-bc|越小,说明X与Y之间的关系越弱,|ad-bc|越大,故检验知选B.12.两个分类变量X和Y, 值域分别为{x1,x2}和{y1,y2}, 其样本频数分别是a=10, b =21, c+d=35.若X与Y有关系的可信程度不小于97.5%, 则c等于() A.3 B.4C.5 D.6解析:选A列2×2列联表如下:故K2的观测值k=66×-c-21c]31×35×+c-c≥5.024.把选项A, B, C, D代入验证可知选A.二、填空题(本大题共4小题,每小题5分,共20分.请把正确答案填在题中的横线上)13.已知某车间加工零件的个数x 与所花费时间y (h)之间的线性回归方程为y ^=0.01x +0.5,则加工600个零件大约需要________h .解析:当x =600时,y ^=0.01×600+0.5=6.5. 答案:6.514.若一组观测值(x 1,y 1),(x 2,y 2),…,(x n ,y n )之间满足y i =bx i +a +e i (i =1,2,…,n ),若e i 恒为0,则R 2为________.解析:e i 恒为0,说明随机误差总为0,于是y i =y ^,故R 2=1. 答案:115.下列是关于出生男婴与女婴调查的列联表那么A =______,B =______,C ______,D =________,E =________. 解析:∵45+E =98,∴E =53,∵E +35=C ,∴C =88,∵98+D =180,∴D =82, ∵A +35=D ,∴A =47,∵45+A =B ,∴B =92. 答案:47 92 88 82 5316.已知x ,y 之间的一组数据如表,对于表中数据,甲、乙两同学给出的拟合直线分别为l 1:y =13x +1与l 2:y =12x +12,利用最小二乘法判断拟合程度更好的直线是________.解析:用y =13x +1作为拟合直线时,所得y 的实际值与y 的估计值的差的平方和为:S 1=⎝⎛⎭⎫1-432+(2-2)2+(3-3)2+⎝⎛⎭⎫4-1032+⎝⎛⎭⎫5-1132=73.用y =12x +12作为拟合直线时,所得y 的实际值与y 的估计值的差的平方和为:S 2=(1-1)2+(2-2)2+⎝⎛⎭⎫3-722+(4-4)2+⎝⎛⎭⎫5-922=12.因为S 2<S 1,故用直线l 2:y =12x +12,拟合程度更好.答案:y =12x +12三、解答题(本大题共6小题,共70分,解答时写出必要的文字说明、证明过程或演算步骤)17.(本小题满分10分)对某校小学生进行心理障碍测试得如下列联表:(其中焦虑、说谎、懒惰都是心理障碍)试说明在这三种心理障碍中哪一种与性别关系最大?解:对于上述三种心理障碍分别构造三个随机变量K 21,K 22,K 23,由表中数据可得K 21=110××60-25×230×80×25×85≈0.863,K 22=110××70-20×230×80×20×90≈6.366,K 23=110××30-15×230×80×65×45≈1.410.因为K 22的值最大,所以说谎与性别关系最大.18.(本小题满分12分)有人统计一个省的6个城市某一年的人均国内生产总值(人均GDP)x 和这一年各城市患白血病的儿童数量y ,其数据如下表所示:(1)画出散点图,并判断是否线性相关; (2)求y 与x 之间的回归方程. 解:(1)作散点图(如下图所示).由散点图可知y 与x 具有线性相关关系.(2)将数据代入公式,可得b ^≈23.253,a ^≈102.151.故y 与x 之间的线性回归方程是y ^=23.253x +102.151.19.(本小题满分12分)某校在两个班进行教学方式对比试验,两个月后进行了一次检测,试验班与对照班成绩统计如下表所示(单位:人):(1)求m ,n ;(2)能否在犯错误的概率不超过0.005的情况下认为教学方式与成绩有关系? 解:(1)m =45-15=30,n =50+50=100. (2)由表中的数据,得K 2的观测值为 k =100××30-15×250×50×55×45≈9.091.因为9.091>7.879,所以能在犯错误的概率不超过0.005的前提下认为教学方式与成绩有关系.20.(本小题满分12分)某工厂用甲、乙两种不同工艺生产一大批同一种零件,零件尺寸均在[21.7,22.3](单位:cm)之间,把零件尺寸在[21.9,22.1)的记为一等品,尺寸在[21.8,21.9)∪[22.1,22.2)的记为二等品,尺寸在[21.7,21.8)∪[22.2,22.3]的记为三等品,现从甲、乙工艺生产的零件中各随机抽取100件产品,所得零件尺寸的频率分布直方图如图所示:(1)根据上述数据完成下列2×2列联表,根据此数据你认为选择不同的工艺与生产出一等品是否有关?附:K2=n ad-bc2a+b c+d a+c b+d(2)以上述各种产品的频率作为各种产品发生的概率,若一等品、二等品、三等品的单件利润分别为30元、20元、15元,你认为以后该工厂应该选择哪种工艺生产该种零件?请说明理由.解:(1)2×2列联表如下K2=200××40-60×2110×90×100×100≈2.02<2.706,所以没有理由认为选择不同的工艺与生产出一等品有关.(2)由题知运用甲工艺生产单件产品的利润X的分布列为X的数学期望为E(X)=30×0.5+20×0.3+15×0.2=24,X的方差为D(X)=(30-24)2×0.5+(20-24)2×0.3+(15-24)2×0.2=39.乙工艺生产单件产品的利润Y的分布列为Y的数学期望为E(Y)=30×0.6+20×0.1+15×0.3=24.5,Y的方差为D(Y)=(30-24.5)2×0.6+(20-24.5)2×0.1+(15-24.5)2×0.3=47.25.由上述结果可以看出D(X)<D(Y),即甲工艺波动小,虽然E(X)<E(Y),但相差不大,所以以后选择甲工艺.21.(本小题满分12分)为调查某地区老年人是否需要志愿者提供帮助,用简单随机抽样的方法从该地区调查了500位老年人,结果如下:附:K2的观测值k=n ad-bc2a+b c+d a+c b+d.(1)估计该地区老年人中,需要志愿者提供帮助的老年人的比例;(2)在犯错误的概率不超过0.01的前提下是否可认为该地区的老年人是否需要志愿者提供帮助与性别有关?(3)根据(2)的结论,能否提出更好的调查方法来估计该地区的老年人中,需要志愿者提供帮助的老年人的比例?请说明理由.解:(1)调查的500位老人中有70位需要志愿者提供帮助,因此该地区老年人中,需要帮助的老年人的比例的估算值为70500=14%.(2)随机变量K2的观测值k=500××270-30×2200×300×70×430≈9.967.由于9.967>6.635,因此,在犯错误的概率不超过0.01的前提下认为该地区的老年人是否需要志愿者提供帮助与性别有关.(3)由(2)的结论知,该地区的老年人是否需要帮助与性别有关,并且从样本数据中能看出该地区男性老年人与女性老年人中需要帮助的比例有明显差异,因此在调查时,先确定该地区老年人中男、女的比例,再把老年人分成男、女两层,并且采用分层抽样方法比采用简单随机抽样的方法更好.22.(本小题满分12分)某市为了对学生的数理(数学与物理)学习能力进行分析,从10 000名学生中随机抽出100位学生的数理综合学习能力等级分数(6分制)作为样本,分数频数分布如下表:。

新课标人教A版 选修2-3 独立性检验的基本思想及其初步应用(共计3课时)

新课标人教A版 选修2-3  独立性检验的基本思想及其初步应用(共计3课时)

3.2独立性检验的基本思想及其初步应用(共计3课时)授课类型:新授课一、教学内容与教学对象分析通过典型案例,学习下列一些常用的统计方法,并能初步应用这些方法解决一些实际问题。

①通过对典型案例(如“患肺癌与吸烟有关吗”等)的探究。

了解独立性检验(只要求2×2列联表)的基本思想、方法及初步应用。

②通过对典型案例(如“人的体重与身高的关系”等)的探究,了解回归的基本思想、方法及其初步应用。

二. 学习目标1、知识与技能通过本节知识的学习,了解独立性检验的基本思想和初步应用,能对两个分类变量是否有关做出明确的判断。

明确对两个分类变量的独立性检验的基本思想具体步骤,会对具体问题作出独立性检验。

2、过程与方法在本节知识的学习中,应使学生从具体问题中认识进行独立性检验的作用及必要性,树立学好本节知识的信心,在此基础上学习三维柱形图和二维柱形图,并认识它们的基本作用和存在的不足,从而为学习下面作好铺垫,进而介绍K的平方的计算公式和K的平方的观测值R的求法,以及它们的实际意义。

从中得出判断“X与Y有关系”的一般步骤及利用独立性检验来考察两个分类变量是否有关系,并能较准确地给出这种判断的可靠程度的具体做法和可信程度的大小。

最后介绍了独立性检验思想的综合运用。

3、情感、态度与价值观通过本节知识的学习,首先让学生了解对两个分类博变量进行独立性检验的必要性和作用,并引导学生注意比较与观测值之间的联系与区别,从而引导学生去探索新知识,培养学生全面的观点和辨证地分析问题,不为假想所迷惑,寻求问题的内在联系,培养学生学习数学、应用数学的良好的数学品质。

加强与现实生活相联系,从对实际问题的分析中学会利用图形分析、解决问题及用具体的数量来衡量两个变量之间的联系,学习用图形、数据来正确描述两个变量的关系。

明确数学在现实生活中的重要作用和实际价值。

教学中,应多给学生提供自主学习、独立探究、合作交流的机会。

养成严谨的学习态度及实事求是的分析问题、解决问题的科学世界观,并会用所学到的知识来解决实际问题。

高中数学人教A版选修2-3课件:3.2独立性检验的基本思想及其初步应用

高中数学人教A版选修2-3课件:3.2独立性检验的基本思想及其初步应用
x
).
问题导学
当堂检测
一、用列联表和等高条形图分析两变量间的关系
活动与探究 问题 1:怎样从列联表判断两个分类变量有无关系? 提示:|ad-bc|越小,说明两个分类变量 x,y 之间的关系越弱;|ad-bc|越 大,说明 x,y 之间的关系越强.
x
问题 2:等高条形图对分析两个分类变量是否有关系,有何帮助? 提示:通过画等高条形图,我们可以通过观察两个变量的比例关系, 直观判断两个变量是否有关系.
问题导学
当堂检测
(1)利用列联表直接计算 分类变量之间有关系.
������ ������ 和 ,如果两者相差很大,就判断两个 ������+������ ������+������
(2)在等高条形图中展示列联表数据的频率特征,比较图中两个深 色条的高可以发现两者频率不一样而得出结论 ,这种直观判断的不足 之处在于不能给出推断“两个分类变量有关系”犯错误的概率.
问题导学
当堂检测
相应的等高条形图如图所示.
图中两个深色条的高分别表示甲在生产现场和甲不在生产现场样 本中次品数的频率.从图中可以看出,甲不在生产现场样本中次品数的 频率明显高于甲在生产现场样本中次品数的频率 .因此可以认为质量 监督员甲在不在生产现场与产品质量好坏有关系 .
问题导学
当堂检测
迁移与应用 某学校对高三学生作了一项调查发现:在平时的模拟考试中,性格 内向的学生 426 人中有 332 人在考前心情紧张,性格外向的学生 594 人 中有 213 人在考前心情紧张,作出等高条形图,利用图形判断考前心情 紧张与性格类别是否有关系. 解:作列联表如下:
2
其中 n=a+b+c+d 为样本容量.

人教版高中数学选修2-3第三章统计案例3.2独立性检验的基本思想及其初步应用教案(1)

人教版高中数学选修2-3第三章统计案例3.2独立性检验的基本思想及其初步应用教案(1)

1.2独立性检验的基本思想及其初步应用(第二课时)一.教学目标:1,理解独立性检验的基本思想; 2,理解独立性检验的实施步骤; 3,了解随机变量K 2的含义。

二.教学重点:理解独立性检验的基本思想实施步骤。

教学难点;1、理解独立性检验的基本思想及实施步骤2、了解随机变量K 2的含义。

三.知识链接独立性检验原理: 四.新课学习1. 独立性检验的概念:利用随机变量2K 来确定在多大程度上可以认为“__________”的方法,称为两个分类变量的独立性检验。

2. 独立性检验的步骤:设有两个分类变量X 与Y ,他们的取值分别为 和 其样本频数列联表(称2⨯2列联表)为:引入随机变量2K ,____________________2=K ,(其中d c b a n +++=为样本容量)推断X 与Y 有关系可按下列步骤进行: (1)假设0H : X 与Y 没有关系(2)根据实际问题的需要确定容许推断“两个分类变量有关系”犯错误概率的上界a ,然后查表1-11确定临界值o k(3)利用公式(1),计算随机变量2K 的观测值k 。

(4)如果,就判断“X 与Y 有关系”,这种判断犯错误的概率不超过a ,否则,就认为在犯错误的概率不超过a 的前提下不能推断“X 与Y 有关系”,或则在样本数据中没有发现足够证据支持结论“X 与Y 有关系”, 3. 为了使不同样本容量的数据有统一的评判标准,我们利用统计量2K 的观测值k 来判断x 与y 有关系的程度。

如果828.10>k ,就有_____的把握认为“x 与y 有关系”; 如果879.7>k ,就有_____的把握认为“x 与y 有关系”;如果_____>k ,就有99%的把握认为“x 与y 有关系”; 如果_____>k,就有97.5%的把握认为“x 与y 有关系”;如果841.3>k ,就有_____的把握认为“x 与y 有关系”; 如果706.2>k ,就有_____的把握认为“x 与y 有关系”; 如果706.2≤k,就认为没有充分证据显示“x 与y 有关系” 。

【优选整合】高中数学人教A版 选修2-3 3.2.2独立性检验的基本思想及其初步应用 教案

【优选整合】高中数学人教A版 选修2-3 3.2.2独立性检验的基本思想及其初步应用 教案

3.2独立性检验的基本思想及其初步应用(2)一、教学目标: 知识与技能:通过本节知识的学习,了解独立性检验的基本思想和初步应用,能对两个分类变量是否有关做出明确 的判断。

明确对两个分类变量的独立性检验的基本思想具体步骤,会对具体问题作出独立性检验。

过程与方法:利用学生身边熟悉的问题引入分类变量是否相关的问题;运用统计学解决问题的一般思路引导学生;让学生经历假设检验思想的形成及运用过程,领会分析、总结的方法; 情感、态度与价值:让学生探索、发现数学知识和掌握数学知识的内在规律的过程中不,不断获得成功积累愉快的体验,不断增进学习数学的兴趣,同时还通过探索这一活动培养学生善于和他人合作的精神. 二、教学重点、难点重点:理解独立性检验的基本思想及实施步骤。

难点:(1)了解独立性检验的基本思想;(2)了解随机变量2K 的含义,2K 太大认为两个分类变量是有关系的。

三、教学模式与教法、学法教学模式:本课采用“探究——发现”教学模式.教师的教法:利用多媒体辅助教学,突出活动的组织设计与方法的引导.“抓三线”,即(一)知识技能线(二)过程与方法线(三)能力线. “抓两点”,即一抓学生情感和思维的兴奋点,二抓知识的切入点. 学法:突出探究、发现与交流.四、教学过程 (一)温故知新(1)某大学在研究性别与职称(分正教授、副教授)之间是否有关系,你认为应该收集哪些数据? .(2)某高校“统计初步”课程的教师随机调查了选该课的一些学生情况,具体数据如下表:非统计专业统计专业 男 13 10 女720专业性别为了判断主修统计专业是否与性别有关系,根据表中的数据,得到χ2250(1320107) 4.84423272030⨯⨯-⨯=≈⨯⨯⨯,∵χ2 3.841≥, 所以判定主修统计专业与性别有关系,那么这种判断出错的可能性为 .(答案:5%) 附:临界值表(部分):P (χ20x ≥)0.10 0.05 0.025 0.010 0x2.7063.8415.0246.635(二)运用巩固例1.在对人们的休闲方式的一次调查中,共调查了124人,其中女性70人,男性54人。

人教A版选修2-3独立性检验的基本思想及其初步应用教学设计

人教A版选修2-3独立性检验的基本思想及其初步应用教学设计

人教A 版选修2—3第三章§3.2 独立性检验的基本思想及其初步应用教学设计【一、教学内容解析】1.教材内容分析统计是研究如何合理地收集、整理、分析数据的学科.它可以为人们制定决策提供依据.在生活中,人们常常需要收集数据,根据所获得的数据提取有价值的信息,做出合理的决策.为了体现统计学科的这一特点,在教学中需要通过案例进行教学。

本节课是人教A 版(选修)2—3第三章第二单元的内容,本单元内容是在学生们学习了初中统计知识以及《数学3》(必修)中的统计知识后的进一步的学习,并与本册课本前面提到的事件的独立性一节关系紧密,此外还涉及到与《数学2-2》(选修)中讲到的“反证法”类似的思想——独立性检验.利用独立性检验进一步分析两个分类变量之间是否有关系,是高中数学知识中体现统计思想的重要课节。

本节的主要内容就是两个分类变量是否有关系的推断,从生活实例出发,发现数学概念、方法与结论,体现数学来源于生活,数学又服务于生活.本节的教学中,重点放在了独立性检验的统计学原理上,理解独立性检验的基本思想,明确独立性检验的基本步骤。

通过对典型案例的研究,介绍了独立性检验的基本思想、方法和解决问题的一般步骤。

独立性检验的基本思想和反证法类似,它们都是假设结论不成立,反证法是在假设结论不成立基础上推出矛盾从而证得结论成立,而独立性检验是在假设结论不成立基础上推出有利于结论成立的小概率事件发生,于是认为结论在很大程度上是成立的。

因为小概率事件在一次试验中通常是不会发生的,所以有利于结论成立的小概率事件的发生为否定假设提供了有力的证据。

但在全部逻辑推理正确的情况下,反证法不会犯错误,但独立性检验会犯随机性错误.独立性检验的具体的操作步骤就是:明确问题→确定犯错误概率的上界 及2K 的临界值0k →收集数据→整理数据→制列联表→计算统计量2K 的观测值k →比较观测值k 与临界值0k 并给出结论.这是一种非常重要的推断方法,不仅有相当广泛的应用,也开启了人类认识世界的一种新的思维方式.学习独立性检验的目的是“通过典型案例介绍独立性检验的基本思想、方法及其初步应用,使学生认识统计方法在决策中的作用”.这是因为,随着现代信息技术飞速发展,信息传播速度快,人们每天都会接触到影响我们生活的统计方面信息,所以具备一些统计知识已经成为现代人应具备的一种数学素养。

「高中数学」人教A版(选修2-3)独立性检验的基本思想及初步应用

「高中数学」人教A版(选修2-3)独立性检验的基本思想及初步应用

「高中数学」人教A版(选修2-3)独立性检验的基本思想及
初步应用
我是“教评宋老师”,致力于教育教学的
交流和经验分享,也在这里给大家推荐教育类
APP,推荐书籍和分享相关资源,如果感兴趣
的朋友们,可以关注下。

前言
从今天开始不仅分享相关资源,在文章最后也会和大家分享一些“趣味数学”和“数学名家”,希望能给大家帮助,也希望能让大家喜欢,如果感兴趣,请点击上面红色“关注”,你的关注和转发是对我最大的支持。

期待你留下脚印。

具体内容(3.2独立性检验的基本思想及其初步应用)
以上是本次资源分享的全部内容,如果需要电子版,请私信回复“资源”,我会在第一时间回复并分享。

趣味数学——书生分卷
毛诗春秋周易书,九十四册共无余,毛诗一册三人读,春秋一本四人呼,周易五人读一本,要分每样几多书,就见学生多少数,请君布算莫踌躇。

《毛诗》相传是西汉毛亨、毛苌所著,此题选自明朝程大位所著的《算法统宗》一书。

答曰:《毛诗》四十册,《春秋》三十册,《周易》二十四册,学生一百二十名。

这道题可以用方程组解,也可以用算术方法解。

你会解吗?请在评论区说出你的详细过程。

书籍推荐
你喜欢看哪方面的图书 (多选)
0人
0%
高中相关教辅
0人0% 文学类0人0% 科幻类0人0% 玄幻类0人0% 励志类。

高中数学(A版)选修2-3 3.2独立性检验的基本思想

高中数学(A版)选修2-3 3.2独立性检验的基本思想
观测数据a、b、c、d都不小于5的独立性检验
中。
对于上节吸烟与患肺癌的问题,计算可得:
6578 (56 4567 1932 23) 2 2 62.698 1988 4590 79 6499
2 因为: 6.635
所以:有99%以上的把握认为吸烟与患肺癌是有关
当等式两边相差很大时, 变量间就不独立。
b ab bd 如当 很大时,A 1 与 B2 就不独立。 n n n
新课讲解
? ?
那么,这些量究竟要达到什么样的程度,
才能够说明变量之间不独立呢??能否选择
一个量,用它来检验变量之间的独 的大小来检验 变量间是否独 立,称它为卡 方统计量。
的,即吸烟与患肺癌不是相互独立的。
例题分析
某地震观测站对地下水位的变化和发生地震的情 况进行了1700次观测,数据如下:
试问观测结果是否说明地下水位的变化与地震的
发生有关系??
分析: 根据列联表的数据,可得:
2 1.59 2.706
所以,没有充分的证据显示地下水位的变化与 地震的发生相关。
(3)当 2 3.841 时,有95%的把握判定变量A、B
有关联; (4)当 2 6.635 时,有99%的把握判定变量A、B 有关联。
由于抽样的随机性,由样本得到的推断有
可能正确,也有可能错误。利用 2进行独立性
检验,可以对推断的正确性的概率作出估计,
样本量n越大,估计越准确。此法一般适用于
2
A、B有关联; (2)当 2 2.706 时,有90%的把握判定变量A、B
有关联; (3)当 2 3.841 时,有95%的把握判定变量A、B
有关联;

高中数学人教A版选修2-3课件:3-2 独立性检验的基本思想及其初步应用

高中数学人教A版选修2-3课件:3-2 独立性检验的基本思想及其初步应用
2
=
89× (24×26-31×8) 55×34×32×57
2
≈3.689>2.706,因此,
可以在犯错误的概率不超过 0.1 的前提下认为“在天气恶劣的飞行 航程中,男乘客比女乘客更容易晕机”.
栏目 导引
第一章 典例透析三角函数
题型一 题型二 题型三 题型四
反思解独立性检验问题的基本步骤: (1)认真读题,根据相关数据,得出2×2列联表; (2)根据2×2列联表中的数据,计算K2的观测值k; (3)比较观测值k与临界值k0; (4)给出结论.
第一章 典例透析三角函数
题型一 题型二 题型三 题型四
解:由列联表中的数据求得 K2 的观测值为 k=
189× (54×63-40×32)2 94×95×86×103
≈10.759.
试画出列联表的等高条形图,分析铅中毒病人与对照组的尿棕色素 阳性数有无差别,并判断铅中毒病人与尿棕色素为阳性是否有关系?
栏目 导引
第一章 典例透析三角函数
题型一 题型二 题型三 题型四
解:等高条形图如图.
其中两个浅色条的高分别代表铅中毒病人和对照组样本中尿棕 色素为阳性的频率. 由图可以直观地看出铅中毒病人与对照组相比较尿棕色素为阳 性差异明显,因此铅中毒病人与尿棕色素为阳性存在相关关系.
栏目 导引
第一章 典例透析三角函数
题型一 题型二 题型三 题型四
【变式训练 2】某大型企业人力资源部为了研究企业员工工作 积极性和对待企业改革态度的关系,随机抽取了 189 名员工进行调 查,所得数据如下表所示:
积极支持企业改革 工作积极 工作一般 总计 54 32 86 不太赞成企业改革 40 63 103 总计 94 95 189

数学人教A版选修2-3课堂导学:3.2独立性检验的基本思想及其初步应用 含解析 精品

数学人教A版选修2-3课堂导学:3.2独立性检验的基本思想及其初步应用 含解析 精品

课堂导学三点剖析一、初识独立性检验的思想方法【例1】为了探究患慢性气管炎是否与吸烟有关,调查了339名50岁以上的人,调查结果试问:50岁以上的人患慢性气管炎与吸烟习惯有关吗?思路分析:最理想的解决办法是向所有50岁以上的人做调查,然后对得到的数据进行统计处理,但这花费的代价太大,实际上是行不通的.339个人相对于全体50岁以上的人,只是一个小部分.回忆一下数学3(必修)中学过的总体和样本的关系,当用样本平均数、样本标准差去估计总体相应的数字特征时,由于抽样的随机性,结果并不惟一.现在情况类似,我们用部分对全体作推断,推断可能正确,也可能错误.例如我们知道,不少中老年烟民的身体很好,没有患慢性气管炎;而又有很多从不吸烟的中老年人体质很差,患有慢性气管炎.如果抽取的339个调查对象中很多人来自上述两个群体,试想会得出什么结论吧.我们有95%(或99%)的把握说事件A 与B 有关,是指推断犯错误的可能性为5%(或1%),这也常常说成是“以95%(或99%)的概率”,其含义是一样的. 解:根据列联表中的数据,得到K 2=28356134205)1316212143(3392⨯⨯⨯⨯-⨯⨯=7.469.因为7.469>6.635,所以我们有99%的把握说:50岁以上的人患慢性气管炎与吸烟习惯有关.二、分类变量之间的相互影响即独立性检验的判断步骤【例2】在一次恶劣气候的飞行航程中调查男女乘客在机上晕机的情况如下表所示,根据此解析:这是一个2×2列联表的独立性检验问题,根据列联表中的数据,得到K 2=57323455)8312624(892⨯⨯⨯⨯-⨯⨯=3.689.因为3.689<3.841,所以我们没有理由说晕机与否跟男女性别有关,尽管这次航班中男人晕机的比例(5524)比女人晕机的比例(348)高,但我们不能认为在恶劣气候飞行中男人比女人更容易晕机.温馨提示在使用K 2作统计量作2×2列联表的独立性检验时,要求表中的4个数据大于等于5,为此,在选取样本的容量时一定要注意这一点.本例中的4个数据24,31,8,26都大于5,是满足这一要求的.三、深刻领会独立性检验的基本思想【例3】打鼾不仅影响别人休息,而且可能与患某种疾病有关.下表是一次调查所得的数据,解:根据列联表中数据,得到,K 2=1579542541379)24224135530(16332⨯⨯⨯⨯-⨯⨯=68.033.因为68.033>6.635,所以有99%的把握说,每一晚都打鼾与患心脏病有关. 温馨提示在本例中,我们所说“每一晚都打鼾与患心脏病有关”或“患慢性气管炎与吸烟有关”指的是统计上的关系,不要误以为这里是因果关系.具体到某一个每晚都打鼾的人,并不能说他患心脏病,其实从2×2列联表中也可以看出,每一晚都打鼾的人群中,患心脏病的概率也只有25430,稍微超过十分之一.至于他患不患心脏病,应该由医学检查来确定,这已经不是统计学的事了. 各个击破【类题演练1】对196个接受心脏搭桥手术的病人和196个接受血管清障手术的病人进行了试根据上述数据比较这两种手术对病人又发作心脏病的影响有没有差别. 解析:根据列联表中的数据,得到K 2=32468196196)2915716739(3922⨯⨯⨯⨯-⨯⨯=1.78.因为1.78<3.841,所以我们没有理由说“心脏搭桥手术”与“又发作过心脏病”有关,可以认为病人又发作心脏病与否与其做过何种手术无关.【变式提升1】某大型企业人力资源部为了研究企业员工工作积极性和对待企业改革态度的对于人力资源部的研究项目,根据上述数据能得出什么结论? 解析:根据列联表中的数据,得到:K 2=103869594)32406354(1892⨯⨯⨯⨯-⨯⨯=10.76.因为10.76>6.635,所以有99%的把握说:员工“工作积极”与“积极支持企业改革”是有关的,可以认为企业的全体员工对待企业改革的态度与其工作积极性是有关的. 【类题演练2】某猪场用80头猪检验某种疫苗是否有预防效果.结果是注射疫苗的44头中有12头发病,32头未发病;未注射的36头中有22头发病,14头未发病,问该疫苗是否有预防效果?你有多大把握认为药物有效?假设H 0:发病与否和注射疫苗无关,即二变量相互独立. 由K 2表达式计算出其观测值k:k=44364634)32221412(802⨯⨯⨯⨯-⨯⨯≈9.277由表1查得:P (K 2≥7.879)≈0.005即在H 0成立的情况下K 2的值大小7.879的概率非常小,近似于0.005.因此我们有99.5%的把握认为H 0不成立,即有99.5%的把握认为该疫苗是有预防效果的.【变式提升2】在500个人身上试验某种血清预防感冒的作用,把一年中的记录与另外500问该种血清能否起到预防感冒的作用?解析:∵K 2=524476500500)224248276252(10002⨯⨯⨯⨯-⨯⨯≈3.14>2.706∴我们有90%的把握认为该种血清能起到预防感冒的作用.【类题演练3】考察小麦种子经灭菌与否跟发生黑穗病的关系,经试验观察,得到数据如下试按照原试验目的作统计分析推断.解析:K 2=38476250210)5018420026(4602⨯⨯⨯⨯-⨯⨯≈4.8>3.841∴我们有95%的把握认为小麦种子灭菌与否跟发生黑穗病有关系.【变式提升3】调查者通过询问72名男女大学生在购买食品时是否看营养说明得到的数据问大学生的性别和是否看营养说明之间有没有关系?解析:K 2=28443636)1682028(722⨯⨯⨯⨯-⨯⨯≈8.4>7.879∴我们有99.5%的把握认为大学生的性别和是否看营养说明之间有关系.。

河北省安平中学高中数学人教A版选修2-3教案:3-2独立性检验的基本思想及其初步应用 精品

河北省安平中学高中数学人教A版选修2-3教案:3-2独立性检验的基本思想及其初步应用 精品

课题:《独立性检验》一、教材内容分析《独立性检验的基本思想及其初步应用》是人教A版(选修)2—3第三章第二节。

在本节课之前,学生已经学习过统计的有关知识,回归分析的基本思想及初步应用。

本节课利用独立性检验进一步分析两个分类变量之间是否有关系,是高中数学知识中体现统计思想的重要课节。

在本节课的教学中,重点是通过对典型案例的分析、讨论让学生了解独立性检验的基本思想,进一步体会运用统计方法解决实际问题的基本思想,认识统计方法在决策中的作用。

独立性检验的基本思想和反证法类似,它们都是假设结论不成立,反证法是在假设结论不成立基础上推出矛盾从而证得结论成立的方法,而独立性检验是在假设结论不成立基础上推出有利于结论成立的小概率事件发生,于是认为结论在很大程度上是成立的,因为小概率事件在一次试验中通常是不会发生的,所以有利于结论成立的小概率事件的发生为否定假设提供了有力的证据。

通过学生的自主探究、小组讨论、同学们的相互质疑、老师的讲解,从而了解了独立性检验的基本思想,明确了独立性检验操作的基本步骤。

本节课是学习《独立性检验的基本思想及其初步应用》的第一课时(教参要求约3课时)。

二、教学目标分析教学目标是教学中最先要考虑的因素,明晰教学目标,做到有的放矢,是课堂教学的第一要素。

教学目标需要在课程标准的要求下结合学情以及本节课教学内容来制定。

1.新课标对本节课的要求:学生将在必修课程学习统计的基础上,通过对典型案例的讨论,了解和使用一些常用的统计方法,进一步体会运用统计方法解决实际问题的基本思想,认识统计方法在决策中的作用。

2.学情分析:(1)学生知识结构:学生已经学习过统计、事件的相互独立性和变量回归分析的基本思想及其初步应用等知识,这为本节课的学习提供了知识基础.(2)学生能力特征:学生已经具备了一定的认知、分析、归纳能力;能够进行小组活动。

但学生运缺少深入探究问题的方法。

根据以上分析,我制定以下教学目标:(一)通过对典型案例的探究,了解独立性检验的基本思想,会对两个分类变量进行独立性检验,明确独立性检验的基本步骤,并能解决实际问题。

数学人教A版选修2-3教案:3.2独立性检验的基本思想及其初步应用第三课时 Word版含解析

数学人教A版选修2-3教案:3.2独立性检验的基本思想及其初步应用第三课时 Word版含解析

第三课时教学目标 知识与技能理解独立性检验的基本思想,会根据K 2的观测值的大小判断两个分类变量有关的可信度,培养学生的自主探究的学习能力,并能应用数学知识解决实际问题.过程与方法 通过主动探究、自主合作、相互交流,从具体实例中归纳出进行独立性检验的基本步骤,使学生充分体会知识的发现过程,并渗透统计的基本思想和方法.情感、态度与价值观使学生体会数学的理性与严谨,了解数学来源于实际,应用于实际的唯物主义思想,培养学生对新知识的科学态度,勇于探索和敢于创新的精神.重点难点教学重点:利用独立性检验的基本思想解决实际问题以及处理步骤; 教学难点:对独立性检验思想的理解.教学过程引入新课提出问题:在某医院,因为患心脏病而住院的665名男性病人中,有214人秃顶;而另外772名不是因为患心脏病而住院的男性病人中有175名秃顶.(1)利用图形判断秃顶与患心脏病是否有关系;(2)能否在犯错误的概率不超过0.01的前提下认为秃顶与患心脏病有关系? 学生活动:小组合作完成.相应的等高条形图如图所示:比较来说,秃顶的病人中患心脏病的比例大一些,可以在某种程度上认为“秃顶与患心脏病有关”.根据列联表中的数据,得到k =1 437×(214×597-175×451)2389×1 048×665×772≈16.373>6.635,因此,在犯错误的概率不超过0.01的前提下认为秃顶与患心脏病有关系.设计目的:以实际问题创建情境,引起学生的好奇,激发学习和探究知识的兴趣,从而也引起学生的无意注意,在不知不觉中进入教师设计的教学情境中,为本节课的学习做有利的准备.探究新知提出问题:上述解法中,用到了等高条形图和独立性检验两种方法来判断“秃顶与患心脏病是否有关系”,试比较两种方法的关系和各自的特点.学生活动:学生先自由发言,大胆描述.学情预测:独立性检验能精确判断可靠程度,而等高条形图的优点是直观,但只可以粗略判断两个分类变量是否有关系,一般在通过图表判断后还需要用独立性检验来确认,这主要是因为列联表中的数据来源于样本数据,它们反映出来的这种相关性的特征能够在多大程度上代表总体,则需要用独立性检验来确认.提出问题:试总结独立性检验的基本步骤. 学生活动:思考总结,然后回答.活动结果:①根据数据画出列联表;②计算随机变量K 2的观测值;③与已知数据对照下结论.设计目的:比较判断分类变量相关性方法的优缺点,并在解决问题的基础上将独立性检验的具体步骤模式化.理解新知提出问题:你所得的结论在什么范围内有效? 学生活动:学生先自由发言,教师逐步引导学生.学情预测:开始学生的回答可能不全面、不准确,但在其他学生的不断补充、纠正下,会趋于完善.活动结果:“样本只能代表相应总体”,这里的数据来自于医院的住院病人,因此题目中的结论能够很好地适用于住院的病人群体,而把这个结论推广到其他群体则可能会出现错误,除非有其他的证据表明可以进行这种推广.设计意图:让学生充分体会用样本估计总体的思想. 提出问题:两个分类变量X 和Y 的2×2列联表如下若令W =⎪⎪⎪⎪a a +b -cc +d ,试结合前面的学习,分析W 的大小与“X 与Y 有关系”的联系.学生活动:分组讨论,通过协作交流来解决问题,教师进行适当的引导.学情预测:W 越大,越有利于结论“X 与Y 有关系”,它越小,越有利于结论“X 与Y 没有关系”.提出问题:类似于通过K 2的构造判断规则,我们也可以用W 构造一个判断“X 与Y 有关系”的规则,即当W 的观测值w>w 0时,就判断“X 与Y 有关系”;否则,判断“X 与Y 没有关系”.那么,在“X 与Y 没有关系”的前提下P(W≥w 0)=0.01,且P(K 2≥k 0)=0.01,可以通过k 0来确定w 0吗?学生活动:分组讨论,通过协作交流来解决问题,教师进行适当的引导.学情预测:由计算公式可得K 2=W 2×n(a +b)(c +d)(a +c)(b +d),其中n =a +b +c +d.因此,K 2≥k 0等价于W≥k 0×(a +c)(b +d)n(a +b)(c +d),即可取w 0=k 0×(a +c)(b +d)n(a +b)(c +d). 设计目的:通过一组精心设计的问题链来引导和激发学生的参与意识、创新意识,培养探究问题的能力,提升思维的层次.在解决问题的过程中,激发学生的研究兴趣,培养学生的科学理性精神,体会交流、合作和竞争等现代意识.运用新知1为考察高中生的性别与是否喜欢数学课程之间的关系,在某城市的某校高中生中随机抽取300由表中数据计算得到K的观察值k≈4.513.在多大程度上可以认为高中生的性别与数学课程之间是否有关系?分析:根据K2的观察值k≈4.513,对照数据确定多大程度上可以认为高中生的性别与数学课程之间是否有关系.解:提下认为“高中生的性别与数学课程之间有关系”.点评:在熟练掌握了两个分类变量的独立性检验方法之后,可直接计算K2的观测值解决实际问题,而没有必要画相应的图形,但是图形的直观性也不可忽视.【变练演编】2某市为调查全市高中生学习状况是否对生理健康有影响,随机进行调查并得到如下的列联表.活动设计:学生先独立探索,允许互相交流成果.然后全班交流.学情预测:等高条形图、独立性检验等.设计意图:设置本开放性问题,意在增加问题的多样性、有趣性、探索性,不仅会加深学生对数学的理解、掌握,而且会潜移默化地学会编题、解题.课堂小结1.知识收获:独立性检验的思想方法及一般步骤;2.方法收获:独立性检验的思想方法;3.思维收获:数学来源于生活.设计意图:让学生自己小结,这是一个多维整合的过程,是一个高层次的自我认识过程.补充练习【基础练习】1试问能否在犯错误的概率不超过0.01的前提下认为新措施对防治猪白痢有效?2.在一次恶劣气候的飞行航程中,调查男女乘客在机上晕机的情况如下表所示,据此资料,在犯错误的概率不超过0.1的前提下,你是否认为在恶劣气候飞行中男性比女性更容易晕机?答案:1.提示:K 2的观测值k≈7.317>6.635,故在犯错误的概率不超过0.01的前提下认为新措施对防治猪白痢有效.2.提示:K 2的观测值k≈2.149<2.706,而P(K 2>2.706)≈0.10,故在犯错误的概率不超过0.1的前提下,我们不能认为在恶劣气候飞行中男性比女性更容易晕机.【拓展练习】3.考察黄烟经过培养液处理与否跟发生青花病的关系,调查了457株黄烟,得到下表解:根据公式得K 2的观测值k =457×(25×142-80×210)2235×222×105×352≈41.61,由于41.61>10.828,故在犯错误的概率不超过0.001的前提下,说明黄烟经过培养液处理与否跟发生青花病是有关系的.设计说明 本设计主要采用“诱思探究教学法”,其核心是“诱导思维,探索研究”,其教学思想是“教师为主导,学生为主体,训练为主线,思维为主攻”的“四为主”原则.教师不是抛售现成的结论,而是充分暴露学生的思维,展示“发现”的过程,突出“师生互动”的教学,这种设计充分体现了教师的主导作用.学生在一系列的思考、探究中逐步完成了本节的学习任务,充分实现了学生的主体性地位,在整个教学过程中,始终着眼于培养学生的思维能力,这种设计符合现代教学观和学习观的精神,体现了素质教育的要求:教与学有机结合而对立统一.良好的教学设想,必须通过教学实践来体现,教师必须善于驾驭教法,指导学法,完成教学目标,从而使学生愉快地、顺利地、认真地、科学地接受知识.备课资料独立性检验在实际生活中有广泛的应用,解决该类问题的关键是准确的运算. 例1为了研究色盲与性别的关系,调查了1 000人,调查结果如下表所示:根据上述数据,试问在犯错概率不超过0.001的前提下,色盲与性别是否是相互独立的?假设色盲与性别是相互独立的,即色盲与性别无关,依据公式得K2的观测值k=1 000×(442×6-38×514)2≈27.139.956×44×480×520由于27.139>10.828,∴在犯错概率不超过0.001的前提下,可认为色盲与性别有关,从而拒绝原假设,故在犯错概率不超过0.01的前提下,可以认为色盲与性别不是相互独立的.(设计者:杨雪峰田宗臣)。

人教版数学高二A版选修2-3教材梳理 3.2独立性检验的基本思想及其初步应用

人教版数学高二A版选修2-3教材梳理 3.2独立性检验的基本思想及其初步应用

庖丁巧解牛知识·巧学一、两个分类变量之间关系的定性分析 1.分类变量取不同的“值”表示个体所属不同类别的分量称为分类变量.这里的“变量”和值都应作为“广义”的变量和值进行理解.例如:对于性别变量,其取值为男和女两种.那么这里的变量指的是性别,同样这里的“值”指的是“男”和“女”,因此,这里所说的“变量”和值不一定取的是具体的数值.要点提示 注意此处空半格分类变量是大量存在的,例如:吸烟变量有吸烟与不吸烟两种类别,而国籍变量则有多种类别. 2.定性分析的方法 (1)频率分析通过对样本的每个分类变量的不同类别的事件发生的频率大小比较来分析分类变量之间是否有关联关系.通常通过列联表列出两个分类变量的占少数表来进行分析. (2)图形分析①三维柱形图.它可以清晰的看出各个频数的相对大小;②二维条形图.如本节引例中,可画叠在一起的二维条形图.浅色条高表示不患肺癌的人数,深色条高表示患肺癌的人数; ③频率分布条形图:为了更清晰的表示引例的特征,我们可用等高条形图表示两种情况下患肺癌的比例.方法归纳 注意此处空半格三维柱形图和二维条形图能更直观地反映出相关数据的总体状况.作三维柱形图时要注意选择恰当的视角,以使每个柱体都能被看到. 二、独立假设上表称为2×2列联表.意思是问题要考虑调查的人的两种状态:是否吸烟,是否患肺癌.每种状态又分两种情况:吸烟,不吸烟以及患肺癌、未患肺癌.表中排成两列的数据是调查得来的结果,希望根据这4个数据来检验上述两种状态是否有关.这一检验就称为2×2列联表的独立性检验.2.独立性检验:利用随机变量K 2=))()()(()(2d b c a d c b a bc ad n ++++-(其中n=a+b+c+d为样本容量)来确定在多大程度上可以认为“两个分类变量有关系”的方法称为两个分类变量的独立性检验.要点提示 注意此处空半格上述表达式就是统计中重要的K 2统计量,用它的大小可以决定是否拒绝原来的统计假设H 1,如果算出的K 2值较大,就拒绝H 1,也就是拒绝事件“X 与Y 无关”,从而就认为它们是有关的了.深化升华 注意此处空半格独立性检验的基本思想类似于反证法.要确认“两个分类变量有关系”这一结论的可信程度,首先假设该结论不成立,即假设结论“两个分类变量没有关系”成立.在该假设下构造的随机变量K 2应该很小.如果由观测数据计算得到的K 2的观测值k很大,则在一定程度上说明假设不合理.根据随机变量K 2的含义,可以通过概率P(K 2≥k)的大小来评价该假设不合理的程度有多大,从而说明这“两个分类变量没有关系”这一结论成立的可信程度有多大.三、判断结论成立的可能性的方法1.通过三维柱形图和二维条形图,可以粗略地判断两个分类变量是否有关系,但是这种判断无法精确地给出所得结论的可靠程度.(1)在三维柱形图中,主对角线上两个柱形高度的乘积ad与副对角线上的两个柱形高度的乘积bc相关越大,H 1成立的可能性就越大.(2)在二维条形图中,可以估计满足条件X=x 1的个体中具有Y=y 1的个体所占的比例ba a+,也可以估计满足条件X=x 2的个体中具有Y=y 2的个体所占的比例dc c+.两个比例的值相差越大,H 1成立的可能性就越大.2.利用独立性检验来考查两个分类变量是否有关系,并且能较精确地给出这种判断的可靠程度.具体做法是根据观测数据计算检验随机变量K 2的值k ,其值越大,说明H 1成立的可能性就越大.当得到的观测数据a、b、c、d都不小于5时,可以通过随机变量k 2来确定结论的可信程度.要点提示 注意此处空半格在计算得检验随机变量K 2的值时,要注意临界值6.635,3.841和2.706.如果k 2>6.635,就有99%把握认为“X 与Y 有关系”.如果k 2>3.841,就有95%把握认为“X 与Y 有关系”.如果k 2>2.706,就有90%把握认为“X 与Y 有关系”.而如果k 2≤2.706,就认为没有充分的证据显示“X 与Y 有关系”.误区警示 注意此处空半格使用K 2统计量作2×2列联表的独立性检验时,要求表中的4个数据都要大于5,所以在选取样本容量时一定要注意这一点. 问题·探究问题1某聋哑研究机构对聋哑关系进行抽样调查,在耳聋的657人中有416人哑,而另外不聋的680人中有249人哑.你能运用这组数据得出相应结论吗?思路:认真分析后,我们就是要在聋与哑有无关系上作出结论.于是可以运用独立性检验进行判断.一种方法可以根据题目所给数据得到2×2列联表,计算K 2的值,与临界值做比较;另一种方法可以用三维柱形图粗略估计得出结论.当然,我们也可以采用对照两组人群中哑的比例进行粗略估计,但精确度要相对低一些.根据列联表中数据得到:K 2=680657672665)241249431416(13372⨯⨯⨯⨯-⨯≈95.29>10.828,所以我们有99.9%的把握说聋与哑有关.方法二:我们可以把题目中的数据做出相应的三维柱形图(图),容易比较发现,底面副对角线两个柱体高度的乘积大些,可以在某种程度上认为聋与哑有关. 问题2如何进行独立性检验?试举一例说明之.思路:(1)作统计假设:假设H 0“事件A 与B 独立”;(2)根据公式K 2=))()()(()(2d b c a d c b a bc ad n ++++-,求出K 2;(3)作出统计判断:若K 2>6.635,则有99%的把握说事件A 与B 有关,若K 2>3.841,则有95%的把握说事件A 与B 有关.若K 2≤2.706,则认为没有充分的证据显示事件A 与B 有关.注意在此过程中要使表中的4个数据大于5.如“五一”黄金周前某地的一旅游景点票价上浮,黄金周过后,统计本地与外地来的游客人数,问票价上浮后游客人数与所处地区是否有关系?探究:按照独立性检验的基本步骤,假设票价上浮后游客人数与所处地区没有关系.因为k 2=4907273833964249)1331284220651407(76452⨯⨯⨯⨯-⨯⨯≈30.35>6.635.所以假设不成立,我们有99%的把握认为票价上浮后游客人数与所处地区有关系. 典题·热题例1为了研究人的性别与患色盲与否是否有关,某研究所进行了随机调查.发现在调查的480名男性中有39名患有色盲,520名女性中有6名患有色盲,试检验人的性别与患色盲与否有关?思路分析:由题意列出2×2列联表,由公式计算出K 2,与临界值做比较,得出事件成立的可信程度.由公式得K 2=52048095545)441651439(10002⨯⨯⨯⨯-⨯⨯≈28.23.因为28.23>10.828,所以有99.9%的把握认为患色盲与否与人的性别有关,男性患色盲的概率要比女性大很多.方法归纳 注意此处空半格独立性检验问题的基本步骤为:(1)找相关数据,作列联表;(2)求统计量K 2;(3)判断可能性,注意与临界值做比较,得出事件有关的确信度.例2某县对在职的71名高中数学教师就支持新的数学教材还是支持旧的数学教材做了调查,根据此资料,你是否认为教龄的长短与支持新的数学教材有关?思路分析:根据独立性检验思想,由公式计算出K 2,然后与两临界值比较得出结论.解:由公式得K 2=49223437)10252412(71))()()(()(22⨯⨯⨯⨯-⨯=++++-d b c a d c b a bc ad n ≈0.08.由K 2<2.706,我们没有充分的证据说明教龄的长短与支持新的数学教材有关.深化升华 注意此处空半格独立性检验能帮助我们对日常生活中的实际问题作出合理的推断和预测.因此要在学习中,应通过案例分析,理解和掌握独立性检验的方法,体会其基本思想在解决实际问题中的应用,以提高我们分析和处理问题的能力.例3在某医院,因为患心脏病而住院的665名男性病人中,有214人秃顶,而另外772名不是因为患心脏病而住院的男性病人中有175人秃顶.利用独立性检验方法判断秃顶与患心脏病是否有关系?你所得的结论是在什么范围内有效? 思路分析:由题意列出2×2列联表,利用公式求得K 2后与临界值比较,得出结论后要注意这组数据是来自于住院的病人,而不是随机对全体人群采样.由公式得K 2=7726651048389)451175597214(14372⨯⨯⨯⨯-⨯⨯≈10.828.所以有99.9%的把握认为“秃顶与患心脏病有关”.误区警示 注意此处空半格在应用公式时,切忌误用公式为K 2=))()()(()(2d b c a d c b a bc ad n ++++-.这会使结果相差甚远.例4某校高三年级在一次全年级的大型考试中,数学成绩优秀和非优秀的学生中,物理、化学、总分也为优秀的人数如下表所示,则数学成绩优秀与物理、化学、总分也优秀哪个关系注:该年级此次考试中数学成绩优秀的有360人,非优秀的有880人. 思路分析:分别列出两个量间的2×2列联表,将数据代入公式求得K 2,对照K 2与临界值及三个的大小关系得出结论.代入公式可得K 2=270.114 3.代入公式可得K2=240.611 2.代入公式可得K2=914.645 6.由上面分析可知,数学成绩优秀与物理、化学、总分优秀都有关系.由计算K2的值都大于10.828,由此说明都有99.9%的把握认为数学优秀与物理、化学、总分优秀都有关系,但与总分优秀关系最大,物理次之.深化升华注意此处空半格本例中,我们利用2×2列联表的独立假设分析了数学与物理、化学、总分优秀是否有关系.由此发现,学好数学对总分及学好物理关联很大,因此我们要努力学好数学.其次,本例还告诉我们如何利用所学习的独立性假设的思想方法来分析多个分类变量之间关系的方法.。

  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

3.2独立性检验的基本思想及其初步应用(共计3课时)授课类型:新授课一、教学内容与教学对象分析通过典型案例,学习下列一些常用的统计方法,并能初步应用这些方法解决一些实际问题。

①通过对典型案例(如“患肺癌与吸烟有关吗”等)的探究。

了解独立性检验(只要求2×2列联表)的基本思想、方法及初步应用。

②通过对典型案例(如“人的体重与身高的关系”等)的探究,了解回归的基本思想、方法及其初步应用。

二. 学习目标1、知识与技能通过本节知识的学习,了解独立性检验的基本思想和初步应用,能对两个分类变量是否有关做出明确的判断。

明确对两个分类变量的独立性检验的基本思想具体步骤,会对具体问题作出独立性检验。

2、过程与方法在本节知识的学习中,应使学生从具体问题中认识进行独立性检验的作用及必要性,树立学好本节知识的信心,在此基础上学习三维柱形图和二维柱形图,并认识它们的基本作用和存在的不足,从而为学习下面作好铺垫,进而介绍K的平方的计算公式和K的平方的观测值R的求法,以及它们的实际意义。

从中得出判断“X与Y有关系”的一般步骤及利用独立性检验来考察两个分类变量是否有关系,并能较准确地给出这种判断的可靠程度的具体做法和可信程度的大小。

最后介绍了独立性检验思想的综合运用。

3、情感、态度与价值观通过本节知识的学习,首先让学生了解对两个分类博变量进行独立性检验的必要性和作用,并引导学生注意比较与观测值之间的联系与区别,从而引导学生去探索新知识,培养学生全面的观点和辨证地分析问题,不为假想所迷惑,寻求问题的内在联系,培养学生学习数学、应用数学的良好的数学品质。

加强与现实生活相联系,从对实际问题的分析中学会利用图形分析、解决问题及用具体的数量来衡量两个变量之间的联系,学习用图形、数据来正确描述两个变量的关系。

明确数学在现实生活中的重要作用和实际价值。

教学中,应多给学生提供自主学习、独立探究、合作交流的机会。

养成严谨的学习态度及实事求是的分析问题、解决问题的科学世界观,并会用所学到的知识来解决实际问题。

三.教学重点、难点教学重点:理解独立性检验的基本思想;独立性检验的步骤。

教学难点;1、理解独立性检验的基本思想;2、了解随机变量K2的含义;3、独立性检验的步骤。

四、教学策略教学方法:诱思探究教学法学习方法:自主探究、观察发现、合作交流、归纳总结。

教学手段:多媒体辅助教学五、教学过程:对于性别变量,其取值为男和女两种.这种变量的不同“值”表示个体所属的不同类别,像这类变量称为分类变量.在现实生活中,分类变量是大量存在的,例如是否吸烟,宗教信仰,国籍,等等.在日常生活中,我们常常关心两个分类变量之间是否有关系.例如,吸烟与患肺癌是否有关系?性别对于是否喜欢数学课程有影响?等等.为调查吸烟是否对肺癌有影响,某肿瘤研究所随机地调查了9965人,得到如下结果(单位:人)表3-7 吸烟与肺癌列联表那么吸烟是否对患肺癌有影响吗?像表3一7 这样列出的两个分类变量的频数表,称为列联表.由吸烟情况和患肺癌情况的列联表可以粗略估计出:在不吸烟者中,有0.54 %患有肺癌;在吸烟者中,有2.28%患有肺癌.因此,直观上可以得到结论:吸烟者和不吸烟者患肺癌的可能性存在差异.与表格相比,三维柱形图和二维条形图能更直观地反映出相关数据的总体状况.图3. 2 一1 是列联表的三维柱形图,从中能清晰地看出各个频数的相对大小.图3.2一2 是叠在一起的二维条形图,其中浅色条高表示不患肺癌的人数,深色条高表示患肺癌的人数.从图中可以看出,吸烟者中患肺癌的比例高于不吸烟者中患肺癌的比例.为了更清晰地表达这个特征,我们还可用如下的等高条形图表示两种情况下患肺癌的比例.如图3.2一3 所示,在等高条形图中,浅色的条高表示不患肺癌的百分比;深色的条高表示患肺癌的百分比.通过分析数据和图形,我们得到的直观印象是“吸烟和患肺癌有关”.那么我们是否能够以一定的把握认为“吸烟与患肺癌有关”呢?为了回答上述问题,我们先假设H 0:吸烟与患肺癌没有关系.用A 表示不吸烟, B 表示不患肺癌,则“吸烟与患肺癌没有关系”独立”,即假设 H 0等价于PAB )=P(A )+P(B) .把表3一7中的数字用字母代替,得到如下用字母表示的列联表:表3-8 吸烟与肺癌列联表在表3一8中,a 恰好为事件AB 发生的频数;a+b 和a+c 恰好分别为事件A 和B 发生的频数.由于频率近似于概率,所以在H 0成立的条件下应该有a ab ac n n n++≈⨯, 其中n a b c d =+++为样本容量, (a+b+c+d)≈(a+b)(a+c) ,即ad ≈bc.因此,|ad-bc|越小,说明吸烟与患肺癌之间关系越弱;|ad -bc|越大,说明吸烟与患肺癌之间关系越强.为了使不同样本容量的数据有统一的评判标准,基于上面的分析,我们构造一个随机变量()()()()()22n ad bc K a b c d a c b d -=++++ (1)其中n a b c d =+++为样本容量.若 H 0 成立,即“吸烟与患肺癌没有关系”,则 K “应该很小.根据表3一7中的数据,利用公式(1)计算得到 K “的观测值为()22996577754942209956.63278172148987491K ⨯-⨯=≈⨯⨯⨯,这个值到底能告诉我们什么呢?统计学家经过研究后发现,在 H 0成立的情况下,2( 6.635)0.01P K ≥≈. (2) (2)式说明,在H 0成立的情况下,2K 的观测值超过 6. 635 的概率非常小,近似为0 . 01,是一个小概率事件.现在2K 的观测值k ≈56.632 ,远远大于6. 635,所以有理由断定H 0不成立,即认为“吸烟与患肺癌有关系”.但这种判断会犯错误,犯错误的概率不会超过0.01,即我们有99%的把握认为“吸烟与患肺癌有关系” .在上述过程中,实际上是借助于随机变量2K 的观测值k 建立了一个判断H 0是否成立的规则:如果k ≥6. 635,就判断H 0不成立,即认为吸烟与患肺癌有关系;否则,就判断H 0成立,即认为吸烟与患肺癌没有关系.在该规则下,把结论“H 0 成立”错判成“H 0 不成立”的概率不会超过2( 6.635)0.01P K ≥≈,即有99%的把握认为从不成立.上面解决问题的想法类似于反证法.要确认是否能以给定的可信程度认为“两个分类变量有关系”,首先假设该结论不成立,即H 0:“两个分类变量没有关系”成立.在该假设下我们所构造的随机变量2K 应该很小.如果由观测数据计算得到的2K 的观测值k 很大,则在一定可信程度上说明H 0不成立,即在一定可信程度上认为“两个分类变量有关系”;如果k 的值很小,则说明由样本观测数据没有发现反对H 0 的充分证据.怎样判断2K 的观测值 k 是大还是小呢?这仅需确定一个正数0k ,当0k k ≥时就认为2K 的观测值k 大.此时相应于0k 的判断规则为:如果0k k ≥,就认为“两个分类变量之间有关系”;否则就认为“两个分类变量之间没有关系”.我们称这样的0k 为一个判断规则的临界值.按照上述规则,把“两个分类变量之间没有关系”错误地判断为“两个分类变量之间有关系”的概率为20()P K k ≥.在实际应用中,我们把0k k ≥解释为有20(1())100%P K k -≥⨯的把握认为“两个分类变量之间有关系”;把0k k <解释为不能以20(1())100%P K k -≥⨯的把握认为“两个分类变量之间有关系”,或者样本观测数据没有提供“两个分类变量之间有关系”的充分证据.上面这种利用随机变量2K 来确定是否能以一定把握认为“两个分类变量有关系”的方法,称为两个分类变量的独立性检验.利用上面结论,你能从列表的三维柱形图中看出两个变量是否相关吗?一般地,假设有两个分类变量X 和Y ,它们的可能取值分别为{12,x x }和{12,y y }, 其样本频数列联表(称为2×2列联表)为: 表3一 9 2×2列联表若要推断的论述为H l :X 与Y 有关系,可以按如下步骤判断结论H l 成立的可能性:1.通过三维柱形图和二维条形图,可以粗略地判断两个分类变量是否有关系,但是这种判断无法精确地给出所得结论的可靠程度.① 在三维柱形图中,主对角线上两个柱形高度的乘积ad 与副对角线上的两个柱形高度的乘积bc 相差越大,H 1成立的可能性就越大.② 在二维条形图中,可以估计满足条件X=1x 的个体中具有Y=1y 的个体所占的比例a a b+,也可以估计满足条件X=2x 的个体中具有Y=2y ,的个体所占的比例c c d +.“两个比例的值相差越大,H l 成立的可能性就越大.2.可以利用独立性检验来考察两个分类变量是否有关系,并且能较精确地给出这种判断的可靠程度.具体做法是:① 根据实际问题需要的可信程度确定临界值0k ;② 利用公式( 1 ) ,由观测数据计算得到随机变量2K 的观测值k ;③ 如果0k k >,就以20(1())100%P K k -≥⨯的把握认为“X 与Y 有关系”;否则就说样本观测数据没有提供“X 与Y 有关系”的充分证据.在实际应用中,要在获取样本数据之前通过下表确定临界值:表3一10(四)、举例:例1.在某医院,因为患心脏病而住院的 665 名男性病人中,有 214 人秃顶,而另外 772 名不是因为患心脏病而住院的男性病人中有 175 人秃顶.(1)利用图形判断秃顶与患心脏病是否有关系.(2)能够以 99 %的把握认为秃顶与患心脏病有关系吗?为什么? 解:根据题目所给数据得到如下列联表: (1)相应的三维柱形图如图3.2一4所示.比较来说,底面副对角线上两个柱体高度的乘积要大一些,可以在某种程度上认为“秃顶与患心脏病有关”.(2)根据列联表3一11中的数据,得到21437(214597175451)3891048665772k ⨯⨯-⨯=⨯⨯⨯≈16.373>6 . 因此有 99 %的把握认为“秃顶与患心脏病有关” .例2.为考察高中生的性别与是否喜欢数学课程之间的关系,在某城市的某校高中生中随机抽取300名学生,得到如下列联表:表3一12 性别与喜欢数学课程列联表由表中数据计算得2K 的观测值 4.514k ≈.能够以95%的把握认为高中生的性别与是否喜欢数学课程之间有关系吗?请详细阐明得出结论的依据.解:可以有约95%以上的把握认为“性别与喜欢数学课之间有关系”.作出这种判断的依据是独立性检验的基本思想,具体过程如下:分别用a , b , c , d 表示样本中喜欢数学课的男生人数、不喜欢数学课的男生人数、喜欢数学课的女生人数、不喜欢数学课的女生人数.如果性别与是否喜欢数学课有关系,则男生中喜欢数学课的比例a a b+与女生中喜欢数学课的人数比例c c d +应该相差很多,即||||()()a c ad bca b c d a b c d --=++++ 应很大.将上式等号右边的式子乘以常数因子,然后平方得22()()()()()n ad bc K a b c d a c b d -=++++,其中n a b c d =+++.因此2K 越大,“性别与喜欢数学课之间有关系”成立的可能性越大.另一方面,在假设“性别与喜欢数学课之间没有关系”的前提下,事件A ={2K ≥3. 841}的概率为P (2K ≥3. 841) ≈0.05,因此事件 A 是一个小概率事件.而由样本数据计算得2K 的观测值k=4.514,即小概率事件 A 发生.因此应该断定“性别与喜欢数学课之间有关系”成立,并且这种判断结果出错的可能性约为5 %.所以,约有95 %的把握认为“性别与喜欢数学课之间有关系”.补充例题1:打鼾不仅影响别人休息,而且可能与患某种疾病有关,下表是一次调查所得的数据,试问:每一晚都打鼾与患心脏病有关吗?患心脏病未患心脏病合计 每一晚都打鼾30 224 254 不打鼾 24 1355 1379 合计 5415791633解:略。

相关文档
最新文档