高中数学 独立性检验与回归分析教案 文 新人教A版选修2-3

合集下载

数学人教A版选修2-3教学设计:3.2独立性检验的基本思想及其初步应用 Word版含解析

数学人教A版选修2-3教学设计:3.2独立性检验的基本思想及其初步应用 Word版含解析

教学设计3.2独立性检验的基本思想及其初步应用整体设计教材分析1.教材的地位和作用独立性检验是一种重要的统计方法,也是统计学中很常用的方法,更是高中数学新教材的新增内容.本节内容将反证法与独立性检验进行了合理整合,将假设检验的思想应用到实际生活中去.教材的设计还原了数学的本源、本质,是对“观察发现、抽象概括、感性到理性”等数学认知规律的提炼与总结,能让学生充分体会数学的发生、发展.2.课时划分独立性检验的基本思想及其初步应用的教学分三个课时完成:第1课时内容为直观判断两个分类变量是否有关系的基本方法;第2课时内容为独立性检验的基本思想;第3课时内容为独立性检验的初步应用.第一课时教学目标知识与技能结合生活实例了解分类变量的概念,了解直观判断分类变量相关性的方法,了解列联表和等高条形图的特点.过程与方法通过探索、研究、总结等方式使判断分类变量是否有关系的方法呈现在学生面前,使学生体会用样本来研究总体的思想.情感、态度与价值观通过学习本节课培养学生思维的批判性,深化学生对数学意义的理解,激发学习兴趣,认识数学的科学价值、应用价值和文化价值;通过探究学习培养学生互助合作的学习习惯,形成良好的思维品质和锲而不舍的钻研精神.重点难点教学重点:直观判断分类变量是否有关系的方法.教学难点:如何根据列联表和等高条形图来判断分类变量是否有关系.教学过程引入新课提出问题:在现实生活中,会遇到各种各样的变量,并需要研究它们之间的关系,观察下面两组变量,分析在取不同的“值”时表示的个体有何差异?(1)国籍、宗教信仰、性别、吸烟与患病是否有关;(2)成绩、身高、年龄、某班学生的百米成绩.学生活动:先独立思考,然后相互讨论交流认识统一看法.教师逐步引导学生发现分类变量的特点,分类变量的取值一定是离散的,而且不同的取值仅表示个体所属的类别.学情预测:(1)中的变量每取不同的“值”时,表示不同的类别;(2)中的变量每取不同的“值”时,表示不同的个体.教师:分类变量:变量的不同“值”表示个体所属的不同类别的变量称为分类变量.分类变量的取值一定是离散的,而且不同的取值仅表示个体所属的类别,如性别变量,只取男、女两个值,商品的等级变量只取一级、二级、三级等等.分类变量的取值有时可用数字来表示,但这时的数字除了分类以外没有其他的含义,如用“0”表示“男”,用“1”表示“女”.注意分类变量的取值一定是离散的.在我们的日常生活中,存在着大量的分类变量,如何判断两个分类变量是否有关系也是我们需要解决的一个重要问题.设计意图:从大量的生活实例出发,让学生充分体会分类变量的含义和分类变量的特点,使分类变量概念的形成水到渠成,同时也为判断分类变量的必要性做好铺垫.探究新知5月31日是世界无烟日.有关医学研究表明,许多疾病,例如:心脏病、癌症、脑血管病、慢性阻塞性肺病等都与吸烟有关,吸烟已成为继高血压之后的第二号全球杀手.这些疾病与吸烟有关的结论是怎样得出的呢?我们来看下面的问题:某医疗机构为了了解呼吸道疾病与吸烟是否有关,进行了一次抽样调查,共调查了515个成年人,其中吸烟者220人,不吸烟者295人.调查结果是:吸烟的220人中有37人患呼吸道疾病(简称患病),183人未患呼吸道疾病(简称未患病);不吸烟的295人中有21人患病,274人未患病.问题:根据这些数据能否断定“患呼吸道疾病与吸烟有关”?学生活动:先让学生独立思考,然后小组交流,教师巡视指导,并注意与学生交流,为了研究这个问题,(1)引导学生将上述数据用下表来表示:(2)估计吸烟者与不吸烟者患病的可能性差异.问题:由上述结论能否得出患病与吸烟有关?把握有多大?学情预测:在吸烟的人中,有37220≈16.82%的人患病,在不吸烟的人中,有21295≈7.12%的人患病.由上可以看出,吸烟者中患病的比例与不吸烟者中患病的比例相比有很大的差异,故“患呼吸道疾病与吸烟可能有关”.教师:类似于上面的表格,我们称分类变量的汇总统计表(频数表)为列联表,一般我们只研究每个分类变量只取两个值,这样的列联表称作2×2列联表.在日常生活中,为了直观显示两个分类变量之间的关系,还可以画出两个分类变量的等高条形图.观察下面的图形,能得到什么结论?(教师在课堂上用Excel 软件演示等高条形图,引导学生观察这类图形的特征,并分析由图形得出的结论)等高条形图学生活动:观察给出的图形,相互讨论,沟通认识.学情预测:通过上面的等高条形图可以直观看出,吸烟者中患病的比例与不吸烟者中患病的比例相比有很大的差异,故“患呼吸道疾病与吸烟可能有关”.设计目的:自然合理地提出问题,并通过不同的手段,让学生学会根据不同的方法来分析两个分类变量是否有关系.理解新知提出问题:一般地,假设有两个分类变量X 和Y ,它们的值域分别为{x 1,x 2}和{y 1,y 2},其2×2列联表和等高条形图如下表所示,试说明如何根据图表来判断分类变量X 和Y是否可能有关系?学生活动:分组讨论,合作交流,教师引导学生回顾上面问题的解决过程并加以适当的提示.学情预测:根据列联表,可估计满足条件X =x 1的个体中具有Y =y 1的个体所占比例a a +b ,也可以估计满足条件X =x 2的个体中具有Y =y 1的个体所占比例c c +d ,两个比例的值相差越大,就意味着X 和Y 有关系的可能越大.由a a +b -c c +d =ad -bc (a +b)(c +d)可知,两个比例的值相差越大即ad 与bc 相差越大,就意味着X 和Y 有关系的可能越大.由于等高条形图的纵轴是频率,故通过等高条形图可以直观展示比例差距的相对大小,进而判断分类变量是否存在关系.提出问题:上面给出的两种判断分类变量是否可能有关系的方法各有什么特点? 学生活动:独立思考,然后再相互交流.学情预测:列联表有助于直观地观测数据之间的关系,与表格相比,等高条形图更能直观地反映出相关数据的总体状况.但这两种方法都仅能粗略地判断两个分类变量是否可能有关系,但无法精确地给出得出结论的可靠程度.设计意图:通过引导学生对三种直观方法进行分析和总结,使学生掌握如何根据列联表、等高条形图来判断两个分类变量是否有关系,并了解两种方法的局限性,同时为下一节课的学习打好基础.运用新知例1某学校对在校部分学生课外活动内容进行调查,结果整理成下表:学生课外活动的类别与性别有关吗?试用学过的等高条形图进行分析.分析:根据题设条件中的列联表,画出等高条形图进行直观分析.解:等高条形图如下图所示:由图可以直观看出喜欢体育的在男生中占有较高比例,喜欢文娱的在女生中占有较高比例,故学生课外活动的类别在性别上有较大差异,说明课外活动的类别与性别在某种程度上有关系.点评:在画等高条形图时,在有条件的情况下,可引导学生利用Excel软件进行作图.【变练演编】例2在调查的480名男人中有38人患色盲,520名女人中有6名患色盲,试利用图形来判断色盲与性别是否有关?分析:根据数据列出列联表,然后画出等高条形图,来分析色盲与性别是否有关.解:根据题目给出的数据作出如下的列联表:根据列联表作出相应的等高条形图:从等高条形图来看在男人中患色盲的比例要比在女人中患色盲的比例大得多,因而,我们认为性别与患色盲是有关系的.设计意图:通过例题以及变式的学习,进一步学习利用图形直观判断分类变量是否有关系的要领,并能够画出大致的直观图形.【达标检测】1.下列不是分类变量的是()A.是否吸烟B.成绩C.宗教信仰D.国籍2.假设两个分类变量X和Y,它们的值域分别为{x1,x2}和{y1,y2},其中2×2列联表如下:对于以下数据,对同一样本能说明X与Y有关的可能性最大的一组为()A.a=5,b=4,c=3,d=2 B.a=5,b=3,c=4,d=2C.a=2,b=3,c=4,d=5 D.a=2,b=3,c=5,d=43.服用某种维生素对婴儿头发稀疏或稠密的影响调查如下:服用维生素的婴儿有60人,头发稀疏的有5人;不服用维生素的婴儿有60人,头发稀疏的有46人.试根据以上数据作出列联表.答案:1.B 2.D 3.列联表如下课堂小结(给学生1~2分钟的时间默写本节的主要基础知识、方法、例题、题目类型、解题规律等;然后用精炼的、准确的语言概括本节的知识脉络、思想方法、解题规律) 1.知识收获:直观判断分类变量是否有关系的方法.2.方法收获:借助于图形的直观特征分析数据间的关系.设计意图:让学生自己小结,这是一个多维整合的过程,是一个高层次的自我认识过程.补充练习【基础练习】1.下列关于等高条形图说法正确的是()A.等高条形图表示高度相对的条形图B.等高条形图表示的是分类变量的频数C.等高条形图表示的是分类变量的比例D.等高条形图表示的是分类变量的实际高度2.下面是一个2×2列联表:则表中a,b处的值分别为()A.94,96 B.52,50 C.52,54 D.54,523.以下说法正确的是()A.分类变量是表示个体所属的不同类别的变量B.分类变量是表示个体所属的不同类别的两个以上的变量C.分类变量是表示个体所属的不同类别的一个变量D.以上答案均不正确答案:1.C 2.C 3.A【拓展练习】4.从发生交通事故的司机中抽取2 000名司机的随机样本,根据他们的血液中是否含有酒精以及他们是否对事故负有责任将数据整理如下:试结合等高条形图分析血液中含有酒精与对事故负责有关系吗?解:由等高条形图可以看出,血液中含酒精的司机中负交通事故责任的比例要大于血液中不含酒精的司机,由此我们可以在某种程度上认为“血液中含有酒精与对事故负责”有关系.设计说明本节课在数学教材的选取上,力求贴近生活实际,如吸烟与患病、性别与课外活动的类型等,就地取材,创设学生熟悉的感兴趣的问题情境,使学生能在轻松、愉快的教学情境中学习有用的数学知识,同时也能运用数学知识来分析问题和解决问题.教案的设计“以人为本,以学定教”,教师始终扮演的是组织者、引导者、参与者的角色,通过问题教学法,变“教的课堂”为“学的课堂”,学生成为课堂学习真正的主人.倡导合作式学习,通过学生小组合作设计问题、小组交流解决问题的方式,不但提高了学生合作学习、主动探究的能力,而且大大促进了学生对知识的理解和灵活运用.备课资料用Excel软件画等高条形图用Excel软件画等高条形图的步骤.(1)在Excel软件中输入列联表的数据(也可以直接复制粘贴).(2)画柱形图.选中已输入的数据部分,然后单击工具栏上的“插入”,在下拉菜单中选择“图表”.然后在图表菜单中选择图表类型(如柱形图).按照提示依次进行下一步操作,就可以得到等高条形图了.(设计者:杨雪峰田宗臣)第二课时教学目标知识与技能通过实例,让学生了解独立性检验的基本思想及其初步应用,能对两个分类变量是否有关做出明确的判断,会对具体问题做出独立性检验.过程与方法经历概念的探索、反思、建构这一过程,让学生进一步体会独立性检验思想的基本原理,培养学生归纳、概括等合情推理能力.通过实际应用,培养学生把实际问题抽象成数学问题的能力和学以致用的数学应用意识.情感、态度与价值观通过创设情境激发学生学习数学的兴趣,培养其严谨治学的态度.在学生分析问题、解决问题的过程中培养其积极探索的精神,从而实现自我的价值.重点难点教学重点:独立性检验基本思想的初步应用; 教学难点:对独立性检验基本思想的理解.教学过程引入新课有甲、乙两个班级进行数学考试,按学生考试及格和不及格统计成绩后,得到如下列联表:试判断成绩不及格与班级是否有关?学生活动:回顾上一节课的学习内容,选择合适的方法进行判断.学情预测:根据列联表可知甲班学生中不及格的比例为1045,乙班学生中不及格的比例为745,相差345;画出等高条形图:有的学生可能说有关系,因为从等高条形图来看,可以发现甲、乙两班的及格率有明显差异;有的学生可能会说没有关系,因为不及格率相差345,应该不算大,所以说及格与班级没有关系.教师:由上面的问题可以看出,虽然利用图表来判断两个分类变量是否有关比较直观,但缺少精确性和可靠性,如何精确地刻画两个分类变量的有关性,我们必须找到一个进行精确判断的方法.设计意图:充分认识独立性检验的必要性,创设悬念,激发斗志,让学生跃跃欲试.探究新知提出问题:为了解决上面的问题,我们可以先假设H 0:不及格与班级无关.设A 表示事件“在甲班”,B 表示事件“不及格”,AB 表示“在甲班且不及格”,则“不及格与班级无关”等价于事件A 与B 相互独立,则有P(AB)=P(A)P(B),否则,应该有A 与B 不独立,即“不及格与班级有关”.那么,如何验证P(AB)=P(A)P(B)呢?学生活动:学生先独立思考,然后分小组讨论,老师加以适当的引导.学情预测:根据概率的统计定义可知,上面各个事件的概率可以用相应的频率来估计,则P(A)=4590=12,P(B)=1790,P(A)P(B)=17180,P(AB)=1090=19=20180,因为P(AB)≠P(A)P(B),故A 与B 不独立,即“不及格与班级有关”.提出问题:由P(AB)≠P(A)P(B)一定有“不及格与班级有关”吗?如果不是,那么如何根据P(A),P(B),P(AB)的值来判断其相关性?学生活动:小组协作讨论,然后说出对这个问题的认识.学情预测:P(AB)≠P(A)P(B)不一定有“不及格与班级有关”,因为在数据上我们是采用频率来估计概率,另外,在实际问题中我们也仅是用样本来估计总体,这些因素都会造成数值上的偏差.但是,应该肯定的是P(AB)与P(A)P(B)越接近,A 与B 独立的可能性就越大,即“不及格与班级有关”的可能性就越小.设计目的:通过实例的分析,为引入和理解独立性检验的基本思想做好铺垫.理解新知提出问题:若将表中“观测值”用字母表示,则得下表:令n =a +b +c +d ,如何判断不及格与班级是否有关系?试加以说明.学生活动:分组讨论,协作完成,教师引导学生类比上面的分析过程,将数字换成字母加以说明.学情预测:假设H 0:不及格与班级无关.设A 表示事件“在甲班”,B 表示事件“不及格”,AB 表示“在甲班且不及格”,则P(A)=a +b n ,P(B)=a +c n ,P(A)P(B)=a +b n ×a +c n ,P(AB)=an ,若“不及格与班级无关”,则a +b n ×a +c n 与an应非常接近. 教师:若a +b n ×a +c n 与a n 非常接近,则a +b n ×a +c n ≈an ,从而ad≈bc ,因此||ad -bc 越小,说明不及格与班级的关系越弱,||ad -bc 越大,说明不及格与班级的关系越强.而且我们还可以发现,当a +b n ×a +c n 与a n 非常接近时,a +b n ×b +d n 与b n 也应该非常接近…或者说(a n -a +b n×a +c n )2,(b n -a +b n ×b +d n )2,(c n -c +d n ×a +c n )2,(d n -c +d n ×b +d n)2应该比较小,从而 (a n -a +b n ×a +c n )2a +b n ×a +c n +(b n -a +b n ×b +d n )2a +b n ×b +d n +(c n -c +d n ×a +c n )2c +d n ×a +c n +(d n -c +d n ×b +d n)2c +d n ×b +dn =n(ad -bc)2(a +b)(a +c)(b +d)(c +d)也应该很小.构造随机变量K 2=n(ad -bc)2(a +b)(a +c)(b +d)(c +d),若H 0成立,即“不及格与班级无关”,则K 2应该很小.在H 0成立的情况下,统计学家估算出如下的概率P(K 2≥6.635)≈0.01.即在H 0成立的情况下,K 2的观测值大于6.635的概率非常小,近似于0.01,也就是说,在H 0成立的情况下对随机变量K 2进行多次观测,观测值超过6.635的频率约为0.01.从而,也说明我们把“H 0成立”错判成“H 0不成立”的概率不会超过0.01.这样,我们就可以通过计算K 2的观测值k 来判断H 0是否成立.我们把这种方法称为独立性检验.提出问题:独立性检验的基本思想是什么?学生活动:反思上面的过程,进行归纳总结,然后小组间交换意见.学情预测:独立性检验的基本思想是:要判断“两个分类变量有关系”这一结论的可信程度,首先假设结论不成立,即假设“两个分类变量没有关系”成立,在该假设下构造的随机变量K 2应该很小.如果由观测数据计算得到的K 2的观测值k 很大,则在一定程度上说明假设不合理,即认为“两个分类变量有关系”;如果观测值k 很小,则说明在样本数据中没有发现足够证据拒绝H 0.独立性检验的基本思想类似于反证法.教师:当确定“两个分类变量有关系”的可信程度时,需要确定一个正数k 0与随机变量K 2的观测值k 比较大小,如果k≥k 0,就认为“两个分类变量之间有关系”,否则就认为“两个分类变量之间没有关系”.我们称这样的k 0为一个判断规则的临界值.按照这种规则,把“两个分类变量之间没有关系”错误地判断为“两个分类变量有关系”的概率不超过P(K 2≥k 0).独立性检验的具体做法是:(1)根据实际问题的需要确定容许推断“两个分类变量有关系”犯错误概率的上界α,然后查表确定临界值k 0.(2)利用公式计算K 2的观测值k.(3)如果k≥k 0,就推断“X 与Y 有关系”,这种推断犯错误的概率不超过α;否则,就认为在犯错误的概率不超过α的前提下不能推断“X 与Y 有关系”,或者在样本数据中没有发现足够证据支持结论“X 与Y 有关系”.设计目的:以问题为驱动,引领学生在积极的思考、探究中,理解独立性检验的基本思想,理解随机变量K 2的构造过程.运用新知提出问题:根据独立性检验的基本思想,判断“不及格与班级是否有关”? 学生活动:类比公式,用计算器进行运算比较.活动结果:由题意知a =10,b =35,c =7,d =38,a +b =45,c +d =45,a +c =17,b +d =73,n =90.代入公式得K 2的观测值为:k =n(ad -bc)2(a +b)(a +c)(b +d)(c +d)=90×(10×38-7×35)245×45×17×73≈0.65.因为0.65>0.455,所以我们在犯错误的概率不超过0.5的前提下可认为“不及格与所在班级有关”.设计目的:通过问题的解决,既照应了开头提出的问题,同时也是对公式应用的一个巩固.【变练演编】题为了探究吸烟习惯与患慢性气管炎是否有关,调查了339名50岁以上的人,获数据如下:吸烟习惯与患慢性气管炎是否相关?试用独立性检验的思想说明理由. 分析:根据公式求出随机变量K 2的观测值k ,然后和已知结论数值进行比较. 解:根据列联表的数据得到K 2的观测值:k =n(ad -bc)2(a +b)(a +c)(b +d)(c +d)=339×(43×121-162×13)2205×56×283×134≈7.469>6.635,所以,在犯错误的概率不超过0.01的前提下认为“吸烟习惯与患慢性气管炎有关”. 提出问题:请解答下列问题:1.已知两个分类变量X 与Y ,你有哪些办法判断它们是否有关系?(把你知道的办法都写出来)2.已知K 2的观测值 k =6.635,你能得到哪些结论?(把你能得到的结论都写出来) 活动设计:学生先独立探索,允许互相交流成果.然后全班交流. 学情预测:1.列联表、等高条形图、独立性检验等.2.P(K 2≥6.635)≈0.01;我们判断“X 与Y 有关系”的出错概率不超过0.01;在犯错误的概率不超过0.01的前提下,可以认为“X 与Y 有关系”.设计意图:设置本组开放性问题,旨在增加问题的多样性、有趣性、探索性和挑战性,训练学生思维的发散性、收敛性、灵活性和深刻性,长期坚持,不仅会加深学生对数学的理解、掌握,而且会潜移默化地学会编题、解题.课堂小结(给学生1~2分钟的时间泛读教材,用精确的语言概括本节的知识脉络、思想方法、解题规律)1.独立性检验的思想方法以及它与反证法的关系. 2.独立性检验的一般操作步骤.设计意图:让学生自己小结,这是一个多维整合的过程,是一个高层次的自我认识过程.补充练习【基础练习】1.下面说法正确的是()A.统计方法的特点是统计推断准确、有效B.独立性检验的基本思想类似于数学上的反证法C.任何两个分类变量有关系的可信度都可以通过查表得到D.不能从等高条形图中看出两个分类变量是否相关2.经过对K2的统计量的研究,得到了若干个临界值,当K2的观测值k>3.841时,我们()A.在犯错误的概率不超过0.05的前提下可认为A与B有关B.在犯错误的概率不超过0.05的前提下可认为A与B无关C.在犯错误的概率不超过0.01的前提下可认为A与B有关D.没有充分理由说明事件A与B有关系3.利用独立性检验来考虑两个分类变量与是否有关系时,通过查阅下表来确定“X和Y 有关系”的可信度.如果k>6.635,那么认为“X和Y有关系”犯错误的概率不超过…()A.99%B.1%C.5%D.97.5%4.独立性检验所采用的思路是:要研究A,B两类分类变量是否彼此相关,首先假设这两类变量彼此__________,在此假设下构造随机变量K2,如果K2的观测值较大,那么在一定程度上说明假设__________.答案:1.B 2.A 3.B 4.无关不成立【拓展练习】5.某聋哑研究机构,对聋哑关系进行抽样调查,在耳聋的657人中有416人哑,而另外不聋的680人中有249人哑,你能运用这组数据判断,在犯错误的概率不超过0.1%的前提下,能否认为聋哑有关系?解:根据题目所给数据,得到如下列联表:根据列联表数据得到K2的观测值K=1 337×(416×431-249×241)2665×672×657×680≈95.29>10.828,∴在犯错误的概率不超过0.1%的前提下,可以认为聋哑有关系.设计说明本设计以问题驱动为指导,通过不断提出问题、研究问题、解决问题,使学生获得知识,完成教学.以学生熟悉的例子为载体,引导他们提炼、概括独立性检验的方法,自然合理地提出问题,让学生体会“数学来源于生活”.创造和谐积极的学习气氛,让学生通过直观感知、观察分析,形成由浅入深、由易到难、由感性到理性的思维飞跃,并借助例题具体说明在数学发现的过程中应用假设检验的过程.备课资料假设检验与反证法独立性检验的基本思想是假设检验,假设检验类似于反证法,但二者是不同的.下表列出了二者之间的关系:从上面的对比中,可以看出假设检验与反证法的不同之处有二:其一是在假设检验用有利于H1的小概率事件的发生代替了反证法中的矛盾;其二是假设检验中接受原假设的结论相当于反证法没有找到矛盾.(设计者:杨雪峰田宗臣)第三课时教学目标知识与技能理解独立性检验的基本思想,会根据K2的观测值的大小判断两个分类变量有关的可信度,培养学生的自主探究的学习能力,并能应用数学知识解决实际问题.过程与方法通过主动探究、自主合作、相互交流,从具体实例中归纳出进行独立性检验的基本步骤,使学生充分体会知识的发现过程,并渗透统计的基本思想和方法.情感、态度与价值观使学生体会数学的理性与严谨,了解数学来源于实际,应用于实际的唯物主义思想,培养学生对新知识的科学态度,勇于探索和敢于创新的精神.重点难点教学重点:利用独立性检验的基本思想解决实际问题以及处理步骤;教学难点:对独立性检验思想的理解.教学过程引入新课提出问题:在某医院,因为患心脏病而住院的665名男性病人中,有214人秃顶;而另外772名不是因为患心脏病而住院的男性病人中有175名秃顶.(1)利用图形判断秃顶与患心脏病是否有关系;(2)能否在犯错误的概率不超过0.01的前提下认为秃顶与患心脏病有关系?学生活动:小组合作完成.活动结果:根据题目所给的数据画出列联表:相应的等高条形图如图所示:。

高二数学 (人教a版)选修2-3教案:3.2独立性检验的基本思想及其应用第2课时

高二数学     (人教a版)选修2-3教案:3.2独立性检验的基本思想及其应用第2课时

§3.2独立性检验的基本思想及其应用(2)【教学过程设计】:同步练习: (基础题)试问新措施对猪白痢的防治效果如何?解:由公式得:()230013236114187.31715015024654k ⨯⨯-⨯=≈⨯⨯⨯,由于7.317>6.635,所以我们有99%的把握认为新措施对猪白痢的防治是有效的。

2、调查某医院某段时间内婴儿出生的时间与性别的关系,得到下面的数据表,试问能以多解:由公式得: 3.689 3.84155343257k =≈<⨯⨯⨯,所以没有充分的证据显示婴儿的性别与出生时间有关。

3、为了解决初二平面几何入门难的问题,某校在初中一年级代数教学中加强概念和推理教学,并设有对照班,下列是初中二年级平面几何期中测验成绩统计表的一部分,试分析研究解:由公式得:()21003238181216.23410.82850504456k ⨯⨯-⨯=≈>⨯⨯⨯,所以有99.9 %的把握认为在初中一年级代数教学中加强概念和推理教学,与初中二年级平面几何期中测验成绩有关。

解:由公式得:()21003616840 1.458 3.84144562476k ⨯⨯-⨯=≈<⨯⨯⨯,所以这两种教学方法对学生成绩的效果是相互独立的。

5、为了确定居民的头发颜色与居地的依赖关系,分别在两个地区A 、B 调查了两组人群,其结果如下表:由调查得到的结果,能否证实居民的发色与他们的居地有关?解:由公式得:()2100243863210.019 6.63544567030k ⨯⨯-⨯=≈>⨯⨯⨯,所以有99 %的把握认为居民的发色与他们的居地有关。

6、研究某特殊药物有无副作用(比如恶心),给50个患者服用此药,给另外50个患者服用安慰剂,记录每类样本中出现恶心的数目如下表,试问此药有无恶心副作用?解:由公式得:7.86 6.63550501981k =≈>⨯⨯⨯,所以有99 %的把握认为此药有恶心副作用。

人教新课标版数学高二人教A选修2-3教案 独立性检验的基本思想及其初步应用(讲)

人教新课标版数学高二人教A选修2-3教案 独立性检验的基本思想及其初步应用(讲)

3.2.2独立性检验的基本思想及其初步应用教学目标通过对典型案例的探究,进一步巩固独立性检验的基本思想、方法,并能运用K 2进行独立性检验.教学重点:独立性检验的基本方法 教学难点:基本思想的领会及方法应用 教学过程 一.学生活动练习:(1)某大学在研究性别与职称(分正教授、副教授)之间是否有关系,你认为应该收集哪些数据?女教授人数,男教授人数,女副教授人数,男副教授人数。

(2)某高校“统计初步”课程的教师随机调查了选该课的一些学生情况,具体数据如下表:K 2250(1320107) 4.84423272030⨯⨯-⨯=≈⨯⨯⨯,∵K 2 3.841≥,所以判定主修统计专业与性别有关系,那么这种判断出错的可能性为.(答案:5%) 附:临界值表(部分):二.数学运用例1为考察高中生的性别与是否喜欢数学课程之间的关系,在某城市的某校高中生中随机抽取300名学生,得到如下列联表: 由表中数据计算得到K 的观察值 4.514k ≈. 在多大程度上可以认为高中生的性别与是否数学课程之间有关系?为什么?(学生自练,教师总结)强调:①使得2( 3.841)0.05P K ≥≈成立的前提是假设“性别与是否喜欢数学课程之间没有关系”.如果这个前提不成立,上面的概率估计式就不一定正确;②结论有95%的把握认为“性别与喜欢数学课程之间有关系”的含义;③在熟练掌握了两个分类变量的独立性检验方法之后,可直接计算2K 的值解决实际问题,而没有必要画相应的图形,但是图形的直观性也不可忽视.例2、为研究不同的给药方式(口服或注射)和药的效果(有效与无效)是否有关,进行了相应的抽样调查,调查结果如表所示。

根据所选择的193个病人的数据,能否作出药的效果与给药方式有关的结论?有效 无效 合计 口服 58 40 98 注射 64 31 95 合计12271193分析:在口服的病人中,有59%98≈的人有效;在注射的病人中,有67%95≈的人有效。

高中数学 3.2 独立性检验(2)教案 新人教A版选修2-3

高中数学 3.2 独立性检验(2)教案 新人教A版选修2-3

福建省漳州市芗城中学高中数学 3.2 独立性检验(2)教案 新人教A 版选修2-3课题: 第 课时 总序第 个教案课型: 新授课 编写时时间: 年 月 日 执行时间: 年 月 日 教学目标:通过对典型案例的探究,进一步巩固独立性检验的基本思想、方法,并能运用χ2统计量进行独立性检验.教学重点:独立性检验的基本方法是重点.基本思想的领会及方法应用是难点. 教学难点:独立性检验的基本方法是重点.基本思想的领会及方法应用是难点. 教学用具:多媒体教学方法:重视基本思想的领会及方法应用教学过程: 一.学生活动练习:(1)某大学在研究性别与职称(分正教授、副教授)之间是否有关系,你认为应该收集哪些数据? .(2)某高校“统计初步”课程的教师随机调查了选该课的一些学生情况,具体数据如下表:非统计专业 统计专业男 13 10 女720为了判断主修统计专业是否与性别有关系,根据表中的数据,得到χ2250(1320107) 4.84423272030⨯⨯-⨯=≈⨯⨯⨯,∵χ2 3.841≥, 所以判定主修统计专业与性别有关系,那么这种判断出错的可能性为 .(答案:5%)附:临界值表(部分):P(χ20x ≥)0.10 0.05 0.025 0.010 0x2.7063.8415.0246.635二.数学运用 1.例题:例1.在对人们的休闲方式的一次调查中,共调查了124人,其中女性70人,男性54人。

女性中有43人主要的休闲方式是看电视,另外27人主要的休闲方式是运动;男性中有21人主要的休闲方式是看电视,另外33人主要的休闲方式是运动。

(1)根据以上数据建立一个2× 2列联表; (2)判断性别与休闲方式是否有关系。

解:(1)2× 2的列联表:休闲方式 性别看电视 运动 总计女 43 27 70 男 21 33 54 总计6460124(2)假设“休闲方式与性别无关”χ22124(43332721) 6.20170546460⨯⨯-⨯=≈⨯⨯⨯ 因为χ25.024≥,所以有理由认为假设“休闲方式与性别无关”是不合理的,即有97.5%的把握认为“休闲方式与性别有关”。

人教版高中数学选修2-3 教学案:3.2 独立性检验的基本思想及其初步应用

人教版高中数学选修2-3 教学案:3.2 独立性检验的基本思想及其初步应用

独立性检验的基本思想及其初步应用预习课本P91~96,思考并完成以下问题1.分类变量与列联表分别是如何定义的?2.独立性检验的基本思想是怎样的?3.独立性检验的常用方法有哪些?[新知初探]1.与列联表相关的概念(1)分类变量:变量的不同“值”表示个体所属的不同类型,像这样的变量称为分类变量.(2)列联表:①列出的两个分类变量的频数表,称为列联表.②一般地,假设有两个分类变量X和Y,它们的取值分别为{x1,x2}和{y1,y2},其样本频数列联表(称为2×2列联表)为:在2×2列联表中,如果两个分类变量没有关系,则应满足ad-bc≈0, 因此|ad-bc|越小,关系越弱;|ad-bc|越大,关系越强.2.等高条形图等高条形图与表格相比,图形更能直观地反映出两个分类变量间是否相互影响,常用等高条形图展示列表数据的频率特征.3.独立性检验的基本思想(1)定义:利用随机变量K2来判断“两个分类变量有关系”的方法称为独立性检验.(2)公式:K2=n ad-bc2a+b c+d a+c b+d,其中n=a+b+c+d为样本容量.[小试身手]1.判断下列命题是否正确.(正确的打“√”,错误的打“×”)(1)分类变量中的变量与函数中的变量是同一概念.()(2)列联表频率分析法、等高条形图可初步分析两分类变量是否有关系,而独立性检验中K2取值则可通过统计表从数据上说明两分类变量的相关性的大小.()(3)独立性检验的方法就是反证法.()答案:(1)×(2)√(3)×2.与表格相比,能更直观地反映出相关数据总体状况的是()A.列联表B.散点图C.残差图D.等高条形图答案:D3.如果有99%的把握认为“X与Y有关系”,那么具体算出的数据满足()附表:A.k>6.635 B.k>5.024C.k>7.879 D.k>3.841答案:A4.下面是一个2×2列联表:则表中a,b的值分别为________.答案:52, 54[典例]液作尿棕色素定性检查,结果如下:铅中毒病人与尿棕色素为阳性是否有关系?[解]等高条形图如图所示:其中两个浅色条的高分别代表铅中毒病人和对照组样本中尿棕色素为阳性的频率.由图可以直观地看出铅中毒病人与对照组相比,尿棕色素为阳性的频率差异明显,因此铅中毒病人与尿棕色素为阳性有关系.,在等高条形图中,可以估计满足条件X=x1的个体中具有Y=y1的个体所占的比例aa+b.两个比例的值相差也可以估计满足条件X=x2的个体中具有Y=y1的个体所占的比例cc+d越大,X与Y有关系成立的可能性就越大.[活学活用]某学校对高三学生作了一项调查发现:在平时的模拟考试中,性格内向的学生426人中有332人在考前心情紧张,性格外向的学生594人中有213人在考前心情紧张,作出等高条形图,利用图形判断考前心情紧张与性格类别是否有关系.解:作列联表如下:相应的等高条形图如图所示:图中阴影部分表示考前心情紧张与考前心情不紧张中性格内向的比例,从图中可以看出考前紧张的样本中性格内向占的比例比考前心情不紧张样本中性格内向占的比例高,可以认为考前紧张与性格类型有关.两个变量的独立性检验[典例]为了探究学生选报文、理科是否与对外语的兴趣有关,某同学调查了361名高二在校学生,调查结果如下:理科对外语有兴趣的有138人,无兴趣的有98人,文科对外语有兴趣的有73人,无兴趣的有52人.能否在犯错误的概率不超过0.1的前提下,认为“学生选报文、理科与对外语的兴趣有关”?[解]根据题目所给的数据得到如下列联表:理科文科总计有兴趣13873211无兴趣9852150总计236125361根据列联表中数据由公式计算得随机变量K2的观测值k=361××52-73×2211×150×236×125≈1.871×10-4.因为1.871×10-4<2.706,所以在犯错误的概率不超过0.1的前提下,不能认为“学生选报文、理科与对外语的兴趣有关”.独立性检验的步骤(1)确定分类变量,获取样本频数,得到列联表.(2)根据实际问题的需要确定容许推断“两个分类变量有关系”犯错误概率的上界α,然后查表确定临界值k0.(3)利用公式K2=n ad-bc2a+b c+d a+c b+d计算随机变量K2的观测值k0.(4)作出判断.如果k≥k0,就推断“X与Y有关系”,这种推断犯错误的概率不超过α,否则就认为在犯错误的概率不超过α的前提下不能推断“X与Y的关系”,或者在样本数据中没有发现足够证据支持结论“X与Y有关系”.[活学活用]在对人们的休闲方式的一次调查中,共调查了124人,其中女性70人,男性54人.女性中有43人主要的休闲方式是看电视,另外27人主要的休闲方式是运动;男性中有21人主要的休闲方式是看电视,另外33人主要的休闲方式是运动.(1)根据以上数据建立一个2×2的列联表;并估计,以运动为主的休闲方式的人的比例;(2)能否在犯错误的概率不超过0.025的前提下,认为性别与休闲方式有关系?附表:P(K2≥k0)0.500.400.250.150.100.050.0250.0100.0050.001k00.4550.7081.3232.0722.7063.8415.0246.6357.87910.8 28K2=n() ad-bc2()a+b()c+d()a+c()b+d.解:(1)由所给的数据得到列联表休闲方式性别看电视运动总计女432770男213354总计6460124 所以以运动为主要的休闲方式的人的比例为15∶31.(2)根据列联表中的数据计算得随机变量K2的观测值,k=124××33-27×270×54×64×60≈6.201,因为k>5.024,所以在犯错误的概率不超过0.025的前提下认为休闲方式与性别有关.独立性检验的综合应用[典例]某中学将100名高一新生分成水平相同的甲、乙两个“平行班”,每班50人.陈老师采用A,B两种不同的教学方式分别在甲、乙两个班级进行教改实验.为了解教学效果,期末考试后,陈老师分别从两个班级中各随机抽取20名学生的成绩进行统计,作出茎叶图如图.记成绩不低于90分者为“成绩优秀”.(1)在乙班样本的20个个体中,从不低于86分的成绩中随机抽取2个,求抽出的两个均“成绩优秀”的概率;(2)由以上统计数据作出列联表,并判断能否在犯错误的概率不超过0.1的前提下认为:“成绩优秀”与教学方式有关.[解](1)由题意知本题是一个等可能事件的概率,试验发生包含的事件是从不低于86分的成绩中随机抽取两个包含的基本事件是:(86,93), (86,96), (86,97), (86,99), (86,99), (93,96),(93,97), (93,99), (93,99), (96,97), (96,99), (96,99),(97,99),(97,99),(99,99),共有15种结果,符合条件的事件数(93,96),(93,97),(93,99),(93,99),(96,97),(96,99),(96,99),(97,99),(97,99),(99,99),共有10种结果,根据等可能事件的概率得到P=1015=2 3.(2)由已知数据得甲班乙班总计成绩优秀15 6成绩不优秀191534总计202040 根据列联表中的数据,计算得随机变量K2的观测值k=-26×34×20×20≈3.137,由于3.137>2.706,所以在犯错误的概率不超过0.1的前提下认为:“成绩优秀”与教学方式有关.(1)独立性检验问题是常与统计、概率相结合,解题时一定要认真审题,找出各数据的联系.(2)解决独立性检验的应用问题,一定要按照独立性检验的步骤得出结论.[活学活用]某市教育局邀请教育专家深入该市多所中小学,开展听课、访谈及随堂检测等活动,他们把收集到的180节课分为三类课堂教学模式,教师主讲的为A 模式,少数学生参与的为B 模式,多数学生参与的为C 模式,A ,B ,C 三类课的节数比例为3∶2∶1.(1)为便于研究分析,教育专家将A 模式称为传统课堂模式,B ,C 统称为新课堂模式,根据随堂检测结果,把课堂教学效率分为高效和非高效,根据检测结果统计得到如下2×2列联表(单位:节)请根据统计数据回答:有没有99%的把握认为课堂教学效率与教学模式有关?并说明理由.(2)教育专家采用分层抽样的方法从收集到的180节课中选出12节课作为样本进行研究,并从样本中的B 模式和C 模式课堂中随机抽取2节课,求至少有一节课为C 模式课堂的概率.参考临界值有:参考公式:K 2=n ad -bc 2a +bc +d a +cb +d,其中n =a +b +c +d .解:(1)由列联表中的统计数据计算随机变量K 2的观测值为: ∵k =180××50-40×2100×80×90×90=9>6.635,由临界值表P (K 2≥6.635)≈0.010,∴有99%的把握认为课堂效率与教学模式有关.(2)样本中的B 模式课堂和C 模式课堂分别是4节和2节.从中任取两节有C 26=15种取法,其中至少有一节课为C 模式课堂取法有C 26-C 24=9种,∴至少有一节课为C 模式课堂的概率为915=35.层级一 学业水平达标1.以下关于独立性检验的说法中, 错误的是( ) A .独立性检验依赖于小概率原理 B .独立性检验得到的结论一定准确C .样本不同,独立性检验的结论可能有差异D .独立性检验不是判断两事物是否相关的唯一方法解析:选B 根据独立性检验的原理可知得到的结论是错误的情况是小概率事件,但并不一定是准确的.2.观察下列各图,其中两个分类变量之间关系最强的是( )解析:选D 在四幅图中,D 图中两个阴影条的高相差最明显,说明两个分类变量之间关系最强,故选D .3.在列联表中,下列哪两个比值相差越大,两个分类变量有关系的可能性就越大( ) A .a a +b 与d c +d B .c a +b 与a c +dC .a a +b 与c c +dD .a a +b 与c b +c解析:选C 由等高条形图可知a a +b 与cc +d的值相差越大,|ad -bc |就越大,相关性就越强.4.对于分类变量X 与Y 的随机变量K 2的观测值k ,下列说法正确的是( ) A .k 越大,“X 与Y 有关系”的可信程度越小 B .k 越小,“X 与Y 有关系”的可信程度越小 C .k 越接近于0,“X 与Y 没有关系”的可信程度越小 D .k 越大,“X 与Y 没有关系”的可信程度越大解析:选B K 2的观测值k 越大,“X 与Y 有关系”的可信程度越大.因此,A 、C 、D 都不正确.5.考察棉花种子经过处理跟生病之间的关系得到下表数据:A.种子是否经过处理跟是否生病有关B.种子是否经过处理跟是否生病无关C.种子是否经过处理决定是否生病D.以上都是错误的解析:选B由K2=407××213-61×293×314×133×274≈0.164<2.706,即没有把握认为是否经过处理跟是否生病有关.6.在一项打鼾与患心脏病的调查中,共调查了1 671人,经过计算K2的观测值k=27.63,根据这一数据分析,我们有理由认为打鼾与患心脏病是________的.(填“有关”或“无关”)解析:∵K2的观测值k=27.63,∴k>10.828,∴在犯错误的概率不超过0.001的前提下认为打鼾与患心脏病是有关的.答案:有关7.如果根据性别与是否爱好运动的列联表得到K2≈3.852>3.841,则判断性别与是否爱好运动有关,那么这种判断犯错的可能性不超过________.解析:∵P(K2≥3.841)≈0.05.∴判断性别与是否爱好运动有关,出错的可能性不超过5%.答案:5%8.统计推断,当________时,在犯错误的概率不超过0.05的前提下认为事件A与B 有关;当________时,认为没有充分的证据显示事件A与B是有关的.解析:当k>3.841时,就有在犯错误的概率不超过0.05的前提下认为事件A与B 有关,当k≤2.706时认为没有充分的证据显示事件A与B是有关的.答案:k>3.841k≤2.7069.为了调查胃病是否与生活规律有关,在某地对540名40岁以上的人进行了调查,结果是:患胃病者生活不规律的共60人,患胃病者生活规律的共20人,未患胃病者生活不规律的共260人,未患胃病者生活规律的共200人.(1)根据以上数据列出2×2列联表;(2)在犯错误的概率不超过0.01的前提下认为40岁以上的人患胃病与否和生活规律有关系吗?为什么?解:(1)由已知可列2×2列联表:(2)k =540××260-200×2220×320×80×460≈9.638.∵9.638>6.635,因此,在犯错误的概率不超过0.01的前提下认为40岁以上的人患胃病与否和生活规律有关.10.为了解某班学生喜爱打篮球是否与性别有关,对本班50人进行了问卷调查得到了如下的列联表:已知在全部50人中随机抽取1人抽到爱打篮球的学生的概率为35.(1)请将上面的列联表补充完整;(2)是否有99.5%的把握认为喜爱打篮球与性别有关;请说明理由. 附参考公式:K 2=n ad -bc 2a +bc +d a +cb +d,其中n =a +b +c +d .解:(1)列联表补充如下:(2)∵K 2=50××15-10×230×20×25×25≈8.333>7.879,∴有99.5%的把握认为喜爱打篮球与性别有关.层级二 应试能力达标1.在第29届北京奥运会上,中国健儿取得了51金、21银、28铜的好成绩,稳居金牌榜榜首,由此许多人认为中国进入了世界体育强国之列,也有许多人持反对意见,有网友为此进行了调查,在参加调查的2 548名男性中有1 560名持反对意见,2 452名女性中有1 200名持反对意见,在运用这些数据说明性别对判断“中国进入了世界体育强国之列”是否有关系时,用什么方法最有说服力()A.平均数与方差B.回归直线方程C.独立性检验D.概率解析:选C由于参加调查的人按性别被分成了两组,而且每一组又被分成了两种情况,判断有关与无关,符合2×2列联表的要求,故用独立性检验最有说服力.2.对于独立性检验,下列说法正确的是()A.K2>3.841时,有95%的把握说事件A与B无关B.K2>6.635时,有99%的把握说事件A与B有关C.K2≤3.841时,有95%的把握说事件A与B有关D.K2>6.635时,有99%的把握说事件A与B无关解析:选B由独立性检验的知识知:K2>3.841时,有95%的把握认为“变量X与Y 有关系”;K2>6.635时,有99%的把握认为“变量X与Y有关系”.故选项B正确.3.想要检验是否喜欢参加体育活动是不是与性别有关,应该检验()A.H0:男性喜欢参加体育活动B.H0:女性不喜欢参加体育活动C.H0:喜欢参加体育活动与性别有关D.H0:喜欢参加体育活动与性别无关解析:选D独立性检验假设有反证法的意味,应假设两类变量(而非变量的属性)无关,这时的K2应该很小,如果K2很大,则可以否定假设,如果K2很小,则不能够肯定或者否定假设.4.春节期间,“厉行节约,反对浪费”之风悄然吹开,某市通过随机询问100名性别不同的居民是否能做到“光盘”,得到如下的列联表:由此表得到的正确结论是()A.在犯错误的概率不超过0.01的前提下,认为“该市居民能否做到‘光盘’与性别有关”B.在犯错误的概率不超过0.01的前提下,认为“该市居民能否做到‘光盘’与性别无关”C.在犯错误的概率不超过0.1的前提下,认为“该市居民能否做到‘光盘’与性别有关”D.在犯错误的概率不超过0.1的前提下,认为“该市居民能否做到‘光盘’与性别无关”解析:选C由2×2列联表得到a=45,b=10,c=30,d=15.则a+b=55,c+d=45,a+c=75,b+d=25,ad=675,bc=300,n=100.代入K2=n ad-bc2a+b c+d a+c b+d,得K2的观测值k=100×-255×45×75×25≈3.030.因为2.706<3.030<3.841.所以在犯错误的概率不超过0.1的前提下认为“该市居民能否做到‘光盘’与性别有关”.5.若两个分类变量X与Y的列联表为:则“X与Y之间有关系”这个结论出错的可能性为________.解析:由题意可得K2的观测值k=+15+40+××16-40×2+×+×+×+≈7.227,∵P(K2≥6.635)≈1%, 所以“x与y之间有关系”出错的可能性为1%.答案:1%6.对196个接受心脏搭桥手术的病人和196个接受血管清障手术的病人进行了3年的跟踪研究,调查他们是否又发作过心脏病,调查结果如下表所示:差别的结论________(填“能”或“不能”).解析:根据列联表中的数据,可以求得K2的观测值k=392××167-29×2 68×324×196×196≈1.779.K2<2.072的概率为0.85.作出这两种手术对病人又发作心脏病的影响有差别的结论.答案:1.779不能7.甲、乙两机床加工同一种零件,抽检得到它们加工后的零件尺寸x(单位:cm)及个数y,如下表:由表中数据得y关于x的线性回归方程为y=-91+100x(1.01≤x≤1.05),其中合格零件尺寸为1.03±0.01(cm).完成下面列联表,并判断是否有99%的把握认为加工零件的质量与甲、乙有关?解:x=1.03,y=a+495,由y^=-91+100x知,a+495=-91+100×1.03,所以a=11,由于合格零件尺寸为1.03±0.01 cm,故甲、乙加工的合格与不合格零件的数据表为:所以K2=n ad-bca+b c+d a+c b+d=60××18-6×230×30×36×24=10,因K2=10>6.635,故有99%的把握认为加工零件的质量与甲、乙有关.8.某大学餐饮中心为了解新生的饮食习惯,在全校一年级学生中进行了抽样调查,调查结果如下表所示:(1)习惯方面有差异”;(2)已知在被调查的北方学生中有5名数学系的学生,其中2名喜欢甜品.现在从这5名学生中随机抽取3人,求至多有1人喜欢甜品的概率.解:(1)将2×2列联表中的数据代入公式计算,得 K 2=100××10-20×270×30×80×20=10021≈4.762. 由于4.762>3.841,所以有95%的把握认为“南方学生和北方学生在选用甜品的饮食习惯方面有差异”.(2)从5名数学系学生中任取3人的一切可能结果所组成的基本事件空间Ω={(a 1,a 2,b 1),(a 1,a 2,b 2),(a 1,a 2,b 3),(a 1,b 1,b 2),(a 1,b 1,b 3),(a 1,b 2,b 3),(a 2,b 1,b 2),(a 2,b 1,b 3),(a 2,b 2,b 3),(b 1,b 2,b 3)}.(其中a i 表示喜欢甜品的学生,i =1,2.b j 表示不喜欢甜品的学生,j =1,2,3)Ω由10个基本事件组成,且这些基本事件的出现是等可能的.用A 表示“3人中至多有1人喜欢甜品”这一事件,则A ={(a 1,b 1,b 2),(a 1,b 1,b 3),(a 1,b 2,b 3),(a 2,b 1,b 2),(a 2,b 1,b 3),(a 2,b 2,b 3),(b 1,b 2,b 3)}.事件A 是由7个基本事件组成,因而P (A )=710.(时间120分钟 满分150分)一、选择题(本大题共12小题,每小题5分,共60分.在每小题给出的四个选项中,只有一项是符合题目要求的)1.对有线性相关关系的两个变量建立的回归直线方程y ^=a ^+b ^x 中,回归系数b ^( ) A .可以小于0 B .大于0 C .能等于0D .只能小于0解析:选A ∵b ^=0时,则r =0,这时不具有线性相关关系,但b ^可以大于0也可以小于0.2.每一吨铸铁成本y (元)与铸件废品率x %建立的回归方程y ^=56+8x ,下列说法正确的是( )A .废品率每增加1%,成本每吨增加64元B .废品率每增加1%,成本每吨增加8%C .废品率每增加1%,成本每吨增加8元D .如果废品率增加1%,则每吨成本为56元解析:选C 根据回归方程知y 是关于x 的单调增函数,并且由系数知x 每增加一个单位,y 平均增加8个单位.3.下表显示出样本中变量y 随变量x 变化的一组数据,由此判断它最可能是( )A .线性函数模型B .二次函数模型C .指数函数模型D .对数函数模型解析:选A 画出散点图(图略)可以得到这些样本点在某一条直线上或该直线附近,故最可能是线性函数模型.4.试验测得四组(x ,y )的值为(1,2),(2,3),(3,4),(4,5),则y 与x 之间的回归直线方程为( )A .y ^=x +1B . y ^=x +2 C .y ^=2x +1 D .y ^=x -1解析:选A 由题意发现,(x ,y )的四组值均满足y ^=x +1,故y ^=x +1为回归直线方程.5.下列关于等高条形图说法正确的是( ) A .等高条形图表示高度相对的条形图 B .等高条形图表示的是分类变量的频数 C .等高条形图表示的是分类变量的百分比 D .等高条形图表示的是分类变量的实际高度 解析:选C 由等高条形图的特点及性质进行判断.6.根据一组样本数据(x 1,y 1),(x 2,y 2),…,(x n ,y n )的散点图分析存在线性相关关系,求得其回归方程y ^=0.85x -85.7,则在样本点(165,57)处的残差为( )A .54.55B .2.45C .3.45D .111.55解析:选B 把x =165代入y ^=0.85x -85.7,得y =0.85×165-85.7=54.55,由57-54.55=2.45,故选B .7.有甲、乙两个班级进行数学考试,按照大于等于85分为优秀,85分以下为非优秀统计成绩,得到如下所示的列联表:已知在全部105人中随机抽取1人,成绩优秀的概率为27,则下列说法正确的是( )A .列联表中c 的值为30,b 的值为35B .列联表中c 的值为15,b 的值为50C .根据列联表中的数据,若按95%的可靠性要求,能认为“成绩与班级有关系”D .根据列联表中的数据,若按95%的可靠性要求,不能认为“成绩与班级有关系” 解析:选C 由题意知,成绩优秀的学生数是30,成绩非优秀的学生数是75,所以c =20,b =45,选项A 、B 错误.根据列联表中的数据,得到K 2=105××30-20×255×50×30×75≈6.109>3.841,因此有95%的把握认为“成绩与班级有关系”,选项C 正确.8.某考察团对全国10大城市进行职工人均工资水平x (千元)与居民人均消费水平y (千元)统计调查,y 与x 具有相关关系,回归方程为y ^=0.66x +1.562,若某城市居民人均消费水平为7.675千元,估计该城市人均消费额占人均工资收入的百分比约为( )A .83%B .72%C .67%D .66%解析:选A 将y =7.675代入回归方程,可计算得x ≈9.262,所以该城市人均消费额占人均工资收入的百分比约为7.675÷9.262≈0.83≈83%,即约为83%.9.为了研究男子的年龄与吸烟的关系,抽查了100个男子,按年龄超过和不超过40岁,吸烟量每天多于和不多于20支进行分组,如下表:则在犯错误的概率不超过__________的前提下认为吸烟量与年龄有关( ) A .0.001 B .0.01 C .0.05 D .没有理由解析:选A K 2=100××25-10×265×35×60×40≈22.16>10.828,所以我们在犯错误的概率不超过0.001的前提下认为吸烟量与年龄有关.10.为了考察两个变量x 和y 之间的线性相关性,甲、乙两个同学各自独立做了10次和15次试验,并且利用线性回归方法,求得回归直线为l1和l2,已知在两人的试验中发现对变量x的观测数据的平均值恰好相等,都为s,对变量y的观测数据的平均值也恰好相等,都为t,那么下列说法正确的是()A.直线l1和直线l2有交点(s,t)B.直线l1和直线l2相交,但交点未必是点(s,t)C.直线l1和直线l2由于斜率相等,所以必定平行D.直线l1和直线l2必定重合解析:选A l1与l2都过样本中心(x,y).11.假设有两个分类变量X和Y,它们的可能取值分别为{x1,x2}和{y1,y2},其2×2列联表如下:() A.a=9,b=8,c=7,d=6B.a=9,b=7,c=6,d=8C.a=8,b=6,c=9,d=7D.a=6,b=7,c=8,d=9解析:选B对于同一样本|ad-bc|越小,说明X与Y之间的关系越弱,|ad-bc|越大,故检验知选B.12.两个分类变量X和Y, 值域分别为{x1,x2}和{y1,y2}, 其样本频数分别是a=10, b =21, c+d=35.若X与Y有关系的可信程度不小于97.5%, 则c等于() A.3 B.4C.5 D.6解析:选A列2×2列联表如下:故K2的观测值k=66×-c-21c]31×35×+c-c≥5.024.把选项A, B, C, D代入验证可知选A.二、填空题(本大题共4小题,每小题5分,共20分.请把正确答案填在题中的横线上)13.已知某车间加工零件的个数x 与所花费时间y (h)之间的线性回归方程为y ^=0.01x +0.5,则加工600个零件大约需要________h .解析:当x =600时,y ^=0.01×600+0.5=6.5. 答案:6.514.若一组观测值(x 1,y 1),(x 2,y 2),…,(x n ,y n )之间满足y i =bx i +a +e i (i =1,2,…,n ),若e i 恒为0,则R 2为________.解析:e i 恒为0,说明随机误差总为0,于是y i =y ^,故R 2=1. 答案:115.下列是关于出生男婴与女婴调查的列联表那么A =______,B =______,C ______,D =________,E =________. 解析:∵45+E =98,∴E =53,∵E +35=C ,∴C =88,∵98+D =180,∴D =82, ∵A +35=D ,∴A =47,∵45+A =B ,∴B =92. 答案:47 92 88 82 5316.已知x ,y 之间的一组数据如表,对于表中数据,甲、乙两同学给出的拟合直线分别为l 1:y =13x +1与l 2:y =12x +12,利用最小二乘法判断拟合程度更好的直线是________.解析:用y =13x +1作为拟合直线时,所得y 的实际值与y 的估计值的差的平方和为:S 1=⎝⎛⎭⎫1-432+(2-2)2+(3-3)2+⎝⎛⎭⎫4-1032+⎝⎛⎭⎫5-1132=73.用y =12x +12作为拟合直线时,所得y 的实际值与y 的估计值的差的平方和为:S 2=(1-1)2+(2-2)2+⎝⎛⎭⎫3-722+(4-4)2+⎝⎛⎭⎫5-922=12.因为S 2<S 1,故用直线l 2:y =12x +12,拟合程度更好.答案:y =12x +12三、解答题(本大题共6小题,共70分,解答时写出必要的文字说明、证明过程或演算步骤)17.(本小题满分10分)对某校小学生进行心理障碍测试得如下列联表:(其中焦虑、说谎、懒惰都是心理障碍)试说明在这三种心理障碍中哪一种与性别关系最大?解:对于上述三种心理障碍分别构造三个随机变量K 21,K 22,K 23,由表中数据可得K 21=110××60-25×230×80×25×85≈0.863,K 22=110××70-20×230×80×20×90≈6.366,K 23=110××30-15×230×80×65×45≈1.410.因为K 22的值最大,所以说谎与性别关系最大.18.(本小题满分12分)有人统计一个省的6个城市某一年的人均国内生产总值(人均GDP)x 和这一年各城市患白血病的儿童数量y ,其数据如下表所示:(1)画出散点图,并判断是否线性相关; (2)求y 与x 之间的回归方程. 解:(1)作散点图(如下图所示).由散点图可知y 与x 具有线性相关关系.(2)将数据代入公式,可得b ^≈23.253,a ^≈102.151.故y 与x 之间的线性回归方程是y ^=23.253x +102.151.19.(本小题满分12分)某校在两个班进行教学方式对比试验,两个月后进行了一次检测,试验班与对照班成绩统计如下表所示(单位:人):(1)求m ,n ;(2)能否在犯错误的概率不超过0.005的情况下认为教学方式与成绩有关系? 解:(1)m =45-15=30,n =50+50=100. (2)由表中的数据,得K 2的观测值为 k =100××30-15×250×50×55×45≈9.091.因为9.091>7.879,所以能在犯错误的概率不超过0.005的前提下认为教学方式与成绩有关系.20.(本小题满分12分)某工厂用甲、乙两种不同工艺生产一大批同一种零件,零件尺寸均在[21.7,22.3](单位:cm)之间,把零件尺寸在[21.9,22.1)的记为一等品,尺寸在[21.8,21.9)∪[22.1,22.2)的记为二等品,尺寸在[21.7,21.8)∪[22.2,22.3]的记为三等品,现从甲、乙工艺生产的零件中各随机抽取100件产品,所得零件尺寸的频率分布直方图如图所示:(1)根据上述数据完成下列2×2列联表,根据此数据你认为选择不同的工艺与生产出一等品是否有关?附:K2=n ad-bc2a+b c+d a+c b+d(2)以上述各种产品的频率作为各种产品发生的概率,若一等品、二等品、三等品的单件利润分别为30元、20元、15元,你认为以后该工厂应该选择哪种工艺生产该种零件?请说明理由.解:(1)2×2列联表如下K2=200××40-60×2110×90×100×100≈2.02<2.706,所以没有理由认为选择不同的工艺与生产出一等品有关.(2)由题知运用甲工艺生产单件产品的利润X的分布列为X的数学期望为E(X)=30×0.5+20×0.3+15×0.2=24,X的方差为D(X)=(30-24)2×0.5+(20-24)2×0.3+(15-24)2×0.2=39.乙工艺生产单件产品的利润Y的分布列为Y的数学期望为E(Y)=30×0.6+20×0.1+15×0.3=24.5,Y的方差为D(Y)=(30-24.5)2×0.6+(20-24.5)2×0.1+(15-24.5)2×0.3=47.25.由上述结果可以看出D(X)<D(Y),即甲工艺波动小,虽然E(X)<E(Y),但相差不大,所以以后选择甲工艺.21.(本小题满分12分)为调查某地区老年人是否需要志愿者提供帮助,用简单随机抽样的方法从该地区调查了500位老年人,结果如下:附:K2的观测值k=n ad-bc2a+b c+d a+c b+d.(1)估计该地区老年人中,需要志愿者提供帮助的老年人的比例;(2)在犯错误的概率不超过0.01的前提下是否可认为该地区的老年人是否需要志愿者提供帮助与性别有关?(3)根据(2)的结论,能否提出更好的调查方法来估计该地区的老年人中,需要志愿者提供帮助的老年人的比例?请说明理由.解:(1)调查的500位老人中有70位需要志愿者提供帮助,因此该地区老年人中,需要帮助的老年人的比例的估算值为70500=14%.(2)随机变量K2的观测值k=500××270-30×2200×300×70×430≈9.967.由于9.967>6.635,因此,在犯错误的概率不超过0.01的前提下认为该地区的老年人是否需要志愿者提供帮助与性别有关.(3)由(2)的结论知,该地区的老年人是否需要帮助与性别有关,并且从样本数据中能看出该地区男性老年人与女性老年人中需要帮助的比例有明显差异,因此在调查时,先确定该地区老年人中男、女的比例,再把老年人分成男、女两层,并且采用分层抽样方法比采用简单随机抽样的方法更好.22.(本小题满分12分)某市为了对学生的数理(数学与物理)学习能力进行分析,从10 000名学生中随机抽出100位学生的数理综合学习能力等级分数(6分制)作为样本,分数频数分布如下表:。

高中新课程数学(新课标人教A版)选修2-3《3.1回归分析的基本思想及其初步应用》教案

高中新课程数学(新课标人教A版)选修2-3《3.1回归分析的基本思想及其初步应用》教案

3.1回归分析的基本思想及其初步应用(共计4课时) 授课类型:新授课一、教学内容与教学对象分析学生将在必修课程学习统计的基础上,通过对典型案例的讨论,了解和使用一些常用的统计方法,进一步体会运用统计方法解决实际问题的基本思想,认识统计方法在决策中的作用。

二、学习目标1、知识与技能通过本节的学习,了解回归分析的基本思想,会对两个变量进行回归分析,明确建立回归模型的基本步骤,并对具体问题进行回归分析,解决实际应用问题。

2、过程与方法 本节的学习,应该让学生通过实际问题去理解回归分析的必要性,明确回归分析的基本思想,从散点图中点的分布上我们发现直接求回归直线方程存在明显的不足,从中引导学生去发现解决问题的新思路—进行回归分析,进而介绍残差分析的方法和利用R 的平方来表示解释变量对于预报变量变化的贡献率,从中选择较为合理的回归方程,最后是建立回归模型基本步骤。

3、情感、态度与价值观 通过本节课的学习,首先让显示了解回归分析的必要性和回归分析的基本思想,明确回归分析的基本方法和基本步骤,培养我们利用整体的观点和互相联系的观点,来分析问题,进一步加强数学的应用意识,培养学生学好数学、用好数学的信心。

加强与现实生活的联系,以科学的态度评价两个变量的相关系。

教学中适当地增加学生合作与交流的机会,多从实际生活中找出例子,使学生在学习的同时。

体会与他人合作的重要性,理解处理问题的方法与结论的联系,形成实事求是的严谨的治学态度和锲而不舍的求学精神。

培养学生运用所学知识,解决实际问题的能力。

三、教学重点、难点教学重点:熟练掌握回归分析的步骤;各相关指数、建立回归模型的步骤;通过探究使学生体会有些非线性模型通过变换可以转化为线性回归模型,了解在解决实际问题的过程中寻找更好的模型的方法。

教学难点:求回归系数 a , b ;相关指数的计算、残差分析;了解常用函数的图象特点,选择不同的模型建模,并通过比较相关指数对不同的模型进行比较。

高中数学选修2-3《独立性检验的基本思想及其初步应用》教案共10页文档

高中数学选修2-3《独立性检验的基本思想及其初步应用》教案共10页文档

◆教案独立性检验的基本思想及其初步应用(第1课时) 教材:人教A版·普通高中课程标准实验教科书·数学·选修2-3【教学目标】知识与技能目标:(1)通过学生课前分组进行“事件与事件之间是否有关系”的调查研究,理解统计方法的基本思想和应用,通过学生根据已有知识的基础上进行的数据分析,得到的直观结论,了解独立性检验的必要性,为知识的形成起到较好的推动作用.(2)通过一起对典型案例“吸烟是否与患肺癌有关系”的合作探究、自主学习,并通过和反证法原理的对比,进一步让学生去理解独立性检验的基本思想、方法及初步应用.(3)经历由实际问题建立数学模型的过程,进一步体会运用统计方法解决实际问题的基本思想,认识统计方法在决策中的作用.过程与方法目标:(1) 学生通过自主调查、设计抽样方案、分析数据、动手探究,培养学生的数学应用意识,掌握统计学的基本思想和方法,培养学生的动手能力、数理统计能力和合作精神.(2) 学生通过对调查数据的分析,作出的直观结论的可靠性程度的探究及其过程,理解独立性检验的基本思想,进一步掌握统计的方法,完善思维品质,并过特殊问题到一般性方法的探究,寻求知识之间的联系,通过新的知识与旧知识之间的对比,使学生掌握学习数学的基本方法,进一步完善认知结构.(3) 在探究过程中,在老师的引导下学生自主学习,学生主要通过合作交流,独立思考探究新知,获取新的知识;通过不同层次学生反映的问题进行适当的分析和指导,让不同层次的学生在学习过程中都有不同程度的提高,在练习中设置B组题,让思维和掌握程度较好同学能够“吃饱”.情感、态度、价值观:(1) 通过学生自主研究,进一步体会统计思想在实践中的应用,体会数形结合的思想;在探究过程中通过对具体情景中的问题到寻求一般解决方案,培养由特殊到一般思想,通过知识间的联系和对比,体验数学中转化思想的意义和价值.(2) 在教学中为学生提供充分的从事数学活动的机会,如:课前的调查研究,分析数据,通过课堂的探究活动,让学生自主探究新知,经历知识形成过程.(3)通过小组的协作,培养学生的团队精神,在活动中激发学生的学习潜能,促进他们真正理解和掌握基本的数学知识技能、数学思想方法及数学的应用意识,学会用计算器或计算机软件进行数理统计能力,获得广泛的数学活动经验,提高综合能力,学会学习,进一步在意志力、自信心、理性精神等情感与态度方面得到良好的发展.【教学重点与难点】重点:理解独立性检验的基本思想及实施步骤.难点:(1)了解独立性检验的基本思想;(2)了解随机变量2K的含义.【教学方法】《新课程标准》的理念是“向学生提供充分从事数学活动的机会,帮助他们在自主探索和合作交流的过程中真正理解和掌握基本的数学知识和技能,数学思想和方法”.考虑授课对象是高二年级理科生,学生层次差异比较明显,动手能力不足,因此通过课前的分组进行课题的调查研究,分析数据,获取结论的过程让学生在活动中提升数学思考能力,锻炼动手能力,学会处理数据的基本方法,课中通过合作探究,自主学习等方式体验知识的形成,根据不同层次学生在探究、解决问题和练习中反映的问题进行适当的引导,让学生在已有的基础上获得最大的发展.本节课主要是探究性学习,学生通过课前的调查研究和直观发现的结论和样本的随机性,理解独立性检验的必要性,根据所探究问题进行类比联想,寻求突破点,并在过程中分析所得数据与问题之间的联系,提升数学思维能力,通过与反证法思想的类比,进一步加深对独立性检验思想的理解.课堂中的例题和练习,主要是学生知识的应用为主,体会统计方法在实际问题中的应用,体会统计方法应用的广泛性,以丰富学生对数学文化价值的认识;并且通过身边问题的研究统计,提高学习数学的信心,数学课也承担着育人的任务,因此通过实际生活中的问题研究有助于完善人生观世界观,树立良好价值观.对实际问题的分析中借助信息技术学会利用图形分析、解决问题及用具体的数量来衡量两个变量之间的联系,学习用图形、数据来正确描述两个变量的关系.展示学生作品则给学生以成功的体验,增强学习数学的兴趣和信心.【学法指导】通过自己设计研究的问题的调查,进行数理统计分析,引出问题后,通过每个环节不同的问题的思考,学生主动积极地参与探究活动,体验学习的乐趣,进行有意义学习活动;教师在这个教学过程中进行有意义的引导,放手让学生进行思考和探究,让学生主动找知识的联系,寻求问题的解决.使学生充分经历“调查研究——分析统计——数学解释——知识障碍——探究新知——讨论归纳——发现新知——应用新知——回归应用”这一完整的数学学习活动,让学生感受到数学来源于生活应用于生活.学生自主探索、动手实践、合作交流的学习方式,体现在整个教学过程中.【教学手段】(1)学生课前分组调查研究,体会统计方法.(2)借助计算器、多媒体,强化直观感知,体现数形结合.(3) 提供学案“学生活动”,突破理解难点.【教学流程】学生课堂练习题A 组.1.下列关于K 2的说法正确的是( )A. K 2是用来判断两个分类变量是否有关系的一个随机变量;B. K 2的值越大,两个分类变量间的关系就越大C. K 2的观测值计算公式为K 2=| a d-bc|D.以上都正确 2.在一个2×2列联表中,由其数据计算的K 2观测值k 为7.097,则这两个变量间有关系的可能性为( )A.99%B.99.5%C.99.9%D.无关系3.观察下列图表,期中两个分类变量的关系最强的是( )A BC D 4.如果有95%的把握说事件A 和B 有关系,那么具体计算出K 2的观测值k 的数据可能是( ) A.k>3.841 B.k<3.841 C.k>6.635 D.k<6.6355. 有甲乙两个班级进行一门课程的考试,按照学生成绩优秀和不优秀统计成绩后,得到如下列联表:请画出列联表的等高条形图,并通过图形判断成绩与班级是否有关系;根据列联表的独立性检验,能否在犯错误的概率不超过0.01的前提下认为成绩与班级有关系? B 组.1. 给出假设0H ,下列结论中,不能对0H 成立与否作出明确判断的是( )A.235.2=kB.723.7=kC.321.10=kD.125.20=k 2.在调查的480名男性中有38名患有色盲,520名女性中有6名患色盲,分别利用图形和独立性检验的方法判断色盲与性别是否有关系?3.在对人们休闲方式的一次调查中,共调查了124人,其中女性70人,男性54人,女性中有43人主要是看电视,另外27人主要是运动,男性中21人主要是看电视,另外33人主要是运动.(1)根据以上数据建立一个2×2的列联表;(2)能否在犯错误的概率不超过0.025的前提下认为“性别与休闲方式有关系”?。

高中数学 独立性检验和回归直线复习课说课稿 新人教A版选修2-3

高中数学 独立性检验和回归直线复习课说课稿 新人教A版选修2-3

独立性检验和回归直线一、教材分析和处理1.本节内容在教材中的地位和作用本节是新课标人教版高中数学课本选修2-3第三章《统计案例》中P79-P91的内容,是在学习了用样本估记总体、线性回归等基本知识的基础上,进一步讨论线性回归方法及其应用,并初步了解独立性检验的基本思想,认识统计方法在决策中的作用。

本节内容在近几年的高考试题中是屡见不鲜的,如2020年陕西选9,湖南选4,安徽解20等等,因而是高考中的热点之一。

2.教学目标知识目标:(1)理解线性回归分析方法及应用;(2)理解独立性检验的基本思想及应用。

能力目标:(3)培养学生分析问题、解决问题的能力;相互探讨、合作交流、共同提高、团结协作的能力。

3.学情分析这节课是在学生对回归分析、独立性检验的基本思想有了初步的了解,对课本基础概念有了感性认识的基础上进行巩固加深的。

要想深刻理解,灵活运用,需要进行全面复习。

根据《新课标》的要求,以学生为主体,充分调动学生在课堂上的积极性,运用多媒体,加大直观性和容量,提高学习效率。

二、教法本课教法以启发式教学法和合作探究法为主,因为在教学中要突出学生的主体地位,培养学生的自主意识和合作意识为根本,整个过程师生互动,学生为主体,教师为主导,共同参与;教师启发、引导、巡查、点拔,充分调动学生的积极性,教学过程采用多媒体展示、多黑板演示,多学生讲解,将教师提供的习题分组完成,重点强化,难点突破,营造活跃的课堂气氛,使课堂成为学生展示的舞台,成功表现自我;各小组成员分工协作,积极动手实践,学习热情高涨,合作探究意识明显增强,打造高效课堂。

三、学法新课程理念是“以学生的发展为核心”,在学习过程中始终让他们自主学习,成为学习的主人,将全班学生分成六个小组各自下达学习任务,既明确分工,又互相合作;完成任务,积极演示,全班互动,共同提高。

组内由组长引领,组员互学,互相借鉴,成果共享。

四、教学过程设计这节课以教师为主导,学生活动为主线,分为导入——展示学习目标——探究学习——反馈练习——学生小结等几个环节。

高中数学 3.2 独立性检验的基本思想及其初步应用学案 新人教A版选修2-3(2021年整理)

高中数学 3.2 独立性检验的基本思想及其初步应用学案 新人教A版选修2-3(2021年整理)

2016-2017学年高中数学3.2 独立性检验的基本思想及其初步应用学案新人教A版选修2-3编辑整理:尊敬的读者朋友们:这里是精品文档编辑中心,本文档内容是由我和我的同事精心编辑整理后发布的,发布之前我们对文中内容进行仔细校对,但是难免会有疏漏的地方,但是任然希望(2016-2017学年高中数学3.2 独立性检验的基本思想及其初步应用学案新人教A版选修2-3)的内容能够给您的工作和学习带来便利。

同时也真诚的希望收到您的建议和反馈,这将是我们进步的源泉,前进的动力。

本文可编辑可修改,如果觉得对您有帮助请收藏以便随时查阅,最后祝您生活愉快业绩进步,以下为2016-2017学年高中数学3.2 独立性检验的基本思想及其初步应用学案新人教A版选修2-3的全部内容。

3.2 独立性检验的基本思想及其初步应用1.了解分类变量、2×2列联表、随机变量K2的意义.2.通过对典型案例的分析,了解独立性检验的基本思想方法.(重点)3.通过对典型案例的分析,了解两个分类变量的独立性检验的应用.(难点)[基础·初探]教材整理1 列联表和等高条形图阅读教材P91~P94,完成下列问题.1.分类变量和列联表(1)分类变量变量的不同“值"表示个体所属的不同类别,像这样的变量称为分类变量.(2)列联表①定义:列出的两个分类变量的频数表称为列联表.②2×2列联表一般地,假设有两个分类变量X和Y,它们的取值分别为{x1,x2}和{y1,y2},其样本频数列联表(称为2×2列联表)为y 1y2总计x1a b a+bx2c d c+d总计a+c b+d a+b+c+d2。

等高条形图(1)等高条形图与表格相比,更能直观地反映出两个分类变量间是否相互影响,常用等高条形图展示列联表数据的频率特征.(2)观察等高条形图发现aa+b和错误!相差很大,就判断两个分类变量之间有关系.1.下面是2×2列联表:y 1y2总计x1a2173x222527总计b46则表中a,b的值分别为【解析】∵a+21=73,∴a=52.又∵a+2=b,∴b=54.【答案】52 542.下面的等高条形图可以说明的问题是________(填序号).图3。

高中数学 独立性检验与回归分析教案 文 新人教A版选修2-3

高中数学 独立性检验与回归分析教案 文 新人教A版选修2-3

回归分析与独立性检验教材分析(一)地位与作用:本节课是一节高三文科复习课,复习内容为新课标人教版高中数学课本选修1-2第一章《统计案例》p1-19页的内容,是在《必修3》概率统计的基础上,通过研究一些典型案例进一步介绍回归分析、独立性检验的基本思想、方法及初步应用。

(二)学情分析:1、学生已经初步掌握概率统计的相关知识;2、学生已经具备了一定的抽象思维能力和演绎推理能力;3、学生整体基础比较薄弱,但求学意识浓厚,高考压力大。

目标分析通过对典型案例的探究,了解回归与独立性检验的基本思想、方法及其初步应用。

(一)教学目标:1、了解回归的基本思想、方法及其简单应用。

2、了解独立性检验(只要求列联表)的基本思想、方法及其简单应用。

(二)重点难点:重点是了解回归分析的方法步骤,独立性检验的基本思想及实施步骤;难点是独立性检验的基本思想及K2的含义。

(三)情感态度与价值观:教材案例典型,方案设计、数据的处理与分析、结论的形成主要通过学生的自主研究来完成,强化了学生的相互协作、合作交流的能力。

知识体系构建本节内容重在线性相关和列联表,最终体现在应用。

教法分析、学法分析(一)教法分析:基于本节课的内容特点和高三学生的年龄特征,在本节课中我采用启发式教学法和合作探究法,突出学生的主体地位,培养学生的自主意识和合作意识。

1、从学生熟悉的实际问题引入课堂,创设情境,引导学生温故知新。

尤其注重以典型案例引领学生探索、发现、掌握方法。

2、教师介绍高考要求和最新动态,学生相互补充复习要点,以起到明确目标、互动交流的作用。

3、合理安排例题讲解与习题巩固,以达到精讲多练、以练为主的目的。

4、合理采用多媒体手段,扩容增效,强化教学效果。

(二)学法分析:学习过程始终贯穿自主学习,通过分组协作,分工配合,协同完成学习。

教学过程分析一、考纲解读1、会作两个变量的散点图,判断两变量之间是否具有相关关系;2、了解最小二乘法的思想,能根据给出的线性回归方程系数公式建立线性回归方程;3、了解常见的统计方法,并能应用这些方法解决一些常见问题:①了解独立性检验(只要求列联表)的基本思想、方法及其简单应用;②了解回归的基本思想、方法及其简单应用.③了解假设检验的基本思想、方法及其简单应用.二、高考预测近几年全国高考个别省市对本部分内容考查有加强趋势,大部分地区以容易题为主。

高中数学 独立性检验的基本思想及其初步应用教案 新人教A版选修2-3

高中数学 独立性检验的基本思想及其初步应用教案 新人教A版选修2-3

独立性检验的基本思想及其初步应用(共计3课时)一、教学内容与教学对象分析通过典型案例,学习下列一些常用的统计方法,并能初步应用这些方法解决一些实际问题。

①通过对典型案例(如“患肺癌与吸烟有关吗”等)的探究。

了解独立性检验(只要求2×2列联表)的基本思想、方法及初步应用。

②通过对典型案例(如“人的体重与身高的关系”等)的探究,了解回归的基本思想、方法及其初步应用。

二. 学习目标1、知识与技能通过本节知识的学习,了解独立性检验的基本思想和初步应用,能对两个分类变量是否有关做出明确的判断。

明确对两个分类变量的独立性检验的基本思想具体步骤,会对具体问题作出独立性检验。

2、过程与方法在本节知识的学习中,应使学生从具体问题中认识进行独立性检验的作用及必要性,树立学好本节知识的信心,在此基础上学习三维柱形图和二维柱形图,并认识它们的基本作用和存在的不足,从而为学习下面作好铺垫,进而介绍K的平方的计算公式和K的平方的观测值R 的求法,以及它们的实际意义。

从中得出判断“X与Y有关系”的一般步骤及利用独立性检验来考察两个分类变量是否有关系,并能较准确地给出这种判断的可靠程度的具体做法和可信程度的大小。

最后介绍了独立性检验思想的综合运用。

3、情感、态度与价值观通过本节知识的学习,首先让学生了解对两个分类博变量进行独立性检验的必要性和作用,并引导学生注意比较与观测值之间的联系与区别,从而引导学生去探索新知识,培养学生全面的观点和辨证地分析问题,不为假想所迷惑,寻求问题的内在联系,培养学生学习数学、应用数学的良好的数学品质。

加强与现实生活相联系,从对实际问题的分析中学会利用图形分析、解决问题及用具体的数量来衡量两个变量之间的联系,学习用图形、数据来正确描述两个变量的关系。

明确数学在现实生活中的重要作用和实际价值。

教学中,应多给学生提供自主学习、独立探究、合作交流的机会。

养成严谨的学习态度及实事求是的分析问题、解决问题的科学世界观,并会用所学到的知识来解决实际问题。

[精品]新人教A版选修2-3高中数学3.2.1独立性检验的基本思想及其初步应用优质课教案

[精品]新人教A版选修2-3高中数学3.2.1独立性检验的基本思想及其初步应用优质课教案

3. 2.1独立性检验的基本思想及其初步应用教学目标(1)通过对典型案例的探究,了解独立性检验(只要求22 列联表)的基本思想、方法及初步应用;(2)经历由实际问题建立数学模型的过程,体会其基本方法。

教学重点:独立性检验的基本方法教学难点:基本思想的领会及方法应用教学过程一、问题情境5月31日是世界无烟日。

有关医学研究表明,许多疾病,例如:心脏病、癌症、脑血管病、慢性阻塞性肺病等都与吸烟有关,吸烟已成为继高血压之后的第二号全球杀手。

这些疾病与吸烟有关的结论是怎样得出的呢?我们看一下问题:某医疗机构为了了解肺癌与吸烟是否有关,进行了一次抽样调查,共调查了9965个人,其中吸烟者2148人,不吸烟者7817人。

调查结果是:吸烟的2148人中有49人患肺癌,2099人未患肺癌;不吸烟的7817人中有42人患肺癌,7775人未患肺癌。

问题:根据这些数据能否断定“患肺癌与吸烟有关”?二、学生活动(1)引导学生将上述数据用下表(一)来表示:(即列联表)在不吸烟者中,有427817 ≈0.54%的人患肺癌;在吸烟的人中,有492148≈2.28%的人患肺癌。

问题:由上述结论能否得出患肺癌与吸烟有关?把握有多大? 三、建构数学1、从问题“吸烟是否与患肺癌有关系”引出独立性检验的问题,借助样本数据的列联表,柱形图和条形图的展示,使学生直观感觉到吸烟和患肺癌可能会有关系。

但这种结论能否推广到总体呢?要回答这个问题,就必须借助于统计理论来分析。

2、独立性检验:(1)假设0H :患肺癌与吸烟没有关系。

即:“吸烟与患肺癌相互独立”。

用A 表示不吸烟,B 表示不患肺癌,则有P(AB)=P(A)P(B)若将表中“观测值”用字母代替,则得下表(二):学生活动:让学生利用上述字母来表示对应概率,并化简整理。

思考交流:||ad bc -越小,说明患肺癌与吸烟之间的关系越 (强、弱)?(2)构造随机变量22()()()()()n ad bc K a b c d a c b d -=++++(其中n a b c d =+++)由此若0H 成立,即患肺癌与吸烟没有关系,则K 2的值应该很小。

全国高中数学优质课:3.2 独立性检验的基本思想 教学设计(人教版选修2-3)

全国高中数学优质课:3.2 独立性检验的基本思想 教学设计(人教版选修2-3)

全国高中数学优质课课例:独立性检验的基本思想及初步应用教材选择:人教A版选修2—3第三章第二节教学设计一、内容和内容解析1.内容独立性检验的基本思想及初步应用2.内容解析本节课分为3个课时,这是第一课时的新授课.是学生已经经历了通过形、数这两方面研究一组变量的概率分布后,继续用形、数这两方面来研究两组变量之间是否有关系,以及它们之间有关系的可信度.先由“吸烟有害健康”的视频引入,在对学生进行健康教育的同时,创设了问题情景,引出了要研究的问题——吸烟与患肺癌两个分类变量是否有关系;然后分析列联表和等高条形图得到直观判断:吸烟与患肺癌有关系,接着通过科学的数据计算给出了吸烟与患肺癌有关系及其可信度,这种从直观感知到科学论证的过程符合数学上研究问题的一般方法;最后根据具体问题归纳、类比得到“判断两个分类变量有关系”的理论依据和实施方法,体现了从特殊到一般的数学思想.独立性检验是在学生学习了小概率事件,事件的独立性等概率知识的基础上,用以检验两个分类变量是否有关系的一种统计学方法,本节课的重点是独立性检验的统计学原理.二、目标和目标解析1.目标(1)了解22列联表的含义;(2)理解独立性检验的基本思想;K的值对两个分类变量是否有关系作出判断.(3)会用22.目标解析(1)通过实际问题设问并让学生思考两个分类变量频数的表示方法,然后直接给出列联表,并对表格数据进行解释.(2)通过图形分析,简单的数据计算得到吸烟与患肺癌有关系的直观判断, 又因统计数据的随机性提出质疑,为了解决这个疑问,先假设吸烟与患肺癌没有关系成立,以事件的独立性为理论基础,构造了一个随机变量2K ,若在假设成立的条件下,有小概率事件发生,就可以否定假设,认为吸烟与患肺癌有关系.这类似于数学证明方法中的反证法.(3)由表格中的观测数据计算2K 的观测值k ,利用该值建立一个判断两个分类变量是否成立的规则:确定一个临界值0k ,当0k k ≥时就认为两个分类变量有关系;当0k k <时,就认为两个分类变量之间没关系.三、教学问题诊断分析独立性检验作为检验两个分类变量是否有关系的统计学方法,是全新的知识,所以学生会有以下困惑:(1)对假设0H :吸烟与患肺癌没有关系的作用提出质疑;(2)随机变量2K 的构建基础;(3)如何利用2K 的观测值以及2K 的概率分布表对两个分类变量之间是否有关系和可信度作出判断.四、教学条件支持根据本节课的特点,为了使学生快速进入问题情境,使用吸烟影响健康的视频引入新课,为了使学生更加直观的感知吸烟与患肺癌有关系,用excel 表格现场作等高条形图.五、教学过程分析(一)创设情境多媒体课件展示吸烟有害健康的视频.设计意图:以视频进行情景引入,不仅调动了学生的积极性,同时又紧扣主题,为本节课的学习进行了方法上的准备.(二)案例探究1.展示案例,列出变量频数值.设计意图:引入列联表以及列联表的概念,并通过列联表的观测数据初步感知吸烟与患肺癌有关系.2.用excel 表格作等高条形图.设计意图:等高条形图所展现频率特征,能更直观的体现吸烟与患肺癌有关系.3.在吸烟与患肺癌没有关系的前提下,探究,,,a b c d 之间的关系.设计意图:为下一步独立性检验作铺垫.4.假设0H :吸烟与患肺癌没有关系成立.设计意图:在0H 成立的条件下,可得事件相互独立,从而得到ad bc ≈,与3中的结果不谋而合,也为随机变量2K 出现与应用奠定了前提基础.5.设置问题:||ad bc -的大小与两个分类变量之间关系强弱的判定.设计意图:为2K 的出现以及应用作铺垫.6.介绍随机变量2K ,把0H 成立时ad bc ≈,转化为2K 的观测值很小.设计意图:为下一步两个分类变量之间是否有关系的判断规则做准备.7.计算2K 的观测值56.632k ≈.设计意图:让学生进一步强化0H 成立时2K 的观测值很小.故根据计算数据,可以否定0H .8.给出2K 的概率分布表,并加以解释.设计意图:使2( 6.635)0.01P K ≥≈的出现更加顺利成章.9.提问、讨论、解释2( 6.635)0.01P K ≥≈所体现的统计学含义设计意图:使学生明白两点:第一点:在0H 成立的条件下,2( 6.635)0.01P K ≥≈,是个小概率事件,所以由统计学知识可知,当2 6.635K ≥发生时,就能有足够的理由否定0H ,也就是认为吸烟与患肺癌有关系;第二点:2( 6.635)0.01P K ≥≈的含义为:“0H 成立”的概率不足0.01;或是判断“0H 不成立犯错”的概率不超过0.01.10.老师引导学生总结探究案例的解决过程:计算2K 的观测值k →判断规则:当 6.635k ≥时,判断0H 成立;当 6.635k <时,判断0H 不成立;→得到结论:把“0H 成立”错判成“0H 不成立”的概率不会超过2( 6.635)0.01P K ≥≈.设计意图:对具体问题做出总结是为了方便将特殊推广到一般,得到判断“两个分类变量有关系”的方法,进而得到独立性检验的定义.(三)总结提升分以下3个环节完成.1.陈述独立性检验的统计学原理:要判断“两个分类变量有关系”,首先假设该结论不成立,即0H :吸烟与患肺癌没有关系成立.在该假设下,我们所构造的2K 的值应该很小,如果2K 的观测值k 很大,断言0H 不成立;如果2K 的观测值k 很小,断言0H 成立.2.学生思考、讨论,将判断吸烟与患肺癌有关系的方法推广到一般.3.总结点题:以上利用随机变量2K 来判断“两个分类变量有关系”的方法称为独立性检验.设计意图: 使学生在探究案例中初步了解独立性检验的基础上,进一步加深对独立性检验的统计学原理以及独立性检验的一般方法的理解.(四)课堂练习例1.某高校“统计初步”课程的教师随机调查了选该课程的一些学生的情况,具体数据如下表.为了检验主修统计专业是否与性别有关系,根据表中的数据,得到:因为2K 的观测值 3.841k ≥,所以断定主修统计专业与性别有关系,这种判断出错的概率不超过_______.. 参考值表:设计意图:使学生会根据2K 的观测值以及参考值表对两个分类变量之间有关系的可信度做出判定.(五)课堂小结这节课你有什么收获?有什么疑惑?学生活动:学生发言交流自己的收获,其他同学补充.师:本节课我们从形、数两个方面研究了两组变量之间是否有关系.首先通过列联表和等高条形图,我们得到吸烟与患肺癌有关系的直观判断,又用以事件的独立性为背景的数据计算得到了吸烟与患肺癌有关系及其可信度的确定,然后从特殊到一般总结出判断两个分类变量有关系的方法,并给出独立性检验的定义.设计意图:通过本环节,进一步强调知识重点的前提下,继续培养学生的数形结合数学意识,从特殊到一般的推理能力,从直观感知到严谨推理科学方法.(七)作业布置思考一下两个问题:1.反证法原理与独立性检验原理的区别与联系;2.尝试归纳独立性检验的一般步骤.设计意图:通过作业在巩固已学知识的基础上,对下节课内容作出预习.250(1320107)23272030 4.844k ⨯-⨯⨯⨯⨯=≈。

【推荐下载】高中数学3.2独立性检验(1)教案新人教A版选修2-3

【推荐下载】高中数学3.2独立性检验(1)教案新人教A版选修2-3

福建省漳州市芗城中学高中数学 3.2 独立性检验(1)教案新人教A版选修2-3课题:第课时总序第个教案课型:新授课编写时时间:年月日执行时间:年月日教学目标:(1)通过对典型案例的探究,了解独立性检验(只要求22列联表)的基本思想、方法及初步应用;(2)经历由实际问题建立数学模型的过程,体会其基本方法.教学重点:独立性检验的基本方法是重点.基本思想的领会及方法应用是难点.教学难点:独立性检验的基本方法是重点.基本思想的领会及方法应用是难点.教学用具:多媒体教学方法:经历由实际问题建立数学模型的过程,体会其基本方法.教学过程:一.问题情境5月31日是世界无烟日。

有关医学研究表明,许多疾病,例如:心脏病、癌症、脑血管病、慢性阻塞性肺病等都与吸烟有关,吸烟已成为继高血压之后的第二号全球杀手。

这些疾病与吸烟有关的结论是怎样得出的呢?我们看一下问题:1.某医疗机构为了了解呼吸道疾病与吸烟是否有关,进行了一次抽样调查,共调查了515个成年人,其中吸烟者220人,不吸烟者295人.调查结果是:吸烟的220人中有37人患呼吸道疾病(简称患病),183人未患呼吸道疾病(简称未患病);不吸烟的295人中有21人患病,274人未患病.问题:根据这些数据能否断定“患呼吸道疾病与吸烟有关”?二.学生活动为了研究这个问题,(1)引导学生将上述数据用下表来表示:患病未患病合计吸烟37om]183 220不吸烟21 274 295合计58 457 515(2)估计吸烟者与不吸烟者患病的可能性差异:在吸烟的人中,有3716.82%220的人患病,在不吸烟的人中,有217.12%295的人患病.问题:由上述结论能否得出患病与吸烟有关?把握有多大?三.建构数学1.独立性检验:(1)假设H:患病与吸烟没有关系.若将表中“观测值”用字母表示,则得下表:患病未患病合计吸烟a b b a 不吸烟c d d c合计cadbdcba(近似的判断方法:设nabcd ,如果0H 成立,则在吸烟的人中患病的比例与不吸烟的人中患病的比例应差不多,由此可得a c abc d,即()()0a c d c a b ad bc ,因此,||ad bc 越小,患病与吸烟之间的关系越弱,否则,关系越强.)设na bc d ,在假设0H 成立的条件下,可以通过求“吸烟且患病”、“吸烟但未患病”、“不吸烟但患病”、“不吸烟且未患病”的概率(观测频率),将各种人群的估计人数用,,,,a b c d n 表示出来.例如:“吸烟且患病”的估计人数为()a b a cn P AB n nn ;“吸烟但未患病”的估计人数为()a bb d nP AB nn n ;“不吸烟但患病”的估计人数为()c d a cn P AB nn n ;“不吸烟且未患病”的估计人数为()c db dn P AB nn n.如果实际观测值与假设求得的估计值相差不大,就可以认为所给数据(观测值)不能否定假设0H .否则,应认为假设0H 不能接受,即可作出与假设0H 相反的结论.(2)卡方统计量:为了消除样本对上式的影响,通常用卡方统计量(χ22()观测值预期值预期值)来进行估计.卡方χ2统计量公式:χ222a b a c a b b d a nb n n n n n a b ac a b bd nnnn nn22c da c c db dc nd nn n n n c d a c c d b d nnnnn n。

数学人教A版选修2-3教案:3.2独立性检验的基本思想及其初步应用第二课时 Word版含解析

数学人教A版选修2-3教案:3.2独立性检验的基本思想及其初步应用第二课时 Word版含解析

第二课时教学目标 知识与技能 通过实例,让学生了解独立性检验的基本思想及其初步应用,能对两个分类变量是否有关做出明确的判断,会对具体问题做出独立性检验.过程与方法经历概念的探索、反思、建构这一过程,让学生进一步体会独立性检验思想的基本原理,培养学生归纳、概括等合情推理能力.通过实际应用,培养学生把实际问题抽象成数学问题的能力和学以致用的数学应用意识.情感、态度与价值观通过创设情境激发学生学习数学的兴趣,培养其严谨治学的态度.在学生分析问题、解决问题的过程中培养其积极探索的精神,从而实现自我的价值.重点难点教学重点:独立性检验基本思想的初步应用; 教学难点:对独立性检验基本思想的理解.教学过程引入新课有甲、乙两个班级进行数学考试,按学生考试及格和不及格统计成绩后,得到如下列联表:试判断成绩不及格与班级是否有关?学生活动:回顾上一节课的学习内容,选择合适的方法进行判断.学情预测:根据列联表可知甲班学生中不及格的比例为1045,乙班学生中不及格的比例为745,相差345;画出等高条形图:有的学生可能说有关系,因为从等高条形图来看,可以发现甲、乙两班的及格率有明显差异;有的学生可能会说没有关系,因为不及格率相差345,应该不算大,所以说及格与班级没有关系.教师:由上面的问题可以看出,虽然利用图表来判断两个分类变量是否有关比较直观,但缺少精确性和可靠性,如何精确地刻画两个分类变量的有关性,我们必须找到一个进行精确判断的方法.设计意图:充分认识独立性检验的必要性,创设悬念,激发斗志,让学生跃跃欲试. 探究新知提出问题:为了解决上面的问题,我们可以先假设H 0:不及格与班级无关.设A 表示事件“在甲班”,B 表示事件“不及格”,AB 表示“在甲班且不及格”,则“不及格与班级无关”等价于事件A 与B 相互独立,则有P(AB)=P(A)P(B),否则,应该有A 与B 不独立,即“不及格与班级有关”.那么,如何验证P(AB)=P(A)P(B)呢?学生活动:学生先独立思考,然后分小组讨论,老师加以适当的引导.学情预测:根据概率的统计定义可知,上面各个事件的概率可以用相应的频率来估计,则P(A)=4590=12,P(B)=1790,P(A)P(B)=17180,P(AB)=1090=19=20180,因为P(AB)≠P(A)P(B),故A 与B 不独立,即“不及格与班级有关”.提出问题:由P(AB)≠P(A)P(B)一定有“不及格与班级有关”吗?如果不是,那么如何根据P(A),P(B),P(AB)的值来判断其相关性?学生活动:小组协作讨论,然后说出对这个问题的认识.学情预测:P(AB)≠P(A)P(B)不一定有“不及格与班级有关”,因为在数据上我们是采用频率来估计概率,另外,在实际问题中我们也仅是用样本来估计总体,这些因素都会造成数值上的偏差.但是,应该肯定的是P(AB)与P(A)P(B)越接近,A 与B 独立的可能性就越大,即“不及格与班级有关”的可能性就越小.设计目的:通过实例的分析,为引入和理解独立性检验的基本思想做好铺垫. 理解新知令n =a +b +c +d ,如何判断不及格与班级是否有关系?试加以说明.学生活动:分组讨论,协作完成,教师引导学生类比上面的分析过程,将数字换成字母加以说明.学情预测:假设H 0:不及格与班级无关.设A 表示事件“在甲班”,B 表示事件“不及格”,AB 表示“在甲班且不及格”,则P(A)=a +b n ,P(B)=a +c n ,P(A)P(B)=a +b n ×a +c n ,P(AB)=an ,若“不及格与班级无关”,则a +b n ×a +c n 与an应非常接近. 教师:若a +b n ×a +c n 与a n 非常接近,则a +b n ×a +c n ≈an ,从而ad≈bc ,因此||ad -bc 越小,说明不及格与班级的关系越弱,||ad -bc 越大,说明不及格与班级的关系越强.而且我们还可以发现,当a +b n ×a +c n 与a n 非常接近时,a +b n ×b +d n 与b n 也应该非常接近…或者说(a n -a +b n×a +c n )2,(b n -a +b n ×b +d n )2,(c n -c +d n ×a +c n )2,(d n -c +d n ×b +d n)2应该比较小,从而(a n -a +b n ×a +c n )2a +b n ×a +c n +(b n -a +b n ×b +d n )2a +b n ×b +d n +(c n -c +d n ×a +c n )2c +d n ×a +c n +(d n -c +d n ×b +d n)2c +d n ×b +dn =n(ad -bc)2(a +b)(a +c)(b +d)(c +d)也应该很小.构造随机变量K 2=n(ad -bc)2(a +b)(a +c)(b +d)(c +d),若H 0成立,即“不及格与班级无关”,则K 2应该很小.在H 0成立的情况下,统计学家估算出如下的概率P(K 2≥6.635)≈0.01.即在H 0成立的情况下,K 2的观测值大于6.635的概率非常小,近似于0.01,也就是说,在H 0成立的情况下对随机变量K 2进行多次观测,观测值超过6.635的频率约为0.01.从而,也说明我们把“H 0成立”错判成“H 0不成立”的概率不会超过0.01.这样,我们就可以通过计算K 2的观测值k 来判断H 0是否成立.我们把这种方法称为独立性检验.提出问题:独立性检验的基本思想是什么?学生活动:反思上面的过程,进行归纳总结,然后小组间交换意见.学情预测:独立性检验的基本思想是:要判断“两个分类变量有关系”这一结论的可信程度,首先假设结论不成立,即假设“两个分类变量没有关系”成立,在该假设下构造的随机变量K 2应该很小.如果由观测数据计算得到的K 2的观测值k 很大,则在一定程度上说明假设不合理,即认为“两个分类变量有关系”;如果观测值k 很小,则说明在样本数据中没有发现足够证据拒绝H 0.独立性检验的基本思想类似于反证法.教师:当确定“两个分类变量有关系”的可信程度时,需要确定一个正数k 0与随机变量K 2的观测值k 比较大小,如果k≥k 0,就认为“两个分类变量之间有关系”,否则就认为“两个分类变量之间没有关系”.我们称这样的k 0为一个判断规则的临界值.按照这种规则,把“两个分类变量之间没有关系”错误地判断为“两个分类变量有关系”的概率不超过P(K 2≥k 0).独立性检验的具体做法是:(1)根据实际问题的需要确定容许推断“两个分类变量有关系”犯错误概率的上界α,然后查表确定临界值k(2)利用公式计算K 的观测值k.(3)如果k≥k 0,就推断“X 与Y 有关系”,这种推断犯错误的概率不超过α;否则,就认为在犯错误的概率不超过α的前提下不能推断“X 与Y 有关系”,或者在样本数据中没有发现足够证据支持结论“X 与Y 有关系”.设计目的:以问题为驱动,引领学生在积极的思考、探究中,理解独立性检验的基本思想,理解随机变量K 2的构造过程.运用新知提出问题:根据独立性检验的基本思想,判断“不及格与班级是否有关”? 学生活动:类比公式,用计算器进行运算比较.活动结果:由题意知a =10,b =35,c =7,d =38,a +b =45,c +d =45,a +c =17,b +d =73,n =90.代入公式得K 2的观测值为:k =n(ad -bc)2(a +b)(a +c)(b +d)(c +d)=90×(10×38-7×35)245×45×17×73≈0.65.因为0.65>0.455,所以我们在犯错误的概率不超过0.5的前提下可认为“不及格与所在班级有关”.设计目的:通过问题的解决,既照应了开头提出的问题,同时也是对公式应用的一个巩固.【变练演编】题为了探究吸烟习惯与患慢性气管炎是否有关,调查了339名50岁以上的人,获数据如下:分析:根据公式求出随机变量K 2的观测值k ,然后和已知结论数值进行比较. 解:根据列联表的数据得到K 2的观测值:k =n(ad -bc)2(a +b)(a +c)(b +d)(c +d)=339×(43×121-162×13)2205×56×283×134≈7.469>6.635,所以,在犯错误的概率不超过0.01的前提下认为“吸烟习惯与患慢性气管炎有关”.提出问题:请解答下列问题: 1.已知两个分类变量X 与Y ,你有哪些办法判断它们是否有关系?(把你知道的办法都写出来)2.已知K 2的观测值 k =6.635,你能得到哪些结论?(把你能得到的结论都写出来) 活动设计:学生先独立探索,允许互相交流成果.然后全班交流. 学情预测:1.列联表、等高条形图、独立性检验等.2.P(K 2≥6.635)≈0.01;我们判断“X 与Y 有关系”的出错概率不超过0.01;在犯错误的概率不超过0.01的前提下,可以认为“X 与Y 有关系”.设计意图:设置本组开放性问题,旨在增加问题的多样性、有趣性、探索性和挑战性,训练学生思维的发散性、收敛性、灵活性和深刻性,长期坚持,不仅会加深学生对数学的理解、掌握,而且会潜移默化地学会编题、解题.课堂小结(给学生1~2分钟的时间泛读教材,用精确的语言概括本节的知识脉络、思想方法、解题规律)1.独立性检验的思想方法以及它与反证法的关系. 2.独立性检验的一般操作步骤. 设计意图:让学生自己小结,这是一个多维整合的过程,是一个高层次的自我认识过程. 补充练习 【基础练习】1.下面说法正确的是( )A .统计方法的特点是统计推断准确、有效B .独立性检验的基本思想类似于数学上的反证法C .任何两个分类变量有关系的可信度都可以通过查表得到D .不能从等高条形图中看出两个分类变量是否相关2.经过对K 2的统计量的研究,得到了若干个临界值,当K 2的观测值k >3.841时,我们()A.在犯错误的概率不超过0.05的前提下可认为A与B有关B.在犯错误的概率不超过0.05的前提下可认为A与B无关C.在犯错误的概率不超过0.01的前提下可认为A与B有关D.没有充分理由说明事件A与B有关系3.利用独立性检验来考虑两个分类变量与是否有关系时,通过查阅下表来确定“X和YA.99%B.1%C.5%D.97.5%4.独立性检验所采用的思路是:要研究A,B两类分类变量是否彼此相关,首先假设这两类变量彼此__________,在此假设下构造随机变量K2,如果K2的观测值较大,那么在一定程度上说明假设__________.答案:1.B 2.A 3.B 4.无关不成立【拓展练习】5.某聋哑研究机构,对聋哑关系进行抽样调查,在耳聋的657人中有416人哑,而另外不聋的680人中有249人哑,你能运用这组数据判断,在犯错误的概率不超过0.1%的前提下,能否认为聋哑有关系?解:根据题目所给数据,得到如下列联表:根据列联表数据得到K2的观测值K=1 337×(416×431-249×241)2665×672×657×680≈95.29>10.828,∴在犯错误的概率不超过0.1%的前提下,可以认为聋哑有关系.设计说明本设计以问题驱动为指导,通过不断提出问题、研究问题、解决问题,使学生获得知识,完成教学.以学生熟悉的例子为载体,引导他们提炼、概括独立性检验的方法,自然合理地提出问题,让学生体会“数学来源于生活”.创造和谐积极的学习气氛,让学生通过直观感知、观察分析,形成由浅入深、由易到难、由感性到理性的思维飞跃,并借助例题具体说明在数学发现的过程中应用假设检验的过程.备课资料假设检验与反证法独立性检验的基本思想是假设检验,假设检验类似于反证法,但二者是不同的.下表列出了二者之间的关系:利于H1的小概率事件的发生代替了反证法中的矛盾;其二是假设检验中接受原假设的结论相当于反证法没有找到矛盾.(设计者:杨雪峰田宗臣)。

高中数学人教A版 选修2-3 3.1.2回归分析的基本思想及其初步应用 教案

高中数学人教A版 选修2-3 3.1.2回归分析的基本思想及其初步应用 教案

3.1回归分析的基本思想及其初步应用(2课时)一、教学目标(一)必备知识:能根据散点分布特点,建立不同的回归模型(二)关键能力:知道有些非线性模型通过变换可以转化为线性回归模型;通过散点图及相关指数比较不同模型的拟合效果.(三)学科素养通过学科教育能给学生终身发展数学运算、数学建模和数据分析的能力。

(四)核心价值:让学生探索、发现数学知识和掌握数学知识的内在规律的过程中不,不断获得成功积累愉快的体验,不断增进学习数学的兴趣,同时还通过探索这一活动培养学生善于和他人合作的精神.二、生情分析:本节课是学生在必修模块《数学3》概率统计知识的基础上,进一步学习用统计方法解决实际问题,主要是通过对典型案例的讨论、解决,让学生初步了解独立性检验的基本思想和操作步骤,认识统计方法在决策中的作用,体验数学的科学价值、应用价值和文化价值.三、过程方法:通过将非线性模型转化为线性回归模型,使学生体会“转化”的思想;让学生经历数据处理的过程,培养他们对数据的直观感觉,体会统计方法的特点,认识统计方法的应用;通过使用转化后的数据,利用计算器求相关指数,使学生体会使用计算器处理数据的方法.四、重点难点:重点:通过探究使学生体会有些非线性模型运用等量变换、对数变换可以转化为线性回归模型;难点:如何启发学生“对变量作适当的变换(等量变换、对数变换)”,变非线性为线性,建立线性回归模型.五、教学用具:黑板、粉笔、多媒体;六、教学课时:1课时七、设计思路:教学模式:本课采用“探究——发现”教学模式.教师的教法:利用多媒体辅助教学,突出活动的组织设计与方法的引导.“抓三线”,即(一)知识技能线(二)过程与方法线(三)能力线.“抓两点”,即一抓学生情感和思维的兴奋点,二抓知识的切入点.学法:突出探究、发现与交流.八、教学过程 (一)创设问题情境我国是世界产棉大国,种植棉花是我国很多地区农民的主要经济来源,在棉花的种植过程中,病虫害的防治是棉农的一项重要任务,如果处置不当就会造成棉花的减产.其中红铃虫就是危害棉花生长的一种常见害虫,在1953年,我国18省曾发生红铃虫大灾害,受灾面积300万公顷,损失皮棉约二十万吨.如图就是红铃虫的有关图片:红铃虫喜高温高湿,适宜各虫态发育的温度为25~32 ℃,相对湿度为80%~100%,低于20 ℃和高于35 ℃卵不能孵化,相对湿度60%以下成虫不产卵.冬季月平均气温低于-4.8 ℃时,红铃虫就不能越冬而被冻死.为采取有效防治方法,有必要研究红铃虫的产卵数和温度之间的关系.现收集了红铃虫的产卵数y 和温度x 之间的7组观测数据列于下表:(1)试建立y 与x 之间的回归方程;并预测温度为28 ℃时产卵的数目. (2)你所建立的模型中温度在多大程度上解释了产卵数的变化? 学生活动:类比前面所学过的建立线性回归模型的步骤,动手实施. 活动结果:(1)画散点图:通过计算器求得线性回归方程:y ^=19.87x -463.73.当x =28 ℃时,y ^=19.87×28-463.73≈93,即温度为28 ℃时,产卵数大约为93. (2)进行回归分析计算得: R 2≈0.746 4,即这个线性回归模型中温度解释了74.64%产卵数的变化.设计目的:通过背景材料,加深学生对问题的理解,并明白“为什么要学”.体会问题产生于生活,并通过问题的解决复习建立回归模型的基本步骤.(二)探究新知提出问题:结合数据可以发现,随着自变量的增加,因变量也随之增加,气温为28 ℃时,估计产卵数应该低于66个,但是从推算的结果来看93个比66个却多了27个,是什么原因造成的呢?学生活动:分组合作讨论交流.学情预测:由于我们所建立的线性回归模型的相关指数约等于0.746 4,即解释变量仅能解释预报变量大约74.64%的变化,所占比例偏小.这样根据我们建立的模型进行预报,会存在较大的误差.我们还可以从残差图上分析一下我们所建立的回归模型的拟合效果:残差数据表:画出残差图根据残差图可以发现,残差点分布的带状区域较宽,并不集中,这表明我们所建立的回归模型拟合效果并不理想.之所以造成预报值偏差太大的原因是所选模型并不理想.实际上根据散点图也可以发现,样本点并没有很好地集中在一条直线附近,故变量之间不会存在很强的线性相关性.设计目的:引导学生对结果进行分析,从而发现存在的问题,激发好奇心、求知欲.同时培养学生对问题的洞悉能力,增强对结果的敏感自检能力.理解新知提出问题:如何选择合适的回归模型进行预测呢?学生活动:学生讨论,教师合理引导学生观察图象特征,联想学过的基本函数.学情预测:方案一:建立二次函数模型y=bx2+a.方案二:建立指数函数模型y=c1ac2x.提出问题:如何求出所建立的回归模型的系数呢?我们不妨尝试解决方案一中的系数.学生活动:分组合作,教师引导学生观察y=bx2+a与y=bx+a的关系.学情预测:通过比较,发现可利用t=x2,将y=bx2+a(二次函数)转化成y=bt+a(一次函数).求出x ,t ,y 间的数据转换表:利用计算器计算出y 和t 的线性回归方程:y ^=0.367t -202.54, 转换回y 和x 的模型:y ^=0.367x 2-202.54.当x =28 ℃时,y ^=0.367×282-202.54≈85,即温度为28 ℃时,产卵数大约为85. 计算相关指数R 2≈0.802,这个回归模型中温度解释了80.2%产卵数的变化. 提出问题:提出问题“如果选用指数模型,是否也能转换成线性模型,如何转化?” 学生活动:独立思考也可相互讨论.教师可启发学生思考“幂指数中的自变量如何转化为自变量的一次幂?”可引导学生回忆对数的运算性质以及指对数关系.学情预测:可利用取对数的方法,即在y =c 1ac 2x 两边取对数,得log a y =c 2x +log a c 1.提出问题:在上面的运算中,由于底数a 不确定,对于x 的值无法求出相应的log a y ,这时可取a =10时的情况,以便利用计算器进行计算,试求出回归模型.学生活动:合作协作,讨论解决. 学情预测:建立数据转换表:根据数据,可求得变量z 关于x 的回归方程:z ^=0.118x -1.665. 转换回y 和x 的模型:y ^=100.118x-1.665.当x =28 ℃时,y ^≈44,即温度为28 ℃时,产卵数大约为44.计算相关指数R 2≈0.985,这个回归模型中温度解释了98.5%产卵数的变化.提出问题:试选择合适的方法,比较方案一和方案二在数据拟合程度上的效果有什么不同? 学生活动:独立思考也可相互讨论,教师加以适当的引导提示. 活动结果:无论从图形上直观观察,还是从数据上分析,指数函数模型都是更好的模型.设计目的:引导学生进行不同模型的比较,体会“虽然任意两个变量的观测数据都可以用线性回归模型来拟合,但不能保证这种模型对数据的拟合效果最好,为更好地刻画两个变量之间的关系,要根据观测数据的特点来选择回归模型”.提出问题:由上面的分析可以看出,回归模型不一定是线性回归模型,对于非线性回归模型,我们的处理方法是什么?学生活动:独立思考,回顾上面的解决过程.学情预测:选用非线性回归模型时,一般思路是转化成线性回归模型,往往要用“等量变换、对数变换”等方法.设计目的:让学生整理建立非线性回归模型的思路.(三)应用巩固例1为了研究某种细菌繁殖个数y与时间x的关系,收集数据如下:试建立y与x之间的回归方程.思路分析:先画出散点图,根据散点图确定回归模型的类型,然后求y与x之间的回归方程.解:根据上表中的数据,作出散点图由图可以看出,样本点分布在某指数函数曲线y=c1ec2x的周围,于是令z=lny,则上表变换后如下:作出散点图从图中可以看出,变换后的样本点分布在某条直线附近,因此可用线性回归模型来拟合. 由表中数据可得,z 与x 之间的线性回归方程为z ^=0.69x +1.112, 则y 与x 之间的回归方程为y ^=e 0.69x+1.112.例2混凝土的抗压强度X 较易测定,其抗弯强度Y 不易测定,已知X 与Y 由关系式Y =AX b 表示,工程中希望由X 估算出Y ,以便应用.现测得一批对应数据如下:试求Y 对X 的回归方程.思路分析:题目中已经给出回归模型为Y =AX b 类型,故只要通过适当的变量置换把非线性回归方程转化为线性回归方程,然后再套用线性回归分析的解题步骤即可.解:对Y =AX b 两边取自然对数得:lnY =blnX +lnA ,做变换y =lnY ,x =lnX ,a =lnA ,则上述数据对应表格如下:根据公式可求得y ^=0.64x +0.017 2,则Y ^=e 0.64lnx +0.017 2=1.02X 0.64.变式1:若X 与Y 的关系由关系式Y ^=β^X b+α^表示,试根据给出的数据求Y 对X 的回归方程.活动设计:学生分组讨论,尝试解决. 活动成果:Y ^=0.086X +13.005.变式2:试选择合适的方法比较上述两种回归模型,相对于给出的数据哪一个的拟合效果更好? 活动成果:计算残差平方和与相关指数,对于模型Y =AX b,残差平方和Q ^(1)=9.819,相关指数R 21=0.930 4;对于模型Y ^=β^X b +α^,残差平方和Q ^(2)=12.306,相关指数R 22=0.908,故模型Y =AX b 的拟合效果较好.设计意图:熟悉判断回归模型拟合效果的方法. (四)达标检测1.相关指数R 2,残差平方和与模型拟合效果之间的关系是( ) A .R 2的值越大,残差的平方和越大,拟合效果越好 B .R 2的值越小,残差的平方和越大,拟合效果越好 C .R 2的值越大,残差的平方和越小,拟合效果越好 D .以上说法都不正确2.如果散点图的所有点都在一条直线上,则残差均为____________________,残差平方和为__________,相关指数为______________.答案:1.C 2.0 0 13.某种书每册的成本费Y 元与印刷册数x(千册)有关,经统计得到数据如下:检验每册书的成本费Y 元与印刷册数的倒数1x 之间是否有线性相关关系,如有,求出Y 对1x 的回归方程.解:把1x 置换为z ,则z =1x,从而z 与Y 的数据为:根据数据可得r≈0.999 8>0.75,故z 与Y 具有很强的线性相关关系. 所以b ^≈8.976,a ^≈1.120,从而y ^=8.976z +1.120.又z =1x ,所以y ^ =8.976x+1.120.(五)、小结1.数学知识:建立回归模型及残差图分析的基本步骤;非线性模型向线性模型的转换方法;不同模型拟合效果的比较方法:相关指数和残差的分析. 2.数学思想:数形结合的思想,化归思想及整体思想. 3.数学方法:数形结合法,转化法,换元法. (六)、作业 1.课时检测九、课后记本课时内容教材中只安排了一道关于“红铃虫”的例题,但是它却代表了一种“回归分析”的类型.如何利用这道例题使学生掌握这类问题的解决方法呢?为此,本课时设计了“引导发现、合作探究”的教学方法.首先展示“红铃虫”的背景资料来激发学生的学习兴趣;鼓励学生用已有知识解决问题,引导学生检查结果从而发现新问题;通过分组合作来对不同方案进行探索;使学生在合作探索的过程中体会“选择模型——将非线性转化成线性”的方法,体会“化未知为已知、用已知探索未知”思想,同时认识不同模型的效果.培养学生观察、类比联想以及分析问题的能力.在教学过程中让学生自主探索、动手实践,养成独立思考、积极探索的习惯.在“选模型”这个环节中,注意引导学生将散点分布和已学函数图象进行比较,从而发现二次函数和指数函数模型.在“转化”这个环节中,通过引导学生观察所选模型,联系已学知识选择“等量变换或对数变换”,从而找到转化的途径.在运算过程中,如求“相关指数”引导学生使用转化后的数据,利用计算器求其相关系数即为相关指数,使学生体会使用计算器处理数据的方法和技能.。

相关主题
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

回归分析与独立性检验教材分析(一)地位与作用:本节课是一节高三文科复习课,复习内容为新课标人教版高中数学课本选修1-2第一章《统计案例》p1-19页的内容,是在《必修3》概率统计的基础上,通过研究一些典型案例进一步介绍回归分析、独立性检验的基本思想、方法及初步应用。

(二)学情分析:1、学生已经初步掌握概率统计的相关知识;2、学生已经具备了一定的抽象思维能力和演绎推理能力;3、学生整体基础比较薄弱,但求学意识浓厚,高考压力大。

目标分析通过对典型案例的探究,了解回归与独立性检验的基本思想、方法及其初步应用。

(一)教学目标:1、了解回归的基本思想、方法及其简单应用。

2、了解独立性检验(只要求列联表)的基本思想、方法及其简单应用。

(二)重点难点:重点是了解回归分析的方法步骤,独立性检验的基本思想及实施步骤;难点是独立性检验的基本思想及K2的含义。

(三)情感态度与价值观:教材案例典型,方案设计、数据的处理与分析、结论的形成主要通过学生的自主研究来完成,强化了学生的相互协作、合作交流的能力。

知识体系构建本节内容重在线性相关和列联表,最终体现在应用。

教法分析、学法分析(一)教法分析:基于本节课的内容特点和高三学生的年龄特征,在本节课中我采用启发式教学法和合作探究法,突出学生的主体地位,培养学生的自主意识和合作意识。

1、从学生熟悉的实际问题引入课堂,创设情境,引导学生温故知新。

尤其注重以典型案例引领学生探索、发现、掌握方法。

2、教师介绍高考要求和最新动态,学生相互补充复习要点,以起到明确目标、互动交流的作用。

3、合理安排例题讲解与习题巩固,以达到精讲多练、以练为主的目的。

4、合理采用多媒体手段,扩容增效,强化教学效果。

(二)学法分析:学习过程始终贯穿自主学习,通过分组协作,分工配合,协同完成学习。

教学过程分析一、考纲解读1、会作两个变量的散点图,判断两变量之间是否具有相关关系;2、了解最小二乘法的思想,能根据给出的线性回归方程系数公式建立线性回归方程;3、了解常见的统计方法,并能应用这些方法解决一些常见问题:①了解独立性检验(只要求列联表)的基本思想、方法及其简单应用;②了解回归的基本思想、方法及其简单应用.③了解假设检验的基本思想、方法及其简单应用.二、高考预测近几年全国高考个别省市对本部分内容考查有加强趋势,大部分地区以容易题为主。

2012年高考,湖北省首次新课标高考,本部分试题难度应该会以中低档题为主,有可能在选择、填空题中考查。

三、课前演练1、下列说法中正确的是 ④⑤ (填序号) ①回归分析就是研究两个相关事件的独立性;②回归模型都是确定性的函数;③回归模型都是线性的;④回归分析的第一步是画散点图或求相关系数;⑤回归分析就是通过分析、判断,确定相关变量之间的内在的关系的一种统计方法. 2.下列说法中正确的是 ( A )①独立性检验的基本思想是带有概率性质的反证法;②独立性检验就是选取一个假设条件下的小概率事件,若在一次试验中该事件发生了,这是与实际推断相抵触的“不合理”现象,则作出拒绝的推断;③独立性检验一定能给出明确的结论.A. ①②B.①③C.②③D.①②③ 3.下列关于K 2的说法中,正确的是 ③①K 2在任何相互独立问题中都可以用于检验是否相关;②K 2越大,两个事件的相关性越大;③K 2是用来判断两个相互独立事件相关与否的一个统计量,它可以用来判断两个事件是否相关.【选题意图】回顾基础知识,唤醒记忆,进入状态。

(提问完成)四、重点强化1、相关检验的步骤:(1)作统计假设:x 与y 不具有线性相关关系;(2)根据小概率0.05与n-2在附表中查出r 的一个临界值r 0.05; (3)根据样本相关系数计算公式计算出r 的值;(4)作统计推断:若|r|>r 0.05,表明有95%的把握认为x 与y 之间具有线性相关关系;若|r|≤r 0.05,我们没有理由拒绝原来的假设,这时寻求回归直线方程是毫无意义的。

相关系数⎪⎭⎫ ⎝⎛-⎪⎭⎫ ⎝⎛--=∑∑∑===ni i ni i ni ii y n y x n x yx n yx r 1221221,r 具有以下性质:|r|≤1,并且|r|越接近1,线性相关程度越强;|r|越接近0,线性相关程度越弱。

2、回归方程: 最小二乘法:求回归直线使得样本数据的点到回归直线的距离的平方和最小的方法叫做最小二乘法。

回归方程:方程 =bx+a 是两个具有线性相关关系的变量的一组数据()()()n n y x y x y x ,,,,2211 的回归方程。

()()()x b y a xn xy x n yx xxyy x xb ni ini iini ini i i-=--=---=∑∑∑∑====︿︿,12211213、独立性检验的基本思想类似反证法。

(1)假设结论不成立,即“两个分类变量没有关系”. (2)在此假设下随机变量应该很小,如果由观测数据计算得到的观测值k 很大,则在一定程度上说明假设不合理.(3)根据随机变量K 2的含义,可以通过评价该假设不合理的程度,由实际计算出, 4、2×2列联表与卡方(K 2)构造变量K 2=()()()()()d b c a d c b a bc ad n ++++-2(其中n=a+b+c+d 为样本容量),用它的大小可以决定是否拒绝原来的统计假设H 0,如果算出的K 2值较大,就拒绝H 0,也就是拒绝“事件A 与B 无关”,从而就认为它们是有关的。

【设计意图】重点知识重点突破,由浅入深,循序渐进。

(师生协作完成)五、考点突破考点1:回归分析 经典例题:某校医务室抽查了10名学生在高一和高二时的体重(单位:kg )如下表:高一体重高二体重(1)利用相关系数r 判断与是否具有相关关系?ˆy(2)若与具有相关关系,试估计高一体重为78kg的学生在高二时的体重.【分析】:求回归直线方程和相关系数,通常用计算器完成。

在一些较专业的计算器中,可通过直接按键得到回归直线方程的系数和相关系数,而用普通计算器计算,则需先列出相应表格,有了表格中的相关数据,回归方程中的系数和相关系数都容易求出。

解:(1),. 由小概率0.05及查得∵, ∴与具有相关关系.(2) ,∴回归直线方程为:,当时,.即估计高一体重为78kg的学生在高二时的体重约为81kg.【选题意图】本题选材切合学生实际,解题过程包含有相关性判断,建立回归方程并进行预测的完整过程,是一个经典案例。

对应训练:已知10只小狗的血球体积及红血球的测量值如下(x(血球体积,mm3),y(血红球数,百万)):(1)画出上表的散点图; (2)求,,,;(3)由散点图判断能否用线性回归方程来刻画与之间的关系,若能,求出线性回归方程.解:(1)散点图如下图(2),(3)由散点图知:能用线性回归方程来刻画与之间的关系,设回归直线为∴线性回归方程为:【选题意图】此题简明易做,规范经典,适合学生巩固基础知识。

(本题由学生分组协作完成:全班学生分成六个小组,每个小组独立计算,组内分工协作,组长安排不同同学分别计算相关数据,鼓励学生经历系统的数据处理的全过程。

)考点二:独立性检验经典例题:在一次恶劣气候的飞机航程中,调查了男女乘客在飞机上晕机的情况:男乘客晕机的有24人,不晕机的有31人;女乘客晕机的有8人,不晕机的有26人。

请你根据所给数据判断是否在恶劣气候飞行中,男人比女人更容易晕机.解:根据题意,列出列联表如下:出统计假设,:在恶劣气候飞行中男人与女人一提样容易晕机则,故我们有90%的把握认为在这次航程中男人比女人更容易晕机.【选题意图】经典例题讲解,重现解题过程,帮助学生复习独立性检验的方法步骤。

课堂巩固:1、提出统计假设,计算出的值,则拒绝的是 ( A ) A.B.C.D.2、下列结论中,能表示变量具有线性相关关系的是 ③ ①②③④3、在对人们饮食习惯的一次调查中,共调查了124人,其中六十岁以上的70人,六十岁以下的54人,六十岁以上的人中有43人的饮食以蔬菜为主,另外27人则以肉类为主;六十岁以下的人中有21人饮食以蔬菜为主,另外33人则以肉类为主。

(1)根据以上数据建立一个2×2的列联表;(2)判断人的饮食习惯是否与年龄有关.【分析】:首先根据题目数据作出2×2列联表,然后根据表中数据算出K 2数值,据K 2值就可以推断一个人的饮食习惯是否与年龄有关。

解:(1)2×2列联表如右:(2)提出统计假设,:假设人的饮食习惯与年龄无关,当统计假设成立时,的概率约为2.5%,即有97.5%的把握认为“人的饮食习惯与年龄有关”.【选题意图】让学生通过这些统计活动,经历较为系统的数据处理过程,并在此过程中综合运用前面所学的知识和统计方法解决实际问题。

六、走近高考1、(2010.湖南高考)某商品销售量y(件)与销售价格x(元/件)负相关,则其回归方程可能是( )A. =-10x+200B. =10x+200C. =-10x-200D. =10x-200 2、(2009·辽宁高考)某企业有两个分厂生产某种零件,按规定内径尺寸(单位:mm )的值落在[29.94,30.06)的零件为优质品.从两个分厂生产的零件中各抽出了500件,量ˆy ˆy ˆyˆy其内径尺寸,得结果如下表:乙厂(1)试分别估计两个分厂生产的零件的优质品率;(2)由以上统计数据填下面2×2列联表,并分析是否有99%的把握认为“两个分厂生产的零件的质量有差异”.附:K 2= ,解析:(1)甲厂抽查的产品中有360件优质品,从而甲厂生产的零件的优质品率估计为500360=72%;乙厂抽查的产品中有320件优质品,从而乙厂生产的零件的优质品率估计为500320=64%.(2) 2×2列联表如下:2()()()()()n ad bc a b c d a c b d -++++K 2= ≈7.35>6.635,所以有99%的把握认为“两个分厂生产的零件的质量有差异”.【选题意图】走近高考,感受高考气氛,体会考纲精神,有助于学生把握复习尺度。

七、课堂小结1、在必修课程《数学3》的基础上,我们进一步研究了两个变量的关系,通过散点图直观地了解两个变量的关系,然后通过最小二乘法建立回归模型,最后通过分析残差、R 2等评价模型的好坏,如果模型拟合效果好,就可以建立回归方程并进行预测。

这就是回归分析的基本思想。

2、在实际问题中,两个变量是否相关,我们不能仅凭主观意愿得出结论,而需要通过实验来收集数据,并依据独立性检验的原理作出合理的判断。

3、统计方法是可能犯错误的,不管是回归分析还是独立性检验,得到的结论都可能犯错误。

这是统计思维与确定性思维差异性的反映。

相关文档
最新文档