高中数学1.2独立性检验的基本思想及其初步应用(3)新人教版选修1_2(1)
新课标人教a版选修1-2教案
1.1回归分析的基本思想及其初步应用(一)教学要求:通过典型案例的探究,进一步了解回归分析的基本思想、方法及初步应用.教学重点:了解线性回归模型与函数模型的差异,了解判断刻画模型拟合效果的方法-相关指数和残差分析.教学难点:解释残差变量的含义,了解偏差平方和分解的思想.教学过程:一、复习准备:1. 提问:“名师出高徒”这句彦语的意思是什么?有名气的老师就一定能教出厉害的学生吗?这两者之间是否有关?2. 复习:函数关系是一种确定性关系,而相关关系是一种非确定性关系. 回归分析是对具有相关关系的两个变量进行统计分析的一种常用方法,其步骤:收集数据→作散点图→求回归直线方程→利用方程进行预报.二、讲授新课:1. 教学例题:体重.(分析思路→教师演示→学生整理)第一步:作散点图第二步:求回归方程 第三步:代值计算 ② 提问:身高为172cm 的女大学生的体重一定是60.316kg 吗?不一定,但一般可以认为她的体重在60.316kg 左右.③ 解释线性回归模型与一次函数的不同事实上,观察上述散点图,我们可以发现女大学生的体重y 和身高x 之间的关系并不能用一次函数y bx a =+来严格刻画(因为所有的样本点不共线,所以线性模型只能近似地刻画身高和体重的关系). 在数据表中身高为165cm 的3名女大学生的体重分别为48kg 、57kg 和61kg ,如果能用一次函数来描述体重与身高的关系,那么身高为165cm 的3名女在学生的体重应相同. 这就说明体重不仅受身高的影响还受其他因素的影响,把这种影响的结果e (即残差变量或随机变量)引入到线性函数模型中,得到线性回归模型y bx a e =++,其中残差变量e 中包含体重不能由身高的线性函数解释的所有部分. 当残差变量恒等于0时,线性回归模型就变成一次函数模型. 因此,一次函数模型是线性回归模型的特殊形式,线性回归模型是一次函数模型的一般形式.2. 相关系数:相关系数的绝对值越接近于1,两个变量的线性相关关系越强,它们的散点图越接近一条直线,这时用线性回归模型拟合这组数据就越好,此时建立的线性回归模型是有意义.3. 小结:求线性回归方程的步骤、线性回归模型与一次函数的不同.1.1回归分析的基本思想及其初步应用(二)教学要求:通过典型案例的探究,进一步了解回归分析的基本思想、方法及初步应用. 教学重点:了解评价回归效果的三个统计量:总偏差平方和、残差平方和、回归平方和. 教学难点:了解评价回归效果的三个统计量:总偏差平方和、残差平方和、回归平方和. 教学过程:一、复习准备:1.由例1知,预报变量(体重)的值受解释变量(身高)或随机误差的影响.2.为了刻画预报变量(体重)的变化在多大程度上与解释变量(身高)有关?在多大程度上与随机误差有关?我们引入了评价回归效果的三个统计量:总偏差平方和、残差平方和、回归平方和.二、讲授新课:1. 教学总偏差平方和、残差平方和、回归平方和:(1)总偏差平方和:所有单个样本值与样本均值差的平方和,即21()ni i SST y y ==-∑.残差平方和:回归值与样本值差的平方和,即21()ni i i SSE y y ==-∑. 回归平方和:相应回归值与样本均值差的平方和,即21()ni i SSR y y ==-∑. (2)学习要领:①注意i y 、 i y 、y 的区别;②预报变量的变化程度可以分解为由解释变量引起的变化程度与残差变量的变化程度之和,即 222111()()()n n ni i i i i i i y y y y y y ===-=-+-∑∑∑;③当总偏差平方和相对固定时,残差平方和越小,则回归平方和越大,此时模型的拟合效果越好;④对于多个不同的模型,我们还可以引入相关指数 22121()1()n i i i ni i y y R yy ==-=--∑∑来刻画回归的效果,它表示解释变量对预报变量变化的贡献率. 2R 的值越大,说明残差平方和越小,也就是说模型拟合的效果越好.2. 教学例题:为了对x 、Y 两个变量进行统计分析,现有以下两种线性模型: 6.517.5y x =+,717y x =+,试比较哪一个模型拟合的效果更好.分析:既可分别求出两种模型下的总偏差平方和、残差平方和、回归平方和,也可分别求出两种模型下的相关指数,然后再进行比较,从而得出结论.(答案: 52211521()155110.8451000()i i i ii y y R y y ==-=-=-=-∑∑,221R =- 521521()18010.821000()i i i i i y y y y ==-=-=-∑∑,84.5%>82%,所以甲选用的模型拟合效果较好.)3. 小结:分清总偏差平方和、残差平方和、回归平方和,初步了解如何评价两个不同模型拟合效果的好坏.1.1回归分析的基本思想及其初步应用(三)教学要求:通过典型案例的探究,进一步了解回归分析的基本思想、方法及初步应用.教学重点:通过探究使学生体会有些非线性模型通过变换可以转化为线性回归模型,了解在解决实际问题的过程中寻找更好的模型的方法.教学难点:了解常用函数的图象特点,选择不同的模型建模,并通过比较相关指数对不同的模型进行比较.教学过程:一、复习准备:1. 给出例3:一只红铃虫的产卵数y 和温度x 有关,现收集了7组观测数据列于下表中,试建立y 与x 之间的回归方程.2. 讨论:观察右图中的散点图,发现样本点并没有分布在某个带状区域内,即两个变量不呈线性相关关系,所以不能直接用线性回归方程来建立两个变量之间的关系. 二、讲授新课: 1. 探究非线性回归方程的确定: ① 如果散点图中的点分布在一个直线状带形区域,可以选线性回归模型来建模;如果散点图中的点分布在一个曲线状带形区域,就需选择非线性回归模型来建模.② 根据已有的函数知识,可以发现样本点分布在某一条指数函数曲线y =2C 1e x C 的周围(其中12,c c 是待定的参数),故可用指数函数模型来拟合这两个变量.③ 在上式两边取对数,得21ln ln y c x c =+,再令ln z y =,则21ln z c x c =+,而z 与x 间的关系线的附近,因此可以用线性回归方程来拟合. ④ 利用计算器算得 3.843,0.272a b =-=,z 与x 间的线性回归方程为0.272 3.843z x =- ,因此红铃虫的产卵数对温度的非线性回归方程为 0.272 3.843x y e -=.⑤ 利用回归方程探究非线性回归问题,可按“作散点图→建模→确定方程”这三个步骤进行.其关键在于如何通过适当的变换,将非线性回归问题转化成线性回归问题.2. 小结:用回归方程探究非线性回归问题的方法、步骤.三、巩固练习:(1(2)试求出预报变量对解释变量的回归方程.(答案:所求非线性回归方程为0.69 1.112ˆy=e x +.)1.1回归分析的基本思想及其初步应用(四)教学要求:通过典型案例的探究,进一步了解回归分析的基本思想、方法及初步应用.教学重点:通过探究使学生体会有些非线性模型通过变换可以转化为线性回归模型,了解在解决实际问题的过程中寻找更好的模型的方法,了解可用残差分析的方法,比较两种模型的拟合效果.教学难点:了解常用函数的图象特点,选择不同的模型建模,并通过比较相关指数对不同的模型进行比较.教学过程:一、复习准备:1. 提问:在例3中,观察散点图,我们选择用指数函数模型来拟合红铃虫的产卵数y 和温度x 间的关系,还可用其它函数模型来拟合吗?2. 讨论:能用二次函数模型234y c x c =+来拟合上述两个变量间的关系吗?(令2t x =,则34y c t c =+,此时y 与t 间的关系如下:直线的周围,因此不宜用线性回归方程来拟合它,即不宜用二次曲线234y c x c =+来拟合y 与x 之间的关系. )小结:也就是说,我们可以通过观察变换后的散点图来判断能否用此种模型来拟合. 事实上,除了观察散点图以外,我们也可先求出函数模型,然后利用残差分析的方法来比较模型的好坏.二、讲授新课:1. 教学残差分析:① 残差:样本值与回归值的差叫残差,即 i ii e y y=-. ② 残差分析:通过残差来判断模型拟合的效果,判断原始数据中是否存在可疑数据,这方面的分析工作称为残差分析.③ 残差图:以残差为横坐标,以样本编号,或身高数据,或体重估计值等为横坐标,作出的图形称为残差图. 观察残差图,如果残差点比较均匀地落在水平的带状区域中,说明选用的模型比较合适,这样的带状区域的宽度越窄,模型拟合精度越高,回归方程的预报精度越高.2. 例3中的残差分析:计算两种模型下的残差一般情况下,比较两个模型的残差比较困难(某些样本点上一个模型的残差的绝对值比另一个模型的小,而另一些样本点的情况则相反),故通过比较两个模型的残差的平方和的大小来判断模型的拟合效果. 残差平方和越小的模型,拟合的效果越好.由于两种模型下的残差平方和分别为1450.673和15448.432,故选用指数函数模型的拟合效果远远优于选用二次函数模型. (当然,还可用相关指数刻画回归效果)3. 小结:残差分析的步骤、作用三、巩固练习:练习:教材P13第1题1.2独立性检验的基本思想及其初步应用(一)教学要求:通过探究“吸烟是否与患肺癌有关系”引出独立性检验的问题,并借助样本数据的列联表、柱形图和条形图展示在吸烟者中患肺癌的比例比不吸烟者中患肺癌的比例高,让学生亲身体验独立性检验的实施步骤与必要性.教学重点:理解独立性检验的基本思想及实施步骤.K的含义.教学难点:了解独立性检验的基本思想、了解随机变量2教学过程:一、复习准备:回归分析的方法、步骤,刻画模型拟合效果的方法(相关指数、残差分析)、步骤.二、讲授新课:1. 教学与列联表相关的概念:①分类变量:变量的不同“值”表示个体所属的不同类别的变量称为分类变量. 分类变量的取值一定是离散的,而且不同的取值仅表示个体所属的类别,如性别变量,只取男、女两个值,商品的等级变量只取一级、二级、三级,等等. 分类变量的取值有时可用数字来表示,但这时的数字除了分类以外没有其他的含义. 如用“0”表示“男”,用“1”表示“女”.②列联表:分类变量的汇总统计表(频数表). 一般. 如吸烟与患肺癌的列联表:称为222. 教学三维柱形图和二维条形图的概念:由列联表可以粗略估计出吸烟者和不吸烟者患肺癌的可能性存在差异.(教师在课堂上用EXCEL软件演示三维柱形图和二维条形图,引导学生观察这两类图形的特征,并分析由图形得出的结论)3. 独立性检验的基本思想:①独立性检验的必要性(为什么中能只凭列联表的数据和图形下结论?):列联表中的数据是样本数据,它只是总体的代表,具有随机性,故需要用列联表检验的方法确认所得结论在多大程度上适用于总体.第一步:提出假设检验问题H0:吸烟与患肺癌没有关系↔H1:吸烟与患肺癌有关系第二步:选择检验的指标22()K()()()()n ad bca b c d a c b d-=++++(它越小,原假设“H:吸烟与患肺癌没有关系”成立的可能性越大;它越大,备择假设“H1:吸烟与患肺癌有关系”成立的可能性越大.1.2独立性检验的基本思想及其初步应用(二)教学要求:通过探究“吸烟是否与患肺癌有关系”引出独立性检验的问题,并借助样本数据的列联表、柱形图和条形图展示在吸烟者中患肺癌的比例比不吸烟者中患肺癌的比例高,让学生亲身体验独立性检验的实施步骤与必要性.教学重点:理解独立性检验的基本思想及实施步骤.教学难点:了解独立性检验的基本思想、了解随机变量2K的含义.教学过程:教学过程:一、复习准备:独立性检验的基本步骤、思想二、讲授新课:1. 教学例1:例1 在某医院,因为患心脏病而住院的665名男性病人中,有214人秃顶;而另外772名不是因为患心脏病而住院的男性病人中有175名秃顶. 分别利用图形和独立性检验方法判断秃顶与患心脏病是否有关系?你所得的结论在什么范围内有效?①第一步:教师引导学生作出列联表,并分析列联表,引导学生得出“秃顶与患心脏病有关”的结论;第二步:教师演示三维柱形图和二维条形图,进一步向学生解释所得到的统计结果;第三步:由学生计算出2K的值;第四步:解释结果的含义.②通过第2个问题,向学生强调“样本只能代表相应总体”,这里的数据来自于医院的住院病人,因此题目中的结论能够很好地适用于住院的病人群体,而把这个结论推广到其他群体则可能会出现错误,除非有其它的证据表明可以进行这种推广.2. 教学例2:例2 为考察高中生的性别与是否喜欢数学课程之间的关系,在某城市的某校高中生中随机抽取300名学生,得到如下列联表:由表中数据计算得到的观察值. 在多大程度上可以认为高中生的性别与是否数学课程之间有关系?为什么?(学生自练,教师总结)强调:①使得2( 3.841)0.05P K ≥≈成立的前提是假设“性别与是否喜欢数学课程之间没有关系”.如果这个前提不成立,上面的概率估计式就不一定正确;②结论有95%的把握认为“性别与喜欢数学课程之间有关系”的含义;③在熟练掌握了两个分类变量的独立性检验方法之后,可直接计算2K 的值解决实际问题,而没有必要画相应的图形,但是图形的直观性也不可忽视.3. 小结:独立性检验的方法、原理、步骤 三、巩固练习: 某市为调查全市高中生学习状况是否对生理健康有影响,随机进行调查并得到如下的列联表:请问有多大把握认为“高中生学习状况与生理健康有关”?2.1.1 合情推理(一)教学要求:结合已学过的数学实例,了解归纳推理的含义,能利用归纳进行简单的推理,体会并认识归纳推理在数学发现中的作用.教学重点:能利用归纳进行简单的推理.教学难点:用归纳进行推理,作出猜想.教学过程:一、新课引入:1. 哥德巴赫猜想:观察4=2+2, 6=3+3, 8=5+3, 10=5+5, 12=5+7, 12=7+7, 16=13+3, 18=11+7, 20=13+7, ……, 50=13+37, ……, 100=3+97,猜测:任一偶数(除去2,它本身是一素数)可以表示成两个素数之和. 1742年写信提出,欧拉及以后的数学家无人能解,成为数学史上举世闻名的猜想. 1973年,我国数学家陈景润,证明了充分大的偶数可表示为一个素数与至多两个素数乘积之和,数学上把它称为“1+2”.2. 费马猜想:法国业余数学家之王—费马(1601-1665)在1640年通过对020213F =+=,121215F =+=,2222117F =+=,32321257F =+=,4242165537F =+=的观察,发现其结果都是素数,于是提出猜想:对所有的自然数n ,任何形如221n n F =+的数都是素数. 后来瑞士数学家欧拉,发现5252142949672976416700417F =+==⨯不是素数,推翻费马猜想.3. 四色猜想:1852年,毕业于英国伦敦大学的弗南西斯.格思里来到一家科研单位搞地图着色工作时,发现了一种有趣的现象:“每幅地图都可以用四种颜色着色,使得有共同边界的国家着上不同的颜色.”,四色猜想成了世界数学界关注的问题.1976年,美国数学家阿佩尔与哈肯在美国伊利诺斯大学的两台不同的电子计算机上,用1200个小时,作了100亿逻辑判断,完成证明.二、讲授新课:1. 教学概念:① 概念:由某类事物的部分对象具有某些特征,推出该类事物的全部对象都具有这些特征的推理,或者由个别事实概括出一般结论的推理,称为归纳推理. 简言之,归纳推理是由部分到整体、由个别到一般的推理.② 归纳练习:(i )由铜、铁、铝、金、银能导电,能归纳出什么结论?(ii )由直角三角形、等腰三角形、等边三角形内角和180度,能归纳出什么结论?(iii )观察等式:2221342,13593,13579164+==++==++++==,能得出怎样的结论? ③ 讨论:(i )统计学中,从总体中抽取样本,然后用样本估计总体,是否属归纳推理? (ii )归纳推理有何作用? (发现新事实,获得新结论,是做出科学发现的重要手段)(iii )归纳推理的结果是否正确?(不一定)2. 教学例题:① 出示例题:已知数列{}n a 的第1项12a =,且1(1,2,)1n n na a n a +==+ ,试归纳出通项公式. (分析思路:试值n =1,2,3,4 → 猜想n a →如何证明:将递推公式变形,再构造新数列)② 思考:证得某命题在n =n 0时成立;又假设在n =k 时命题成立,再证明n =k +1时命题也成立. 由这两步,可以归纳出什么结论? (目的:渗透数学归纳法原理,即基础、递推关系) ③ 练习:已知(1)0,()(1)1,f af n bf n ==-= 2,0,0n a b ≥>>,推测()f n 的表达式.3. 小结:①归纳推理的药店:由部分到整体、由个别到一般;②典型例子:哥德巴赫猜想的提出;数列通项公式的归纳.三、巩固练习:1. 练习:教材P 38 1、2题.2. 作业:教材P 44 习题A 组 1、2、3题.2.1.1合情推理(二)教学要求:结合已学过的数学实例,了解合情推理的含义,能利用归纳和类比等进行简单的推理,体会并认识合情推理在数学发现中的作用.教学重点:了解合情推理的含义,能利用归纳和类比等进行简单的推理.教学难点:用归纳和类比进行推理,作出猜想.教学过程:一、复习准备:1. 练习:已知 0(1,2,,)i a i n >= ,考察下列式子:111()1i a a ⋅≥;121211()()()4ii a a a a ++≥;123123111()()()9iii a a a a a a ++++≥. 我们可以归纳出,对12,,,n a a a 也成立的类似不等式为 . 2. 猜想数列1111,,,,13355779--⨯⨯⨯⨯ 的通项公式是 . 3. 导入:鲁班由带齿的草发明锯;人类仿照鱼类外形及沉浮原理,发明潜水艇;地球上有生命,火星与地球有许多相似点,如都是绕太阳运行、扰轴自转的行星,有大气层,也有季节变更,温度也适合生物生存,科学家猜测:火星上有生命存在. 以上都是类比思维,即类比推理.二、讲授新课:1. 教学概念:① 概念:由两类对象具有某些类似特征和其中一类对象的某些已知特征,推出另一类对象也具有这些特征的推理. 简言之,类比推理是由特殊到特殊的推理.② 类比练习:(i )圆有切线,切线与圆只交于一点,切点到圆心的距离等于半径. 由此结论如何类比到球体? (ii )平面内不共线的三点确定一个圆,由此结论如何类比得到空间的结论?(iii )由圆的一些特征,类比得到球体的相应特征. (教材P81 探究 填表)小结:平面→空间,圆→球,线→面.③ 讨论:以平面向量为基础学习空间向量,试举例其中的一些类比思维.2. 教学例题:思维:直角三角形中,090C ∠=,3条边的长度,,a b c ,2条直角边,a b 和1条斜边c ; →3个面两两垂直的四面体中,090PDF PDE EDF ∠=∠=∠=,4个面的面积123,,S S S 和S 3个“直角面”123,,S S S 和1个“斜面”S . → 拓展:三角形到四面体的类比. 3. 小结:归纳推理和类比推理都是根据已有的事实,经过观察、分析、比较、联想,再进行归纳、类比,然后提出猜想的推理,统称为合情推理.三、巩固练习:1. 练习:教材P 38 3题. 2. 探究:教材P 35 例5 3.作业:P 44 5、6题.2.1.2 演绎推理教学要求:结合已学过的数学实例和生活中的实例,体会演绎推理的重要性,掌握演绎推理的基本方法,并能运用它们进行一些简单的推理。
1.2独立性检验的基本思想及其应用,安徽省定远中学 赵艳丽说课稿
1.2独立性检验的基本思想及其应用(第1课时)说课稿定远中学赵艳丽各位老师:你们好!我今天说的课题是《1.2独立性检验的基本思想及其应用(第1课时)》,下面我从教材、教学目标、教学重点、教学难点、教学方法、学生学法、教学过程等几个方面说说我对这堂课的设计:一、说教材:《1.2独立性检验的基本思想及其应用(第1课时)》是人教A版高中数学选修1-2第一章的内容,本属大学《数理统计》里的内容,难度较大。
本节内容只是力求让学生对独立性检验思想有个初步了解,并会简单应用。
二、说教学目标:根据这部分内容的特征,制定本课的教学目标是:(1)知识与技能:理解分类变量的含义;会根据收集的数据列出2×2列联表,并会阅读三维柱形图和二维条形图,并粗略判断两个分类变量是否有关系;理解假设检验思想,会利用独立性检验精确判断两个分类变量是否有关系;(2)过程与方法:利用学生身边熟悉的问题引入分类变量是否相关的问题;运用统计学解决问题的一般思路引导学生;让学生经历假设检验思想的形成及运用过程,领会分析、总结的方法;(3)情感态度与价值观:通过提供适当的情境资料,吸引学生的注意力,激发学生的学习兴趣;通过实际问题的解决和从不同角度对问题的解决,可提高学生应用数学能力。
三、说教学重点:根据本节的教学目标、学习重点,并结合学生实际,确定本节课的教学重点是独立性检验思想的初步认识和其简单应用。
四、说教学方法:为了达到目标、突出重点、突破难点、解决疑点,我本着以教师为主导,学生参与其中的原则,再结合本节内容的实际特点,确定本节课教学方法。
这些教学方法想方设法引起学生注意,引导他们积极思考,热情参与,独立自主地解决问题。
具体做法如下:1、情景设置法——激发感情,引起兴趣。
2、提问法——逐步引导,逐渐深入。
3、点拨法——展开联想,拓展思路。
4、讲授法——讲授法教师可以系统的传授知识,充分发挥教师的主导作用。
5、多媒体辅助教学。
其中点拨法是最基本的方法。
【全程复习14-2015学年高中数学 1.2 独立性检验的基本思想及其初步应用课堂达标效果检测 新人教A版选修1-2
"【全程复习方略】2014-2015学年高中数学 1.2 独立性检验的基本思想及其初步应用课堂达标效果检测新人教A版选修1-2 "1.在研究两个分类变量之间是否有关时,可以粗略地判断两个分类变量是否有关的是( )A.散点图B.等高条形图C.2×2列联表D.以上均不对【解析】选B.等高条形图可以粗略地判断两个分类变量之间是否有关.2.对于分类变量A与B的随机变量K2,下列说法正确的是( )A.K2越大,说明“A与B有关系”的可信度越小B.K2越大,说明“A与B无关”的程度越大C.K2越小,说明“A与B有关系”的可信度越小D.K2接近于0,说明“A与B无关”的程度越小【解析】选C.由独立性检验的定义及K2的意义可知C正确.3.想要检测天气阴晴与人心情好坏是否相关,应该检测()A.H0:晴天心情好B.H0:阴天心情好C.H0:天气与心情有关系D.H0:天气与心情无关【解析】选D.根据假设检验的意义,要先假设两个分类变量之间没有关系.4.若由一个2×2列联表中的数据计算得K2的观测值k为7.22,那么在犯错误的概率不超过的前提下认为两个变量有关系.【解析】因为K2的观测值k=7.22>6.635,故在犯错误的概率不超过0.01的前提下认为两个变量有关系. 答案:0.015.某校文理合卷期中考试后,按照学生的数学考试成绩优秀和不优秀统计,得到如下的列联表:(1)画出列联表的等高条形图,并通过图形判断数学成绩与文理分科是否有关.(2)利用独立性检验,分析文理分科对学生的数学成绩是否有影响.【解析】(1)等高条形图如图所示.(2)由列联表中的数据得到K2的观测值k==科对学生的数学成绩有影响.。
1.2独立性检验的基本思想及其初步应用
试用图形判断服用药和患病之间是否有关系?
解析:相应的等高条形图如下:
从图形可以看出,服用药的样本中患病的比例明显低于 没有服用药的样本中患病的比例,因此可以认为:服用药和 患病之间有关系.
独立性检验方法——K2公式
在调查的480名男士中有38名患有色盲,520名女 士中有6名患有色盲,能否在犯错误的概率不超过0.001的前 提下认为性别与患色盲有关系? 分析:
4.下面是一个2×2列联表: x1 x2 总计 y1 a 2 b y2 21 25 46 总计 73 27 100
则表中a、b的值分别为( C ) A.94、96 C.52、54 B.52、50 D.54、52
5.性别与身高列联表如下: 男 女 总计 高(165 cm以上) 37 6 43 矮(165 cm以下) 4 13 17 总计 41 19 60
作出2×2列联表 → 计算随机变量K2的值 → 对照临界值作出结论 解析:根据题目所给的数据作出如下的列联表:
色盲 不色盲 总计
男
女 总计
38
6 44
442
514 956
480
520 1 000
根据列联表中所给的数据可以得: a=38,b=442,c=6,d=514,a+b=480,c+d= 520,a+c=44,b+d=956,n=1 000.
3.独立性检验. 利用随机变量K2来判断“两个分类变量有关系”的方法 定义 称为独立性检验.
nad-bc2 公式 K2=_____________________ a+bc+da+cb+d ,其中n=______________. a+b+c+d
①根据实际问题的需要确定容许推断“两个分类变量有 临界值 k0 .② 关系”犯错误概率的上界α,然后查表确定 ________ k________ ≥k0 利用公式计算随机变量K2的 ________ , 观测值 k .③如果 具体 就推断“X与Y有关系”,这种推断犯错误的概率不超过 步骤 α;否则,就认为在犯错误的概率不超过α的前提下不能 推断“X与Y有关系”,或者在样本数据中没有发现足够 证据支持结论“X与Y有关系”.
高中数学《1.2 独立性检验的基本思想及其初步应用》评估训练 新人教A版选修1-2
1.2 独立性检验的基本思想及其初步应用双基达标限时20分钟1.下面是一个2×2列联表:则表中a、b( ).A.94、96 B.52、50 C.52、60 D.54、52解析∵a+21=73,∴a=52.又b=a+8=52+8=60.答案 C2.下列关于等高条形图的叙述正确的是( ).A.从等高条形图中可以精确地判断两个分类变量是否有关系B.从等高条形图中可以看出两个变量频数的相对大小C.从等高条形图可以粗略地看出两个分类变量是否有关系D.以上说法都不对解析在等高条形图中仅能粗略判断两个分类变量的关系,故A错.在等高条形图中仅能够找出频率,无法找出频数,故B错.答案 C3.关于分类变量x与y的随机变量K2的观测值k,下列说法正确的是( ).A.k的值越大,“X和Y有关系”可信程度越小B.k的值越小,“X和Y有关系”可信程度越小C.k的值越接近于0,“X和Y无关”程度越小D.k的值越大,“X和Y无关”程度越大解析k的值越大,X和Y有关系的可能性就越大,也就意味着X与Y无关系的可能性就越小.答案 B4.若由一个2×2列联表中的数据计算得k=4.013,那么在犯错误的概率不超过________的前提下认为两个变量之间有关系.解析因随机变量K2的观测值k=4.013>3.841,因此,在犯错误的概率不超过0.05的前提下,认为两个变量之间有关系.答案0.055.为了判断高中三年级学生是否选修文科与性别的关系,现随机抽取50名学生,得到如下2×2列联表:已知P(K2中数据,得到k=50×13×20-10×7223×27×20×30≈4.844.则认为选修文科与性别有关系出错的可能性约为________.解析k≈4.844>3.841,故判断出错的概率为0.05.答案0.056.高中流行这样一句话“文科就怕数学不好,理科就怕英语不好”.下表是一次针对高三文科学生的调查所得的数据,试问:文科学生总成绩不好与数学成绩不好有关系吗?解k=913×478×24-399×122490×423×877×36≈6.233>5.024.所以在犯错误的概率不超过0.025的前提下,认为“文科学生总成绩不好与数学成绩不好有关系”.综合提高限时25分钟7.某班主任对全班50名学生进行了作业量的调查,数据如表( ).A.0.01 B.0.005 C.0.025 D.0.001解析k=50×18×15-8×9226×24×27×23≈5.059>5.024.∵P(K2≥5.024)=0.025,∴犯错误的概率不超过0.025.答案 C8.利用独立性检验来考察两个分类变量X和Y是否有关系时,通过查阅下表来确定“X与Y 有关系”的可信程度.如果k≥5.024,那么就有把握认为“X与Y有关系”的百分比为( ).解析k=5.024对应的0.025是“X和Y有关系”不合理的程度,因此两个分类变量有关系的可信程度约为97.5%.答案 D9.某卫生机构对366人进行健康体检,有阳性家族史者糖尿病发病的有16例,不发病的有93例,有阴性家族史者糖尿病发病的有17例,不发病的有240例,认为糖尿病患者与遗传有关系的概率为________.解析列出2×2列联表:k=366×16×240-17×932109×257×33×333≈6.067>5.024,所以在犯错误的概率不超过0.025的前提下,认为糖尿病患者与遗传有关.答案0.97510.某医疗研究所为了检验某种血清预防感冒的作用,把500名使用血清的人与另外500名未用血清的人一年中的感冒记录作比较,提出假设H0:“这种血清不能起到预防感冒的作用”,利用2×2列联表计算得k≈3.918,经查对临界值表知P(K2≥3.841)≈0.05.对此,四名同学作出了以下的判断:p:有95%的把握认为“这种血清能起到预防感冒的作用”;q:若某人未使用该血清,那么他在一年中有95%的可能性得感冒;r:这种血清预防感冒的有效率为95%;s:这种血清预防感冒的有效率为5%.则下列结论中,正确结论的序号是________(把你认为正确的命题序号都填上).①p∧綈q;②綈p∧q;③(綈p∧綈q)∧(r∨s);④(p∨綈r)∧(綈q∨s).解析根据题中叙述可知p真,q假,因为95%是两者有关系的概率,不是患病的概率,r为真,s为假,故①④为真.答案①④11.高二(1)班班主任对全班50名学生进行了有关作业量多少的调查,得到如下列联表:解由表中数据计算K2的观测值为k=50×18×15-8×9227×23×26×24≈5.059>5.024.所以在犯错误的概率不超过0.025的前提下认为“喜欢玩电脑游戏与认为作业多有关”,其有关的概率为0.975.12.(创新拓展)第16届亚运会于2010年11月12日至27日在中国广州进行,为了搞好接待工作,组委会招幕了16名男志愿者和14名女志愿者,调查发现,男、女志愿者中分别有10人和6人喜爱运动,其余人不喜爱运动.(1)根据以上数据完成以下2×2列联表:(2)爱运动有关?解(1)(2)k=30×10×8-6×6210+66+810+66+8≈1.157 5<2.706,因此,在犯错误的概率不超过0.10的前提下不能判断喜爱运动与性别有关.。
高中数学《1.2 独立性检验的基本思想及其初步应用》导学案2 新人教A版选修1-2
独立性检验的基本思想及其初步应用通过探究“秃顶是否与患心脏病有关系”引出独立性检验的问题,并借助样本数据的列联表、柱形图和条形图展示患心脏病的秃顶比例比患其它病的秃顶比例高,让学生亲身体验独立性1416 复习1:统计量2K :复习2:独立性检验的必要性:二、新课导学 ※ 学习探究新知1:独立性检验的基本思想: 1、 独立性检验的必要性:探究任务:吸烟与患肺癌的关系第一步:提出假设检验问题 H 0:第二步:根据公式求2K 观测值k =(它越小,原假设“H 0:吸烟与患肺癌没有关系”成立的可能性越 ;它越大,备择假设“H 1: ” 成立的可能性越大.)第三步:查表得出结论※典型例题例1 在某医院,因为患心脏病而住院的665名男性病人中,有214人秃顶;而另外772名不是因为患心脏病而住院的男性病人中有175名秃顶. 分别利用图形和独立性检验方法判断秃顶与患心脏病是否有关系?你所得的结论在什么范围内有效?小结:用独立性检验的思想解决问题:第一步:第二步:第三步:例2为考察高中生的性别与是否喜欢数学课程之间的关系,在某城市的某校高中生中随机抽k . 在多大程度上可以认为高中生的性别与是否由表中数据计算得到K的观察值 4.513数学课程之间有关系?为什么?※动手试试练1. 某市为调查全市高中生学习状况是否对生理健康有影响,随机进行调查并得到如下的列联表:请问有多大把握认为“高中生学习状况Array与生理健康有关”?三、总结提升※学习小结1. 独立性检验的原理:2. 独立性检验的步骤:※知识拓展. Array※自我评价你完成本节导学案的情况为().A. 很好B. 较好C. 一般D. 较差※当堂检测(时量:5分钟满分:10分)计分:1. 在吸烟与患肺病这两个分类变量的计算中,下列说法正确的是()A. 若k=6.635,则有99%的把握认为吸烟与患肺病有关,那么100名吸烟者中,有99个患肺病.B. 从独立性检验可知,有99%的把握认为吸烟与患肺病有关时,可以说某人吸烟,那么他有99%的可能性患肺病.C. 若从统计量中求出有95%的把握认为吸烟与患肺病有关,是指有5%的可能性使推断出现错误.D. 以上三种说法都不对.2. 下面是一个22⨯列联表则表中a,b 的之分别是( )D. 54,52 3.某班主任对全班50名学生进行了作业量多少的调查,数据如下表:则认为喜欢玩游戏与认为作业量多少有关系的把握大约为( )A. 99%B. 95%C. 90%D.无充分依据4. 在独立性检验中,当统计量2K 满足时,我们有99%的把握认为这两个分类变量有关系. 5. 在22⨯列联表中,统计量2K = . 为考察某种药物预防疾病的效果,进行动物试验,得到如下列联表 能以97.5%的把握认为药物有效吗?为什么?。
人教A版 选修1-2 独立性检验的基本思想及其初步应用(一) 教案
在该规则下,把结论h0错判成H0不成立的概率不会超过P(K2>=)=0.010这里计算的前提是H0成立。上面解决问题的想法类似于反正法,要判断“两个分类变量有关系”,首现假设该结论不成立。即H0:两个变量没有关系成立,在该假设下我们所构造的随机变量K2应该很小,如果由观测值数据计算得到的K2的观测值k很大,则断言H0不成立即认为“两个分类变量有关系”;如果观测值k很小,则说明在样本数据组没有发现足够理由拒绝H0。怎么样判断K2的观测值k是大还是小?这仅需要一个确定的整数k0,当k>=k0时就认为K2的观测值k大。此时相应于k0的判断规则:如果k>=k0,就认为“两个分类变量有关系”;否则就认为“两个分类变量没有关系”,我们称这样的一个k0为临界值。
上述利用随机变量K2判断“两个随机分类变量有关系”的方法称为独立性检验
目标三导
学做思一:独立性检验原理
列联表:列出两个变量的频数表。解决问题的想法类似于反正法,要判断“两个分类变量有关系”,首现假设该结论不成立。
即H0:两个变量没有关系成立,在该假设下我们所构造的随机变量K2应该很小,如果由观测值数据计算得到的K2的观测值k很大,则断言H0不成立即认为“两个分类变量有关系”;如果观测值k很小,则说明在样本数据组没有发现足够理由拒绝H0。怎么样判断K2的观测值k是大还是小?这仅需要一个确定的整数k0,当k>=k0时就认为K2的观测值k大。此时相应于k0的判断规则:如果k>=k0,就认为“两个分类变量有关系”;否则就认为“两个分类变量没有关系”,我们称这样的一个k0为临界值。
独立性检验原理
在假设H0下,如果推出了一个与H0相矛盾的小概率事件,就推断H0不成立,且该推论犯错误的概率不超过这个小概率。
高中数学1-2独立性检验的基本思想及其初步应用同步课件新人教A版选修1-2.ppt
与性别是有关的.
根据列联表中所给的数据,有 a=38,b=442,c=6,
d=514,a+b=480,c+d=520,a+c=44,b+d=956,n
=1000,得 K2 的观测值
k=(a+b)(cn+(add-)(ab+c)c2)(b+d)
=
1000×(38×514-442×6)2 480×520×44×956
第一种剂量 第二种剂量
合计
死亡 14 6 20
存活 11 19 30
合计 25 25 50
三、解答题
7.在500个人身上试验某种血清预防感冒的作用,把一年中的记录与另外500个未用血 清的人作比较,结果如下表所示.
试画出列表的条形图,并通过图形判断这种血清能否起到预防感冒的作用?并进行独立
性检验.
[答案] 0.005
[解析] k=8.654>7.879,就推断“X与Y有关”犯错误的 概率不超过0.005.
6.为了探究电离辐射的剂量与人体的受损程度是否有关,用两种不同剂量的电离辐射 照射小白鼠.在照射后14天内的结果如下表所示:
进行统计分析时的统计假设是__________________. [答案] 假设电离辐射的剂量与人体受损程度无关.
≈27.1.
由
于
k≈27.1>10.828,所以我们有 99.9%的把握认为色盲与性
别有关系.这个结论只对所调查的 480 名男人和 520 名
女人有效.
[点评] 本题应首先作出调查数据的列联表,再根据列联 表画出二维条形图或三维柱形图,并进行分析,最后利用 独立性检验作出判断.
1.利用图形来判断两个分类变量是否有关系,可以画出三 维柱形图,也可以画出二维条形图,仅从图形上只可以粗 略地判断两个分类变量是否有关系,可以结合所给的数值 来进行比较.作图应注意单位统一,图形准确,但它不能 给我们两个分类变量有关或无关的精确的可信程度,若要 作出精确的判断,可以作独立性检验的有关计算.
1.2.2独立性检验的基本思想及其初步应用习题及答案
数学·选修1-2(人教A版)独立性检验的基本思想及其初步应用►达标训练1.在研究两个分类变量之间是否有关时,可以粗略地判断两个分类变量是否有关的是()A.散点图B.等高条形图C.2×2列联表D.以上均不对,答案:B2.在等高条形图形图中,下列哪两个比值相差越大,要推断的论述成立的可能性就越大()与dc+d与ac+d与cc+d与cb+c答案:C3.对分类变量X与Y的随机变量K2的观测值k,说法正确的是()A.k越大,“ X与Y有关系”可信程度越小【B.k越小,“ X与Y有关系”可信程度越小C.k越接近于0,“X与Y无关”程度越小D.k越大,“X与Y无关”程度越大答案:B@4.下面是一个2×2列联表:则表中a、b的值分别为()。
A.94、96 B.52、50C.52、54 D.54、52答案:C5.性别与身高列联表如下:那么,检验随机变量K2的值约等于()A.B.C.22 D.答案:C:6.给出列联表如下:根据表格提供的数据,估计“成绩与班级有关系”犯错误的概率约是( ) *A .B .0.5C .D .答案:B►素能提高1.在调查中发现480名男人中有38名患有色盲,520名女人中有6名患有色盲,下列说法中正确的是( )A .男人、女人中患有色盲的频率分别为、B .男人、女人患色盲的概率分别为19240、3260C .男人中患色盲的比例比女人中患色盲的比例大,患色盲是与性别有关的 /D .调查人数太少,不能说明色盲与性别有关解析:男人患色盲的比例为38480,比女人中患色盲的比例6520大,其差值为⎪⎪⎪⎪⎪⎪38480-6520≈ 6,差值较大. 答案:C2.通过随机询问110名性别不同的大学生是否爱好某项运动,得到如下的列联表:男 女 :总计爱好40 20 60 不爱好 20 30 50总计¥6050 110由K 2=算得, K 2=≈.附表:P(K2≥k0):k0参照附表,得到的正确结论是()A.有99%以上的把握认为“爱好该项运动与性别有关”B.有99%以上的把握认为“爱好该项运动与性别无关”¥C.在犯错误的概率不超过%的前提下,认为“爱好该项运动与性别有关”D.在犯错误的概率不超过%的前提下,认为“爱好该项运动与性别无关”答案:A3.若由一个2×2列联表中的数据计算得K2=,那么在犯错误的概率不超过的前提下认为两个变量______(填“有”或“没有”)关系.答案:有4.(2013·韶关二模)以下四个命题:%①在一次试卷分析中,从每个试室中抽取第5号考生的成绩进行统计,是简单随机抽样;②样本数据:3,4,5,6,7的方差为2;③对于相关系数r,|r|越接近1,则线性相关程度越强;④通过随机询问110名性别不同的行人,对过马路是愿意走斑马线还是愿意走人行天桥进行抽样调查,得到如下列联表:男女总计走天桥—402060走斑马线203050总计6050·110由K2=可得,K2==,则有99%以上的把握认为“选择过马路方式与性别有关”,其中正确的命题序号是________.答案:②③④附表P(K2≥k0)?k05.某学校为了调查喜欢语文学科与性别的关系,随机调查了一些学生情况,具体数据如下表:^类别不喜欢语文喜欢语文性别男1310女720—为了判断喜欢语文学科是否与性别有关系,根据表中的数据,得到K2的观测值k=≈,因为k≥,根据下表中的参考数据:P(K2≥k0)/k0|判定喜欢语文学科与性别有关系,那么这种判断出错的可能性为________.答案:5%—6.某学校课题组为了研究学生的数学成绩与物理成绩之间的关系,随机抽取高二年级20名学生某次考试成绩(满分100分)如下表序号12345678~910数学成绩95758094926567 (849871)物理成绩906372879171]58829381序号11121314(151617181920数学成绩679364·78779057837283物理成绩7782 (4885699161847886)若单科成绩85以上(含85分),则该科成绩优秀.(1)根据上表完成下面的2×2列联表(单位:人).< 数学成绩优秀数学成绩不优秀合计物理成绩优秀物理成绩不优秀【合计解析:(1)2×2列联表为(单位:人):;数学成绩优秀数学成绩不优秀合计物理成绩优秀527物理成绩不优秀112;13合计61420(2)根据题(1)中表格的数据计算,能否在犯错误的概率不超过的前提下认为学生的数学成绩与物理成绩之间有关系参数数据:①假设有两个分类变量X和Y,它们的值域分别为(x1,x2)和(y1,y2),其样本频数列联表(称为2×2列联表)为:! y1y2合计x1a b a+bx2c:d c+d合计a+c b+d a+b+c+d则随机变量K2=,其中n=a+b+c+d为样本容量;②独立检验随机变量K2的临界值参考表如下:…P(K2≥k0)k0<P(K2≥k0)k0/解析:根据列联表可以求得K2的观测值k=≈>.在犯错误的概率不超过的前提下认为:学生的数学成绩与物理成绩之间有关系."7.2013年3月14日,CCTV财经频道报道了某地建筑市场存在违规使用未经淡化海砂的现象.为了研究使用淡化海砂与混凝土耐久性是否达标有关,某大学实验室随机抽取了60个样本,得到了相混凝土耐久性达标混凝土耐久性不达标总计使用淡化海砂255^30使用未经淡化海砂151530总计402060的概率不超过1%的前提下,认为使用淡化海砂与混凝土耐久性是否达标有关、解析:提出假设H0:使用淡化海砂与混凝土耐久性是否达标无关.根据表中数据,求得K2的观测值k==>.查表得P(K2≥=.∴能在犯错误的概率不超过1%的前提下,认为使用淡化海砂与混凝土耐久性是否达标有关.(2)若用分层抽样的方法在使用淡化海砂的样本中抽取了6个,现从这6个样本中任取2个,则取出的2个样本混凝土耐久性都达标的概率是多少参考数据:解析:用分层抽样的方法在使用淡化海砂的样本中抽取6个,其中应抽取“混凝土耐久性达标”的为2530×6=5,“混凝土耐久性不达标”的为6-5=1,“混凝土耐久性达标记”为A1,A2,A3,A4,A5”;“混凝土耐久性不达标”的记为B.在这6个样本中任取2个,有以下几种可能:(A1,A2),(A1,A3),(A1,A4),(A1,A5),(A1,B),(A2,A3),(A2,A4),(A2,A5),(A2,B),(A3,A4),(A3,A5),(A3,B),(A4,A5),(A4,B)(A5,B),共15种.设“取出的2个样本混凝土耐久性都达标”为事件A,它的对立事件A为“取出的2个样本至少有1个混凝土耐久性不达标”,包含(A1,B),(A2,B),(A3,B),(A4,B),(A5,B),共5种可能.∴P(A)=1-P(A)=1-515=2 3.即取出的2个样本混凝土耐久性都达标的概率是2 3.8.某食品厂为了检查甲、乙两条自动包装流水线的生产情况,随机在这两条流水线上各抽取40件产品作为样本称出它们的重量(单位:克),重量值落在(495,510]的产品为合格品,否则为不合格品.左下表是甲流水线样本频数分布表,右下图是乙流水线样本的频率分布直方图.(1)根据上表数据作出甲流水线样本的频率分布直方图;解析:甲流水线样本的频率分布直方图如下:((2)若以频率作为概率,试估计从两条流水线分别任取1件产品,该产品恰好是合格品的概率;解析:由题表知甲样本中合格品数为8+14+8=30,由题图知乙样本中合格品数为++×5×40=36,故甲样本合格品的频率为3040=,乙样本合格品的频率为36 40=.据此可估计从甲流水线任取1件产品,该产品恰好是合格品的概率为.从乙流水线任取1件产品,该产品恰好是合格品的概率为.(3)由以上统计数据完成下面2×2列联表,能否在犯错误的概率不超过的前提下认为产品的包装质量与两条自动包装流水线的选择有关甲流水线?乙流水线合计合格品a=b=不合格品c=d=|合计n=附表:P(K2≥k0)?k0~(参考公式:K2=,其中n=a+b+c+d)解析:2×2列联表如下:¥甲流水线乙流水线合计合格品a=30b=3666不合格品c=10d=4'14合计4040n=80∵K2=n ad-bc2a+b c+d a+c b+d=80×120-360266×14×40×40≈>.∴在犯错误的概率不超过的前提下认为产品的包装质量与两条自动包装流水线的选择有关.>►品味高考1.为调查某地区老年人是否需要志愿者提供帮助,用简单随机抽样方法从该地区调查了500位老人,结果如下:性别是否需要志愿者男女需要4030:不需要160270(1)解析:调查的500位老年人中有70位需要志愿者提供帮助,因此该地区老年人中需要帮助的老年人的比例的估计值为70500=14%.(2)能否在犯错误的概率不超过的前提下认为该地区的老年人是否需要志愿者提供帮助与性别有关解析:K2的观测值k=500×40×270-30×1602200×300×70×430≈,`由于>所以在犯错误的概率不超过的前提下认为该地区的老年人是否需要帮助与性别有关.(3)根据(2)的结论,能否提出更好的调查办法来估计该地区的老年人中需要志愿者提供帮助的老年人的比例说明理由.解析:由于(2)的结论知,该地区的老年人是否需要帮助与性别有关,并且从样本数据能看出该地区男性老年人与女性老年人中需要帮助的比例有明显差异,因此在调查时,先确定该地区老年人中男、女的比例,再把老年人分成男、女两层并采用分层抽样方法比采用简单随机抽样方法更好.附:K2=P(K2≥k0)k02.某工厂有25周岁以上(含25周岁)工人300名,25周岁以下工人200名.为研究工人的日平均生产量是否与年龄有关,现采用分层抽样的方法,从中抽取了100名工人,先统计了他们某月的日平均生产件数,然后按工人年龄在“25周岁以上(含25周岁)”和“25周岁以下”分为两组,再将两组工人的日平均生产件数分为5组:[50,60),[60,70),[70,80),[80,90),[90,100)分别加以统计,得到如图所示的频率分布直方图.(1)从样本中日平均生产件数不足60件的工人中随机抽取2人,求至少抽到一名“25周岁以下组”工人的概率;解析:由已知得,样本中有25周岁以上组工人60名,25周岁以下组工人40名.所以,样本中日平均生产件数不足60件的工人中,25周岁以上组工人有60×=3(人),记为A1,A2,A3;25周岁以下组工人有40×=2(人),记为B1,B2.从中随机抽取2名工人,所有的可能结果共有10种,它们是:(A1,A2),(A1,A3),(A2,A3),(A1,B1),(A1,B2),(A2,B1),(A2,B2),(A3,B1),(A3,B2),(B1,B2).其中至少有1名“25岁以下组”工人的可能结果共有7种,它们是:(A1,B1),(A1,B2),(A2,B1),(A2,B2),(A3,B1),(A3,B2),(B1,B2).故所求的概率P=7 10.(2)规定日平均生产件数不少于80件者为“生产能手”,请你根据已知条件完成列联表,并判断是否有90%的把握认为“生产能手与工人所在的年龄组有关”附:K2=P(K2≥k0)k0解析:由频率分布直方图可知,在抽取的100名工人中,“25周岁以上组”中的生产能手60×=15(人),“25周岁以下组”中的生产能手40×=15(人),据此可得2×2列联表如下:生产能手非生产能手合计25周岁以上组15456025周岁以下组152540合计3070100因为<,所以没有90%的把握认为“生产能手与工人所在年龄组有关”.。
高考数学 1.2独立性检验的基本思想及其初步应用
高考数学 1. 2 独立性检验的基本思想及其初步应用课前预习学案一、预习目标:能用所学的知识对实际问题进行回归分析,体会回归分析的实际价值与基本思想;了解判断刻画回归模型拟合好坏的方法――相关指数和残差分析。
二、预习内容1. 给出例3:一只红铃虫的产卵数y 和温度x 有关,现收集了7组观测数据列于下表中,试建立y 与x 之间的回归方程.温度/x C21 23 25 27 29 32 35 产卵数/y 个 71121 24 66115325(学生描述步骤,教师演示)2. 讨论:观察右图中的散点图,发现样本点并没有分布在某个带状区域内,即两个变量不呈线性相关关系,所以不能直接用线性回归方程来建立两个变量之间的关系.课内探究学案一、学习要求:通过对典型案例的探究,了解独立性检验的基本思想、方法及初步应用学习重点:对独立性检验的基本思想的理解.学习难点:独立性检验的基本思想的应用.二、学习过程:知识点详解知识点一:分类变量对于性别变量,其取值为男和女两种.这种变量的不同“值”表示个体所属的不同类别,像这样的变量称为分类变量.知识点二:列联表为调查吸烟是否对患肺癌有影响,某肿瘤研究所随机调查了9965人,得到如下结果(单位:人):吸烟与患肺癌列联表不患肺癌 患肺癌 总计 不吸烟 7775 42 7817 吸烟 2099 49 2148 总计9874919965像上表这样列出的两个分类变量的频数表,称为列联表. 知识点三:独立性检验这种利用随机变量K 2来确定在多大程度上可以认为“两个分类变量有关系”的方法称为两个分类变量的独立性检验.知识点四:判断结论成立的可能性的步骤一般地,假设有两个分类变量X 和Y ,它们的值域分别为{x 1,x 2}和{y 1,y 2},其样50100150200250300350010203040温度产卵数本频数列联表(称为2×2列联表)为:2×2列联表y1y2总计x1x b x+bx2c d c+d总计x+c b+d x+b+c+d 若要推断的论述为H1:“X与Y有关系”,可以按如下步骤判断结论H1成立的可能性:(1)通过三维柱形图和二维条形图,可以粗略地判断两个分类变量是否有关系,但是这种判断无法精确地给出所得结论的可靠程度.①在三维柱形图中,主对角线上两个柱形高度的乘积xd与副对角线上的两个柱形高度的乘积bc相差越大,H1成立的可能性就越大.②在二维条形图中,可以估计满足条件X=x1的个体中具有Y=y1的个体所占的比例a a+b ,也可以估计满足条件X=x2的个体中具有Y=y1的个体所占的比例cc+d.两个比例的值相差越大,H1成立的可能性就越大.(2)可以利用独立性检验来考察两个分类变量是否有关系,并且能较精确地给出这种判断的可靠程度.具体做法是:根据观测数据计算由K2=n(ad-bc)2(a+b)(c+d)(a+c)(b+d)给出的检验随机变量K2的值k,其值越大,说明“X 与Y有关系”成立的可能性越大.当得到的观测数据x,b,c,d都不小于5时,可以通过查阅下表来确定断言“X与Y有关系”的可信程度.P(K2≥k)0.50 0.40 0.25 0.15 0.10 0.05 0.025 0.010 0.005 0.001 k0.455 0.708 1.323 2.072 2.706 3.841 5.024 6.635 7.879 10.828 说明:当观测数据x,b,c,d中有小于5时,需采用很复杂的精确的检验方法.五、几个典型例题:例1 三维柱形图中柱的高度表示的是(A)A.各分类变量的频数B.分类变量的百分比C.分类变量的样本数D.分类变量的具体值例2 分类变量X和Y的列联表如下y1y2总计x1x b x+bx2c d c+d总计x+c b+d x+b+c+d 则下列说法正确的是(C)X.xd-bc越小,说明X和Y关系越弱B.xd-bc越大,说明X和Y关系越强C.(xd-bc)2越大,说明X和Y关系越强D.(xd-bc)2越接近于0 ,说明X和Y关系越强例3 研究人员选取170名青年男女大学生的样本,对他们进行一种心理测验,发现有60名女生对该心理测验中的最后一个题目的反应是:作肯定的18名,不定的42名;男生110名在相同的项目上作肯定的有22名,否定的有88名.问:性别与态度之间是否存在某种关系?分别用图形和独立性检验的方法判断.解:根据题目所给数据建立如下列联表性别 肯定 否定 总计 男生 22 88 110 女生 18 42 60 总计40130170根据列联表中的数据得到K 2=170×(22×42-18×88)2110×60×40×130≈2.158<2.706因此没有充分的证据显示“性别与态度有关”.例 4 打鼾不仅影响别人休息,而且可能与患某种病症有关.下表是一次调查所得的数据,试问:每一晚都打鼾与患心脏病有关吗?患心脏病 未患心脏病总计 每一晚都打鼾 30 224 254 不打鼾 24 1355 1379 总计5415791633解:根据列联表中数据,得到,K 2=1633×(30×1355-224×24)21379×254×54×1579=68.033.因为68.033>6.635,所以有99%的把握说,每一晚都打鼾与患心脏病有关课后练习与提高为了研究某种细菌随时间x 变化,繁殖的个数,收集数据如下:天数x /天 1 2 3 4 5 6繁殖个数y /个 612254995190(1)用天数作解释变量,繁殖个数作预报变量,作出这些数据的散点图;(2)试求出预报变量对解释变量的回归方程.(答案:所求非线性回归方程为0.69 1.112ˆy =e x .)。
人教版高中数学章节目录
第一章集合与函数概念
集合
函数及其表示
函数的基本性质
第二章基本初等函数(Ⅰ)
指数函数
对数函数
幂函数
第三章函数的应用
函数与方程
函数模型及其应用
人教版高中数学必修二目录
第一章空间几何体
空间几何体的结构
空间几何体的三视图和直观图
空间几何体的表面积与体积
第二章点、直线、平面之间的位置关系
3.3 导数在研究函数中的应用
3.4 生活中的优化问题举例
人教版高中数学选修1-2目录
第一章 统计案例
1.1 回归分析的基本思想及其初步应用
1.2 独立性检验的基本思想及其初步应用
第二章 推理与证明
2.1 合情推理与演绎推理
2.2 直接证明与间接证明
第三章 数系的扩充与复数的引入
3.1 数系的扩充和复数的概念
2.2 二项分布及其应用
2.3 离散型随机变量的均值与方差
2.4 正态分布
第三章 统计案例
3.1 回归分析的基本思想及其初步应用
3.2 独立性检验的基本思想及其初步应用
人教版高中数学选修4-1目录
第一讲 相似三角形的判定及有关性质
一 平行线等分线段定理
二 平行线分线段成比例定理
三 相似三角形的判定及性质
2.2 直接证明与间接证明
2.3 数学归纳法
第三章 数系的扩充与复数的引入
3.1 数系的扩充和复数的概念
3.2 复数代数形式的四则运算
人教版高中数学选修2-3目录
第一章 计数原理
1.1 分类加法计数原理与分步乘法计数原理
1.2 排列与组合
1.3 二项式定理
独立性检验的基本思想及其初步应用
【解】 根据题目所给数据得如下 2×2 列联表:
(a c)(b d) n(a b)(c d)
课堂练习
1.下列关于等高条形图的叙述正确的是( ) A.从等高条形图中可以精确地判断两个分类变量是否有关系 B.从等高条形图中可以看出两个变量频数的相对大小 C.从等高条形图可以粗略地看出两个分类变量是否有关系 D.以上说法都不对 解析:选 C.在等高条形图中仅能粗略判断两个分类变量的关 系,故 A 错.在等高条形图中仅能找出频率,无法找出频数, 故 B 错.
有关概念:分类变量
对于性别变量,其取值为男和女两种,这种变量的 不同“值”表示个体所属的不同类别,像这样的变量称 为分类变量.如是否吸烟、是否患肺癌、宗教信仰、国 籍等等
在日常生活中,主要考虑分类变量之间是否有关系: 例如,吸烟是否与患肺癌有关系?等等.
“美图”欣赏
列联表 2×2 为了调查吸烟是否对肺癌有影响,某肿瘤研究所随机 地调查了9965人,得到如下结果(单位:人)
查对临界值表,作出判断。(如果K2值很大,就断言 H0不成立,即认为“两个分类变量有关系”;如果很 小,则说明在样本数据中没有发现足够证据拒绝H0。)
例题解析:
例1. 在某医院,因为患心脏病而住院的665名男性病人中, 有214人秃顶;而另外772名不是因为患心脏病而住院的 男性病人中,有175人秃顶. 利用图形判断秃顶与患心脏 病是否有关系。能否在犯错误的概率不超过0.010的前 提下认为秃顶与患心脏病有关系?
9965(7775 49 42 2099)2
k
56.632.
7817 2148 9874 91
在H0成立的情况下,统计学家估算出如下的概率:
P(K 2 6.635) 0.01
2014-2015学年高中数学(人教版选修1-2)课时训练第一章 1.2 独立性检验的基本思想及其初步应用
y
x x1 x2 总计
y1
a c a+c
y2
b d b+d
总计
a+b c+ d a+b+c+d
栏 目 链 接
在列联表中,如果两个分类变量没有关系,则应该满足ad -bc≈0.因此|ad-bc|越小,说明两个分量之间的关系越 弱;|ad-bc|越大,说明两个分类变量之间的关系越强.
栏 目 链 接
解析:P(K2>3.841)=0.05,判断出错的可能性为5%.
答案:5%
栏 目 链 接
1.重点 通过案例理解分类变量、列联表、独立性检验的含义; 利用列联表的独立性检验进行估计.
栏 目 链 接
2.难点 独立性检验的基本思想;随机变量K2的含义.
第一章
统计案例
1.2 独立性检验的基本思想及其初步应用
栏 目 链 接
1. 了解独立性检验 记住K2的计算公式. 用.
只要求 2×2 列联表
的基本思想,
2. 了解实际推断原理和假设检验的基本思想及其初步应 3. 通过实际问题培养学生的学习兴趣,激发学生学习的 积极性和主动性,增强社会实践能力,培养分析问题、解决 问题的能力.
②图形分析: 利用等高条形图来分析两分类变量之间是否具有相关关系,形象、直 观地反映两个分类变量之间的总体状态和差异大小, 进而推断它们之间是 否有关系. a.绘制等高条形图时,列联表的行对应的是高度,两行的数据不相等, 但对应的条形图的高度是相同的,两列的数据对应不同颜色.b.等高条形 图中有两个高度相同的矩形,每一个矩形中都有两种颜色,观察下方颜色 a c 区域的高度,如果两个高度相差比较明显(即 和 相差很大),就判 a+b c+d 断两个分类变量之间有关系.
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
课题 1.2独立性检验的基本思想及其初步应用
(3)授课时间课型新授二次修改意见
教学目标知识与技能了解独立性检验的基本思想和初步应用,能对两个分类变量是否有关做出明确的判断。
明确对两个分类变量的独立性检验的基本思想具体步骤,会对具体问题作出独立性检验。
过程与方法从具体问题中认识进行独立性检验的作用及必要性,介绍了独立性检验思想的综合运用;
情感态度价值观多给学生提供自主学习、独立探究、合作交流的机会。
养成严谨的学习态度及实事求是的分析问题、解决问题的科学世界观,并会用所学到的知识来解决实际问题。
教材分析重难点理解独立性检验的基本思想;独立性检验的步骤。
教学设想教法引导探究
学法合作交流
教具多媒体,直尺
课堂设计目标展示
通过典型案例,学习下列一些常用的统计方法,并能初步应用这些方法解决一些实际问题。
通过对典型案例(如“患肺癌与吸烟有关吗”等)的探究。
了解独立性检验(只要求2×2列联表)的基本思想、方法及初步应用。
通过对典型案例(如“人的体重与身高的关系”等)的探究,了解回归的基本思想、方法及其初步应用。
预习检测
一般地,假设有两个分类变量X和Y,它们的可能取值分别为{}和{}, 其样本频数列联表(称为2×2列联表)为:
表3一 9 2×2列联表
总计
总计
要推断的论述为Hl:X与Y有关系,
按怎样的步骤进行?
质疑探究
K的值解决实际问题,而没有必要画相应的图形,但是图形的直观性也不可忽在熟练掌握了两个分类变量的独立性检验方法之后,可直接计算2
视.
五.当堂检测
某市为调查全市高中生学习状况是否对生理健康有影响,随机进行调查并得到如下的列联表:请问有多大把握认为“高中生学习状况与生理健康有关”?
六、作业布置课本16 页第4题;
19页第3题
板
书
设
计 1.2独立性检验的基本思想及其初步应用(3)
例1 在某医院,因为患心脏病而住院的665名男性病人中,有214人秃顶;而另外772名不是因为患心脏病而住院的男性病人中有175名秃顶. 分别利用图形和独立性检验方法判断秃顶与患心脏病是否有关系?你所得的结论在什么范围内有效?
①第一步:教师引导学生作出列联表,并分析列联表,引导学生得出“秃顶与患心脏病有关”的结论;
第二步:教师演示三维柱形图和二维条形图,进一步向学生解释所得到的统计结果;
K的值;
第三步:由学生计算出2
第四步:解释结果的含义.
②通过第2个问题,向学生强调“样本只能代表相应总体”,这里的数据来自于医院的住院病人,因此题目中的结论能够很好地适用于住院的病人群体,而把这个结论推广到其他群体则可能会出现错误,除非有其它的证据表明可以进行这种推广.
为考察高中生的性别与是否喜欢数学课程之间的关系,在某城市的某校高中生中随机抽取300名学生,得到如下列联表:
由表中数据计算得到2K 的观察值 4.513k ≈. 在多大程度上可以认为高中生的性别与是否数学课程之间有关系?为什么?
(学生自练,教师总结)
强调:①使得
2( 3.841)0.05P K ≥≈成立的前提是假设“性别与是否喜欢数学课程之间没有关系”.如果这个前提不成立,上面的概率估计式就不一定正确;
②结论有95%的把握认为“性别与喜欢数学课程之间有关系”的含义;
1. 目标展示
2. 例1 在某医院,因为患心脏病而住院的665名男性病人中,有214人秃顶;而另外772名不是因为患心脏病而住院的男性病人中有175名秃顶. 分别利用图形和独立性检验方法判断秃顶与患心脏病是否有关系?你所得的结论在什么范围内有效?
精讲点拨
3. 某市为调查全市高中生学习状况是否对生理健康有影响,随机进行调查并得到如下的列联表:请问有多大把握认为“高中生学习状况与生理健康有关”?
教学反思。