选修2-3第三章统计案例复习课
高中数学 第三章 统计案例 1.2 相关系数知识导航 北师大版选修2-3(2021年最新整理)
高中数学第三章统计案例1.2 相关系数知识导航北师大版选修2-3 编辑整理:尊敬的读者朋友们:这里是精品文档编辑中心,本文档内容是由我和我的同事精心编辑整理后发布的,发布之前我们对文中内容进行仔细校对,但是难免会有疏漏的地方,但是任然希望(高中数学第三章统计案例1.2 相关系数知识导航北师大版选修2-3)的内容能够给您的工作和学习带来便利。
同时也真诚的希望收到您的建议和反馈,这将是我们进步的源泉,前进的动力。
本文可编辑可修改,如果觉得对您有帮助请收藏以便随时查阅,最后祝您生活愉快业绩进步,以下为高中数学第三章统计案例1.2 相关系数知识导航北师大版选修2-3的全部内容。
1。
2相关系数自主整理判断两个变量之间的线性相关关系的方法有:(1)_______________________________________________________________. (2)_______________________________________________________________。
高手笔记1。
假设两个随机变量的数据分别为(x 1,y 1),(x 2,y 2),…,(x n ,y n ),则变量间线性相关系数r 的计算公式为r=∑∑∑∑∑∑======---==---=ni i ni i ni ii ni in i ii ni iyyxx xy yn y xn x yx n yx y yx xy y x xl l l 122122121121)()()()(2。
(1)r∈[—1,1],|r|值越大,误差Q 越小,变量之间的线性相关程度越高. (2)|r |值越接近0,Q 越大,变量之间的线性相关程度越低。
(3)当r >0时,l xy >0,b=xxxy l l >0,两个变量正相关。
当r <0时,l xy <0,b=xxxy l l <0,两个变量负相关。
当r=0时,两个变量线性不相关。
高中数学选修2-3公开课教案3.1回归分析的基本思想及其初步应用
第三章、统计案例3.1回归分析的基本思想及其初步应用(共计4课时) 授课类型:新授课一、教学内容与教学对象分析学生将在必修课程学习统计的基础上,通过对典型案例的讨论,了解和使用一些常用的统计方法,进一步体会运用统计方法解决实际问题的基本思想,认识统计方法在决策中的作用。
二、学习目标1、知识与技能通过本节的学习,了解回归分析的基本思想,会对两个变量进行回归分析,明确建立回归模型的基本步骤,并对具体问题进行回归分析,解决实际应用问题。
2、过程与方法 本节的学习,应该让学生通过实际问题去理解回归分析的必要性,明确回归分析的基本思想,从散点图中点的分布上我们发现直接求回归直线方程存在明显的不足,从中引导学生去发现解决问题的新思路—进行回归分析,进而介绍残差分析的方法和利用R 的平方来表示解释变量对于预报变量变化的贡献率,从中选择较为合理的回归方程,最后是建立回归模型基本步骤。
3、情感、态度与价值观 通过本节课的学习,首先让显示了解回归分析的必要性和回归分析的基本思想,明确回归分析的基本方法和基本步骤,培养我们利用整体的观点和互相联系的观点,来分析问题,进一步加强数学的应用意识,培养学生学好数学、用好数学的信心。
加强与现实生活的联系,以科学的态度评价两个变量的相关系。
教学中适当地增加学生合作与交流的机会,多从实际生活中找出例子,使学生在学习的同时。
体会与他人合作的重要性,理解处理问题的方法与结论的联系,形成实事求是的严谨的治学态度和锲而不舍的求学精神。
培养学生运用所学知识,解决实际问题的能力。
三、教学重点、难点教学重点:熟练掌握回归分析的步骤;各相关指数、建立回归模型的步骤;通过探究使学生体会有些非线性模型通过变换可以转化为线性回归模型,了解在解决实际问题的过程中寻找更好的模型的方法。
教学难点:求回归系数 a , b ;相关指数的计算、残差分析;了解常用函数的图象特点,选择不同的模型建模,并通过比较相关指数对不同的模型进行比较。
最新人教版高中数学选修2-3《统计案例复习》示范教案
最新人教版高中数学选修2-3《统计案例复习》示范教案本章复习本章知识脉络基础知识聚焦1.回归分析是对具有相关关系的两个变量进行统计分析的一种方法,而联系这两个变量之间的关系的方程称为回归方程,下列叙述正确的是( )A .回归方程一定是直线方程B .回归方程一定不是直线方程C .回归方程是变量之间关系的严格刻画D .回归方程是变量之间关系的一种近似刻画 2.在两个变量Y 与X 的回归模型中,选择了4个不同的模型,它们的相关指数R 2如下,其中拟合效果最好的是( )A .R 2=0.98B .R 2=0.80C .R 2=0.50D .R 2=0.25 3.下列关于K 2的说法正确的是( )A .K 2在任何相互独立的问题中都可以用来检验有关还是无关B .K 2的观测值越大,事件相关的可能性就越大C .K 2是用来判断两个分类变量是否有关系的随机变量,只对两个分类变量适合D .当K 2的观测值大于某一数值(比如10.828)时,我们就说两个分类变量X 与Y 一定相关4.当我们建立多个模型拟合某一数据时,为了比较各个模型的拟合效果,我们可通过计算下列哪些量来确定( )①残差平方和;②回归平方和;③相关指数R 2;④相关系数rA .①B .①②C .①②③D .③④5.线性回归方程y ^=b ^x +a ^必经过( )A .(0,0)B .(x ,0)C .(0,y )D .(x ,y ) 学生活动:先用3~5分钟的时间完成上面5个小题,然后再交流答案,相互讨论,并根据题目设计的知识,回顾本章的主要内容.活动结果:1.D 2.A 3.B 4.C 5.D 基础知识回顾:1.回归方程模型及相关检验(1)回归方程中a ^ =y ^ -b ^ x ,b ^=∑i =1n(x i -x )(y i -y )∑i =1n(x i -x )2,其中(x ,y )称为样本点的中心.(2)r 具有如下性质:||r ≤1,并且||r 越接近1,线性相关程度越强,||r 越接近0,线性相关程度越弱.(3)为了衡量预报的精确度,我们要进行残差分析,通常σ2越小,预报精度越高. 2.2×2列联表的独立性检验(1)分类变量:变量的不同“值”表示个体所属的不同类别,这类变量称为分类变量.(2)列联表:两个分类变量的频数表称为列联表.有两个分类变量的样本频数列联表称为2×2列联表.(3)独立性检验独立性检验一般采用列联表的形式,每个因素可以分为两个类别.当列联表是2×2列联表的形式时,独立性检验的随机变量K 2的计算公式如下:K 2=n(ac -bd)2(a +b)(c +d)(a +c)(b +d).这里的字母如下表在给定的出错概率上限下,我们可以通过K 的观测值与已知数据的大小关系,来判断分类变量的关系.设计目的:把某一节复习课要复习的基础知识(概念、公式、法则、公理、定理、方法、思想、技能、技巧等)整理成一组问题的形式,通过解答问题,达到引发学生再现某些基础知识,进而牢记某些基础知识的目的,即这里的主要目的是再现本节课所要复习的知识、技能、方法与思想.典型示例类型一:线性回归模型及回归分析例1下表提供了某厂节能降耗技术改造后生产甲产品过程中记录的产量x(吨)与相应的生产能耗y(吨标准煤)的几组对照数据:(1)请画出上表数据的散点图;(2)请根据上表提供的数据,用最小二乘法求出y 关于x 的线性回归方程y =b ^x +a ^;(3)已知该厂技术改造前100吨甲产品能耗为90吨标准煤;试根据(2)求出的线性回归方程,预测生产100吨甲产品的生产能耗比技术改造前降低多少吨标准煤?思路分析:结合统计知识,正确作图和计算.解:(1)散点图如图所示:(2)由系数公式可知,x =4.5,y =3.5,b ^=66.5-4×4.5×3.586-4×4.52=66.5-635=0.7. a ^=3.5-0.7×92=0.35,所以线性回归方程为y =0.7x +0.35;(3)x =100时,y =0.7x +0.35=70.35,所以预测生产100吨甲产品的生产能耗比技术改造前降低19.65吨标准煤.点评:回归分析是对具有相关关系的两个变量进行统计分析的常用方法.采用回归分析基本思想,解决实际问题的基本步骤如下:①明确对象;②画散点图;③选择模型,即通过观察分析散点图确定回归方程的类型,如果观察到数据呈线性关系,则选用线性回归方程y ^=b ^x +a ^;④估算方程,即按一定的规则估计回归方程的参数,如最小二乘法原理;⑤线性相关程度的判定,即通过样本相关系数的大小作出判断:|r|≤1;|r|越接近于1,线性相关程度越强;|r|越接近于0,线性相关程度越弱.变式练习:一个车间为了规定工时定额,需要确定加工零件所花费的时间,为此进行了(1)y 与x 是否具有线性相关关系?(2)如果y 与x 具有线性相关关系,求回归直线方程;(3)根据求出的回归直线方程,预测加工200个零件所用的时间为多少?x =55,y =91.7,∑i =110x 2i =38 500,∑i =110y 2i =87 777,∑i =110x i y i =55 950,因此 r =∑i =110x i y i -10x y(∑i =110x 2i -10x 2)(∑i =110y 2i -10y 2)=55 950-10×55×91.7(38 500-10×552)×(87 777-10×91.72)≈0.999 8,由于r =0.999 8>0.75,因此x 与y 之间有很强的线性相关关系,因而可求回归直线方程. (2)设所求的回归直线方程为y ^=b ^x +a ^,则有b ^=∑i =110x i y i -10x y ∑i =110x 2i -10x2≈0.668,a ^ =y -b ^ x ≈54.96,因此,所求线性回归方程为y ^=0.668x +54.96.(3)这个回归直线方程的意义是当x 每增大1时,y 的值约增加0.668,而54.96是y 不随x 增加而变化的部分,因此,当x =200时,y 的估计值为y ^=0.668×200+54.96=188.56≈189,因此,加工200个零件所用的工时约为189分.类型二:非线性回归模型及回归分析例2在试验中得到变量y 与x 的数据如下:由经验知,y 与1x 之间具有线性相关关系,试求y 与x 之间的回归曲线方程;当x 0=0.038时,预测y 0的值.分析:通过换元转化为线性回归问题.解:令u =1x,由题目所给数据可得下表所示的数据:计算得b ^=0.29,a ^=34.24,∴y ^=34.24+0.29u.故所求回归曲线方程为y ^=34.24+0.29x ,当x 0=0.038时,y ^=34.24+0.290.038≈41.87.点评:非线性回归问题有时并不给出经验公式,此时我们可以由已知的数据画出散点图,并把散点图与已经学习过的各种函数,如幂函数、指数函数、对数函数、二次函数等作比较,挑选出跟这些散点拟合得最好的函数,然后再采用变量的变换,把问题转化为线性回归问题,使问题得以解决.变式练习:某地大气中氰化物浓度测定结果如下:(2)求相关指数.(3)作出残差图,并求残差平方和.解:(1)选取污染源距离为自变量x ,氰化物浓度为因变量y ,作散点图.从表中所给的数据可以看出,氰化物浓度与距离有负的相关关系,用非线性回归方程来拟合,建立y 关于x 的指数回归方程:y ^=0.929 3e-0.009 4x.(2)相关指数R 2=1-∑n i =1(y i -y ^i )2∑ni =1(y i -y )2≈0.991 5.残差平方和∑ni =1 (y i -y ^i )2=0.011 8. 类型三:独立性检验思想例3某些行为在运动员的比赛之间往往被赋予很强的神秘色彩,如有一种说法认为,在进入某乒乓球场比赛前先迈入左脚的运动员就会赢得比赛的胜利.某记者为此追踪了某著名负有关?思路分析:根据列联表,求出K 2的观测值,再进行判断.。
2020学年高中数学第3章统计案例3.2独立性检验的基本思想及其初步应用课件新人教A版选修2_3
返回目录
(2)独立性检验(精确判断) 具体实施步骤如下: ①根据实际问题需要的可信程度确定临界值 k0; ② 根 据 观 测 数 据 计 算 随 机 变 量 K2 = a+bcn+add-ab+cc2b+d的观测值 k,其中 n=a+b+c+ d 为样本容量;
返回目录
③查临界值表(以K2的观测值k的大小作为检验在多 大程度上可以认为“两个变量有关系”的标准),如果 k≥k0,就以(1-P(K2≥k0))×100%的把握认为“两分类 变量有关系”;否则,就认为根据样本数据没有充分的 理由说明“两分类变量有关系”.
返回目录
2.(独立性检验)有人发现,多看电视容易使人变冷 漠,下表是一个调查机构对此现象的调查结果.
冷漠 不冷漠 总计 多看电视 68 42 110 少看电视 20 38 58
总计 88 80 168
返回目录
则大约有多大的把握认为多看电视与人变冷漠有关
系( )
A.99%
B.97.5%
C.95%
D.90%
返回目录
要点三 独立性检验
定义 利用随机变量K2来判断“两个分类变量有关系” 的方法称为独立性检验 nad-bc2
公式 K2=_____a_+__b__c_+__d__a_+__c___b_+__d_____,其中n= ___a_+_b_+__c_+__d___
返回目录
①认真读题,取出相关数据,作出2×2列联表; 具体 ②根据2×2列联表中的数据,计算K2的观测值k; 步骤 ③通过观测值k与临界值k0比较,得出事件有关的
返回目录
P(K2≥k0) 0.100 0.050 0.010 k0 2.706 3.841 6.635
思维导引:根据列联表直接代入K2公式可得南方学 生和北方学生的差异与是否喜欢甜品的相关程度.
第三章--统计案例-3.2-独立性检验的基本思想及其初步应用
解:由列联表中的数据,得 K2 的观测值为 1 633×30×1 355-224×242 k= ≈68.033>10.828. 254×1 379×54×1 579 因此,在犯错误的概率不超过 0.001 的前提下,认为每 一晚都打鼾与患心脏病有关.
为了调查某生产线上,某质量监督员甲对产
品质量好坏有无影响,现统计数据如下:质量监督员在现 场时,990件产品中合格品为 982 件,次品数为 8 件,甲不 在现场时,510件产品中合格品为493件,次品数为17件, 试分别用列联表、等高条形图、假设检验的方法对数据进
的方法来判断色盲与性别是否有关?你所得的结论在什么
范围内有效? 解:根据题目所给的数据作出如下的列联表: 色盲 不色盲 合计
男 女 合计
38 6 44
442 514 956
480 520 1 000
根据列联表作出相应的等高条形图,如图所示:
38 从等高条形图来看在男人中患色盲的比例480比在女人
38 6 6 中患色盲的比例520要大,其差值为480-520 ≈0.068,差
位统一,图形准确,但它不能给我们两个分类变量有关或
无关的精确的判断,若要作出精确的判断,可以进行独立 性检验的有关计算.
本题应首先作出调查数据的列联表,再根据列联表画
出等高条形图,并进行分析,ห้องสมุดไป่ตู้后利用独立性检验作出判 断.
在调查 480 名男士中有 38 名患有色盲, 520名女士中有6名患有色盲,分别利用图形和独立性检验
步
骤
③如果 k≥k0 ,就推断“X与Y有关系”,这种推断
犯错误的概率不超过α;否则,就认为在犯错误的概 率不超过α的前提下不能推断“X与Y有关系”,或者 在样本数据中没有发现足够证据支持结论“X与Y有 关系”.
人教a版数学【选修2-3】第3章《统计案例》归纳总结ppt课件
B.75% D.97.5%
第三章 章末归纳总结
成才之路 · 高中新课程 · 学习指导 · 人教A版 · 数学 · 选修2-3
[答案] D [解析] 有关系”. 查表可得K2>5.024.因此有97.5%的把握认为“x和y
第三章
章末归纳总结
成才之路 · 高中新课程 · 学习指导 · 人教A版 · 数学 · 选修2-3
算可得 k≈0.04145,而 0.04145<2.706,所以没有充分的证据表 明该药品对防治 A 疾病有效.
第三章
章末归纳总结
成才之路 · 高中新课程 · 学习指导 · 人教A版 · 数学 · 选修2-3
[点评]
利用独立性检验可以帮助我们定量地分析两个分
第三章
章末归纳总结
成才之路 · 高中新课程 · 学习指导 · 人教A版 · 数学 · 选修2-3
[解析] 将问题中的数据写成 2×2 列联表如下表: 患病 使用 不使用 总计 5 18 23 不患病 100 400 500 总计 105 418 523
2 n ad - bc 将上述数据代入公式 K2= 中,计 a+bc+da+cb+d
3.(2014· 唐山模拟)对具有线性相关关系的变量 x、y 有一 1 ^ 组观测数据(xi,yi)(i=1,2,„,8),其回归直线方程是:y=3x +a, 且 x1+x2+x3+„+x8=2(y1+y2+y3+„+y8)=6, 则实数 a 的值是( 1 A.16 1 C.4 [答案] B ) 1 B.8 1 D.2
成才之路 · 数学
人教A版 · 选修2-3
路漫漫其修远兮 吾将上下而求索
成才之路 · 高中新课程 · 学习指导 · 人教A版 · 数学 · 选修2-3
人教B版《数学2-3》(选修) 第三章《独立性检验》教学设计
人教B版《数学2-3》(选修) 第三章《独立性检验》教学设计一 .教材课标分析本节课作为人教B版《数学2-3》(选修) 第三章统计案例第一节,课标对它的要求为“通过对典型案例(吸烟和患肺癌有关吗?)的探究,了解独立性检验(只要求2×2列联表)的基本思想、方法及初步应用;”统计是研究如何合理地收集、整理,分析数据的学科,它可以为人们的决策提供依据,在日常生活中,人们常常需要收集数据,根据数据提取有价值的信息,作为合理地决策,为了体现统计的特点,实现课标中提出的目标,通过案例进行统计教学是十分必要的。
在高中阶段,我们只是学习统计的初步,因此许多的知识的来龙去脉都不能做系统的讲解,或者说以高中学生的数学基础,也无法做出更详细的解答。
因此如何形象生动的展示统计的方法,如何梳理统计方法的脉络,如何在繁复的数据和计算方法中把握独立性检验的精髓,是本节课备课过程中重点研究的问题。
二.教学目标分析【知识与技能】1、了解独立性检验的基本思想、方法及初步应用。
列联表)分析两个分类变量是否有关。
2、会从列联表(只要求22K公式判断两个分类变量在某种可信程度上的相关性。
3、会用2【过程与方法】经历数据处理的过程,发现数据的直观感觉,认识统计方法的直观特点,体会统计运用的广泛性,统计思想的严谨性。
【情感、态度与价值观】1、通过本节课的学习,让学生感受数学与现实生活的联系,体会独立性检验的基本思想在解决日常生活问题中的作用。
2、培养学生运用所学知识,依据独立性检验的思想作出合理推断的实事求是的好习惯。
三.教学重点与难点重点:独立性检验的思想方法和初步应用难点:独立性检验的基本思想方法四.学情分析:高二的学生在必修三中已经接触到了统计,具备了一定的统计思维和基本的数学素养。
但本节内容无论在知识上还是在思维方式上与其它章节上存在较大差异,学生在学习中很不适应。
学生在理解,分析数据上,还存在着恐惧心理。
在数学阅读理解上也存在较大障碍。
人教版A版高中数学选修2-3:第三章 统计案例 复习课件
4
xi2 14,
4
xi zi 0 2 8 15 25,
4
i 1
zi2 46,
2
4x 9,
i 1
i 1
4
2
4z 36,
b
i 1 4
xi zi 4x z
xi 2
2
4x
25 18 7 14 9 5
i 1
a z bx 3 7 1.5 9 , z 7 x 9
a
y
i 1
bx.
i 1
例1(安徽卷)某地最近十年粮食需求量逐年上升,下 表是部分统计数据:
年份
2002 2004 2006 2008 2010
需求量(万吨) 236 246 257 276 286
(1)利用所给数据求年需求量与年份之间的回归直线
方程 yˆ=bx a ;(2)利用(1)中所求出的直线方程预测该
yi--y
0
1
3 -4
4
(y y)2
R2
1
i 1 4
(y y)2
i 1
0.1923
1
(1.5)2 02
0.52 12
3.52 (2.5) 32 (4)2
2
回归直线方程是y x 5
R2 0.1923
2
相关指数越大,越 接近于1,模拟的拟 合效果越好;相关 指数越小,拟合的 效果越差!
x 0123 y 2 4 16 32
(1)画出散点图;(2)试建立y与x之间的回归方程.
解:(1)作出散点图如右图所示: 32
y 2c2xc1 ,
高中数学选修2-3第三章 统计案例
3.1回归分析的基本思想及其初步应用(一)(新授课) 3.1回归分析的基本思想及其初步应用(二)(新授课) 3.1回归分析的基本思想及其初步应用(三)(新授课) 3.1 回归分析的基本思想及其初步应用(四)(新授课) 3.2 独立性检验的基本思想及其初步应用(一)(新授课)3.2 独立性检验的基本思想及其初步应用(二)(新授课)第三章统计案例单元练习题(习题课)一、课程目标在《数学3(必修)》概率统计内容的基础上,通过典型案例进一步介绍回归分析的基本思想、方法以及初步应用;通过典型案例介绍独立性检验的基本思想、方法以及初步应用,使学生认识统计方法在决策中的作用。
二、学习目标1、通过典型案例的探究,进一步了解回归分析的基本思想、方法及其应用。
2、通过典型案例的探究,了解独立性检验的基本思想、方法以及初步应用。
三、本章知识框图四、课时分配本章共2小结,教学约需2课时,具体安排如下3.1 回归分析的基本思想及其初步应用约4课时3.2 独立性检验的基本思想及其初步应用约2课时3.1 回归分析的基本思想及其初步应用(一)(新授课)一、教学目标: 知识与能力:通过典型案例的探究,进一步了解回归分析的基本思想、方法及初步应用. 过程与方法:通过本节的学习,让雪生通过实际问题去理解回归分析的必要性,明确回归分析的基本思想。
情感、态度与价值观:培养学生运用所学的知识,解决实际问题的能力。
二、教学重点与难点: 重点:了解线性回归模型与函数模型的差异,了解判断刻画模型拟合效果的方法-相关指数和残差分析.难点:解释残差变量的含义,了解偏差平方和分解的思想. 三、教学过程: (一)课前复习: 1. 提问:“名师出高徒”这句彦语的意思是什么?有名气的老师就一定能教出厉害的学生吗?这两者之间是否有关?2. 复习:函数关系是一种确定性关系,而相关关系是一种非确定性关系. 回归分析是对具有相关关系的两个变量进行统计分析的一种常用方法,其步骤:收集数据→作散点图→求回归直线方程→利用方程进行预报.(二)讲授新课: 1. 举例应用:例1 从某大学中随机选取8名女大学生,其身高和体重数据如下表所示: 编 号 1 2 3 4 5 6 7 8身高/cm 165 165 157 170 175 165 155 170体重/kg 48 57 50 54 64 61 43 59求根据一名女大学生的身高预报她的体重的回归方程,并预报一名身高为172cm 的女大学生的体重. (分析思路→教师演示→学生整理)第一步:作散点图 第二步:求回归方程 第三步:代值计算 (1)思考:身高为172cm 的女大学生的体重一定是60.316kg 吗? 不一定,但一般可以认为她的体重在60.316kg 左右. (2)解释线性回归模型与一次函数的不同事实上,观察上述散点图,我们可以发现女大学生的体重y 和身高x 之间的关系并不能用一次函数y bx a =+来严格刻画(因为所有的样本点不共线,所以线性模型只能近似地刻画身高和体重的关系). 在数据表中身高为165cm 的3名女大学生的体重分别为48kg 、57kg 和61kg ,如果能用一次函数来描述体重与身高的关系,那么身高为165cm 的3名女在学生的体重应相同. 这就说明体重不仅受身高的影响还受其他因素的影响,把这种影响的结果e (即残差变量或随机变量)引入到线性函数模型中,得到线性回归模型y bx a e =++,其中残差变量e 中包含体重不能由身高的线性函数解释的所有部分. 当残差变量恒等于0时,线性回归模型就变成一次函数模型. 因此,一次函数模型是线性回归模型的特殊形式,线性回归模型是一次函数模型的一般形式.10203040506070150155160165170175180身高/cm体重/k g2. 相关系数:相关系数的绝对值越接近于1,两个变量的线性相关关系越强,它们的散点图越接近一条直线,这时用线性回归模型拟合这组数据就越好,此时建立的线性回归模型是有意义.(三)课时小结:求线性回归方程的步骤、线性回归模型与一次函数的不同.四、课后反思:3.1 回归分析的基本思想及其初步应用(二)(新授课)一、教学目标: 知识与能力:通过典型案例的探究,进一步了解回归分析的基本思想、方法及初步应用. 过程与方法:从散点图中点的分布上发现直接求回归方程存在的不足,从中引导学生去发现解决问题的新思路,进行回归分析,进而介绍残差分析的方法。
高二数学PPT之(人教版)高中数学选修2-3:3
数学 选修2-3
第三章 统计案例
自主学习 新知突破
合作探究 课堂互动
3.在吸烟与患肺病是否有关旳判断中,有下面旳说 法:
①若K2旳观察值k>6.635,则在犯错误旳概率不超出0.01 旳前提下,以为吸烟与患肺病有关系,那么在100个吸烟旳人 中必有99人患有肺病;
②从独立性检验可知在犯错误旳概率不超出0.01旳前提 下,以为吸烟与患肺病有关系时,若某人吸烟,则他有99%旳 可能患有肺病;
8分
此时,K2 的观测值 k=861×4×5×722×2-555×0×3192≈5.785.10 分
由于 5.785>5.024,
所以在犯错误的概率不超过 0.025 的前提下认为该种疾病
与饮用不干净水有关.
数学 选修2-3
第三章 统计案例
自主学习 新知突破
合作探究 课堂互动
两个样本都能统计得到传染病与饮用不洁净水有关这一
∵54.21>10.828,所以拒绝 H0. 因此在犯错误的概率不超过 0.001 的前提下认为这种传染
病与饮用不干净水有关.
6分
数学 选修2-3
第三章 统计案例
自主学习 新知突破
合作探究 课堂互动
(2)依题意得 2×2 列联表:
得病 不得病 合计
干净水
5
50
55
不干净水 9
22
31
合计
14
72
86
数学 选修2-3
第三章 统计案例
自主学习 新知突破
合作探究 课堂互动
[规律方法] 1.判断分类变量及其关系的方法: (1)利用数形结合思想,借助等高条形图来判断两个分类变 量是否相关是判断变量相关的常见方法; (2)一般地,在等高条形图中,a+a b与c+c d相差越大,两个 分类变量有关系的可能性就越大.
《统计案例》教案新人教A版选修
《统计案例》教案1(新人教A版选修2-3)第三章统计案例3.1回归分析的基本思想及其初步应用(共计4课时)授课类型:新授课一、教学内容与教学对象分析学生将在必修课程学习统计的基础上,通过对典型案例的讨论,了解和使用一些常用的统计方法,进一步体会运用统计方法解决实际问题的基本思想,认识统计方法在决策中的作用。
二、学习目标1、知识与技能通过本节的学习,了解回归分析的基本思想,会对两个变量进行回归分析,明确建立回归模型的基本步骤,并对具体问题进行回归分析,解决实际应用问题。
2、过程与方法本节的学习,应该让学生通过实际问题去理解回归分析的必要性,明确回归分析的基本思想,从散点图中点的分布上我们发现直接求回归直线方程存在明显的不足,从中引导学生去发现解决问题的新思路-进行回归分析,进而介绍残差分析的方法和利用R的平方来表示解释变量对于预报变量变化的贡献率,从中选择较为合理的回归方程,最后是建立回归模型基本步骤。
3、情感、态度与价值观通过本节课的学习,首先让显示了解回归分析的必要性和回归分析的基本思想,明确回归分析的基本方法和基本步骤,培养我们利用整体的观点和互相联系的观点,来分析问题,进一步加强数学的应用意识,培养学生学好数学、用好数学的信心。
加强与现实生活的联系,以科学的态度评价两个变量的相关系。
教学中适当地增加学生合作与交流的机会,多从实际生活中找出例子,使学生在学习的同时。
体会与他人合作的重要性,理解处理问题的方法与结论的联系,形成实事求是的严谨的治学态度和锲而不舍的求学精神。
培养学生运用所学知识,解决实际问题的能力。
三、教学重点、难点教学重点:熟练掌握回归分析的步骤;各相关指数、建立回归模型的步骤;通过探究使学生体会有些非线性模型通过变换可以转化为线性回归模型,了解在解决实际问题的过程中寻找更好的模型的方法。
教学难点:求回归系数 a , b ;相关指数的计算、残差分析;了解常用函数的图象特点,选择不同的模型建模,并通过比较相关指数对不同的模型进行比较。
高中数学第三章统计案例模块复习课课件北师大版选修2_3
专题归纳
高考体验
专题一
专题二
解(1)列出下表,并用科学计算器进行有关计算:
i xi yi 1 70 5. 1 2 74 6. 0 444 10 108 11. 0 3 80 6. 8 544 11 115 11. 8 4 78 7. 8 608. 4 12 123 12. 2 5 85 9. 0 765 13 130 12. 5 6 92 10. 2 938. 4 14 138 12. 8 7 90 10. 0 900 15 145 13. 0 8 95 12. 0 1 140
������ = ������-����������������� , ������)称为样本点的中心. ������ ������ =1
知识网络
要点梳理
(3)相关系数 当r>0时,表明两个变量正相关; 当r<0时,表明两个变量负相关. r的绝对值越接近于1,表明两个变量的线性相关性越强. r的绝对值越接近于0,表明两个变量之间几乎不存在线性相关关 系.通常|r|大于0.75时,认为两个变量有很强的线性相关性. 3.独立性检验 (1)分类变量:变量的不同“值”表示个体所属的不同类别,像这类 变量称为分类变量. (2)列联表:列出两个分类变量的频数表,称为列联表.假设有两个 分类变量X和Y,它们的可能取值分别为{x1,x2}和{y1,y2},其样本频数 列联表(称为2×2列联表)为
xi2 =161 125,
15
i=1
∑ ������������2 =1
628. 55, ∑ xi yi =16 076. 8.
专题归纳
高考体验
专题一
专题二
专题一 回归分析 【例1】 蔬菜之乡山东寿光的某块菜地每单位面积菜地年平均 使用氮肥量x kg与每单位面积蔬菜年平均产量y t之间的关系有如 下数据:
高中数学选修2-3:第三章 统计案例章末复习提升
一、两个基本思想 1.回归分析的基本思想回归分析包括线性回归分析和非线性回归分析两种,而非线性回归分析往往可以通过变量代换转化为线性回归分析,因此,回归分析的思想主要是指线性回归分析的思想. 注意理解以下几点: (1)确定线性相关关系线性相关关系有两层含义:一是具有相关关系,如广告费用与销售量的关系等在一定条件下具有相关关系,而气球的体积与半径的关系是函数关系,而不是相关关系;二是具有线性相关关系.判断是否线性相关的依据是观察样本点的散点图. (2)引起预报误差的因素对于线性回归模型y =b ^x +a ^+e ,引起预报变量y 的误差的因素有两个:一个是解释变量x ,另一个是随机误差e .(3)回归方程的预报精度判断回归方程的预报精度是通过计算残差平方和来进行的,残差平方和越小,方程的预报精度越高.简单来说,线性回归分析就是通过建立回归直线方程对变量进行预报,用回归方程预报时,需对函数值明确理解,它表示当x取值时,真实值在函数值附近或平均值在函数值附近,不能认为就是真实值.(4)回归模型的拟合效果判断回归模型的拟合效果的过程也叫残差分析,残差分析的方法有两种,一是通过残差图直观判断,二是通过计算相关指数R2的大小判断.2.独立性检验的基本思想独立性检验的基本思想类似于反证法.要确认两个分类变量有关系的可信程度,先假设两个分类变量没有关系,再计算随机变量K2的观测值,最后由K2的观测值很大在一定程度上说明两个分类变量有关系.进行独立性检验要注意理解以下三个问题:(1)独立性检验适用于两个分类变量.(2)两个分类变量是否有关系的直观判断:一是根据2×2列联表计算|ad-bc|,值越大关系越强;二是观察等高条形图,两个深色条的高度相差越大关系越强;(3)独立性检验是对两个分类变量有关系的可信程度的判断,而不是对其是否有关系的判断.独立性检验的结论只能是有多大的把握确认两个分类变量有关系,而不能是两个分类变量一定有关系或没有关系.二、两个重要参数1.相关指数R2相关指数R2是用来刻画回归模型的回归效果的,其值越大,残差平方和越小,模型的拟合效果越好.2.随机变量K2随机变量K2是用来判断两个分类变量在多大程度上相关的变量.独立性检验即计算K2的观测值,并与教材中所给表格中的数值进行比较,从而得到两个分类变量在多大程度上相关.三、两种重要图形1.散点图散点图是进行线性回归分析的主要手段,其作用如下:一是判断两个变量是否具有线性相关关系,如果样本点呈条状分布,则可以断定两个变量有较好的线性相关关系;二是判断样本中是否存在异常.2.残差图残差图可以用来判断模型的拟合效果,其作用如下:一是判断模型的精度,残差点所分布的带状区域越窄,说明模型的拟合精度越高,回归方程的预报精度越高.二是确认样本点在采集中是否有人为的错误.题型一 回归分析的思想及其应用回归分析是对具有相关关系的两个变量进行统计分析的一种常用方法.其基本步骤为:通过散点图和经验选择回归方程的类型,然后通过一定的规则确定出相应的回归方程,通过一定的方法进行检验,最后应用于实际或对预报变量进行预测.例1 某地搜集到的新房屋的销售价格(单位:万元)和房屋面积(单位:m 2)的数据如下表:(1)(2)求回归直线方程;(3)根据(2)的结果,估计当房屋面积为150m 2时的销售价格.反思与感悟 解答此类问题,一般先根据散点图判断两个变量是否具有相关关系,然后求出回归方程,根据回归方程解决问题.跟踪训练1 从某居民区随机抽取10个家庭,获得第i 个家庭的月收入xi (单位:千元)与月储蓄y i (单位:千元)的数据资料,算得∑i =110x i =80,∑i =110y i =20,∑i =110x i y i =184,∑i =110x 2i =720.(1)求家庭的月储蓄y 对月收入x 的线性回归方程y ^=b ^x +a ^; (2)判断变量x 与y 之间是正相关还是负相关;(3)若该居民区某家庭月收入为7千元,预测该家庭的月储蓄.附:线性回归方程y ^=b ^x +a ^中,b ^=∑i =110x i y i -n x y∑i =110x 2i -n x2,a ^=y -b ^x ,其中x ,y 为样本平均值.题型二 独立性检验思想独立性检验研究的问题是两个分类变量之间是否有关系.为此需先列出2×2列联表,从表格中可以直观地得到两个分类变量是否有关系.另外等高条形图能更直观地反映两个分类变量之间的情况.独立性检验的思想是:要判断两个分类变量是否有关系,可以先假设二者无关系,求随机变量K 2的观测值k ,若k 大于临界值,则拒绝假设,否则,接受假设. 例2 考察小麦种子灭菌与否跟发生黑穗病的关系,经试验观察,得到数据如下表:反思与感悟 在利用统计量K 2进行独立性检验时,观测值的计算要准确,再把计算结果和临界值比较,从而得出判断的可信程度.跟踪训练2在研究某种新措施对猪白痢的防治效果问题时,得到以下数据:题型三数形结合思想数形结合思想就是在解决与几何图形有关的问题时,将图形信息转换成代数信息,利用数量特征,将其转化为代数问题;在解决与数量有关的问题时,根据数量的结构特征,构造出相应的几何图形,即化为几何问题,从而利用数形的辩证统一和各自的优势尽快得到解决途径,这对提高分析和解决问题的能力将有极大的帮助.数形结合的主要途径:(1)形转化为数,即用代数方法研究几何问题,这是解决几何问题的基本方法;(2)数转化为形,即根据给出的“数”的结构特点,构造出与之相应的几何图形,用几何方法解决代数问题;(3)数形结合,即用形研究数,用数研究形,相互结合,使问题变得直观、简捷.在进行回归分析时,常利用散点图、残差图等说明线性相关情况或模型的拟合效果.在独立性检验中,我们常用等高条形图直观地反映数据的情况,从而可以粗略地判断两个分类变量是否有关系.例3电视传媒公司为了解某地区电视观众对某类体育节目的收视情况,随机抽取了100名观众进行调查.如图所示的是根据调查结果绘制的观众日均收看该体育节目时间的频率分布直方图.将日均收看该体育节目时间不低于40分钟的观众称为“体育迷”.(1)根据已知条件完成下面的2×2列联表,据此资料你是否认为“体育迷”与性别有关?(2)次抽取1名观众,抽取3次,记被抽取的3名观众中的“体育迷”人数为X.若每次抽取的结果是相互独立的,求X的分布列,期望E(X)和方差D(X).附:K2=n(ad-bc)2(a+b)(c+d)(a+c)(b+d)反思与感悟本题考查频率分布直方图的应用、独立性检验、随机变量的分布列、期望、方差计算.准确读取频率分布直方图中的数据是解题的关键.跟踪训练3PM2.5(细颗粒物)是指空气中直径小于或等于2.5微米的颗粒物(也称可入肺颗粒物).为了探究车流量与PM2.5的质量分数是否相关,现采集到某城市周一至周五某一时间段车流量与PM2.5的数据如下表:图(1)(2)根据上表数据,用最小二乘法求出y 关于x 的线性回归方程y ^=b ^x +a ^;(3)若周六同一时间段车流量是25万辆,试根据(2)中求出的线性回归方程预测此时PM2.5的质量分数(保留整数).题型四 等价转化思想等价转化就是将复杂问题简单化,抽象问题直观化,以便于应用数学规律解决问题.它是一种非常重要的数学思想方法.在解决实际问题的预测和检验时,可以分别转化为回归分析模型和独立性检验问题. 例4 在考察黄烟经过药物处理和发生青花病的关系时,得到如下数据:在试验的470株黄烟中,经过药物处理的黄烟有25株发生青花病,60株没有发生青花病;未经过药物处理的有185株发生青花病,200株没有发生青花病.试推断药物处理跟发生青花病是否有关系.反思与感悟 本题是判断两个分类变量是否有关系的问题,应转化为独立性检验问题,解题的关键是正确列出2×2列联表,再计算K 2的观测值.在选取样本时,要求表中的4个数据都要大于或等于5.跟踪训练4 在彩色显影中,析出银的光学密度x 与形成染料的光学密度y 的试验数据如下表:1.建立回归模型的基本步骤:(1)确定研究对象,明确哪个变量是解释变量,哪个变量是预报变量.(2)画出散点图,观察它们之间的关系.(3)由经验确定回归方程的类型.(4)按照一定的规则估计回归方程中的参数.(5)得出结果后分析残差图是否有异常.2.独立性检验是对两个分类变量有关系的可信程度的判断.常用的直观方法为等高条形图,等高条形图由于是等高的,因此它能直观地反映两个分类变量之间的差异的大小,而利用假设的思想方法,计算出某一个随机变量K2的值来判断更精确些.提醒:完成作业章末检测[答案]精析题型探究例1 解 (1)设x 轴表示房屋的面积,y 轴表示销售价格,数据对应的散点图如图.(2)由(1)知y 与x 具有线性相关关系,可设其回归方程为 y ^=b ^x +a ^,依据题中的数据,应用科学计算器,可得出 x =15∑i =15x i =109,i =15(x i -x )2=1570,y =15∑i =15y i =23,2,i =15(x i -x )(y i -y )=308,∴b ^=i =15(x i -x )(y i -y )i =15(x i -x )2=3081570≈0.1962, a ^=y -b ^x ≈23.2-0.1962×109=1.8142. 故所求的回归直线方程为y ^=0.1962x +1.8142.(3)由(2)知当x =150时,销售价格的估计值为y ^=0.1962×150+1.8142=31.2442(万元). 故当房屋面积为150m 2时,估计销售价格是31.2442万元. 跟踪训练1 解 (1)由题意知n =10,x =1n ∑i =1n x i =8010=8,y =1n ∑i =1n y i =2010=2,又l xx =∑i =1nx 2i -n x 2=720-10×82=80,l xy =∑i =1nx i y i -n x y =184-10×8×2=24,由此得b ^=l xy l xx =2480=0.3,a ^=y -b ^x =2-0.3×8=-0.4, 故所求回归方程为y ^=0.3x -0.4.(2)由于变量y 的值随x 值的增加而增加(b ^=0.3>0), 故x 与y 之间正相关.(3)将x =7代入回归方程可以预测该家庭的月储蓄为 y ^=0.3×7-0.4=1.7(千元).例2 解 由列联表的数据可求K 2的观测值 k =460×(26×200-184×50)276×384×210×250≈4.804.而4.804>3.841,所以在犯错误的概率不超过0.05的前提下,认为种子灭菌与小麦发生黑穗病有关系. 跟踪训练2 解 由列联表可求K 2的观测值, k =300(114×18-132×36)2150×150×246×54≈7.317>6.635,所以有99%的把握认为“新措施对防治猪白痢有效”.例3 解 (1)由频率分布直方图可知,在抽取的100人中,“体育迷”有25人,从而2×2列联表如下:将2×2K 2的观测值k =n (ad -bc )2(a +b )(c +d )(a +c )(b +d )=100×(30×10-45×15)275×25×45×55=10033≈3.030.因为3.030<3.841,所以没有理由认为“体育迷”与性别有关.(2)由频率分布直方图知抽到“体育迷”的频率为0.25,将频率视为概率,即从观众中抽取一名“体育迷”的概率为14.由题意知X ~B ⎝⎛⎭⎫3,14,从而X 的分布列为:E (X )=np =3×14=34,D (X )=np (1-p )=3×14×34=916.跟踪训练3 解 (1)散点图如图(2).图(2)(2)计算得x =50+51+54+57+585=54,y =69+70+74+78+795=74,i =15(x i -x )(y i -y )=(-4)×(-5)+(-3)×(-4)+3×4+4×5=64,i =15(x i -x )2=(-4)2+(-3)2+32+42=50,∴b ^=i =15(x i -x )(y i -y )i =15(x i -x )2=6450=1.28, a ^=y -b x =74-1.28×54=4.88.故y 关于x 的线性回归方程是y ^=1.28x +4.88. (3)当x =25时,y =1.28×25+4.88≈37, ∴可以预测此时PM2.5的质量分数约为37. 例4 解 由已知条件得2×2列联表如下:提出假设H 0:经过药物处理跟发生青花病无关系. 根据列联表中的数据,可以求得K 2的观测值 k =470×(25×200-185×60)2210×260×85×385≈9.788.因为当H 0成立时,K 2≥7.879的概率约为0.005,而此时k =9.788>7.879,所以在犯错误的概率不超过0.005的前提下,认为药物处理跟发生青花病是有关系的.跟踪训练4 在彩色显影中,析出银的光学密度x 与形成染料的光学密度y 的试验数据如下表:解 作散点图如图.由散点图,可设回归方程为y =A e bx (A >0,b <0),其中A 和b 为参数,对两边取对数,得ln y=ln A +b x ,作变量代换X =1x ,Y =ln y ,并设a =ln A ,得Y =a +bX ,则由试验数据(x i ,y i )(i =1,2,3,…,11),求出对应的数据(X i ,Y i )(i =1,2,3,…,11)如下表:经过计算可得X =7.946,Y =-0.612,i =111(X i -X )2≈406.614,i =111(Y i -Y )2≈8.690,i =111(X i -X )(Y i -Y )≈-59.342,样本相关系数r ≈-59.342406.614×8.690≈-0.9983.显然|r |≈0.9983>0.75,所以认为Y 与X 之间的线性相关关系特别显著. 再求a ^与b ^的估计值,b ^=-59.342406.614≈-0.146,a ^=Y -b X ≈-0.612-(-0.146)×7.946≈0.548. 则Y 与X 的回归直线方程为Y =0.548-0.146X . 换回原变量,得y =0.1460.548ex-所以y 关于x 的回归方程为y =0.1460.548ex-。
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
2 2
利用P94表3-10来判断两分类变量x和y的关系 2 ◆◆◆当随机变量K 的观测值k 2.706, 就认为没有充分的证据 显示“X与Y有关系”
x
i 1
.
2 i
1 n 1 n 其中 x xi , y yi , ( x , y )称为样本点的中心. n i 1 n i 1
求回归直线方程的步骤:
第一步:画散点图说明
变量 x , y线性相关 ;
第二步:计算x , y;
第三步:代入公式计算b,a的值;
ˆ bxa 第四步:写出直线方程 . y
n
2 ( y y ) i i
越小,模型的拟合效果 越好;R 2 越小,则残差平方和越 大,即模型 的拟合效果越差。
4.(2011·惠州模拟)已知x,y之间的一组数据如表:
(1)分别从集合A={1,3,6,7,8},B={1,2,3,4,5}中各取一个数 x,y,求x+y≥10的概率; (2)对于表中数据,甲、乙两同学给出的拟合直线分别为
【自主解答】(1)甲厂抽查的产品中有360件优质品,从而甲
360 厂生产的零件的优质品率估计为 =72%; 500
乙厂抽查的产品中有320件优质品,从而乙厂生产的零件的 优质品率估计为 320 =64%.
500
【规律方法】1.独立性检验的步骤:
(1)根据样本数据制成2×2列联表. (2)根据公式K2=
1 1 1 试根据残差平方和 y x 1与y x , 3 2 2
n i 1
yi y i
2
的大小,
判断哪条直线拟合程度更好.
【解析】(1)分别从集合A,B中各取一个数组成数对(x,y), 共有25对, 其中满足x+y≥10的有(6,4),(6,5),(7,3),(7,4), (7,5), (8,2),(8,3),(8,4),(8,5),共9对. 故使x+y≥10的概率为 9 .
^ ^
回归直线的一些常用结论: 1.回归直线过样本点中心;
2.回归直线方程中x的系数反映正、负相关; 3.给定一个x值,可以用回归方程估计y值;
4.回归方程的意义:当变量x值增加……个单 位,y值平均增加了……个单位?
C
A
R2 1
( y
i 1 n i 1
n
i
ˆi ) y
2
2 ˆ R 2 越大,则残差平方和 ( y y ) i i i 1
25
(2)用y= 1 x+1作为拟合直线时,所得y的实际值与y的估计值
3
的差的平方和为:
4 2 ) +(2-2)2+(3-3)2+(4- 10 )2+(5- 11 )2= 7 . 3 3 3 3 用 y 1 x 1 作为拟合直线时,所得y的实际值与y的估计值 2 2
S1=(1-
的差的平方和为:
n ad bc
2
a b a c b d (c d)
计算K2的观测值.
(3)比较K2与临界值的大小关系作统计推断. 2.另外,还可利用图形来判断两个变量之间是否有关系,可 以画出等高条形图,从图形上只可以粗略地估计两个分类变 量的关系,可以结合所求数值来进行比较,作图时应注意单 位统一,图形准确.
有相关关系,如果所有的样本点都落在某一直线附
近,变量之间就有线性相关关系.
2.(2010·广东高考)某市居民2005~2009年家庭年平均收入 x(单位:万元)与年平均支出Y(单位:万元)的统计资料如下
表所示:
13万元 , 根据统计资料,居民家庭年平均收入的中位数是_______ 正(较强的)线性相关关系. 家庭年平均收入与年平均支出有________
3
独立性检验
【例3】(2011·潮州模拟)某企业有两个分厂生产某种零 件,按规定内径尺寸(单位:mm)的值落在[29.94,30.06)
内的零件为优质品.从两个分厂生产的零件中各抽出了500件,
量其内径尺寸,得结果如下表: 甲厂:
(1)试分别估计两个分厂生产的零件的优质品率; (2)由以上统计数据填下面2×2列联表,并问是否能在犯错 误的概率不超过0.01的前提下认为“两个分厂生产的零件的 质量有差异”?
3.求回归直线方程
回归直线方程: y ˆ bxa
n ^ ( xi x )( yi y ) b i 1 n 其中 2 ( x x ) i i 1 ^ a y b x.
^ ^
x y
i 1 n i
n
i
nx y nx
2
知 识 体 系 构 建
1.观察下列各图形,
每个图中的两个变量具有相关关系的是( (A)(1)(2) (B)(1)(4)
)
C
(C)(3)(4)
(D)(2)(3)
【规律方法】利用散点图判断两个变量是否有相关 关系是比较简便的方法.在散点图中如果所有的样本 点都落在某一函数的曲线上,就用该函数来描述变 量之间的关系,即变量之间具有函数关系,如果所 有的样本点落在某一函数的曲线附近,变量之间就
S2=(1-1)2+(2-2)2+(3- )2+(4-4)2+(5- )2=
2 2 7 2 9 2 1 . 2
∵S2<S1,故用直线 y 1 x 1 拟合程度更好.
设有两个分类变量X和Y,它们的值域分别为{x1,x2} 和{y1,y2},其样本频数列联表(称为2×2列联表) y1 y2 总计 x1 a b a+b x2 c d c+d 总计 a+c b+d a+b+c+d