2016年秋季学期新苏教版高中数学选修2-3 3.2 回归分析(二)教案
江苏省高二数学苏教版选修2-3教案:3.2 回归分析3
3.2回归分析(1)教学目标(1)通过实例引入线性回归模型,感受产生随机误差的原因;(2)通过对回归模型的合理性等问题的研究,渗透线性回归分析的思想和方法; (3)能求出简单实际问题的线性回归方程. 教学重点,难点线性回归模型的建立和线性回归系数的最佳估计值的探求方法. 教学过程 一.问题情境1. 情境:对一作直线运动的质点的运动过程观测了次,得到如下表所示的数据,试估计当先作散点图,如下图所示:从散点图中可以看出,样本点呈直线趋势,时间与位置观测值y 之间有着较好的线性关系.因此可以用线性回归方程来刻画它们之间的关系.根据线性回归的系数公式,1221()ni i i ni i x y nx y b x n x a y bx==⎧-⎪⎪=⎪⎨-⎪⎪=-⎪⎩∑∑ 可以得到线性回归方为 3.5361 2.1214y x =+,所以当9x =时,由线性回归方程可以估计其位置值为22.6287y =2.问题:在时刻9x =时,质点的运动位置一定是22.6287cm 吗?二.学生活动思考,讨论:这些点并不都在同一条直线上,上述直线并不能精确地反映与y 之间的关系,y 的值不能由完全确定,它们之间是统计相关关系,y 的实际值与估计值之间存在着误差. 三.建构数学1.线性回归模型的定义:我们将用于估计y 值的线性函数a bx +作为确定性函数;y 的实际值与估计值之间的误差记为,称之为随机误差;将y a bx ε=++称为线性回归模型. 说明:(1)产生随机误差的主要原因有:①所用的确定性函数不恰当引起的误差; ②忽略了某些因素的影响; ③存在观测误差.(2)对于线性回归模型,我们应该考虑下面两个问题: ①模型是否合理(这个问题在下一节课解决); ②在模型合理的情况下,如何估计,? 2.探求线性回归系数的最佳估计值:对于问题②,设有对观测数据(,)i i x y (1,2,3,,)i n =,根据线性回归模型,对于每一个i x ,对应的随机误差项()i i i y a bx ε=-+,我们希望总误差越小越好,即要使21nii ε=∑越小越好.所以,只要求出使21(,)()niii Q y x αββα==--∑取得最小值时的α,β值作为,的估计值,记为,.注:这里的i ε就是拟合直线上的点(),i i x a bx +到点(),i i i P x y 的距离.用什么方法求,?回忆《数学3(必修)》“2.4线性回归方程”P71“热茶问题”中求,的方法:最小二乘法.利用最小二乘法可以得到,的计算公式为1122211()()()()nni i iii i nni ii i x x y y x ynx yb x x xn x a y bx====⎧---⎪⎪==⎪⎨--⎪⎪=-⎪⎩∑∑∑∑,其中11n i i x x n ==∑,11ni i y y n ==∑由此得到的直线y a bx =+就称为这对数据的回归直线,此直线方程即为线性回归方程.其中,分别为,的估计值,称为回归截距,称为回归系数,y 称为回归值. 在前面质点运动的线性回归方程 3.5361 2.1214y x =+中, 3.5361a =, 2.1214b =. 3. 线性回归方程y a bx =+中,的意义是:以为基数,每增加1个单位,y 相应地平均增加个单位;4. 化归思想(转化思想)在实际问题中,有时两个变量之间的关系并不是线性关系,这就需要我们根据专业知识或散点图,对某些特殊的非线性关系,选择适当的变量代换,把非线性方程转化为线性回归方程,从而确定未知参数.下面列举出一些常见的曲线方程,并给出相应的化为线性回归方程的换元公式.(1)b y a x =+,令'y y =,1'x x=,则有''y a bx =+. (2)by ax =,令'ln y y =,'ln x x =,'ln a a =,则有'''y a bx =+. (3)bxy ae =,令'ln y y =,'x x =,'ln a a =,则有'''y a bx =+. (4)b x y ae =,令'ln y y =,1'x x=,'ln a a =,则有'''y a bx =+. (5)ln y a b x =+,令'y y =,'ln x x =,则有''y a bx =+.四.数学运用 1.例题:例1.下表给出了我国从1949年至1999年人口数据资料,试根据表中数据估计我国2004年的人口数.解:为了简化数据,先将年份减去1949,并将所得值用表示,对应人口数用y 表示,得807 909 975 1035 1107 1177 1246作出11个点(),x y 构成的散点图,由图可知,这些点在一条直线附近,可以用线性回归模型y a bx ε=++来表示它们之间的关系.根据公式(1)可得14.453,527.591.b a ⎧≈⎪⎨≈⎪⎩ 这里的,a b 分别为,a b 的估 计值,因此线性回归方程 为527.59114.453y x =+由于2004年对应的55x =,代入线性回归方程527.59114.453y x =+可得1322.50y =(百万),即2004年的人口总数估计为13.23亿.例2. 某地区对本地的企业进行了一次抽样调查,下表是这次抽查中所得到的各企业的人均资本(万元)与人均产出y (万元)的数据:(1)设y 与之间具有近似关系by ax ≈(,a b 为常数),试根据表中数据估计和的值; (2)估计企业人均资本为16万元时的人均产出(精确到0.01).分析:根据,y 所具有的关系可知,此问题不是线性回归问题,不能直接用线性回归方程处理.但由对数运算的性质可知,只要对by ax ≈的两边取对数,就能将其转化为线性关系.解(1)在by ax ≈的两边取常用对数,可得lg lg lg y a b x ≈+,设lg y z =,lg a A =,lg x X =,则z A bX ≈+.相关数据计算如图327--所示.仿照问题情境可得A ,的估计值A ,分别为0.2155,1.5677,A b ⎧=-⎪⎨=⎪⎩由lg 0.2155a =-可得0.6088a ≈,即,的估计值分别为0.6088和1.5677.(2)由(1)知1.56770.6088y x =.样本数据及回归曲线的图形如图328--(见书本102P页)当16x =时, 1.56770.60881647.01y =⨯≈(万元),故当企业人均资本为16万元时,人均产值约为47.01万元. 2.练习:104P 练习第题. 五.回顾小结:1. 线性回归模型y a bx ε=++与确定性函数y a bx =+相比,它表示y 与之间是统计相关关系(非确定性关系)其中的随机误差提供了选择模型的准则以及在模型合理的情况下探求最佳估计值,的工具;2. 线性回归方程y a bx =+中,的意义是:以为基数,每增加1个单位,y 相应地平均增加个单位;3.求线性回归方程的基本步骤. 六.课外作业:.。
苏教版高中数学选修(2-3)-3.2要点讲解:回归分析
回归分析1.回归直线:如果散点图中点的分布从整体上看大致在一条直线附近,我们就称这两个变量之间具有线性相关关系,这条直线叫作回归直线.求回归直线方程的一般步骤:作出散点图(由样本点是否呈条状分布来判断两个量是否具有线性相关关系),若存在线性相关关系→②求回归系数→③写出回归直线方程,并利用回归直线方程进行预测说明.2.回归分析:对具有相关关系的两个变量进行统计分析的一种常用方法.建立回归模型的基本步骤是:①确定研究对象,明确哪个变量是解释变量,哪个变量是预报变量;②画好确定好的解释变量和预报变量的散点图,观察它们之间的关系(线性关系).③由经验确定回归方程的类型.④按一定规则估计回归方程中的参数(最小二乘法);⑤得出结论后在分析残差图是否异常,若存在异常,则检验数据是否有误,后模型是否合适等.3.利用统计方法解决实际问题的基本步骤:①提出问题;②收集数据;③分析整理数据;④进行预测或决策.4.残差变量e 的主要来源:①用线性回归模型近似真实模型(真实模型是客观存在的,通常我们并不知道真实模型到底是什么)所引起的误差.可能存在非线性的函数能够更好地描述y 与x 之间的关系,但是现在却用线性函数来表述这种关系,结果就会产生误差.这种由于模型近似所引起的误差包含在e 中.②忽略了某些因素的影响.影响变量y 的因素不只变量x 一个,可能还包含其他许多因素(例如在描述身高和体重关系的模型中,体重不仅受身高的影响,还会受遗传基因、饮食习惯、生长环境等其他因素的影响),但通常它们每一个因素的影响可能都是比较小的,它们的影响都体现在e 中.③观测误差.由于测量工具等原因,得到的y 的观测值一般是有误差的(比如一个人的体重是确定的数,不同的秤可能会得到不同的观测值,它们与真实值之间存在误差),这样的误差也包含在e 中.上面三项误差越小,说明我们的回归模型的拟合效果越好.名师要点解析例1研究某灌溉渠道水的流速与水深之间的关系,测得一组数据如下:(1)求y对x的回归直线方程;(2)预测水深为1.95m时水的流速是多少?【分析】本题考查如何求回归直线的方程,可先把有关数据用散点图表示出来,若这些点大致分布在通过散点图中心的一条直线附近,说明这两个变量线性相关,从而可利用我们学过的最小二乘估计思想及计算公式求得线性回归直线方程.【解】(1)由于问题中要求根据水深预报水的流速,因此选取水深为解释变量,流速为预报变量,作散点图:由图容易看出,x与y之间有近似的线性关系,或者说,可以用一个回归直线方程来反映这种关系.由计算器求得.对x的回归直线方程为.。
高中数学苏教版选修2-3教案:3.2 回归分析2.doc
15 〃 ________£也凹一心〉1=1n3.2回归分析(2)教学目标(1)通过实例了解相关系数的概念和性质,感受相关性检验的作用; (2)能对相关系数进行显著性检验,并解决简单的I 口I 归分析问题; (3) 进一步了解回归的基本思想、方法及初步应用.教学重点,难点相关系数的性质及其显著性检验的基木思想、操作步骤.教学过程%1. 问题情境1. 情境:下面是一组数据的散点图,若求出相应的线性I 叫归方程,求出的线性回归方程可以用作预测和估计吗?2. 问题:思考、讨论:求得的线性|门I 归方程是否有实际意义.%1. 学生活动 对任意给定的样本数据,由计算公式都可以求出相应的线性回归方程,但求得的线 性回归方程未必有实际意义.左图中的散点明显不在一条直线附近,不能进行线性拟合, 求得的线性1叫归方程是没有实际意义的;右图中的散点基本上在一条直线附近,我们可 以粗略地估计两个变量间有线性相关关系,但它们线性相关的程度如何,如何较为精确 地刻画线性相关关系呢?这就是上节课提到的问题①,即模型的合理性问题.为了回答这个问题,我们需要 对变量与y 的线性相关性进行检验(简称相关性检验).%1. 建构数学1. 相关系数的计算公式:对于,y 随机取到的对数据(m )(' = 1,2,3,•・・,〃),样本相关系数的计算公式为 )(乂一)') 三---- m .⑵ £ — f )2 完(乂 -方•-心)2)(£寸 (y )2) /=! i=\ V /=! /=12・相关系数的性质: (2) |尸|越接近与1,, y 的线性相关程度越强;5 10(3)|尸|越接近与0,,),的线性相关程度越弱.可见,一条回归直线有多大的预测功能,和变量间的相关系数密切相关.3.对相关系数进行显著性检验的步骤:相关系数的绝对值与1接近到什么程度才表明利用线性I口I归模型比较合理呢?这需要对相关系数进行显著性检验.对此,在统计上有明确的检验方法,基本步骤是:(1)提出统计假设H。
苏教版高中数学选修(2-3)课件3.2《回归分析》
灿若寒星整理制作
3.1回归分析的基本思想及 其初步应用
比《数学3》中“回归”增加的内
数学3——统计
容 选修2-3——统计案例
5. 引入线性回归模型
1. 画散点图
2. 了解最小二乘法 的思想
y=bx+a+e
6. 了解模型中随机误差项e产 生的原因
3. 求回归直线方程
y=bx+a
4. 用回归直线方程 解决应用问题
i=1
i 1
i 1
i=1
R2 1 3.1643 0.9999. 25553.3
即解释变量天数对预报变量繁殖细菌得个数解释了99.99%.
练习假设关于某设备的使用年限x和所支出的维修费用y(万
元),有如下的统计资料。
使用年限x
2
3
4
5
6
维修费用y
2.2
3.8
5.5
6.5
7.0
若由资料知,y对x呈线性相关关系。试求:
两个含有未知参数的模型:y(1) f (x, a)和y(2) g(x, b),
其中a和b都是未知参数。拟合效果比较的步骤为:
(1)分别建立对应于两个模型的回归方程 yˆ (1) f (x, aˆ)
与其yˆ (中2) 和分g别(x是, bˆ参),数a和abˆ的估bˆ计值;
n
(2)分别计算两个回归方程的残差平方和 Qˆ (1) ( yi yˆi(1) )2
最好的模型是哪个?
产卵数
400
300
200
100
0
0
5
10
15
20
25
30
35
40
-100
线性模型
高中数学苏教版选修2-3学案:3.2 回归分析
§3。
2 回归分析(一)课时目标1.掌握建立线性回归模型的步骤。
2。
了解回归分析的基本思想和初步应用.1.对于n对观测数据(x i,y i)(i=1,2,3,…,n),直线方程____________称为这n对数据的线性回归方程.其中________称为回归截距,________称为回归系数,________称为回归值.2。
错误!,错误!的计算公式错误!3.相关系数r的性质(1)|r|≤1;(2)|r|越接近于1,x,y的线性相关程度越强;(3)|r|越接近于0,x,y的线性相关程度越弱.一、填空题1.下列关系中正确的是________(填序号).①函数关系是一种确定性关系;②相关关系是一种非确定性关系;③回归分析是对具有函数关系的两个变量进行统计分析的一种方法;④回归分析是对具有相关关系的两个变量进行统计分析的一种常用方法.2.回归直线错误!=错误!+错误!x恒经过定点________.3.为了解决初中二年级平面几何入门难的问题,某校在初中一年级代数教学中加强概念和推理教学,并设有对照班,下表是初中二年级平面几何期中测试成绩统计表的一部分,其χ2≈________(保留小数点后两位).4.和体重y (kg)的回归方程为错误! =0.849x -85。
712,则身高172 cm 的女大学生,由线性回归方程可以估计其体重为________ kg 。
5.设两个变量x 和y 之间具有线性相关关系,它们的相关系数是r ,且y 关于x 的回归直线的斜率是错误! ,那么错误! 与r 的符号________(填写“相同”或“相反”).6.某小卖部为了了解冰糕销售量y (箱)与气温x (℃)之间的关系,随机统计了某4天卖出的冰糕的箱数与当天气温,并制作了对照表(如下表所示),且由表中数据算得线性回归方程错误! =错误! x +错误! 中的错误! =2,则预测当气温为25℃时,冰糕销量为________箱。
3.2.回归分析-苏教版选修2-3教案
3.2.回归分析-苏教版选修2-3教案教材基本信息•教材名称:苏教版高中数学选修2•单元名称:数据分析与统计•课时:3课时教学目标1.了解什么是回归分析。
2.学习回归分析的基本概念和方法。
3.掌握直线拟合和残差分析的实现方法。
4.理解回归分析在生活中的应用。
教学重点1.回归分析的基本概念和方法。
2.直线拟合和残差分析的实现。
教学难点1.理解回归分析的概念和方法。
2.掌握直线拟合和残差分析的实现步骤。
教学内容及安排一、引入1.通过一个实际问题引出回归分析的概念和应用。
2.以表格和图像等形式,引导学生识别数据之间的关系和规律。
二、回归分析的概念和方法1.回归分析的定义和基本概念。
2.以简单线性回归模型为例,介绍回归分析的方法。
–公式推导和参数估计。
–模型拟合与模型检验。
3.针对多元回归分析,简要介绍其方法和应用。
三、直线拟合的实现1.介绍直线方程和相关系数的定义和计算方法。
2.以实例为基础,讲解直线拟合的步骤和实现过程。
–用手动计算的方法计算,再用计算器或软件求解。
3.培养学生的数据分析能力,注重判断拟合效果和可靠性。
四、残差分析的实现1.残差的定义和计算方法。
2.残差分布图和残差散点图的绘制和解释。
3.强调残差分析及其结果对模型的影响。
五、回归分析在生活中的应用1.针对学生关心的实际问题,介绍回归分析的运用。
2.初步了解其在经济、社会学、医学和环境等领域的应用。
教学方法1.课件讲解:以幻灯片为主,结合实例、图像和文字呈现。
2.讨论和交流:引导学生大胆提问,鼓励学生尝试回答其他同学的问题。
3.实验探究:引导学生在问题解决中体验回归分析的乐趣和重要性。
教学手段1.课件展示。
2.板书和笔记。
3.实际数据和软件操作。
教学评估1.期中/期末考试考查学生对回归分析的掌握程度。
2.课堂测试考查学生对直线拟合和残差分析等具体内容的理解。
3.个人/小组报告,重点评估学生实践能力和解决问题的能力。
参考文献1.线性回归分析及其在医学中的应用[M]. 北京:人民卫生出版社,2001.2.Applied Linear Regression [M]. Third Edition, Wiley, 2013.3.单元教材和参考书中的相关内容。
苏教版高中数学选修2-3§3.2 回归分析(二).docx
§3.2 回归分析(二)课时目标1.进一步理解回归分析的基本思想.2.了解一些非线性回归问题的解法.1.对相关系数r进行显著性检验的基本步骤如下:(1)提出统计假设H0:变量x,y________________________;(2)如果以95%的把握作出推断,可以根据1-0.95=0.05与n-2在附录2中查出一个r 的____________(其中1-0.95=0.05称为____________);(3)计算________________;(4)作出统计推断:若____________,则否定H0,表明有________的把握认为x与y之间具有________________;若____________,则没有理由拒绝原来的假设H0,即就目前数据而言,没有充分理由认为x与y之间有________________.2.用相关系数可以对两个变量之间的______________进行较为精确的刻画,运用________的方法研究一些非线性相关问题.一、填空题1.下列说法正确的是________.(填序号)①y=2x2+1中的x、y是具有相关关系的两个变量;②正四面体的体积与其棱长具有相关关系;③电脑的销售量与电脑的价格之间是一种确定性的关系;④传染病医院感染甲型H1N1流感的医务人员数与医院收治的甲型流感人数是具有相关关系的两个变量.2.两个变量成负相关关系时,散点图的点散布特征是________________________.3.已知x与y之间的一组数据如下表:则y 关于x 4.某种产品的广告费支出x 与销售额y 之间有下表关系,现在知道其中一个数据弄错了,则最可能错的数据是5.为此进行了10次试验,6.对有关数据的分析可知,每一立方米混凝土的水泥用量x (单位:kg)与28天后混凝土的抗压度y (单位:kg/cm 2)之间具有线性相关关系,其线性回归方程为y ^=0.30x +9.99.根据建设项目的需要,28天后混凝土的抗压度不得低于89.7 kg/cm 2,每立方米混凝土的水泥用量最少应为________kg.(精确到0.1 kg)7.根据统计资料,我国能源生产自1986年以来发展很快.下面是我国能源生产总量(单位:亿吨标准煤)的回归模型是下列四种模型中的哪一种________.(填序号)①y ^=a ^x +b ^(a ≠0);②y =ax 2+bx +c (a ≠0);③y =a x(a >0且a ≠1); ④y =log a x (a >0且a ≠1).8.下列说法中正确的是________(填序号).①回归分析就是研究两个相关事件的独立性;②回归模型都是确定性的函数;③回归模型都是线性的;④回归分析的第一步是画散点图或求相关系数;⑤回归分析就是通过分析、判断,确定相关变量之间的内在的关系的一种统计方法.二、解答题9.假设学生在初一和初二的数学成绩是线性相关的.若10名学生的初一(x )和初二(y )10.在某化学实验中,测得如下表所示的6对数据,其中x (单位:min)表示化学反应进行的时间,y ((1)设y 与0.001); (2)估计化学反应进行到10 min 时未转化物质的质量(精确到0.1).能力提升11(1)(2)如果y与x之间具有线性相关关系,求回归直线方程;(3)如果父亲的身高为73英寸,估计儿子的身高.检验每册书的成本费y与印刷册数的倒数之间是否具有线性相关关系?如有,求出yx对x的线性回归方程.1.利用回归分析可对一些实际问题作出预测.2.非线性回归方程有时并不给出回归模型,这时我们可以画出已知数据的散点图,把它与我们所学过的各种函数(幂函数、指数函数、对数函数、二次函数等)图象进行比较,挑选一种拟和比较好的函数,把问题通过变量转换,转化为线性的回归分析问题,使之得到解决.3.2 回归分析(二)答案知识梳理1.(1)不具有线性相关关系 (2)临界值r 0.05 检验水平 (3)样本相关系数r (4)|r |>r 0.05 95% 线性相关关系 |r |≤r 0.05 线性相关关系 2.线性相关程度 转化 作业设计 1.④解析 感染的医务人员数不仅受医院收治的病人数的影响,还受防护措施等其他因素的影响.2.从左上角到右下角区域内解析 散点图的主要作用是直观判断两个变量之间的相关关系.一般地说,当散点图中的点是呈“由左下角到右上角”的趋势时,则两个变量之间具有正相关关系;而当散点图中的点是呈“由左上角到右下角”的趋势时,则两个变量之间具有负相关关系.3.(1.5,4)解析 在本题中,样本点的中心为(1.5,4),所以回归直线过(1.5,4)点. 4.(6,50) 5.0.999 8解析 x =55,y =91.7,∑10i =1x 2i =38 500, ∑10i =1y 2i =87 777,∑10i =1x i y i =55 950, 所以r =∑10i =1x i y i -10·x ·y(∑10i =1x 2i -n x 2)(∑10i =1y 2i -n y 2)≈0.999 8.6.265.7 7.①8.④⑤解析 回归分析就是研究两个事件的相关性;回归模型是需要通过散点图模拟的;回归模型有线性和非线性之分.9.解 因为x =71,∑i =110x 2i =50 520,y =72.3,∑i =110x i y i =51 467,所以,b ^=51 467-10×71×72.350 520-10×712≈1.218 2. a ^=72.3-1.218 2×71=-14.192 2,线性回归方程是:y ^=1.218 2x -14.192 2.10.解 (1)在y =cd x两边取自然对数,令ln y =z ,ln c =a ,ln d =b ,则z =a +bx .由公式得a ≈3.905 5,b ≈-0.221 9,则线性回归方程为z =3.905 5-0.221 9x .而ln c =3.905 5,ln d =-0.221 9,故c ≈49.681,d ≈0.801,所以c 、d 的估计值分别为49.681,0.801.(2)当x =10时,由(1)所得公式可得y ≈5.4(mg).11.解 (1)x =66.8,y =67.01,∑10 i =1x 2i =44 794,∑10 i =1y 2i =44 941.93.x y =4 476.27,x 2=4 462.24,y 2=4 490.34,∑10i =1x i y i =44 842.4.所以r =∑10 i =1x i y i -10x y⎝⎛⎭⎫∑10 i =1x 2i -10x 2⎝⎛⎭⎫∑10 i =1y 2i -10y 2=44 842.4-10×4 476.27(44 794-44 622.4)(44 941.93-44 903.4)=79.76 611.748≈79.781.31≈0.980 2.由于r 非常接近于1,所以y 与x 之间具有线性相关关系.(2)设线性回归方程为y ^=b ^x +a ^.由b ^ =∑10 i =1x i y i -10x y ∑10 i =1x 2i -10x2=44 842.4-44 726.744 794-44 622.4=79.7171.6≈0.4645,a ^=y -b ^x =67.01-0.464 5×66.8≈35.98.故所求的线性回归方程为y ^=0.464 5x +35.98.(3)当x =73时,y ^=0.464 5×73+35.98≈69.9,所以当父亲身高为73英寸时,估计儿子的身高约为69.9英寸.12.解 把1x 置换为z ,则有z =1x,从而回归方程来拟合.z =110×(1+0.5+0.333+0.2+0.1+0.05+0.033+0.02+0.01+0.005)=0.225 1,y =110×(10.15+5.52+4.08+…+1.15)=3.14,∑10i =1z 2i =12+0.52+0.3332+…+0.012+0.0052=1.415,∑10i =1y 2i =10.152+5.522+…+1.212+1.152=171.803,∑10i =1z i y i =1×10.15+0.5×5.52+…+0.005×1.15=15.221 02, 所以b ^=∑10i =1z i y i -10z y∑10i =1z 2i -10z2≈8.976,a ^=y -b ^z =3.14-8.976×0.225 1≈1.120,所以所求的z 与y 的线性回归方程为y ^=8.976z +1.120.又因为z =1x ,所以y ^=8.976x+1.120.。
苏教版高中数学选修2-3线性回归分析教案
线性回归分析教学目标:通过对典型案例的探究,了解回归的基本思想、方法及其初步应用。
教学重点:通过对典型案例的探究,了解回归的基本思想、方法及其初步应用。
教学过程一、变量的相关关系中最为简单的是线性相关关系,设随机变量与变量之间存在线性相关关系,则由试验数据得到的点(,)将散布在某一直线周围,因此,可以认为关于的回归函数的类型为线性函数,即,下面用最小二乘法估计参数、b,设服从正态分布,分别求对、b的偏导数,并令它们等于零,得方程组解得其中,且为观测值的样本方差.线性方程称为关于的线性回归方程,称为回归系数,对应的直线称为回归直线.顺便指出,将来还需用到,其中为观测值的样本方差.二、现在讨论线性相关的显著性检验中最简便、最常用的一种方法,即相关系数的显著性检验法.我们早在前面的学习中知道,变量与的相关系数是表示与之间线性相关关系的一个数字特征,因此,要检验随机变量与变量之间的线性相关关系是否显著,自然想到考察相关系数的大小,若相关系数的绝对值很小,则表明与之间的线性相关关系不显著,或者它们之间根本不存在线性相关关系;当且仅当相关系数的绝对值接近1时,才表明与之间的线性相关关系显著,这时求关于的线性回归方程才有意义.在相关系数未知的情况下,可用样本相关系数r作为相关系数的估计值,参照相关系数的定义,并用样本均值与样本方差分别作为数学期望与方差的估计值,定义与的样本相关系数如下:因此,根据试验数据(,),得到的值后可进一步算出样本相关系数r的值. 若使用的是具有线性回归计算功能的电子计算器时,把所有试验数据(,)逐对存入计算器中,则可直接算出r的值.由于样本相关系数r 是相关系数的估计值,所以,r的绝对值越接近1,与之间的线性相关关系越显著. 当r>0时,称与正相关;当r<0时,称与负相关. 而当r的绝对值接近0时,则可认为与之间不存在线性相关关系.三、例1.在7块并排、形状大小相同的试验田上进行施化肥量对水稻产量影1x2)检验相关系数r的显著性水平:r=∑∑∑===---7171222271)7)(7(7i i i i i ii y y x x yx yx =)3.39971132725)(3077000(3.3993078717522⨯-⨯-⨯⨯-≈0.9733,在“相关系数检验的临界值表”查出与显著性水平0.05及自由度7-2=5相应的相关数临界值r 0 05=0.754<0.9733,这说明水稻产量与施化肥量之间存在线性相关关系.3)设回归直线方程a bx y +=ˆ,利用⎪⎪⎪⎩⎪⎪⎪⎨⎧-=--=∑∑==xb y a x x y x y x b i i i i i 71227177 计算a ,b , 得b=75.430770005.399307871752≈⨯-⨯⨯-a=399.3-4.75×30≈257,则回归直线方程25775.4ˆ+=x yx例2.一个工厂在某年里每月产品的总成本y (万元)与该月产量x (万件)之间由如下一组数据:之间的回归直线方程.x2)r=∑∑∑===---1211212222121)12)(12(12i i i i i ii y y x x yx yx18.534.1754.243120.997891-⨯⨯=在“相关系数检验的临界值表”查出与显著性水平0.05及自由度12-2=10相应的相关数临界值r 0 05=0.576<0.997891, 这说明每月产品的总成本y (万元)与该月产量x (万件)之间存在线性相关关系.3)设回归直线方程a bx y+=ˆ, 利用⎪⎪⎪⎩⎪⎪⎪⎨⎧-=--=∑∑==xb y a x x y x y x b i i i i i 121221211212,计算a ,b ,得b ≈1.215, a=x b y -≈0.974,∴回归直线方程为:974.0215.1ˆ+=x y课堂小节:本节课学习了回归的基本思想、方法及其初步应用 课堂练习:略。
江苏省高二数学苏教版选修2-3学案:3.2 回归分析
§3.2 回归分析(一)课时目标1.掌握建立线性回归模型的步骤.2.了解回归分析的基本思想和初步应用.1.对于n 对观测数据(x i ,y i )(i =1,2,3,…,n ),直线方程____________称为这n 对数据的线性回归方程.其中________称为回归截距,________称为回归系数,________称为回归值.2.a ^,b ^的计算公式⎩⎨⎧b ^=∑ni =1x i y i-n x y ∑ni =1x 2i-n (x )2,a ^ =y -b ^x .3.相关系数r 的性质 (1)|r |≤1;(2)|r |越接近于1,x ,y 的线性相关程度越强; (3)|r |越接近于0,x ,y 的线性相关程度越弱.一、填空题1.下列关系中正确的是________(填序号). ①函数关系是一种确定性关系; ②相关关系是一种非确定性关系;③回归分析是对具有函数关系的两个变量进行统计分析的一种方法;④回归分析是对具有相关关系的两个变量进行统计分析的一种常用方法.2.回归直线y ^=a ^+b ^x 恒经过定点________.3.为了解决初中二年级平面几何入门难的问题,某校在初中一年级代数教学中加强概念和推理教学,并设有对照班,下表是初中二年级平面几何期中测试成绩统计表的一部分,其χ2≈________(保留小数点后两位).4.从某学校随机选取8名女大学生,其身高x (cm)和体重y (kg)的回归方程为y ^=0.849x -85.712,则身高172 cm 的女大学生,由线性回归方程可以估计其体重为________ kg.5.设两个变量x 和y 之间具有线性相关关系,它们的相关系数是r ,且y 关于x 的回归直线的斜率是b ^,那么b ^与r 的符号________(填写“相同”或“相反”).6.某小卖部为了了解冰糕销售量y (箱)与气温x (℃)之间的关系,随机统计了某4天卖出的冰糕的箱数与当天气温,并制作了对照表(如下表所示),且由表中数据算得线性回归方程y ^=b ^x+a ^中的b ^=27.今年一轮又一轮的寒潮席卷全国.某商场为了了解某品牌羽绒服的月销售量y (件)与月平均气温x (℃)由表中数据算出线性回归方程y =b x +a 中的b ≈-2.气象部门预测下个月的平均气温约为6℃,据此估计,该商场下个月羽绒服的销售量的件数约为________.8.已知线性回归方程为y ^=0.50x -0.81,则x =25时,y 的估计值为________.二、解答题9.某企业上半年产品产量与单位成本资料如下:(1)求出线性回归方程;(2)指出产量每增加1 000件时,单位成本平均变动多少? (3)假定产量为6 000件时,单位成本为多少元?10(1)求年推销金额(2)若第6名推销员的工作年限为11年,试估计他的年推销金额.能力提升11.下表提供了某厂节能降耗技术改造后,生产甲产品过程中记录的产量x (吨)与相应的生产能耗y (吨标准煤)的几组对照数据.________. 12(1)(2)求线性回归方程,并在散点图中加上回归直线;(3)根据(2)的结果估计当房屋面积为150 m 2时的销售价格.1.(1)求线性回归方程的步骤为①作出散点图;②利用公式计算回归系数b ^及a ^的值;③写出线性回归方程.(2)一般地,我们可以利用线性回归方程进行预测,这里所得到的值是预测值,但不是精确值.2.计算相关系数r 可以判断变量x ,y 的线性相关程度.3.2 回归分析(一)答案知识梳理1.y ^=a ^+b ^x a ^b ^y ^作业设计 1.①②④ 2.(x ,y ) 3.16.23 4.60.316解析 当x =172时,y ^=0.849×172-85.172=60.316. 5.相同解析 可以分析b ^、r 的计算公式. 6.70解析 由线性回归方程必过点(x ,y ),且b ^=2,得a ^=20,所以当x =25时,y ^=70.7.46解析 ∵样本点的中心为(10,38),∴38=-2×10+a ^,∴a ^=58,∴当x =6时,y ^=-2×6+58=46. 8.11.69解析 y 的估计值就是当x =25时的函数值,即0.50×25-0.81=11.69.9.解 (1)n =6,∑6i =1x i =21,∑6i =1y i =426,x =3.5, y =71,∑6i =1x 2i =79,∑6i =1x i y i =1 481, b ^=∑6i =1x i y i -6x y ∑6i =1x 2i -6x 2=1 481-6×3.5×7179-6×3.52≈-1.82. a ^=y -b ^x =71+1.82×3.5=77.37.线性回归方程为y ^=a ^+b ^x =77.37-1.82x .(2)因为单位成本平均变动b ^=-1.82<0,且产量x 的计量单位是千件,所以根据回归系数b ^的意义有:产量每增加一个单位即1 000件时,单位成本平均减少1.82元. (3)当产量为6 000件时,即x =6,代入线性回归方程:y ^=77.37-1.82×6=66.45(元)当产量为6 000件时,单位成本约为66.45元.10.解 (1)设所求的线性回归方程为y ^=b ^x +a ^,则b ^=∑5i =1(x i -x )(y i -y )∑5i =1(x i -x )2=1020=0.5,a ^ =y -b ^ x =0.4. 所以年推销金额y 关于工作年限x 的线性回归方程为y ^=0.5x +0.4.(2)当x =11时,y ^=0.5×11+0.4=5.9(万元).所以可以估计第6名推销员的年推销金额为5.9万元.11.y ^=0.7x +0.35解析 对照数据,计算得:∑4i =1x 2i =86, x =3+4+5+64=4.5,y =2.5+3+4+4.54=3.5. 已知∑4i =1x i y i =66.5, 所以b ^=∑4i =1x i y i -4x y∑4i =1x 2i -4(x )2=66.5-4×4.5×3.586-4×4.52=0.7. a ^=y -b ^x =3.5-0.7×4.5=0.35.因此,所求的线性回归方程为y ^=0.7x +0.35. 12.解 (1)散点图如图所示:(2)x =15∑5i =1x i =109,∑5i =1 (x i -x )2=1 570, y =23.2,∑5i =1(x i -x )(y i -y )=308. 设所求线性回归方程为y ^=b ^x +a ^,则b ^=3081 570≈0.196 2, a ^=y -b ^x =23.2-109×3081 570≈1.816 6. 故所求线性回归方程为y ^=0.196 2x +1.816 6.(3)根据(2),当x =150 m 2时,销售价格的估计值为y ^=0.196 2×150+1.816 6=31.246 6≈31.2(万元).。
高中数学选修回归分析教案
高中数学选修回归分析教案教学内容:1. 线性回归分析的基本概念2. 简单线性回归分析3. 多元线性回归分析4. 回归模型的拟合度检验教学目标:1. 了解线性回归分析的基本概念及相关原理2. 能够运用简单线性回归分析进行数据分析与预测3. 能够应用多元线性回归分析解决实际问题4. 能够进行回归模型的拟合度检验,评估模型的有效性教学重难点:1. 理解线性回归分析中的相关概念,包括自变量、因变量、回归方程等2. 掌握简单线性回归的计算方法和实际应用3. 理解多元线性回归的基本原理,能够运用多元线性回归进行数据分析4. 掌握回归模型的拟合度检验方法及其应用教学过程:第一课时:1. 引入线性回归分析的概念和应用领域2. 讲解简单线性回归的原理和计算方法3. 给出简单线性回归的实例并进行计算练习第二课时:1. 复习简单线性回归的内容2. 讲解多元线性回归的概念和应用3. 给出多元线性回归的实例并进行计算练习第三课时:1. 复习多元线性回归的内容2. 讲解回归模型的拟合度检验方法3. 给出拟合度检验的实例并进行计算练习教学方法:1. 讲解结合实例分析2. 组织学生进行小组讨论与分享3. 带领学生进行数据分析与计算实践4. 指导学生进行模型拟合度检验的实验操作教学评估:1. 利用课堂练习、作业和小考查学生对于概念和计算方法的掌握情况2. 设计实际应用题目,评估学生对于多元线性回归和拟合度检验的应用能力3. 结合学生提问和错误答案进行即时纠正和指导教学资源:1. 课本《数学选修-回归分析》2. 计算器、电脑及相关软件3. 实例数据集和计算练习题教学反思:通过本次教学,学生对线性回归分析有了更深入的理解,能够应用简单线性回归和多元线性回归解决实际问题,同时也能够进行回归模型的拟合度检验,提高了数学分析和实际应用能力。
但在教学过程中,需要更加关注学生的实际操作能力和问题解决能力,进一步提高教学效果。
苏教版数学高二数学苏教版选修2-3课前引导3.2回归分析
3.2 回归分析课前导引情景导入针对某工厂某产品产量与单位成本的资料进行线性回归分析:月份 产量(千件)x单位成本(元/件)yx 2 xy 1 2 73 4 146 2 3 72 9 216 3 4 71 16 284 4 3 73 9 219 5 4 69 16 276 6 56825340合计21 426 79 1 481思路分析:这是一个实际应用的回归分析问题,其实就是找出回归方程,通过回归方程来分析产品产量与单位成本的关系. 解:设回归直线方程y=b ^x +a ^,则x =621 =27,y =6426 =71,∑=612i i x =79,∑=61i i i y x =1 481,所以代入公式,得b ^=2)27(679712761481⨯-⨯⨯-≈-1.818, a ^=71-(-1.818)×27≈77.36,故回归直线方程为y^=77.36-1.82x ;故回归系数b 的意义为:产量每增加1 000件,产品的单位成本就降低1.82元. 知识预览1.a ^与回归系数b ^的计算方法a ^=____________,b ^=________________. a 与回归系数b 还可用列表的方法计算.2.对于变量x 与y 随机抽取到的n 对数据(x 1,y 1),(x 2,y 2),…,(x n ,y n ),检验统计量是样本相关系数 r =_____________________________________________=∑∑∑===---ni ni i i ni iiy n y x n x yx n yx 1122221))((.3.r 的性质r 具有以下性质:|r |≤1,并且|r |越接近1,线性相关程度________;|r |越接近0,线性相关程度_________. 检验步骤如下:(1)作统计假设:x 与y ___________线性相关关系.(2)根据小概率0.05与n -2在附表中查出r 的一个临界值___________. (3)根据样本相关系数计算公式算出_________的值.(4)作统计推断.如果__________,表明有95%的把握认为x 与y 之间具有线性相关关系. 如果________,我们没有理由拒绝原来的假设.这时寻找回归直线方程是毫无意义的.答案:1.y -b ^x∑∑==---ni ini i ix xy y x x121)())((2.∑∑∑===----n i ni ii ni i iy y x x y y x x11221)()())((3.越强 越弱(1)不具有(2)r 0.05(3)r(4)|r|>r 0.05|r|≤r 0.05。
江苏省高二数学苏教版选修2-3教案:3.2 回归分析2
3.2回归分析(2)教学目标(1)通过实例了解相关系数的概念和性质,感受相关性检验的作用; (2)能对相关系数进行显著性检验,并解决简单的回归分析问题; (3)进一步了解回归的基本思想、方法及初步应用. 教学重点,难点相关系数的性质及其显著性检验的基本思想、操作步骤. 教学过程 一.问题情境1.情境:下面是一组数据的散点图,若求出相应的线性回归方程,求出的线性回归方程可以用作预测和估计吗?2.问题:思考、讨论:求得的线性回归方程是否有实际意义. 二.学生活动对任意给定的样本数据,由计算公式都可以求出相应的线性回归方程,但求得的线性回归方程未必有实际意义.左图中的散点明显不在一条直线附近,不能进行线性拟合,求得的线性回归方程是没有实际意义的;右图中的散点基本上在一条直线附近,我们可以粗略地估计两个变量间有线性相关关系,但它们线性相关的程度如何,如何较为精确地刻画线性相关关系呢?这就是上节课提到的问题①,即模型的合理性问题.为了回答这个问题,我们需要对变量与y 的线性相关性进行检验(简称相关性检验). 三.建构数学1.相关系数的计算公式:对于,y 随机取到的对数据(,)i i x y (1,2,3,,)i n =,样本相关系数的计算公式为()()nniii ix x y y x y nx yr ---==∑∑.()22.相关系数的性质: (1)||1r ≤;(2)||r 越接近与1,,y 的线性相关程度越强;(3)||r 越接近与0,,y 的线性相关程度越弱.可见,一条回归直线有多大的预测功能,和变量间的相关系数密切相关. 3.对相关系数进行显著性检验的步骤:相关系数的绝对值与1接近到什么程度才表明利用线性回归模型比较合理呢?这需要对相关系数进行显著性检验.对此,在统计上有明确的检验方法,基本步骤是: (1)提出统计假设0H :变量,y 不具有线性相关关系;(2)如果以95%的把握作出推断,那么可以根据10.950.05-=与2n -(是样本容量)在附录(教材P111)中查出一个的临界值0.05r (其中10.950.05-=称为检验水平); (3)计算样本相关系数;(4)作出统计推断:若0.05||r r >,则否定0H ,表明有95%的把握认为变量y 与之间具有线性相关关系;若0.05||r r ≤,则没有理由拒绝0H ,即就目前数据而言,没有充分理由认为变量y 与之间具有线性相关关系.说明:1.对相关系数进行显著性检验,一般取检验水平0.05α=,即可靠程度为95%. 2.这里的指的是线性相关系数,的绝对值很小,只是说明线性相关程度低,不一定不相关,可能是非线性相关的某种关系.3.这里的是对抽样数据而言的.有时即使||1r =,两者也不一定是线性相关的.故在统计分析时,不能就数据论数据,要结合实际情况进行合理解释. 4.对于上节课的例1,可按下面的过程进行检验: (1)作统计假设0H :与y 不具有线性相关关系;(2)由检验水平0.05与29n -=在附录中查得0.050.602r =; (3)根据公式()2得相关系数0.998r =;(4)因为0.9980.602r =>,即0.05r r >,所以有95﹪的把握认为与y 之间具有线性相关关系,线性回归方程为527.59114.453y x =+是有意义的.四.数学运用 1.例题:例1.下表是随机抽取的对母女的身高数据,试根据这些数据探讨y 与之间的关系.解:所给数据的散点图如图所示:由图可以看出,这些点在一条直线附近,因为()1541571638159.25x =+++÷=,()1551561668161y =+++÷=, ()82222218()1541638159.2559.5ii xx =-=++-⨯=∑, ()82222218()1551668161116ii yy =-=++-⨯=∑,()8181541551631668159.2516180iii x y x y =-⨯++⨯-⨯⨯=∑,所以963.01165.5980≈⨯=r ,由检验水平0.05及26n -=,在附录中查得707.005.0=r ,因为0.9630.707>,所以可以认为与y 之间具有较强的线性相关关系.线性回归模型y a bx ε=++中,a b 的估计值,a b 分别为()8182218 1.345,8i ii ii x y x yb xx==-=≈-∑∑ 53.191a y bx =-≈-,故y 对的线性回归方程为x y 345.1191.53+-=.例2.要分析学生高中入学的数学成绩对高一年级数学学习的影响,在高一年级学生中随机抽取名学生,分析他们入学的数学成绩和高一年级期末数学考试成绩如下表:(2)如果与y 之间具有线性相关关系,求线性回归方程;(3)若某学生入学数学成绩为80分,试估计他高一期末数学考试成绩.解:(1)因为()16367767010x =⨯+++=,()16578757610y =⨯+++=,101()()1894xy i i i L x x y y ==--=∑,2101()2474xx i i L x x ==-=∑,1021()2056yy i i L y y ==-=∑.因此求得相关系数为10()()0.840iix x y y L r --===∑.结果说明这两组数据的相关程度是比较高的; 小结解决这类问题的解题步骤:(1)作出散点图,直观判断散点是否在一条直线附近; (2)求相关系数;(3)由检验水平和2n -的值在附录中查出临界值,判断y 与是否具有较强的线性相关关系; (4)计算,,写出线性回归方程. 2.练习:104P 练习第题.五.回顾小结:1.相关系数的计算公式与回归系数计算公式的比较; 2.相关系数的性质;3.探讨相关关系的基本步骤. 六.课外作业:106P 习题3.2第题.。
高中数学 第三章 统计案例 3.2 回归分析学案 苏教版选修23
3.2 回归分析1.会作出两个有关联变量的散点图,并利用散点图认识变量间的相关关系.2.了解线性回归模型,能根据给出的线性回归方程系数公式建立线性回归方程.(重点、难点)3.了解回归分析的基本思想、方法及简单应用.[基础·初探]教材整理1 线性回归模型阅读教材P 100~P 103“例1”以上部分,完成下列问题.1.线性回归模型的概念:将y =a +bx +ε称为线性回归模型,其中a +bx 是确定性函数,ε称为随机误差.2.线性回归方程:直线y ^=a ^+b ^x 称为线性回归方程,其中a ^称为回归截距,b ^称为回归系数,y ^称为回归值,其中⎩⎪⎨⎪⎧b ^=∑ni =1x i y i -n x - y -∑n i =1x 2i -n x -2,a ^=y --b ^x -.其中x -=1n∑n i =1x i ,y -=1n∑n i =1y i .设某大学生的女生体重y (单位:kg)与身高x (单位:cm)具有线性相关关系.根据一组样本数据(x i ,y i )(i =1,2,…,n ),用最小二乘法建立的回归方程为y ^=0.85x -85.71,则下列结论中正确的是________(填序号).(1)y 与x 具有正的线性相关关系; (2)回归直线过样本点的中心(x ,y );(3)若该大学某女生身高增加1 cm ,则其体重约增加0.85 kg ; (4)若该大学某女生身高为170 cm ,则可断定其体重必为58.79 kg.【解析】 回归方程中x 的系数为0.85>0,因此y 与x 具有正的线性相关关系,(1)正确;由回归方程系数的意义可知回归直线过样本点的中心(x ,y ),B 正确;∵回归方程y ^=0.85x -85.71,∴该大学某女生身高增加1 cm ,则其体重约增加0.85 kg ,(3)正确;(4)不正确.【答案】 (1)(2)(3) 教材整理2 相关关系阅读教材P 104~P 105“例2”以上部分,完成下列问题. 1.相关系数是精确刻画线性相关关系的量.2.相关系数r =∑ni =1x i -x-y i -y-∑n i =1x i -x-2∑n i =1y i -y-2=∑ni =1x i y i -n x - y -⎝⎛⎭⎫∑ni =1x 2i -nx-2⎝⎛⎭⎫∑ni =1y 2i -ny-2.3.相关系数r 具有的性质: (1)|r |≤1;(2)|r |越接近于1,x ,y 的线性相关程度越强; (3)|r |越接近于0,x ,y 的线性相关程度越弱. 4.相关性检验的步骤:(1)提出统计假设H 0:变量x ,y 不具有线性相关关系;(2)如果以95%的把握作出推断,那么可以根据1-0.95=0.05与n -2在附录2中查出一个r 的临界值r 0.05(其中1-0.95=0.05称为检验水平);(3)计算样本相关系数r ;(4)作出统计推断:若|r |>r 0.05,则否定H 0,表明有95%的把握认为x 与y 之间具有线性相关关系;若|r |≤r 0.05,则没有理由拒绝原来的假设H 0,即就目前数据而言,没有充分理由认为y 与x 之间有线性相关关系.判断(正确的打“√”,错误的打“×”)(1)求回归直线方程前必须进行相关性检验.( ) (2)两个变量的相关系数越大,它们的相关程度越强.( ) (3)若相关系数r =0,则两变量x ,y 之间没有关系.( ) 【答案】 (1)√ (2)× (3)√[质疑·手记]预习完成后,请将你的疑问记录,并与“小伙伴们”探讨交流: 疑问1: 解惑: 疑问2: 解惑: 疑问3: 解惑:[小组合作型]回归分析的有关概念(1)有下列说法:①线性回归分析就是由样本点去寻找一条直线,使之贴近这些样本点的数学方法; ②利用样本点的散点图可以直观判断两个变量的关系是否可以用线性关系表示; ③通过回归方程y ^=b ^x +a ^,可以估计和观测变量的取值和变化趋势;④因为由任何一组观测值都可以求得一个线性回归方程,所以没有必要进行相关性检验.其中正确的命题是__________(填序号).(2)如果某地的财政收入x 与支出y 满足线性回归方程y ^=b ^x +a ^+e (单位:亿元),其中b ^=0.8,a ^=2,|e |≤0.5,如果今年该地区财政收入10亿元,则今年支出预计不会超过________亿.【自主解答】 (1)①反映的正是最小二乘法思想,故正确.②反映的是画散点图的作用,也正确.③解释的是回归方程y ^=b ^x +a ^的作用,故也正确.④在求回归方程之前必须进行相关性检验,以体现两变量的关系,故不正确.(2)由题意可得:y ^=0.8x +2+e ,当x =10时,y ^=0.8×10+2+e =10+e ,又|e |≤0.5,∴9.5≤y ^≤10.5.故今年支出预计不会超过10.5亿.【答案】(1)①②③(2)10.51.在分析两个变量的相关关系时,可根据样本数据散点图确定两个变量之间是否存在相关关系,然后利用最小二乘法求出回归直线方程.2.由线性回归方程给出的是一个预报值而非精确值.3.随机误差的主要来源(1)线性回归模型与真实情况引起的误差;(2)省略了一些因素的影响产生的误差;(3)观测与计算产生的误差.[再练一题]1.下列有关线性回归的说法,不正确的是________(填序号).【导学号:29440068】①自变量取值一定时,因变量的取值带有一定随机性的两个变量之间的关系叫做相关关系;②在平面直角坐标系中用描点的方法得到表示具有相关关系的两个量的一组数据的图形叫做散点图;③线性回归方程最能代表观测值x,y之间的关系;④任何一组观测值都能得到具有代表意义的回归直线方程.【解析】只有具有线性相关的两个观测值才能得到具有代表意义的回归直线方程.【答案】④求线性回归方程某班5学生A B C D E学科成绩数学成绩(x)8876736663物理成绩(y)7865716461(1)(2)求物理成绩y对数学成绩x的回归直线方程;(3)一名学生的数学成绩是96,试预测他的物理成绩.【精彩点拨】先画散点图,分析物理与数学成绩是否有线性相关关系,若相关,再利用线性回归模型求解.【自主解答】 (1)散点图如图所示.(2)由散点图可知y 与x 之间具有线性相关关系. 因为x -=15×(88+76+73+66+63)=73.2,y -=15×(78+65+71+64+61)=67.8,∑5i =1x i y i =88×78+76×65+73×71+66×64+63×61=25 054,∑5i =1x 2i =882+762+732+662+632=27 174.所以b ^=∑5i =1x i y i -5 x - y-∑5i =1x 2i -5x-2=25 054-5×73.2×67.827 174-5×73.22≈0.625, a ^=y --b ^x -≈67.8-0.625×73.2=22.05.所以y 对x 的回归直线方程是y ^=0.625x +22.05.(3)当x =96时,y ^=0.625×96+22.05≈82,即可以预测他的物理成绩是82.1.求线性回归方程的基本步骤:2.需特别注意的是,只有在散点图大致呈直线时,求出的线性回归方程才有实际意义,否则求出的回归方程毫无意义.[再练一题]2.某商场经营一批进价是30元/台的小商品,在市场调查中发现,此商品的销售单价x (x 取整数)元与日销售量y 台之间有如下关系:x35 40 45 50 y56412811(1)y 与x (方程的回归系数保留一位有效数字)(2)设经营此商品的日销售利润为P 元,根据(1)写出P 关于x 的函数关系式,并预测当销售单价x 为多少元时,才能获得最大日销售利润.【解】 (1)散点图如图所示,从图中可以看出这些点大致分布在一条直线附近,因此两个变量线性相关.设回归直线为y ^=b ^x +a ^,由题知x -=42.5,y -=34,则求得b ^=∑4i =1x i y i -4x - y-∑4i =1x 2i -4x-2=-370125≈-3, a ^=y --b ^x -=34-(-3)×42.5=161.5,∴y ^=-3x +161.5.(2)依题意有P =(-3x +161.5)(x -30)=-3x 2+251.5x -4 845=-3⎝ ⎛⎭⎪⎫x -251.562+251.5212-4 845. ∴当x =251.56≈42时,P 有最大值,约为426,即预测销售单价为42元时,能获得最大日销售利润. [探究共研型]线性回归分析探究1 作散点图的目的是什么?【提示】 直观分析数据是否存在线性相关关系.探究2 下表显示出变量y 随变量x 变化的一组数据,由此判断表示y 与x 之间的关系最可能的是________.(填序号)x 4 5 6 7 8 9 10 y14181920232528①线性函数模型;②二次函数模型;③指数函数模型;④对数函数模型.【提示】 画出散点图(图略),可以得到这些样本点在一条直线附近,故最可能是线性函数模型.故填①10名同学在高一和高二的数学成绩如下表:x 74 71 72 68 76 73 67 70 65 74 y76757170767965776272其中x 为高一数学成绩,y 为高二数学成绩. (1)y 与x 是否具有相关关系?(2)如果y 与x 具有线性相关关系,求回归直线方程.【精彩点拨】 可先计算线性相关系数r 的值,然后与r 0.05比较,进而对x 与y 的相关性做出判断.【自主解答】 (1)由已知表格中的数据,求得x =71,y =72.3,r =∑i =110x i -xy i -y∑i =110x i -x2∑i =110 y i -y2≈0.78.由检验水平0.05及n -2=8,在课本附录2中查得r 0.05=0.632,因为0.78>0.632, 所以y 与x 之间具有很强的线性相关关系. (2)y 与x 具有线性相关关系,设回归直线方程为y ^=a ^+b ^x ,则有b ^=∑i =110x i -xy i -y∑i =110x i -x2≈1.22,a ^=y --b ^x -=72.3-1.22×71=-14.32.所以y 关于x 的回归直线方程为y ^=1.22x -14.32.1.线性回归分析必须进行相关性检验;若忽略,则所求回归方程没有实际意义. 2.|r |越接近于1,两变量相关性越强,|r |越接近于0,两变量相关性越弱.[再练一题]3.关于两个变量x 和y 的7组数据如下表所示:x 21 23 25 27 29 32 35 y711212466115325试判断x 与y 之间是否有线性相关关系.【解】 x -=17×(21+23+25+27+29+32+35)≈27.4,y -=17×(7+11+21+24+66+115+325)≈81.3,∑7i =1x 2i =212+232+252+272+292+322+352=5 414,∑7i =1x i y i =21×7+23×11+25×21+27×24+29×66+32×115+35×325=18 542,∑7i =1y 2i =72+112+212+242+662+1152+3252=124 393,∴r =∑7i =1x i y i -7 x - y-∑7i =1x 2i -7x -2∑7i =1y 2i -7y-2=18 542-7×27.4×81.35 414-7×27.42124 393-7×81.32≈0.837 5. ∵0.837 5>0.755,∴x 与y 之间具有线性相关关系.[构建·体系]1.设(x1,y1),(x2,y2),…,(x n,y n)是变量x和y的n个样本点,直线l是由这些样本点得到的线性回归直线(如图321),以下结论正确的序号是__________.图321①直线l过点(x,y);②x和y的相关系数为直线l的斜率;③x和y相关系数在0到1之间;④当n为偶数时,分布在l两侧的样本点的个数一定相同.【解析】因为相关系数是表示两个变量是否具有线性相关关系的一个值,它的绝对值越接近于1,两个变量的线性相关程度越强,所以②③错误;④中n为偶数时,分布在l两侧的样本点的个数可能不相同,所以④错误;根据回归直线方程一定经过样本中心点可知①正确.【答案】①2.根据如下样本数据:x 345678y 4.0 2.5-0.50.5-2.0-3.0 得到的回归方程为y=bx+a,则下列说法正确的是__________.(填序号)①a>0,b>0;②a>0,b<0;③a<0,b>0;④a<0,b<0.【解析】由表中数据画出散点图,如图,由散点图可知b<0,a>0,故②正确.【答案】②3.设有一个回归方程为y ^=2-2.5x ,则变量x 每增加一个单位时,y =__________. 【导学号:29440069】【解析】 由回归系数的意义可知当变量x 增加一个单位时,y ^的平均改变量为b ^,由题目回归方程y ^=2-2.5x ,可得当变量x 增加一个单位时,y ^平均减少2.5个单位. 【答案】 平均减少2.5个单位4.对具有线性相关关系的变量x 和y ,由测得的一组数据求得回归直线的斜率为6.5,且恒过(2,3)点,则这条回归直线的方程为________.【解析】 由题意知x =2,y =3,b ^=6.5,所以a ^=y -b ^x =3-6.5×2=-10,即回归直线的方程为y ^=-10+6.5x .【答案】 y ^=-10+6.5x5.某工厂为了对新研发的一种产品进行合理定价,将该产品按事先拟定的价格进行试销,得到如下数据:单价x (元) 8 8.2 8.4 8.6 8.8 9 销量y (件)908483807568(1)求回归直线方程y =b x +a ,其中b =-20,a =y -b ^x ;(2)预计在今后的销售中,销量与单价仍然服从(1)中的关系,且该产品的成本是4元/件,为使工厂获得最大利润,该产品的单价应定为多少元?(利润=销售收入-成本)【解】 (1)x =16(8+8.2+8.4+8.6+8.8+9)=8.5,y =16(90+84+83+80+75+68)=80.∵b ^=-20,a ^=y -b ^x , ∴a ^=80+20×8.5=250, ∴回归直线方程为y ^=-20x +250.(2)设工厂获得的利润为L 元,则L =x (-20x +250)-4(-20x +250)=-20⎝⎛⎭⎪⎫x -3342+361.25,∴该产品的单价应定为334元时,工厂获得的利润最大.我还有这些不足:(1) (2)我的课下提升方案: (1) (2)学业分层测评 (建议用时:45分钟)[学业达标]一、填空题1.如图322所示,对变量x ,y 有观测数据(x i ,y i )(i =1,2,…,10),得散点图(1);对变量u ,v 有观测数据(u i ,v i )(i =1,2,…,10),得散点图(2).由这两个散点图可以判断________.图322①变量x 与y 正相关,u 与v 正相关; ②变量x 与y 正相关,u 与v 负相关; ③变量x 与y 负相关,u 与v 正相关; ④变量x 与y 负相关,u 与v 负相关.【解析】 由图(1)知,x 与y 是负相关,由图(2)知,u 与v 是正相关,故③正确. 【答案】 ③2.已知对一组观测值(x i ,y i )(i =1,2,…,n )作出散点图后,确定具有线性相关关系,若对于y ^=a ^+b ^x ,求得b ^=0.51,x =61.75,y =38.14,则线性回归方程为________.【解析】 ∵a ^=y -b ^x =38.14-0.51×61.75=6.647 5≈6.65. ∴y ^=0.51x +6.65. 【答案】 y ^=0.51x +6.653.某产品的广告费用x 与销售额y 的统计数据如下表:根据上表可得回归方程y =b x +a 中的b 为9.4,据此模型,预报广告费用为6万元时销售额为______万元.【解析】 样本中心点是(3.5,42),则a ^=y --b ^x -=42-9.4×3.5=9.1,所以回归直线方程是y ^=9.4x +9.1,把x =6代入得y ^=65.5.【答案】 65.54.对两个具有线性相关关系的变量进行回归分析时,得到一个回归方程y ^=1.5x +45,x ∈{1,5,7,13,14},则y -=________.【解析】 由x -=8,得y -=1.5×8+45=57. 【答案】 575.已知x ,y 的取值如下表:画出散点图,从所得的散点图分析,y 与x 线性相关,且y =0.95x +a ^,则a ^=________. 【导学号:29440070】【解析】 因为回归方程必过样本点的中心(x -,y -),解得x -=2,y -=4.5,将(2,4.5)代入y ^=0.95x +a ^,可得a ^=2.6.【答案】 2.66.一轮又一轮的寒潮席卷全国.某商场为了了解某品牌羽绒服的月销售量y (件)与月平均气温x (℃)之间的关系,随机统计了某4个月的月销售量与当月平均气温,数据如下表:由表中数据算出线性回归方程y =b x +a 中的b ≈-2.气象部门预测下个月的平均气温约为6 ℃,据此估计,该商场下个月羽绒服的销售量的件数约为________.【解析】 ∵样本点的中心为(10,38),∴38=-2×10+a ^. ∴a ^=58,即y ^=-2x +58. ∴当x =6时,y =46. 【答案】 467.对具有线性相关关系的变量x ,y 有观测数据(x i ,y i )(i =1,2,…,10),它们之间的线性回归方程是y =3x +20,若∑i =110x i =18,则∑i =110y i =________.【解析】 由于∑i =110x i =18,则x -=1.8,∵(x -,y -)在回归方程上, ∴y -=3×1.8+20=25.4, ∴∑i =110y i =10y -=254.【答案】 2548.已知回归直线的斜率的估计值为 1.23,样本点的中心为(4,5),则回归直线方程是________.【解析】 由斜率的估计值为1.23,且回归直线一定经过样本点的中心(4,5),可得y ^-5=1.23(x -4),即y ^=1.23x +0.08.【答案】 y ^=1.23x +0.08 二、解答题 9.对于数据组:(1)(2)求线性回归方程.【解】 (1)作图略.x ,y 具有很好的线性相关性. (2)设y ^=a ^+b ^x ,因为x -=2.5,y -=5,∑4i =1x i y i =60, ∑4i =1x 2i =30,故b ^=60-4×2.5×530-4×2.52=2,a ^=y --b ^x -=5-2×2.5=0,故所求的回归直线方程为y ^=2x .10.下表为某地近几年机动车辆数与交通事故的统计资料,求出y 关于x 的线性回归方程.机动车辆数x /千台95110112120129135150180交通事故数y /千件6.27.5 7.78.5 8.79.8 10.2 13【解】 ∑8i =1x i =1 031,∑8i =1y i =71.6,∑8i =1x 2i =137 835,∑8i =1x i y i =9 611.7,x =128.875,y -=8.95,将它们代入⎩⎪⎨⎪⎧b ^=∑ni =1x i y i -n x - y -∑n i =1x 2i -n x -2,a ^=y --b ^x -,计算得b ^≈0.077 4.a ^=-1.025,所以,所求线性回归方程为y ^=0.077 4x -1.025.[能力提升]1.对具有线性相关关系的变量x ,y 有观测数据(x i ,y i )(i =1,2,…,10),它们之间的线性回归方程是y ^=3x +20,若∑10i =1x i =18,则∑10i =1y i =________. 【解析】 由∑10i =1x i =18,得x =1.8. 因为点(x ,y )在直线y ^=3x +20上,则y =25.4.所以∑10i =1y i =25.4×10=254. 【答案】 2542.(2016·徐州月考)已知对一组观测值(x i ,y i )(i =1,2,…,n )作出散点图后,确定具有线性相关关系,若对于y ^=a ^+b ^x ,求得b ^=0.51,x -=61.75,y -=38.14,则线性回归方程为________.【解析】 ∵a ^=y --b ^x -=38.14-0.51×61.75 =6.647 5≈6.65.∴y ^=0.51x +6.65.【答案】 y =0.51x +6.653.(2016·南京检测)若线性回归方程中的回归系数b ^=0,则相关系数r =________.【解析】 b ^=∑i =1nx i -x-y i -y-∑i =1nx i -x-2,r =∑i =1nx i -x-y i -y-∑i =1nx i -x-2∑i =1ny i -y-2.由计算公式知,若b =0,则r =0. 【答案】 04.某农科所对冬季昼夜温差大小与某反季节大豆新品种发芽多少之间的关系进行分析研究,他们分别记录了12月1日至12月5日的每天昼夜温差与实验室每天每100棵种子中的发芽数,得到如下资料:日期 12月 1日 12月 2日 12月 3日 12月 4日 12月 5日 温差x (℃) 10 11 13 12 8 发芽y (颗)2325302616剩下的2组数据用于回归方程检验.(1)若选取的是12月1日与12月5日的2组数据,请根据12月2日至12月4日的数据,求出y 关于x 的线性回归方程y ^=b ^x +a ^;(2)若由线性回归方程得到的估计数据与所选出的检验数据的误差均不超过2颗,则认为得到的线性回归方程是可靠的,试问(1)中所得的线性回归方程是否可靠?(3)请预测温差为14 ℃的发芽数.【解】 (1)由数据求得,x =12,y =27, 由公式求得,b ^=52,a ^=y -b ^x =-3.所以y 关于x 的线性回归方程为y ^=52x -3.(2)当x =10时,y ^=52×10-3=22,|22-23|<2;当x =8时,y ^=52×8-3=17,|17-16|<2.所以该研究所得到的线性回归方程是可靠的. (3)当x =14时,有y ^=52×14-3=35-3=32,所以当温差为14 ℃时的发芽数约为32颗.。
苏教版高中数学选修233.2回归分析学案
1.线性回归模型(1)随机偏差拥有线性有关关系的两个变量的取值x、y,y的值不可以由x完整确立,可将x,y之间的关系表示为y=a+bx+ε,此中a+bx是确立性函数,ε称为随机偏差.(2)随机偏差产生的主要原由①所用确实定性函数不适合惹起的偏差;②忽视了某些要素的影响;③存在观察偏差.(3)线性回归模型中a,b值的求法y=a+bx+ε称为线性回归模型.a,b的预计值为a∧,b∧,则n--∑x iyi-nxyi=1b∧=n22-n(x)∑x ii=1-a∧=y-b∧x(4)回归直线和线性回归方程直线y_∧=a_∧+b_∧x称为回归直线,此直线方程即为线性回归方程,a∧称为回归截距,b∧称为回归系数,y∧称为回归值.2.样真有关系数r及其性质n--∑x iyi-nxy(1)r =i=1.n n2222(∑=xi-n(x))(∑=1yi-n(y))i1ir拥有以下性质①|r|≤1.|r|越靠近于1,x,y的线性有关程度越强.③|r|越靠近于0,x,y的线性有关程度越弱.3.对有关系数r进行明显性查验的基本步骤(1)提出统计假定H0:变量x,y不拥有线性有关关系.(2)假如以95%的掌握作出判断,那么能够依据1-0.95=0.05与n-2在教材附录2中查出一个r的临界值r0.05(此中1-0.95=0.05称为查验水平).(3)计算样真有关系数r.(4)作出统计推测:若|r|>r0.05,则否认H0,表示有95%的掌握以为x与y之间拥有线性有关关系;若|r|≤r0.05,则没有原由拒绝本来的假定H0,即就当前数据而言,没有充足原由以为y与x之间有线性有关关系.1.在线性回归方程中,b既表示回归直线的斜率,又表示自变量x的取值增添一个单位时,函数值y的改变量.2.经过回归方程y∧=a∧+b∧x可求出相应变量的预计值.3.判断变量之间的线性有关关系,一般用散点图,但在作图中,因为存在偏差,有时很难判断这些点能否散布在一条直线的邻近,从而就很难判断两个变量之间能否拥有线性有关关系,此时就一定利用线性有关系数来判断.[例1]假定对于某设施的使用年限x(年)和所支出的维修花费y(万元)有以下的统计资料:x23456y 2.2 3.8 5.5 6.57.0若由数据可知,y对x体现线性有关关系.(1)求线性回归方程;(2)预计使用年限为10年时,维修花费是多少?[思路点拨]代入数值求线性回归方程,而后把x=10代入,预计维修花费.[精解详析](1)列表以下:i12345x i23456y i 2.2 3.8 5.5 6.57.0x i y i 4.411.422.032.542.0x i249162536经计算得:x=4,y=5,∑5,i=1x2i=90,∑5,i=1x i y i=112.3,a∧=y-b∧·x=0.08,所以线性回归方程为y∧=a∧+b∧x=0.08+1.23x.(2)当x=10时,y∧=0.08+1.23×10=12.38(万元),即若预计使用年限为10年时,维修花费为12.38万元.[一点通]线性回归剖析的步骤:(1)列出散点图,从直观上剖析数据间能否存在线性有关关系;(2)计算x,y,∑n,i=1x2i,∑n,i=1y2i,∑n,i=1x i y i;(3)代入公式求出y∧=b∧x+a∧中参数b∧,a∧的值;(4)写出线性回归方程,并对实质问题作出预计.1.某研究机构对高三学生的记忆力x和判断力y进行统计剖析,所得数据以下表:x681012y2356则y对x的线性回归方程为_________________________________________________.-=6+8+10+12-=2+3+5+6分析:∵x=9,y=4,44故y对x的线性回归方程为y∧=0.7x-2.3.答案:y∧=0.7x-2.32.某班5名学生的数学和物理成绩如表:学生学科A B C D E数学成绩(x)8876736663物理成绩(y)7865716461(1)画出散点图;(2)求物理成绩y对数学成绩x的线性回归方程;(3)一名学生的数学成绩是96,试展望他的物理成绩.解:(1)散点图如图.(2)∵x=15×(88+76+73+66+63)=73.2.y=15×(78+65+71+64+61)=67.8.5∑i=1x i y i=88×78+76×65+73×71+66×64+63×61=25054.5又∑i=1x2i=882+762+732+662+632=27174.∴y对x的线性回归方程是y∧=0.625x+22.05.(3)当x=96时,y∧=0.625×96+22.05≈82.能够展望他的物理成绩是82.[例2]现随机抽取了某中学高一10名在校学生,他们入学时的数学成绩(x)与入学后第一次考试的数学成绩(y)以下:学生号12345678910 x12010811710410311010410599108y84648468696869465771请问:这10名学生的两次数学成绩能否拥有线性关系?[思路点拨]可先计算线性有关系数r的值,而后与r0.05比较,从而对x与y的有关性作出判断.11[精解详析]x=10(120+108++99+108)=107.8,y=10(84+64++57+71)=68.所以有关系数为r=73796-10×107.8×68(116584-10×107.82)(47384-10×682)0.751.由查验水平0.05及n-2=8,在附录2中查得r0.05=0.632,因为0.751>0.632,由此可看出这10名学生的两次数学成绩拥有较强的线性有关关系.[一点通]利用有关系数r进行判断有关关系,需要应用公式计算出r的值,因为数据较大,需要借助计算器,但计算时应当特别仔细,防止出现计算错误.3.对于回归剖析,有以下表达:(1)在回归剖析中,变量间的关系假如非确立性关系,则因变量不可以自由变量唯一确立.(2)线性有关系数能够是正的或是负的.(3)回归剖析中,假如r2=1或r=±1,说明x与y之间完整线性有关.(4)样真有关系数r∈(-∞,+∞).判断其说法能否正确.解:由回归模型及其性质易知(1),(2),(3)是正确的.有关系数的取值范围应为|r|≤1,所以(4)是错误的.4.一台机器因为使用时间较长,但还能够使用,它按不一样的转速生产出来的某机械零件有一些会有弊端,每小时生产有弊端的部件的多少,随机器运行的速度而变化,下表为抽样试验的结果:转速x(转/秒)1614128每小时生产有弊端的部件数y(件)11985对变量y与x进行线性有关性查验.--4解:由题中数据可得x=12.5,y=8.25,∑x i y i=438,--44=412.5,∑x i2=660,∑y i2=291,所以4xy438-412.5=660-625)×(291-272.25)25.5=≈0.995.656.25由查验水平0.05及n-2=2在教材附录表2中查得r0.05=0.950,因为r>r0.05,所以y与x拥有线性有关关系.对两个有关变量进行线性回归剖析时,第一判断两个变量能否线性有关,能够经过散点图和有关系数判断,而后再求线性回归方程,对问题进行展望,不然求出的回归方程无心义,展望也无价值.课下能力提高(十九)一、填空题1.以下命题中正确的选项是________(填全部正确命题的序号).①任何两个变量都拥有有关关系;②圆的周长与圆的半径拥有有关关系;③某商品的需求量与该商品的价钱是一种非确立性关系;④依据散点图求得的线性回归方程可能是没存心义的;⑤两个变量的线性有关关系能够经过线性回归方程,把非确立性问题转变为确立性问题进行研究.分析:明显①是错误的;而②中,圆的周长与圆的半径的关系为C=2πR,是一种确立性的函数关系.答案:③④⑤2.已知x,y的取值以下表:x0134y 2.2 4.3 4.8 6.7从所得的散点图剖析,y与x线性有关,且y∧=0.95x+a∧,则a∧=________.--=4.5.又回归直线恒过定点--分析:∵x=2,y(x,y),代入得a∧=2.6.答案:2.63.从某大学随机选用8名女大学生,其身高x(cm)和体重y(kg)的线性回归方程为y∧=0.849x-85.712,则身高172cm的女大学生,由线性回归方程能够预计其体重为________.分析:y∧=0.849×172-85.712=60.316.答案:60.316kg4.有以下关系:①人的年纪与他(她)拥有的财产之间的关系;②曲线上的点与该点的坐标之间的关系;③苹果的产量与天气之间的关系;④丛林中的同一种树木,其断面直径与高度之间的关系;⑤学生与其学号之间的关系.此中有有关关系的是____________.(填序号)分析:由有关关系定义剖析.答案:①③④5.某产品的广告花费x与销售额y的统计数据以下表:广告花费x(万元)4235销售额y(万元)49263954依据上表可得线性回归方程y=b∧x+a∧中的b∧为9.4,据此模型预告广告花费为6万元时销售额为________万元.分析:样本中心点是(3.5,42),答案:65.5二、解答题6.下边是水稻产量与施肥量的一组观察数据:施肥量15202530354045水稻产量320330360410460470480(1)将上述数据制成散点图;(2)你能从散点图中发现施肥量与水稻产量近似成什么关系吗?解:(1)散点图以下:从图中能够发现施肥量与水稻产量拥有线性有关关系,当施肥量由小到大变化时,水稻产量也由小变大,图中的数据点大概散布在一条直线的邻近,所以施肥量和水稻产量近似成线性正有关关系.7.在一段时间内,分5次测得某种商品的价钱x(万元)和需求量y(t)之间的一组数据为12345价钱x 1.4 1.6 1.82 2.2需求量y1210753已知∑5,i=1x i y i=62,∑5,i=1x i2=16.6.(1)画出散点图;(2)求出y对x的线性回归方程;(3)如价钱定为1.9万元,展望需求量大概是多少?(精准到0.01t)解:(1)散点图以以下图所示:11(2)因为x=5×9=1.8,y=5×37=7.4,8.为了剖析某个高三学生的学习状态,对其下一阶段的学习供给指导性建议.现对他前7次考试的数学成绩x、物理成绩y进行剖析.下边是该生7次考试的成绩:数学(x)888311792108100112物理(y)949110896104101106(1)他的数学成绩与物理成绩哪个更稳固?请给出你的证明;(2)已知该生的物理成绩y与数学成绩x是线性有关的,若该生的物理成绩达到115分,请你预计他的数学成绩大概是多少?并请你依据物理成绩与数学成绩的有关性,给出该生在学习数学、物理上的合理性建议.--12-17+17-8+8+12解:(1)∵x=100+=100;7--6-9+8-4+4+1+6y=100+7=100;∴29942250σ数学=7=142,σ物理=,722从而σ数学>σ物理,∴物理成绩更稳固.(2)因为x与y之间拥有线性有关关系,因为77x i y i=70497,∑x2i=70994,所以依据回归系数公式获得当y=115时,x=130,即该生物理成绩达到115分时,他的数学成绩大概为建议:进一步增强对数学的学习,130分.提高数学成绩的稳固性,将有助于物理成绩的进一步提高.。
苏教版高中数学选修2-3§3.2 回归分析(二).docx
高中数学学习材料马鸣风萧萧*整理制作§3.2回归分析(二)课时目标1.进一步理解回归分析的基本思想.2.了解一些非线性回归问题的解法.1.对相关系数r进行显著性检验的基本步骤如下:(1)提出统计假设H0:变量x,y________________________;(2)如果以95%的把握作出推断,可以根据1-0.95=0.05与n-2在附录2中查出一个r 的____________(其中1-0.95=0.05称为____________);(3)计算________________;(4)作出统计推断:若____________,则否定H0,表明有________的把握认为x与y之间具有________________;若____________,则没有理由拒绝原来的假设H0,即就目前数据而言,没有充分理由认为x与y之间有________________.2.用相关系数可以对两个变量之间的______________进行较为精确的刻画,运用________的方法研究一些非线性相关问题.一、填空题1.下列说法正确的是________.(填序号)①y=2x2+1中的x、y是具有相关关系的两个变量;②正四面体的体积与其棱长具有相关关系;③电脑的销售量与电脑的价格之间是一种确定性的关系;④传染病医院感染甲型H1N1流感的医务人员数与医院收治的甲型流感人数是具有相关关系的两个变量.2.两个变量成负相关关系时,散点图的点散布特征是________________________.3.已知x与y之间的一组数据如下表:x 012 3y 1357则y关于x的线性回归直线必过________点.4.某种产品的广告费支出x与销售额y之间有下表关系,现在知道其中一个数据弄错了,则最可能错的数据是______.x/万元24568y/万元30406050705.一个车间为了规定工时定额,需要确定加工零件所花费的时间,为此进行了10次试验,测得的数据如下:零件数x /个10 20 30 40 50 60 70 80 90 100 加工时间y /分62 68 75 81 89 95 102 108 115 122 则加工时间y (分)与零件数x (个)之间的相关系数r =________.(精确到0.000 1)6.对有关数据的分析可知,每一立方米混凝土的水泥用量x (单位:kg)与28天后混凝土的抗压度y (单位:kg/cm 2)之间具有线性相关关系,其线性回归方程为y ^=0.30x +9.99.根据建设项目的需要,28天后混凝土的抗压度不得低于89.7 kg/cm 2,每立方米混凝土的水泥用量最少应为________kg.(精确到0.1 kg)7.根据统计资料,我国能源生产自1986年以来发展很快.下面是我国能源生产总量(单位:亿吨标准煤)的几个统计数据:年份1986 1991 1996 2001 产量8.6 10.4 12.9 16.1 根据有关专家预测,到2010年我国能源生产总量将达到21.7亿吨左右,则专家所选择的回归模型是下列四种模型中的哪一种________.(填序号)①y ^ =a ^ x +b ^ (a ≠0);②y =ax 2+bx +c (a ≠0);③y =a x (a >0且a ≠1);④y =log a x (a >0且a ≠1).8.下列说法中正确的是________(填序号).①回归分析就是研究两个相关事件的独立性;②回归模型都是确定性的函数;③回归模型都是线性的;④回归分析的第一步是画散点图或求相关系数;⑤回归分析就是通过分析、判断,确定相关变量之间的内在的关系的一种统计方法.二、解答题9.假设学生在初一和初二的数学成绩是线性相关的.若10名学生的初一(x )和初二(y )数学分数如下:x 74 71 72 68 76 73 67 70 65 74y 76 75 71 70 76 79 65 77 62 72试求初一和初二数学分数间的线性回归方程.10.在某化学实验中,测得如下表所示的6对数据,其中x (单位:min)表示化学反应进行的时间,y (单位:mg)表示未转化物质的质量.x /min 1 2 3 4 5 6y /mg 39.8 32.2 25.4 20.3 16.2 13.3(1)设y 与x 之间具有关系y =cd x ,试根据测量数据估计c 和d 的值(精确到0.001);(2)估计化学反应进行到10 min 时未转化物质的质量(精确到0.1).能力提升11.测得某国家10对父子身高(单位:英寸)如下:父亲身高(x ) 6062 64 65 66 67 68 70 72 74 儿子身高(y ) 63.6 65.2 66 65.5 66.9 67.1 67.4 68.3 70.1 70(1)对变量y 与x 进行相关性检验;(2)如果y 与x 之间具有线性相关关系,求回归直线方程;(3)如果父亲的身高为73英寸,估计儿子的身高.12.某种书每册的成本费y (元)与印刷册数x (千册)有关,经统计得到数据如下:x 1 2 3 5 10 20 30 50 100 200 y 10.15 5.52 4.08 2.85 2.11 1.62 1.41 1.30 1.21 1.15检验每册书的成本费y 与印刷册数的倒数1x之间是否具有线性相关关系?如有,求出y 对x 的线性回归方程.1.利用回归分析可对一些实际问题作出预测.2.非线性回归方程有时并不给出回归模型,这时我们可以画出已知数据的散点图,把它与我们所学过的各种函数(幂函数、指数函数、对数函数、二次函数等)图象进行比较,挑选一种拟和比较好的函数,把问题通过变量转换,转化为线性的回归分析问题,使之得到解决.3.2 回归分析(二)答案知识梳理1.(1)不具有线性相关关系 (2)临界值r 0.05 检验水平 (3)样本相关系数r(4)|r |>r 0.05 95% 线性相关关系 |r |≤r 0.05 线性相关关系2.线性相关程度 转化作业设计1.④解析 感染的医务人员数不仅受医院收治的病人数的影响,还受防护措施等其他因素的影响.2.从左上角到右下角区域内解析 散点图的主要作用是直观判断两个变量之间的相关关系.一般地说,当散点图中的点是呈“由左下角到右上角”的趋势时,则两个变量之间具有正相关关系;而当散点图中的点是呈“由左上角到右下角”的趋势时,则两个变量之间具有负相关关系.3.(1.5,4)解析 在本题中,样本点的中心为(1.5,4),所以回归直线过(1.5,4)点.4.(6,50)5.0.999 8解析 x =55,y =91.7,∑10i =1x 2i =38 500, ∑10i =1y 2i =87 777,∑10i =1x i y i =55 950, 所以r =∑10i =1x i y i -10·x ·y(∑10i =1x 2i -n x 2)(∑10i =1y 2i -n y 2)≈0.999 8. 6.265.7 7.①8.④⑤解析 回归分析就是研究两个事件的相关性;回归模型是需要通过散点图模拟的;回归模型有线性和非线性之分.9.解 因为x =71,∑i =110x 2i =50 520,y =72.3,∑i =110x i y i =51 467,所以,b ^=51 467-10×71×72.350 520-10×712≈1.218 2. a ^ =72.3-1.218 2×71=-14.192 2, 线性回归方程是:y ^=1.218 2x -14.192 2.10.解 (1)在y =cd x 两边取自然对数,令ln y =z ,ln c =a ,ln d =b ,则z =a +bx .由已知数据,得 x 1 2 3 4 5 6y 39.8 32.2 25.4 20.3 16.2 13.3z 3.684 3.472 3.235 3.011 2.785 2.588 由公式得a ^ ≈3.905 5,b ^ ≈-0.221 9,则线性回归方程为z ^=3.905 5-0.221 9x .而ln c =3.905 5,ln d =-0.221 9,故c ≈49.681,d ≈0.801,所以c 、d 的估计值分别为49.681,0.801.(2)当x =10时,由(1)所得公式可得y ≈5.4(mg).11.解 (1)x =66.8,y =67.01,∑10 i =1x 2i =44 794,∑10 i =1y 2i =44 941.93.x y =4 476.27,x 2=4 462.24,y 2=4 490.34,∑10 i =1x i y i =44 842.4. 所以r =∑10 i =1x i y i -10x y⎝⎛⎭⎫∑10 i =1x 2i -10x 2⎝⎛⎭⎫∑10 i =1y 2i -10y 2 =44 842.4-10×4 476.27(44 794-44 622.4)(44 941.93-44 903.4) =79.76 611.748≈79.781.31≈0.980 2. 由于r 非常接近于1,所以y 与x 之间具有线性相关关系.(2)设线性回归方程为y ^ =b ^ x +a ^.由b ^=∑10 i =1x i y i -10x y ∑10 i =1x 2i -10x2=44 842.4-44 726.744 794-44 622.4=79.7171.6≈0.4645, a ^ =y -b ^x =67.01-0.464 5×66.8≈35.98.故所求的线性回归方程为y ^ =0.464 5x +35.98. (3)当x =73时,y ^=0.464 5×73+35.98≈69.9,所以当父亲身高为73英寸时,估计儿子的身高约为69.9英寸.12.解 把1x 置换为z ,则有z =1x, 从而z 与y 的数据为 z 1 0.5 0.333 0.2 0.1 0.05 0.033 0.02 0.01 0.005y 10.15 5.52 4.08 2.85 2.11 1.62 1.41 1.30 1.21 1.15可作出散点图,从图可看出,变换后的样本点分布在一条直线的附近,因此可以用线性回归方程来拟合.z =110×(1+0.5+0.333+0.2+0.1+0.05+0.033+0.02+0.01+0.005)=0.225 1, y =110×(10.15+5.52+4.08+…+1.15)=3.14, ∑10i =1z 2i =12+0.52+0.3332+…+0.012+0.0052 =1.415,∑10i =1y 2i =10.152+5.522+…+1.212+1.152 =171.803, ∑10i =1z i y i =1×10.15+0.5×5.52+…+0.005×1.15=15.221 02,所以b ^ =∑10i =1z i y i -10z y∑10i =1z 2i -10z 2≈8.976, a ^ =y -b ^ z =3.14-8.976×0.225 1≈1.120,所以所求的z 与y 的线性回归方程为y ^=8.976z +1.120.又因为z =1x ,所以y ^ =8.976x+1.120.。
苏教版数学高二 选修2-3学案 3.2 回归分析
3.2回归分析1.会作出两个有关联变量的散点图,并利用散点图认识变量间的相关关系.2.了解线性回归模型,能根据给出的线性回归方程系数公式建立线性回归方程.(重点、难点)3.了解回归分析的基本思想、方法及简单应用.[基础·初探]教材整理1线性回归模型阅读教材P100~P103“例1”以上部分,完成下列问题.1.线性回归模型的概念:将y=a+bx+ε称为线性回归模型,其中a+bx 是确定性函数,ε称为随机误差.2.线性回归方程:直线y^=a^+b^x称为线性回归方程,其中a^称为回归截距,b^称为回归系数,y^称为回归值,其中⎩⎨⎧b^=∑ni=1x i y i-n x-y-∑ni=1x2i-n(x-)2,a^=y--b^x-.其中x-=1n∑ni=1x i,y-=1n∑ni=1y i.设某大学生的女生体重y(单位:kg)与身高x(单位:cm)具有线性相关关系.根据一组样本数据(x i,y i)(i=1,2,…,n),用最小二乘法建立的回归方程为y^=0.85x -85.71,则下列结论中正确的是________(填序号).(1)y与x具有正的线性相关关系;(2)回归直线过样本点的中心(x,y);(3)若该大学某女生身高增加1 cm,则其体重约增加0.85 kg;(4)若该大学某女生身高为170 cm,则可断定其体重必为58.79 kg.【解析】回归方程中x的系数为0.85>0,因此y与x具有正的线性相关关系,(1)正确;由回归方程系数的意义可知回归直线过样本点的中心(x,y),B正确;∵回归方程y^=0.85x-85.71,∴该大学某女生身高增加1 cm,则其体重约增加0.85 kg,(3)正确;(4)不正确.【答案】(1)(2)(3)教材整理2相关关系阅读教材P104~P105“例2”以上部分,完成下列问题.1.相关系数是精确刻画线性相关关系的量.2.相关系数r=∑ni=1(x i-x-)(y i-y-)∑ni=1(x i-x-)2∑ni=1(y i-y-)2=∑ni=1x i y i-n x-y-⎝⎛⎭⎫∑ni=1x2i-n(x-)2⎝⎛⎭⎫∑ni=1y2i-n(y-)2.3.相关系数r具有的性质:(1)|r|≤1;(2)|r|越接近于1,x,y的线性相关程度越强;(3)|r|越接近于0,x,y的线性相关程度越弱.4.相关性检验的步骤:(1)提出统计假设H0:变量x,y不具有线性相关关系;(2)如果以95%的把握作出推断,那么可以根据1-0.95=0.05与n-2在附录2中查出一个r的临界值r0.05(其中1-0.95=0.05称为检验水平);(3)计算样本相关系数r;(4)作出统计推断:若|r|>r0.05,则否定H0,表明有95%的把握认为x与y之间具有线性相关关系;若|r|≤r0.05,则没有理由拒绝原来的假设H0,即就目前数据而言,没有充分理由认为y与x之间有线性相关关系.判断(正确的打“√”,错误的打“×”)(1)求回归直线方程前必须进行相关性检验.()(2)两个变量的相关系数越大,它们的相关程度越强.()(3)若相关系数r=0,则两变量x,y之间没有关系.()【答案】(1)√(2)×(3)√[质疑·手记]预习完成后,请将你的疑问记录,并与“小伙伴们”探讨交流:疑问1:解惑:疑问2:解惑:疑问3:解惑:[小组合作型]回归分析的有关概念(1)①线性回归分析就是由样本点去寻找一条直线,使之贴近这些样本点的数学方法;②利用样本点的散点图可以直观判断两个变量的关系是否可以用线性关系表示;^=b^x+a^,可以估计和观测变量的取值和变化趋势;③通过回归方程y④因为由任何一组观测值都可以求得一个线性回归方程,所以没有必要进行相关性检验.其中正确的命题是__________(填序号).(2)如果某地的财政收入x与支出y满足线性回归方程y^=b^x+a^+e(单位:亿^=0.8,a^=2,|e|≤0.5,如果今年该地区财政收入10亿元,则今年支元),其中b出预计不会超过________亿.【自主解答】(1)①反映的正是最小二乘法思想,故正确.②反映的是画散点图的作用,也正确.③解释的是回归方程y^=b^x+a^的作用,故也正确.④在求回归方程之前必须进行相关性检验,以体现两变量的关系,故不正确.(2)由题意可得:y^=0.8x+2+e,当x=10时,y^=0.8×10+2+e=10+e,又|e|≤0.5,∴9.5≤y^≤10.5.故今年支出预计不会超过10.5亿.【答案】(1)①②③(2)10.51.在分析两个变量的相关关系时,可根据样本数据散点图确定两个变量之间是否存在相关关系,然后利用最小二乘法求出回归直线方程.2.由线性回归方程给出的是一个预报值而非精确值.3.随机误差的主要来源(1)线性回归模型与真实情况引起的误差;(2)省略了一些因素的影响产生的误差;(3)观测与计算产生的误差.[再练一题]1.下列有关线性回归的说法,不正确的是________(填序号).【导学号:29440068】①自变量取值一定时,因变量的取值带有一定随机性的两个变量之间的关系叫做相关关系;②在平面直角坐标系中用描点的方法得到表示具有相关关系的两个量的一组数据的图形叫做散点图;③线性回归方程最能代表观测值x ,y 之间的关系; ④任何一组观测值都能得到具有代表意义的回归直线方程.【解析】 只有具有线性相关的两个观测值才能得到具有代表意义的回归直线方程.【答案】 ④求线性回归方程某班5名学生的数学和物理成绩如下表:学生学科成绩 A B C D E 数学成绩(x ) 88 76 73 66 63 物理成绩(y )7865716461(1)(2)求物理成绩y 对数学成绩x 的回归直线方程; (3)一名学生的数学成绩是96,试预测他的物理成绩.【精彩点拨】 先画散点图,分析物理与数学成绩是否有线性相关关系,若相关,再利用线性回归模型求解.【自主解答】 (1)散点图如图所示.(2)由散点图可知y 与x 之间具有线性相关关系. 因为x -=15×(88+76+73+66+63)=73.2,y-=15×(78+65+71+64+61)=67.8,∑5i =1x i y i =88×78+76×65+73×71+66×64+63×61=25 054,∑5i =1x 2i =882+762+732+662+632=27 174.所以b ^=∑5i =1x i y i -5 x - y -∑5i =1x 2i -5(x -)2=25 054-5×73.2×67.827 174-5×73.22≈0.625,a ^=y --b ^x -≈67.8-0.625×73.2=22.05. 所以y 对x 的回归直线方程是y ^=0.625x +22.05.(3)当x =96时,y ^=0.625×96+22.05≈82,即可以预测他的物理成绩是82.1.求线性回归方程的基本步骤:2.需特别注意的是,只有在散点图大致呈直线时,求出的线性回归方程才有实际意义,否则求出的回归方程毫无意义.[再练一题]2.某商场经营一批进价是30元/台的小商品,在市场调查中发现,此商品的销售单价x (x 取整数)元与日销售量y 台之间有如下关系:x354045 50y 56412811(1)y与x程.(方程的回归系数保留一位有效数字)(2)设经营此商品的日销售利润为P元,根据(1)写出P关于x的函数关系式,并预测当销售单价x为多少元时,才能获得最大日销售利润.【解】(1)散点图如图所示,从图中可以看出这些点大致分布在一条直线附近,因此两个变量线性相关.设回归直线为y^=b^x+a^,由题知x-=42.5,y-=34,则求得b^=∑4i=1x i y i-4x-y-∑4i=1x2i-4(x-)2=-370125≈-3,a^=y--b^x-=34-(-3)×42.5=161.5,∴y^=-3x+161.5.(2)依题意有P=(-3x+161.5)(x-30)=-3x2+251.5x-4 845=-3⎝⎛⎭⎪⎫x-251.562+251.5212-4 845.∴当x=251.56≈42时,P有最大值,约为426,即预测销售单价为42元时,能获得最大日销售利润.[探究共研型]线性回归分析探究1【提示】直观分析数据是否存在线性相关关系.探究2下表显示出变量y随变量x变化的一组数据,由此判断表示y与x 之间的关系最可能的是________.(填序号)x 45678910y 14181920232528【提示】画出散点图(图略),可以得到这些样本点在一条直线附近,故最可能是线性函数模型.故填①10名同学在高一和高二的数学成绩如下表:x 74717268767367706574y 76757170767965776272 其中(1)y与x是否具有相关关系?(2)如果y与x具有线性相关关系,求回归直线方程.【精彩点拨】可先计算线性相关系数r的值,然后与r0.05比较,进而对x 与y的相关性做出判断.【自主解答】(1)由已知表格中的数据,求得x=71,y=72.3,r=∑i=110(x i-x)(y i-y)∑i=110(x i-x)2∑i=110(y i-y)2≈0.78.由检验水平0.05及n-2=8,在课本附录2中查得r0.05=0.632,因为0.78>0.632,所以y与x之间具有很强的线性相关关系.(2)y与x具有线性相关关系,设回归直线方程为y^=a^+b^x,则有b^=∑i=110(x i-x)(y i-y)∑i=110(x i-x)2≈1.22,a^=y--b^x-=72.3-1.22×71=-14.32.所以y关于x的回归直线方程为y^=1.22x-14.32.1.线性回归分析必须进行相关性检验;若忽略,则所求回归方程没有实际意义.2.|r|越接近于1,两变量相关性越强,|r|越接近于0,两变量相关性越弱.[再练一题]3.关于两个变量x和y的7组数据如下表所示:x 21232527293235y 711212466115325 【解】x-=17×(21+23+25+27+29+32+35)≈27.4,y-=17×(7+11+21+24+66+115+325)≈81.3,∑7i=1x2i=212+232+252+272+292+322+352=5 414,∑7i=1x i y i=21×7+23×11+25×21+27×24+29×66+32×115+35×325=18 542,∑7i=1y2i=72+112+212+242+662+1152+3252=124 393,∴r=∑7i=1x i y i-7 x-y-(∑7i=1x2i-7(x-)2)(∑7i=1y2i-7(y-)2)=18 542-7×27.4×81.3(5 414-7×27.42)(124 393-7×81.32)≈0.837 5.∵0.837 5>0.755,∴x与y之间具有线性相关关系.[构建·体系]1.设(x1,y1),(x2,y2),…,(x n,y n)是变量x和y的n个样本点,直线l是由这些样本点得到的线性回归直线(如图3-2-1),以下结论正确的序号是__________.图3-2-1①直线l过点(x,y);②x和y的相关系数为直线l的斜率;③x和y相关系数在0到1之间;④当n为偶数时,分布在l两侧的样本点的个数一定相同.【解析】因为相关系数是表示两个变量是否具有线性相关关系的一个值,它的绝对值越接近于1,两个变量的线性相关程度越强,所以②③错误;④中n 为偶数时,分布在l两侧的样本点的个数可能不相同,所以④错误;根据回归直线方程一定经过样本中心点可知①正确.【答案】①2.根据如下样本数据:x 345678y 4.0 2.5-0.50.5-2.0-3.0^=bx+a^,则下列说法正确的是__________.(填序号) 得到的回归方程为y①a>0,b>0;②a>0,b<0;③a<0,b>0;④a<0,b<0.【解析】由表中数据画出散点图,如图,由散点图可知b<0,a>0,故②正确.【答案】②3.设有一个回归方程为y^=2-2.5x,则变量x每增加一个单位时,y=__________. 【导学号:29440069】^的平均改变【解析】由回归系数的意义可知当变量x增加一个单位时,y量为b^,由题目回归方程y^=2-2.5x,可得当变量x增加一个单位时,y^平均减少2.5个单位.【答案】平均减少2.5个单位4.对具有线性相关关系的变量x和y,由测得的一组数据求得回归直线的斜率为6.5,且恒过(2,3)点,则这条回归直线的方程为________.【解析】由题意知x=2,y=3,b^=6.5,所以a^=y-b^x=3-6.5×2=-10,即回归直线的方程为y ^=-10+6.5x .【答案】 y ^=-10+6.5x5.某工厂为了对新研发的一种产品进行合理定价,将该产品按事先拟定的价格进行试销,得到如下数据:单价x (元) 8 8.2 8.4 8.6 8.8 9 销量y (件)908483807568(1)求回归直线方程y ^=b^x +a ^,其中b ^=-20,a ^=y -b ^x ; (2)预计在今后的销售中,销量与单价仍然服从(1)中的关系,且该产品的成本是4元/件,为使工厂获得最大利润,该产品的单价应定为多少元?(利润=销售收入-成本)【解】 (1)x =16(8+8.2+8.4+8.6+8.8+9)=8.5, y =16(90+84+83+80+75+68)=80. ∵b^=-20,a ^=y -b ^x , ∴a^=80+20×8.5=250, ∴回归直线方程为y ^=-20x +250.(2)设工厂获得的利润为L 元,则L =x (-20x +250)-4(-20x +250)=-20⎝ ⎛⎭⎪⎫x -3342+361.25, ∴该产品的单价应定为334元时,工厂获得的利润最大.我还有这些不足:(1)(2)我的课下提升方案:(1)(2)学业分层测评(建议用时:45分钟)[学业达标]一、填空题1.如图3-2-2所示,对变量x,y有观测数据(x i,y i)(i=1,2,…,10),得散点图(1);对变量u,v有观测数据(u i,v i)(i=1,2,…,10),得散点图(2).由这两个散点图可以判断________.图3-2-2①变量x与y正相关,u与v正相关;②变量x与y正相关,u与v负相关;③变量x与y负相关,u与v正相关;④变量x与y负相关,u与v负相关.【解析】由图(1)知,x与y是负相关,由图(2)知,u与v是正相关,故③正确.【答案】③2.已知对一组观测值(x i,y i)(i=1,2,…,n)作出散点图后,确定具有线性^=a^+b^x,求得b^=0.51,x=61.75,y=38.14,则线性回归相关关系,若对于y方程为________.【解析】 ∵a ^=y -b ^x =38.14-0.51×61.75=6.647 5≈6.65. ∴y ^=0.51x +6.65.【答案】 y ^=0.51x +6.653.某产品的广告费用x 与销售额y 的统计数据如下表:根据上表可得回归方程y =b x +a 中的b 为9.4,据此模型,预报广告费用为6万元时销售额为______万元.【解析】 样本中心点是(3.5,42),则a ^=y --b ^x -=42-9.4×3.5=9.1,所以回归直线方程是y ^=9.4x +9.1,把x =6代入得y ^=65.5.【答案】 65.54.对两个具有线性相关关系的变量进行回归分析时,得到一个回归方程y ^=1.5x +45,x ∈{1,5,7,13,14},则y -=________.【解析】 由x -=8,得y -=1.5×8+45=57. 【答案】 575.已知x ,y 的取值如下表:画出散点图,从所得的散点图分析,y 与x 线性相关,且y =0.95x +a ^,则a ^=________. 【导学号:29440070】【解析】 因为回归方程必过样本点的中心(x -,y -),解得x -=2,y -=4.5,将(2,4.5)代入y ^=0.95x +a^,可得a ^=2.6. 【答案】 2.66.一轮又一轮的寒潮席卷全国.某商场为了了解某品牌羽绒服的月销售量y (件)与月平均气温x (℃)之间的关系,随机统计了某4个月的月销售量与当月平均气温,数据如下表:由表中数据算出线性回归方程y =b x +a 中的b ≈-2.气象部门预测下个月的平均气温约为 6 ℃,据此估计,该商场下个月羽绒服的销售量的件数约为________.【解析】 ∵样本点的中心为(10,38), ∴38=-2×10+a ^.∴a ^=58,即y ^=-2x +58. ∴当x =6时,y =46. 【答案】 467.对具有线性相关关系的变量x ,y 有观测数据(x i ,y i )(i =1,2,…,10),它们之间的线性回归方程是y =3x +20,若∑i =110x i =18,则∑i =110y i =________.【解析】 由于∑i =110x i =18,则x -=1.8,∵(x -,y -)在回归方程上, ∴y -=3×1.8+20=25.4, ∴∑i =110y i =10y -=254.【答案】 2548.已知回归直线的斜率的估计值为1.23,样本点的中心为(4,5),则回归直线方程是________.【解析】 由斜率的估计值为1.23,且回归直线一定经过样本点的中心(4,5),可得y ^-5=1.23(x -4),即y ^=1.23x +0.08.【答案】 y ^=1.23x +0.08 二、解答题 9.对于数据组:(1)(2)求线性回归方程.【解】 (1)作图略.x ,y 具有很好的线性相关性. (2)设y ^=a^+b ^x ,因为x -=2.5,y -=5,∑4i =1x i y i =60, ∑4i =1x 2i =30, 故b ^=60-4×2.5×530-4×2.52=2, a ^=y --b ^x -=5-2×2.5=0, 故所求的回归直线方程为y ^=2x .10.下表为某地近几年机动车辆数与交通事故的统计资料,求出y 关于x 的线性回归方程.【解】∑8i =1x i =1 031,∑8i =1y i =71.6,∑8i =1x 2i =137 835,∑8i =1x i y i =9 611.7,x -=128.875,y -=8.95,将它们代入⎩⎪⎨⎪⎧b ^=∑ni =1x i y i -n x - y -∑ni =1x 2i -n (x -)2,a^=y --b ^x -,计算得b^≈0.077 4.a ^=-1.025,所以,所求线性回归方程为y ^=0.077 4x -1.025.[能力提升]1.对具有线性相关关系的变量x ,y 有观测数据(x i ,y i )(i =1,2,…,10),它们之间的线性回归方程是y ^=3x +20,若∑10i =1x i =18,则∑10i =1y i=________. 【解析】 由∑10i =1x i=18,得x =1.8. 因为点(x ,y )在直线y ^=3x +20上,则y =25.4. 所以∑10i =1y i =25.4×10=254. 【答案】 2542.(2016·徐州月考)已知对一组观测值(x i ,y i )(i =1,2,…,n )作出散点图后,确定具有线性相关关系,若对于y ^=a ^+b ^x ,求得b ^=0.51,x -=61.75,y -=38.14,则线性回归方程为________.【解析】 ∵a ^=y --b ^x -=38.14-0.51×61.75 =6.647 5≈6.65.∴y ^=0.51x +6.65. 【答案】 y =0.51x +6.653.(2016·南京检测)若线性回归方程中的回归系数b ^=0,则相关系数r =________.【解析】 b^=∑i =1n(x i -x -)(y i -y -)∑i =1n(x i -x -)2,r =∑i =1n(x i -x -)(y i -y -)∑i =1n(x i -x -)2∑i =1n(y i -y -)2.由计算公式知,若b =0,则r =0. 【答案】 04.某农科所对冬季昼夜温差大小与某反季节大豆新品种发芽多少之间的关系进行分析研究,他们分别记录了12月1日至12月5日的每天昼夜温差与实验室每天每100棵种子中的发芽数,得到如下资料:程,剩下的2组数据用于回归方程检验.(1)若选取的是12月1日与12月5日的2组数据,请根据12月2日至12月4日的数据,求出y 关于x 的线性回归方程y ^=b^x +a ^;(2)若由线性回归方程得到的估计数据与所选出的检验数据的误差均不超过2颗,则认为得到的线性回归方程是可靠的,试问(1)中所得的线性回归方程是否可靠?(3)请预测温差为14 ℃的发芽数.【解】 (1)由数据求得,x =12,y =27, 由公式求得,b^=52,a ^=y -b ^x =-3.所以y关于x的线性回归方程为y^=52x-3.(2)当x=10时,y^=52×10-3=22,|22-23|<2;当x=8时,y^=52×8-3=17,|17-16|<2.所以该研究所得到的线性回归方程是可靠的.(3)当x=14时,有y^=52×14-3=35-3=32,所以当温差为14 ℃时的发芽数约为32颗.。
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
年份
1986
1991
1 996
2001
产量
8.6
10.4
12.9
16.1
根据有关专家预测,到2010年我国能源生产总量将达到21.7亿吨左右,则专家所选择的回归模型是下列四种模型中的哪一种________.(填序号)
④传染病医院感染甲型H1N1流感的医务人员数与医院收治的甲型流感人数是具有相关关系的两个变量.
2.两个变量成负相关关系时,散点图的点散布特征是________________________.
3.已知x与y之间的一组数据如下表:
x
0
1
2
3
y
1
3
5
7
则y关于x的线性回归直线必过________点.
4.某种产品的广告费支出x与销售额y之间有下表关系,现在知道其中一个数据弄错了,则最可能错的数据是______.
(3)计算________________;
(4)作出统计推断:若____________,则否定H0,表明有________的把握认为x与y之间具有________________;若____________,则没有理由拒绝原来的假设H0,即就目前数据而言,没有充分理由认为x与y之间有________________.
6.对有关数据的分析可知,每一立方米混凝土的水泥用量x(单位:kg)与28天后混凝土的抗压度y(单位:kg/cm2)之间具有线性相关关系,其线性回归方程为=0.30x+9.99.根据建设项目的需要,28天后混凝土的抗压度不得低于89.7 kg/cm2,每立方米混凝土的水泥用量最少应为________kg.(精确到0.1 kg)
2.用相关系数可以对两个变量之间的______________进行较为精确的刻画,运用________的方法研究一些非线性相关问题.
一、填空题
1.下列说法正确的是________.(填序号)
①y=2x2+1中的x、y是具有相关关系的两个变量;
②正四面体的体积与其棱长具有相关关系;
③电脑的销售量与电脑的价格之间是一种确定性的关系;
2.从左上角到右下角区域内
解析 散点图的主要作用是直观判断两个变量之间的相关关系.一般 地说,当散点图中的点是呈“由左下角到右上角”的趋势时,则两个变 量之间具有正相关关系;而当散点图中的点是呈“由左上角到右下角”的趋势时,则两个变量之间具有负相关关系.
3.(1.5,4)
解析 在本题中,样本点的中心为(1.5,4),所以回归直线过(1.5,4)点.
x
1
2
3
5
10
20
30
50
100
200
y
10.15
5.52
4.08
2.85
2.11
1.62
1.41
1.30
1.21
1.15
检验每册书的成本费y与印刷册数的 倒数之间是否具 有线性相关关系?如有,求出y对x的线性回归方程.
1.利用回归分析可对一些实际问题作出预测.
2.非线 性回归方程有时并不给出回归模型,这时我们可以画出已知数据的散点图,把它与我们所学过的各种函数(幂函数、指数函数、对数函数、二次函数等)图象进行比较,挑选一种拟和比较好的函数,把问题通过变量转换,转化为线性的回归分析问题,使之得到 解决.
§3.2回归分析(二)
课时目标
1.进一步理解回归分析的基本思想.
2.了解一些非线性回归问题的解法.
1.对相关系数r进行显著性检验的基本步骤如下:
(1)提出统计假设H0:变量x,y________________________;
(2)如果以95%的把握作出推断,可以根据1-0.95=0.05与n-2在附录2中查出一个r的____________(其中1-0.95=0.05称为____________);
①=x+(a≠0);
②y=ax2+bx +c(a≠0);
③y=ax(a>0且a≠1);
④y=logax(a>0且a≠1).
8.下列说法中正确的是_ _______(填序号).
①回归分析就是研究两个相关事件的独立性;②回归模型都是确定性的函数;③回归模型都是线性的;④回归分析的第一步是画散点图或求相关系数;⑤回归分 析就是通过分析、判断,确定相关变量之间的内在的关系的一种统计方法.
二、解答题
9.假设学生在初一和初二的数学成绩是线性相关的.若10名学生的初一(x)和初二(y)数学分数如下:
x
74
71
72
68
76
73
67
70
65
74
y
76
75
71
70
76
79
65
77
62
72
试求初一和初二数学分数间的线性回归方程.
10.在某化学实验中,测得如下表所示的6对数据,其中x(单位:min)表示化学反应进行的时间,y(单位:mg)表示未转化物质的质量.
3.2回归分析(二)
答案
知识梳理
1.(1)不具有线性相关关系(2)临界值r0.05检验水平(3)样本相关系数r
(4)|r|>r0.0595%线性相关关系|r|≤r0.05线性相关关系
2.线性相关程度 转化
作业设计
1.④
解析 感染的 医务人员数不仅受医院收治的病人数的影响,还受防护措施等其他因素的影响.
x/万元
2
4
5
6
8
y/万元
30
40
60
50
70
5.一个车间为了规定工时定额,需要确定加工零件所花费的时间,为此进行了10次试验,测得的数据如下:
零件数x/个
10
20
30
40
50
60
70
80
90
100
加工时间y/分
62
68
75
81
89
95
102
108
115
122
则加工时间y(分)与零件数x(个)之间的相关系数r=________.(精确到0.000 1)
60
62
64
65
66
67
68
70
72
74
儿子身高(y)
63.6
65.2
66
65.5
66.9
67.1
67.4
变量y与x进行相关性检验;
(2)如果y与x之间具有线性相关关系,求回归直线方程;
(3)如果父亲的身高为73英寸,估计儿子的身高.
12.某种书每册的成本费y(元)与印刷册数x(千册)有关,经统计得到数据如下:
x/min
1
2
3
4
5
6
y/mg
39.8
32.2
25.4
20.3
16.2
13.3
(1)设y与x之间具有关系y=cdx,试根据测量数据估计c和d的值(精确到0.001);
(2)估计化学反应进行到10 min时未转化物质的质量(精确到0.1).
能力提升
11.测得某国家10对父子身高(单位:英寸)如下:
父亲身高(x)