讲义+第16课时变量之间的相关关系两个变量的线性相关最新
两个变量的线性相关_课件
1.相关关系与函数关系不同,相关关系是一种_不__确___定__性关
系. 2.从散点图上看,点散布在从左下角到右上角的区域内,两个
变量的这种相关关系称为__正__相___关_,点散布在从左上角到右 下角的区域内,两个变量的这种相关关系称为_负__相___关__.
3.从散点图上看,如果这些点从整体上看大致分布在通过散点
(4)写出回归直线方程.
变式训练2:求变式训练1中的回归直线方程.
解:列表: i xi yi
xiyi
x
2 i
1 80 70 5600 6400
2 75 66 4950 5625
3 70 68 4760 4900
4 65 64 4160 4225
5
x 70, y 66, x i yi 23190 i 1
3.如下图所示,有5组(x,y)数据,去掉( 数据的线性相关系数最大.( )
2.两个变量的线性相关 (1)回归分析 对具有相关关系的两个变量进行统计分析的方法叫回归分析. 通俗地讲, 回归分析是寻找相关关系中非确定性关系的某种确定性. (2)散点图 将n个数据点(xi,yi),(i=1,2,…,n)描在平面直角坐标系中,以表示 具有相关关系的两个变量的一组数据的图形叫做散点图. 散点图形象地反映了各对数据的密切程度.
施化肥 15 20 25 30 35 40 45 量x
水稻产 330 345 365 405 445 450 455 量y
(1)画出散点图; (2)求水稻产量y与施化肥量x之间的回归直线方程; (3)当施化肥50 kg时,对水稻的产量予以估计. 分析:解答本题应先画散点图,判断其是否线性相关,再利用 最小二乘法求其回归方程.
题型二 求回归直线方程 例2:每立方米混凝土的水泥用量(单位:kg)与28天后混凝土 的抗压强度(单位:kg/cm2)之间的关系有如下数据:
变量间的相关关系讲义
变量间的相关关系讲义变量间的相关关系讲义一、基础知识梳理知识点1:变量之间的相关关系两个变量之间的关系可能是确定的关系(如:函数关系),或非确定性关系。
当自变量取值一定时,因变量也确定,则为确定关系;当自变量取值一定时,因变量带有随机性,这种变量之间的关系称为相关关系。
相关关系是一种非确定性关系,如长方体的高与体积之间的关系就是确定的函数关系,而人的身高与体重的关系,学生的数学成绩好坏与物理成绩的关系等都是相关关系。
注意:两个变量之间的相关关系又可分为线性相关和非线性相关,如果所有的样本点都落在某一函数曲线的附近,则变量之间具有相关关系(不确定性的关系),如果所有样本点都落在某一直线附近,那么变量之间具有线性相关关系,相关关系只说明两个变量在数量上的关系,不表明他们之间的因果关系,也可能是一种伴随关系。
点睛:两个变量相关关系与函数关系的区别和联系相同点:两者均是两个变量之间的关系,不同点:函数关系是一种确定的关系,如匀速直线运动中时间t与路程s的关系,相关关系是一种非确定的关系,如一块农田的小麦产量与施肥量之间的关系,函数关系是两个随机变量之间的关系,而相关关系是非随机变量与随机变量之间的关系;函数关系式一种因果关系,而相关关系不一定是因果关系,也可能是伴随关系。
知识点2.散点图.1.在考虑两个量的关系时,为了对变量之间的关系有一个大致的了解,人们常将变量所对应的点描出来,这些点就组成了变量之间的一个图,通常称这种图为变量之间的散点图。
2.从散点图可以看出如果变量之间存在着某种关系,这些点会有一个集中的大致趋势,这种趋势通常可以用一条光滑的曲线来近似,这种近似的过程称为曲线拟合。
3.对于相关关系的两个变量,如果一个变量的值由小变大时,另一个变量的的值也由小变大,这种相关称为正相关,正相关时散点图的点散布在从左下角到由上角的区域内。
如果一个变量的值由小变大时,另一个变量的值由大变小,这种相关称为负相关,负相关时散点图的点散步在从左上角到右下角的区域。
变量间的相关关系教案
变量间的相关关系优秀教案一、教学目标:1. 让学生理解相关关系的概念,能够识别和描述两种变量之间的相关关系。
2. 学生能够运用相关系数来衡量两个变量之间的相关程度。
3. 学生能够运用图表和数学模型来分析变量之间的相关关系。
4. 培养学生的数据分析能力和问题解决能力。
二、教学内容:1. 相关关系的概念和类型。
2. 相关系数的计算和解读。
3. 散点图在分析相关关系中的应用。
4. 线性回归方程的构建和应用。
5. 实际案例分析,运用相关关系解决实际问题。
三、教学重点与难点:重点:相关关系的概念和类型,相关系数的计算和解读,散点图在分析相关关系中的应用。
难点:线性回归方程的构建和应用,实际案例分析。
四、教学方法:1. 采用问题驱动的教学方法,引导学生通过实际案例来理解和应用相关关系。
2. 使用多媒体教学资源,如图表和数学软件,辅助学生直观地理解相关关系。
3. 组织小组讨论和合作活动,培养学生的团队合作能力和问题解决能力。
4. 提供充足的练习机会,让学生通过实践来巩固所学知识。
五、教学过程:1. 引入:通过一个简单的实际案例,引导学生思考两种变量之间的关系。
2. 讲解相关关系的概念和类型,解释相关系数的意义。
3. 演示如何通过散点图来分析两种变量之间的相关关系。
4. 讲解线性回归方程的构建过程,并演示如何应用线性回归方程来预测未知数据。
5. 提供实际案例分析,让学生运用相关关系来解决实际问题。
7. 布置作业,让学生通过练习来巩固所学知识。
六、教学评估与反馈:1. 通过课堂练习和作业,评估学生对相关关系概念的理解程度。
2. 通过小组讨论和案例分析,评估学生在实际问题中运用相关关系的能力。
3. 收集学生的疑问和困难,及时给予反馈和解答。
4. 鼓励学生提出自己的观点和思考,促进学生的主动学习。
七、拓展与深化:1. 介绍相关关系在社会科学、自然科学和工程科学中的应用。
2. 探讨非线性相关关系和多变量相关关系的研究方法。
课件6:2.3.1 变量之间的相关关系~2.3.2 两个变量的线性相关
=65.5,答案应选 B.
【答案】 B
4.四名同学根据各自的样本数据研究变量 x,y 之间的相关关系,并求得回归直线方程,
分别得到以下四个结论: ①y 与 x 负相关且y^ =2.347x-6.423;②y 与 x 负相关且y^ =-3.476x+5.648; ③y 与 x 正相关且y^ =5.437x+8.493;④y 与 x 正相关且y^ =-4.326x-4.578.
探要点、究所然
题型三:回归方程
例 3 有一个同学家开了一个小卖部,他为了研究气温对热饮销售的影响,经过统 计,得到一个卖出的热饮杯数与当天气温的对比表:
摄氏温度/℃ -5 0 4 7 12 15 19 23 27 31 36 热饮杯数 156 150 132 128 130 116 104 89 93 76 54
3.利用回归方程,我们可以进行估计和预测.若回归直线方程为y^=b^ x+a^,则 x=x0 处的 估计值为y^0=b^ x0+a^ .
本节内容结束 更多精彩内容请登录:
2.3.1 变量之间的相关关系 2.3.2 两个变量的线性相关
重点难点
学习目标 1.理解两个变量的相关关系的概念. 2.会作散点图,并利用散点图判断两个变量之间是否具有相关关系. 3.会求回归直线方程.
知识掌握
1.两个变量的线性相关 (1)散点图:将样本中 n 个数据点(xi,yi)(i=1,2,…,n)描在平面直角坐标系中得到 的图形. (2)正相关与负相关: ①正相关:散点图中的点散布在从 左下角 到 右上角 的区域. ②负相关:散点图中的点散布在从 左上角 到 右下角 的区域.
探要点、究所然
题型二:散点图
例 2 以下是某地搜集到的新房屋的销售价格和房屋面积的数据:
2.3.1 变量之间的相关关系 2.3.2 两个变量的线性相关
2.3 变量间的相关关系 2.3.1 变量之间的相关关系 2.3.2 两个变量的线性相关考点 学习目标核心素养 相关关系的概念理解两个变量的相关关系的概念 数学抽象 散点图 会作散点图,并利用散点图判断两个变量之间是否具有相关关系逻辑推理、数学建模回归直线方程会求回归直线方程数学运算问题导学(1)相关关系分为哪两种? (2)什么叫散点图?(3)什么叫回归直线?求回归直线的方法及步骤是什么?1.两个变量的线性相关(1)散点图:将样本中n 个数据点(x i ,y i )(i =1,2,…,n )描在平面直角坐标系中得到的图形.(2)正相关与负相关①正相关:散点图中的点散布在从左下角到右上角的区域; ②负相关:散点图中的点散布在从左上角到右下角的区域. 2.回归直线的方程(1)回归直线:如果散点图中点的分布从整体上看大致在一条直线附近,我们就称这两个变量之间具有线性相关关系,这条直线叫做回归直线.(2)回归方程:回归直线对应的方程叫回归直线的方程,简称回归方程. (3)最小二乘法求回归直线方程y ^=b ^x +a ^时,使得样本数据的点到回归直线的距离的平方和最小的方法叫做最小二乘法.其中b ^是回归方程的斜率,a ^是回归方程在y 轴上的截距. ■名师点拨 (1)散点图的作用散点图形象地反映了各对数据的密切程度.根据散点图中点的分布趋势分析两个变量之间的关系,可直观地判断并得出结论.(2)回归直线的性质由a ^=y --b ^x -可知回归直线一定经过点(x -,y -),因此点(x -,y -)通常称为样本点的中心,其中,x -,y -分别是变量x 1,x 2,…,x n 和y 1,y 2,…,y n 的平均数.(3)线性相关关系强弱的定性分析线性相关关系的强弱体现在散点图中就是样本点越集中在某条直线附近,两变量的线性相关关系越强;样本点在某条直线附近越分散,两变量的线性相关关系越弱.判断正误(对的打“√”,错的打“×”) (1)线性回归方程必经过点(x -,y -).( )(2)对于方程y ^=b ^x +a ^,x 增加一个单位时,y 平均增加b ^个单位.( ) (3)样本数据中x =0时,可能有y =a ^.( ) (4)样本数据中x =0时,一定有y =a ^.( )解析:根据回归直线方程的意义知,(1)(2)都正确,而(3)(4)中,样本数据x =0时,y 的值可能为a ^,也可能不是a ^,故(3)正确.答案:(1)√ (2)√ (3)√ (4)×下列各图中所示的两个变量具有相关关系的是( )A .(1)(2)B .(1)(3)C .(2)(4)D .(2)(3)解析:选D.(1)为函数关系;(2)(3)为相关关系;(4)中,因为点分布得比较分散,两者之间无相关关系.5位学生的数学成绩和物理成绩如下表: 学科 A B C D E 数学 80 75 70 65 60 物理7066686462A .是函数关系B .是相关关系,但相关性很弱C .具有较好的相关关系,且是正相关D .具有较好的相关关系,且是负相关解析:选C.数学成绩x 和物理成绩y 的散点图如图所示.从图上可以看出数学成绩和物理成绩具有较好的相关关系,且成正相关. 设有一个回归方程为y ^=2-1.5x ,则变量x 每增加1个单位时,y 平均减少____________个单位.,解析:因为y ^=2-1.5x ,所以变量x 每增加1个单位时,y 1-y 2=[2-1.5(x +1)]-(2-1.5x )=-1.5,所以y 平均减少1.5个单位.答案:1.5相关关系的判断以下是在某地搜集到的不同楼盘新房屋的销售价格y(单位:万元)和房屋面积x(单位:m2)的数据:房屋面积x(m2)11511080135105销售价格y(万元)24.821.619.429.222(2)判断新房屋的销售价格和房屋面积之间是否具有相关关系?如果有相关关系,是正相关还是负相关?【解】(1)数据对应的散点图如图所示:(2)通过以上数据对应的散点图可以判断,新房屋的销售价格和房屋的面积之间具有相关关系,且是正相关.相关关系的判断方法(1)两个变量x和y具有相关关系的判断方法①散点图法:通过散点图,观察它们的分布是否存在一定规律,直观地判断;②表格、关系式法:结合表格或关系式进行判断;③经验法:借助积累的经验进行分析判断.(2)判断两个变量x和y之间是否具有线性相关关系,常用的简便方法就是绘制散点图,如果发现点的分布从整体上看大致在一条直线附近,那么这两个变量就是线性相关的,注意不要受个别点的位置的影响.[易错警示]在解答本题过程中,易出现如下错误:虽然五点中有四点大致分布在一条直线附近,但第二个点离这条直线太远,所以两个变量不相关,导致错误的原因是没有看主流点,而过分关注了不影响大局的个别点.对变量x,y有观测数据(x i,y i)(i=1,2,…,10),得散点图如图所示.由这个散点图可以判断()A.变量x与y正相关B.变量x与y不相关C.变量x与y负相关D.变量x与y是函数关系解析:选C.由这个散点图可以判断,变量x与y负相关,故选C.线性回归方程的求法下表提供了某厂节能降耗技术改造后生产甲产品过程中记录的产量x(吨)与相应的生产能耗y(吨标准煤)的几组对照数据:x 345 6y 2.534 4.5 (2)请根据上表提供的数据,用最小二乘法求出y关于x的线性回归方程y^=b^x+a^. 【解】(1)散点图如图.(2)x-=3+4+5+64=4.5,y-=2.5+3+4+4.54=3.5,∑i=14x i y i=3×2.5+4×3+5×4+6×4.5=66.5,∑i=14x2i=32+42+52+62=86,所以b ^=∑4i =1x i y i -4x -y-∑4i =1x 2i -4x-2=66.5-4×4.5×3.586-4×4.52=0.7, a ^=y --b ^x -=3.5-0.7×4.5=0.35. 所以所求的线性回归方程为y ^=0.7x +0.35.如果把例题中的y 的值2.5及4.5分别改为2和5,如何求回归直线方程? 解:散点坐标分别为(3,2),(4,3),(5,4),(6,5). 可验证这四点共线, 斜率k =3-24-3=1,所以直线方程为y -2=x -3, 即回归直线方程为y ^=x -1.求线性回归方程的步骤(1)计算平均数x -,y -.(5)用a ^=y --b ^x -,求a ^. (6)写出回归方程.某化工厂为预测某产品的回收率y ,需要研究它和原料有效成分含量x之间的相关关系,现取了8对观测值,计算得:则y 关于x 的回归直线方程是( )A.y ^=11.47+2.62x B.y ^=-11.47+2.62x C.y ^=2.62+11.47x D.y ^=11.47-2.62x解析:选A.利用题目中的已知条件可以求出x -=6.5,y -=28.5,然后利用回归直线方程的计算公式得b ^=∑8i =1x i y i -8x -y-∑8i =1x 2i -8x-2=1 849-8×6.5×28.5478-8×6.52≈2.62, a ^=y --b ^x -=11.47,因此回归直线方程为y ^=11.47+2.62x .线性回归方程的应用(2020·黑龙江省大庆铁人中学期末考试)某班主任为了对本班学生的月考成绩进行分析,从全班40名同学中随机抽取一个容量为6的样本进行分析.随机抽取6位同学的数学、物理分数对应如表:学生编号 1 2 3 4 5 6 数学分数x 60 70 80 85 90 95 物理分数y728088908595(1) (2)如果具有线性相关性,求出线性回归方程(系数精确到0.1);如果不具有线性相关性,请说明理由;(3)如果班里的某位同学数学成绩为50,请预测这位同学的物理成绩.【解】 (1)画出散点图:通过图象可以看出物理成绩y 与数学成绩x 之间具有线性相关性. (2)x -=16×(60+70+80+85+90+95)=80,y -=16×(72+80+88+90+85+95)=85,故b ^=0.6,a ^=37.故回归方程是y =0.6x +37. (3)当x =50时,解得y =67.故数学成绩为50,预测这位同学的物理成绩是67.利用线性回归方程解题的常见思路及注意点(1)利用回归直线过样本点的中心,可以求参数问题,参数可涉及回归方程或样本点数据.(2)利用回归方程中系数b ^的意义,分析实际问题.(3)利用回归直线进行预测,此时需关注两点:①所得的值只是一个估计值,不是精确值;②变量x 与y 成线性相关关系时,线性回归方程才有意义,否则即使求出线性回归方程也是毫无意义的,用其估计和预测的量也是不可信的.(2020·江西省临川第一中学期末考试)我国西部某贫困地区2011年至2017年农村居民家庭人均年收入y (千元)的数据如下表:年份 2011 2012 2013 2014 2015 2016 2017 年份代号x 1 2 3 4 5 6 7 人均年收入y2.93.33.64.44.85.25.9(2)利用(1)中的回归方程,预测该地区2019年农村居民家庭人均年收入将达到多少千元.解:(1)依题意x -=4,y -=4.3,从而b ^=0.5,a ^=y --b ^x -=4.3-0.5×4=2.3, 故所求线性回归方程为y ^=0.5x +2.3. (2)令x =9,得y ^=0.5×9+2.3=6.8.预测该地区在2019年农村居民家庭人均年收入为6.8千元.1.我们常说“吸烟有害健康”,吸烟与健康之间的关系是( ) A .正相关 B .负相关 C .无相关D .不确定解析:选B.烟吸得越多,则健康程度越差.2.关于回归直线方程y ^=a ^+b ^x 的叙述正确的是( ) ①反映y ^与x 之间的函数关系; ②反映y 与x 之间的函数关系; ③表示y ^与x 之间的不确定关系;④表示最接近y 与x 之间真实关系的一条直线. A .①② B .②③ C .③④ D .①④解析:选D.y ^=a ^+b ^x 表示y ^与x 之间的函数关系,而不是y 与x 之间的函数关系,它反映的关系最接近y 与x 之间的真实关系.故①④正确.3.在最小二乘法中,用来刻画各个样本点到直线y =a ^+b ^x 的“距离”的量是( ) A .|y i -y -| B .(y i -y -)2 C .|y i -(a ^+b ^x i )|D .[y i -(a ^+b ^x i )]2解析:选D.最小二乘法的定义明确给出,用[y i -(a ^+b ^x i )]2来刻画各个样本点与这条直线之间的“距离”(即二者之间的接近程度),用它们的和表示所有样本点与这条直线的接近程度.4.已知工厂加工零件的个数x 与花费时间y (h)之间的线性回归方程为y ^=0.01x +0.5,则加工200个零件大约需要________小时.解析:将200代入线性回归方程y ^=0.01x +0.5, 得y ^=2.5. 答案:2.5[A 基础达标]1.如图所示是具有相关关系的两个变量的一组数据的散点图,去掉哪个点后,两个变量的相关关系更明显( )A .DB .EC .FD .A解析:选C.A 、B 、C 、D 、E 五点分布在一条直线附近且贴近该直线,而F 点离得远,故去掉点F .2.(2020·江西省上饶市期末统考)某车间为了规定工时定额,需要确定加工零件所花费用的时间,为此进行了5次实验,根据收集到的数据(如下表),由最小二乘法求得回归直线方程为y ^=7.8x +40.2.零件数x (个) 1 23 4 5 加工时间y (min)50677179A .55B .55.8C .59D .51解析:选 D.设表中模糊的数据为m .由表中的数据可得x -=1+2+3+4+55=3,y -=50+m +67+71+795=267+m5,又由回归直线的方程为y ^=7.8x +40.2,所以267+m 5=7.8×3+40.2,解得m =51.即表中模糊的数据为51.故选D.3.已知变量x 和y 满足关系y =-0.1x +1,变量y 与z 正相关.下列结论中正确的是( ) A .x 与y 正相关,x 与z 负相关 B .x 与y 正相关,x 与z 正相关 C .x 与y 负相关,x 与z 负相关 D .x 与y 负相关,x 与z 正相关解析:选C.因为y =-0.1x +1的斜率小于0,故x 与y 负相关.因为y 与z 正相关,可设z =b ^y +a ^,b ^>0,则z =b ^y +a ^=-0.1b ^x +b ^+a ^,故x 与z 负相关.4.已知x 与y 之间的几组数据如下表:假设根据上表数据所得线性回归方程为y =b x +a .若某同学根据上表中的前两组数据(1,0)和(2,2)求得的直线方程为y =b ′x +a ′,则以下结论正确的是( )A.b ^>b ′,a ^>a ′ B.b ^>b ′,a ^<a ′ C.b ^<b ′,a ^>a ′D.b ^<b ′,a ^<a ′解析:选C.由两组数据(1,0)和(2,2)可求得直线方程为y =2x -2,从而b ′=2,a ′=-2.而利用线性回归方程的公式与已知表格中的数据,可求得b ^=∑6i =1x i y i -6x -·y-∑6i =1x 2i -6x-2=58-6×72×13691-6×⎝⎛⎭⎫722=57,a ^=y --b ^x -=136-57×72=-13,所以b ^<b ′,a ^>a ′. 5.(2020·广西钦州市期末考试)若回归直线y ^=b ^x +a ^的斜率估值为1.23,样本中心点为(4,5),当x =2时,估计y 的值为____________.解析:因为回归直线y ^=b ^x +a ^的斜率估值为1.23,所以b ^=1.23,y ^=1.23x +a ^. 因为样本中心点为(4,5),所以5=1.23×4+a ^,a ^=0.08,y ^=1.23x +0.08, 代入x =2,y =1.23×2+0.08=2.54. 答案:2.546.(2020·湖北省宜昌市葛洲坝中学期末考试)某公司借助手机微信平台推广自己的产品,对今年前5个月的微信推广费用x 与利润额y (单位:百万元)进行了初步统计,得到下列表格中的数据:x 2 4 5 6 8 y304060p70经计算,月微信推广费用x 与月利润额y 满足线性回归方程y ^=6.5x +17.5,则p 的值为____________.解析:由题中数据可得x -=2+4+5+6+85=5,y -=30+40+60+p +705=200+p5.由线性回归方程y ^=6.5x +17.5经过样本中心(x -,y -), 有200+p 5=6.5×5+17.5,解得p =50.答案:507.对某台机器购置后的运营年限x (x =1,2,3,…)与当年利润y 的统计分析知具备线性相关关系,线性回归方程为y ^=10.47-1.3x ,估计该台机器使用________年最合算.解析:只要预计利润不为负数,使用该机器就算合算,即y ^≥0,所以10.47-1.3x ≥0,解得x ≤8.05,所以该台机器使用8年最合算.答案:88.(2020·湖南省张家界市期末联考)为了解某地区某种农产品的年产量x (单位:吨)对价格y (单位:千元/吨)的影响,对近五年该农产品的年产量和价格统计如表:x 1 2 3 4 5 y86542(1)求x -,y -;(2)求y 关于x 的线性回归方程y ^=b ^x +a ^; (3)若年产量为4.5吨,试预测该农产品的价格.解:(1)计算可得x -=1+2+3+4+55=3,y -=8+6+5+4+25=5.(2)b ^=∑5i =1x i y i -5x -y-∑5i =1x 2i -5x-2=61-5×3×555-5×32=-1.4, 因为线性回归直线过(x -,y -),则a ^=y --b ^x -=5-(-1.4×3)=9.2, 故y 关于x 的线性回归方程是y ^=-1.4x +9.2. (3)当x =4.5时,y ^=-1.4×4.5+9.2=2.9(千元/吨).9.(2020·河北省石家庄市期末考试)在一段时间内,分5次测得某种商品的价格x (万元)和需求量y (吨)之间的一组数据为(1)根据上表数据,求出回归直线方程y =b x +a ;(2)试根据(1)中求出的回归方程预估当价格为1.9万元时,需求量大约是多少吨?(参考公式:b ^=∑ni =1(x i -x -)(y i -y -)∑ni =1(x i -x -)2=∑ni =1x i y i -n x -y -∑n i =1x 2i -n (x )-2,a ^=y --b ^x -)解:(1)因为x -=15×9=1.8,y -=15×37=7.4,∑i =15 x i y i =62,∑i =15x 2i =16.6,所以 b ^=∑5i =1x i y i -5x -y-∑5i =1x 2i -5(x )-2=62-5×1.8×7.416.6-5×1.82=-11.5, a ^=y --b ^x -=7.4+11.5×1.8=28.1, 故y 对x 的线性回归方程为y ^=28.1-11.5x . (2)y =28.1-11.5×1.9=6.25(吨).所以如果价格为1.9万元,则需求量大约是6.25吨.[B 能力提升]10.对两个变量的四组数据进行统计,获得以下散点图,关于两个变量相关系数的比较,正确的是( )A .r 2<r 4<0<r 3<r 1B .r 4<r 2<0<r 1<r 3C .r 4<r 2<0<r 3<r 1D .r 2<r 4<0<r 1<r 3解析:选A.由相关系数的定义以及散点图的含义,可知r 2<r 4<0<r 3<r 1.11.期中考试后,某校高三(9)班班主任对全班65名学生的成绩(单位:分)进行分析,得到数学成绩y 关于总成绩x 的回归直线方程为y ^=6+0.4x .由此可以估计:若2名同学的总成绩相差50分,则他们的数学成绩大约相差________分.解析:设两名同学的总成绩分别为x 1,x 2,则对应的数学成绩估计为y ^1=6+0.4x 1,y ^2=6+0.4x 2,所以|y ^1-y ^2|=|0.4(x 1-x 2)|=0.4×50=20.答案:2012.(2020·湖北省宜昌县域高中协同发展共同体期末考试)为研究冬季昼夜温差大小对某反季节大豆新品种发芽率的影响,某校课外兴趣小组记录了5组昼夜温差与100颗种子发芽数,得到如下资料:组号 1 2 3 4 5 温差x (℃) 10 11 13 12 8 发芽数y (颗)2325302616组数据中选取3组数据求出线性回归方程,再用没选取的2组数据进行检验.(1)若选取的是第2,3,4组的数据,求出y 关于x 的线性回归方程y ^=b ^x +a ^; (2)若由线性回归方程得到的估计数据与所选出的检验数据的误差均不超过2颗,则认为得到的线性回归方程是可靠的,试问(1)中所得的线性回归方程是否可靠?(参考公式:b ^=∑ni =1(x i -x -)(y i -y -)∑ni =1 (x i -x -)2=∑ni =1x i y i -n x -y -∑n i =1x 2i -n x-2,a ^=y --b ^x -)解:(1)由题意:x -=11+13+123=12,y -=25+30+263=27,b ^=∑3i =1 (x i -x -)(y i -y -)∑3i =1 (x i -x -)2=(x 1-x -)(y 1-y -)+(x 2-x -)(y 2-y -)+(x 3-x -)(y 3-y -)(x 1-x -)2+(x 2-x -)2+(x 3-x -)2=(11-12)×(25-27)+(13-12)×(30-27)+(12-12)×(26-27)(11-12)2+(13-12)2+(12-12)2=52, a ^=y --b ^x -=27-52×12=-3,故回归直线方程为y ^=52x -3.(2)当x =10时,y =52×10-3=22,|22-23|=1<2,当x =8时,y =52×8-3=17,|17-16|=1<2,所以(1)中所得的回归直线方程是可靠的.13.(选做题)(2019·黑龙江省牡丹江市第一高级中学期末考试)某公司为确定下一年度投入某种产品的宣传费,需了解年宣传费x (单位:千元)对年销售量y (单位:t)和年利润z (单位:千元)的影响,对近8年的年宣传费x i 和年销售量y i (i =1,2,…,8)数据作了初步处理,得到下面的散点图及一些统计量的值.表中w i=xi,w-=18i=18w i.(1)根据散点图判断,y=a+bx与y=c+d x哪一个适宜作为年销售量y关于年宣传费x 的回归方程类型?(给出判断即可,不必说明理由)(2)根据(1)的判断结果及表中数据,建立y关于x的回归方程;(3)已知这种产品的年利润z与x、y的关系为z=0.2y-x.根据(2)的结果回答下列问题:(ⅰ)年宣传费x=49时,年销售量及年利润的预报值是多少?(ⅱ)年宣传费x为何值时,年利润的预报值最大?附:对于一组数据(u1,v1),(u2,v2),…,(u n,v n),其回归线v=α+βu的斜率和截距的最小二乘估计分别为解:(1)由散点图可以判断,y=c+d x适宜作为年销售量y关于年宣传费x的回归方程类型.(2)令w=x,先建立y关于w的线性回归方程.由于d=108.81.6=68,c^=y--d^w-=563-68×6.8=100.6,所以y关于w的线性回归方程为y^=100.6+68w,因此y关于x的回归方程为y^=100.6+68x.(3)(ⅰ)由(2)知,当x=49时,年销售量y的预报值y^=100.6+6849=576.6,年利润z的预报值z^=576.6×0.2-49=66.32.(ⅱ)根据(2)的结果知,年利润z的预报值z^=0.2(100.6+68x)-x=-x+13.6x+20.12.所以当x=13.62=6.8,即x=46.24时,z^取得最大值.故年宣传费为46.24千元时,年利润的预报值最大.。
高中数学精品课件 2.3.1 变量之间的相关关系--2.3.2 两个变量的线性相关
①画出数据对应的散点图; ②判断房屋的销售价格和房屋面积之间是否具有相关关系,如果 有相关关系,是正相关还是负相关?
解 ①数据对应的散点图如图所示.
②通过以上数据对应的散点图可以判断,房屋的销售价格和房屋 面积之间具有相关关系,并且是正相关.
x0123 y1357 则 y 与 x 的线性回归方程为y^=b^ x+a^ 必过点( )
A.(2,2)
B.(1,2)
C.(1.5,0)
D.(1.5,4)
解析 易得-x=1.5,-y=4,由于回归直线过样本点的中心(-x,
-y),故选 D. 答案 D
4.小学生身高 y 与年龄 x 之间的线性回归直线方程为y^=8.8x+65, 预测一名 10 岁的小学生的身高为________. 解析 当 x=10 时,y^=8.8×10+65=153. 答案 153
题型三 利用回归方程对总体进行估计 【例3】 某地最近十年粮食需求量逐年上升,下表是部分统计数
据:
年份
2008 2010 2012 2014 2016
需求量/万吨 236 246 257 276 286
(1)利用所给数据求年需求量与年份之间的回归直线方程y^=b^ x+ a^ ; (2)利用(1)中所求出的直线方程预测该地 2018 年的粮食需求量.
函数关系
变量之间的关系可以用函数表示
相关关系 变量之间有一定的联系,但不能完全用函数表示
2.相关关系与函数关系的区别与联系
类别
区别
联系
函 ①函数关系中两个变量间是一种确定性 ①在一定的条件下可以相
变量之间的相关关系
变量间的相互关系是指两个或两个以上变量之间相联系的性质,主要有两种类型。
(1)因果关系:是指在两个有关系的变量中,因为一个变量的变化而引起另一个变量的变化。
应注意三点:第一,在两个变量中,只能一个是因,另一个是果,而不能互为因果。
第二,原因变量一定出现在结果变量之前。
第三,两者之间的变化关系是必然的,否则就不是因果关系。
社会现象的因果关系十分复杂,有一因一果、一果多因、一因多果以及多因多果等。
在社会调查研究中,调查者应注意区别事物之间因果关系的类型,对一果多因、一因多果以及多因多果等复杂的因果关系要仔细分析,逐一明确,这样才能清楚地认识社会现象和事物发展变化的规律。
(2)相关关系:是指变量的变化之间存在着非因果关系的一定联系和一定关系。
社会调查研究运用相关这一概念,其目的是了解社会现象和事物之间关系的密切程度,从中探寻其规律性。
变量之间的相关关系从变化的方向来看,可以分为正相关与负相关;从变化的表现形式来看,可以分为直线相关和曲线相关。
当一个变量的数值发生变化时,另一个变量的数值也随之发生同方向的变化,这种相关关系是正相关,也叫直接相关。
当一个变量的数值发生变化时,另一个变量的数值也随之发生反方向的变化,这种相关关系是负相关,也叫逆相关。
在社会调查研究中,掌握变量关系的正相关与负相关的概念,有利于了解社会现象和事物的发展方向和趋势。
当一个变量的数值发生变动(增加或减少),另一个变量的数值随着发生大致均等的变动时,这种关系称为直线相关;当一个变量的数值发生变动,另一个变量的数值随之发生不均等的变动时,这种关系称为曲线相关。
高中数学 课件 变量间的相关关系
题型四
解:(1)散点图如图:
(2)具有相关关系.根据散点图,样本点散布在从左下角到右上角
的区域,变量x的值由小变大时,另一个变量y的值也由小变大,故它
们具有正相关关系.
目标导航
题型一
题型二
题型三
Z 知识梳理 Z重难聚焦源自HISHISHULIHONGNANJUJIAO
D典例透析
IANLITOUXI
题型四
(参考数值:3×2.5+4×3+5×4+6×4.5=66.5)
目标导航
题型一
题型二
题型三
Z 知识梳理 Z重难聚焦
HISHISHULI
HONGNANJUJIAO
D典例透析
IANLITOUXI
题型四
分析:(1)以产量为横坐标,以生产能耗对应的测量值为纵坐标,在
平面直角坐标系内画出散点图;(2)应用计算公式求得线性相关系
^ ^
, 的值; (3)实际上就是求当 = 100时, 对应的的值.
解:(1)散点图如图所示:
目标导航
题型一
题型二
题型三
Z 知识梳理 Z重难聚焦
HISHISHULI
HONGNANJUJIAO
D典例透析
IANLITOUXI
题型四
4
(2)由题意,得 ∑ = 3 × 2.5 + 4 × 3 + 5 × 4 + 6 × 4.5
x
3
4
5
6
y
2.5
3
4
4.5
(1)请画出上表数据的散点图;
(2)请根据上表提供的数据,用最小二乘法求出y关于x的线性回归
^
^
^
高中数学 第二章 统计 2.3.1-2.3.2 变量之间的相关关系 两个变量的线性相关课件 新人教
A .1 B .1 C .1 D .1 1 6 8 4 2
35
【思路导引】利用回归直线方程必过样本点的中心求解.
【解析】选B.依题意可知样本点的中心为 ( 3 , ,3 )
48
则3
8
= 1×
3
+3
4
,a 解得
=a .
1 8Βιβλιοθήκη 36【拓展延伸】相关关系的强弱
(1)若相应于变量x的取值xi,变量y的观测值为yi(1≤i≤n),称r=
6
(2)你能举例说明你对正相关与负相关的理解吗? 提示:随自变量的变大(或变小),因变量也随之变大(或变小),这种带有随机性 的相关关系,我们称为正相关.例如,人年龄由小变大时,体内脂肪含量也由少 变多. 随自变量的变大(或变小),因变量却随之变小(或变大),这种带有随机性的相关 关系,我们称为负相关.例如,汽车越重,每消耗1 L汽油所行驶的平均路程就 越短.
n
n
x i2,
xi y,i
i1
i1
30
(5)代入公式计算
b ,a,公式为
n
x iyi n x y
b
i1
n
x
2 i
n
x
2
i1
,
a y b x .
(6)写出回归直线方程 = x+ .
yb a
31
【跟踪训练】 已知变量x,y有如下对应数据:
x1234 y1345
(1)作出散点图. (2)用最小二乘法求关于x,y的回归直线方程.
42
【思路导引】(1)以产量为横坐标,以生产能耗对应的测量值为纵坐标, 在平面直角坐标系内画散点图. (2)应用计算公式求得线性相关系数 bˆ , aˆ 的值. (3)实际上就是求当x=100时,对应的 yˆ 的值.
2.3.1 变量之间的相关关系2.3.2 两个变量的线性相关 课件(人教A版必修三)
5
5
x 70, y 66, xi2 24 750, xiyi 23 190
i1
i1
设所求回归方程为 y$ b$x, a$
则由上表可得
5
b$=
i1 5
xi yi xi2
5xy
2
5x
=
9 =.为 =0.36x+40.8.
y$
【拓展提升】利用公式求回归方程的一般步骤
思考:你能举出几个函数关系和相关关系的实例吗? 提示:函数关系:圆的面积与其半径,正方体的体积与其棱长; 相关关系:销售额与广告费用.
二、两个变量的线性相关 1.散点图 将n个数据点(xi,yi)(i=1,2,…,n)描在平面直角坐 标系中,以表示具有__相__关_关__系__的两个变量的图形叫做散点图. 2.两类特殊的相关关系 (1)正相关:散点图中的点散布的位置是从_左__下__角__到_右__上__角__ 的区域.(2)负相关:散点图中的点散布的位置是从_左__上__角__到 _右__下__角__的区域.
中心,即 .
2.利用公(式x,确y)定 .
y$ b$x a$
a$, b$
【解析】1.选C.由题意知,可设此回归直线的方程为
y$1.23,x又因a$ 为回归直线必过点
线
上,
所以y$5=1.213.x23×a$ 4+ , =0.08,
,所以点(4,5)在直
(x, y)
故回归直线的方程a$是a$ =1.23x+0.08.
三、回归直线方程 1.线性相关 如果散点图中点的分布从整体上看大致在一条_____附近,
直线 我们就称这两个变量之间具有线性相关关系,这条直线 叫做_________.
回归直线
变量之间的相关关系、两个变量的线性相关 课件
[解析] (1)利用模型①,可得该地区 2018 年的环境基础设施投资额的预测值为 ^y=-30.4+13.5×19=226.1(亿元).
利用模型②,可得该地区 2018 年的环境基础设施投资额的预测值为^y=99+ 17.5×9=256.5(亿元).
● (ii)从计算结果看,相对于2016年的环境基础设施投资额220亿元,由模型①得到的预测值 226.1亿元的增幅明显偏低,而利用模型②得到的预测值的增幅比较合理,说明利用模型②得到 的预测值更可靠. ● (以上给出了2种理由,考生答出其中任意一种或其他合理理由均可)
『规律总结』 利用回归方程,我们可以进行预测,并对总体进行估计.尽 管我们利用回归方程所得的值仅是一个估计值,具有随机性,但我们是根据统计 规律得到的,因而所得结论正确的概率是最大的,故我们可以放心大胆地利用回 归方程进行预测.
人均 GDP/万元 10 8 6 4 3 1 患白血病的儿童数/人 351 312 207 175 132 180
● (1)画出散点图,并判定这两个变量是否具有线性相关关系; ● (2)通过计算可知这两个变量的回归直线方程为=23.25x+102.15,假如一个城市的人均 GDP为12万元,那么可以断言,这个城市患白血病的儿童一定超过380人,请问这个断言是否正 确?
为了预测该地区 2018 年的环境基础设施投资额,建立了 y 与时间变量 t 的两个 线性回归模型.根据 2000 年至 2016 年的数据(时间变量 t 的值依次为 1,2,…,17) 建立模型①:^y=-30.4+13.5t;根据 2010 年至 2016 年的数据(时间变量 t 的值依次 为 1,2,…,7)建立模型②:^y=99+17.5t.
变量间的相关关系 课件
(1)将上表中的数据制成散点图; (2)你能从散点图中发现施肥量与水稻产量近似成什么关 系吗? (3)若近似成线性关系,请画出一条直线来近似地表示这 种线性关系. [思路点拨] 作出散点图.根据散点图判断.
n
是偏差的平方和,即 Q= (yi-a-bxi)2,这样,回归直线就
i=1
是所有直线中 Q 取最小值的那一条,这种使得样本数据的点 到它的距离的平方和最小的方法叫做最小二乘法.
(2)利用最小二乘法求a、b时,是将Q转化为关于 a或b的二次函数,利用二次函数的知识求得的.
[例1] 下面是水稻产量与施肥量的一组统计数 据(单位:kg):
[思路点拨] (1)以产量为横坐标,以生产能耗对应的测 量值为纵坐标,在平面直角坐标系内画散点图;(2)应用 计算公式求得线性相关系数^b,^a的值;(3)实际上就是求 当 x=100 时,对应的 y 的值.
[精解详析] (1)散点图,如图所示.
4
(2)由题意,得 xiyi=3×2.5+4×3+5×4+6×4.5
i=1
i=1
=
n
xi2-n x 2
i=1
a= y -b x
其中:b 是回归方程的 斜率 ,a 是 截距 .
1.相关关系与函数关系均是指两个变量的关 系,不同的是函数关系是一种因果关系,而相关关 系不一定是因果关系,也可能是一种伴随关系.
2.对回归方程的推导,注意以下两点: (1)回归直线是数据最贴近的直线,反映贴近程度的数据
2.判断两个变量x和y间是否具有线性相关关 系,常用的简便方法就是绘制散点图,如果图上 发现点的分布从整体上看大致在一条直线附近, 那么这两个变量就是线性相关的,注意不要受个 别点的位置的影响.
两个变量的线性相关ppt课件
例、假设关于某设备的使用年限x(年)和所支出的维修 费用y(万元),有如下的统计资料:
使用年限x(年) 2
3
4
5
6
维修费用y(万元) 2.2 3.8
5.5 6.5 7.0
若资料知y,x呈线性相关关系,试求:
(1) 线性回归方程Y=bx+a的回归系数a、b;
(2) 估计使用年限为10年时,维修费用是多少?
(x2,y2)
是比较合适的。
x
为深入学习习近平新时代中国特色社 会主义 思想和 党的十 九大精 神,贯彻 全国教 育大会 精神,充 分发挥 中小学 图书室 育人功 能
n
Σ(yi-Yi)的最小值
i=1
n
Σ|yi-Yi|的最小值
i=1
n
Σ(yi-Yi)2的最小值
i=1
n
xiyi n x y
b
根据上述数据,人体的脂肪含量与年龄之间 有怎样的关系?
为深入学习习近平新时代中国特色社 会主义 思想和 党的十 九大精 神,贯彻 全国教 育大会 精神,充 分发挥 中小学 图书室 育人功 能
人体脂肪含量百分比与年龄散点图
散点图:
脂肪含量
40 30 20 10 0
0 10 20 30 40 50 60 70
设所求的回归直线方程为Y=bx+a,其中a,b是待定 的系数。当变量x取x1,x2,…,xn时,可以得到
Yi=bxi+a(i=1,2,…,n) y 它与实际收集得到的yi之间偏差是
(xi ,yi )
yi-Yi
yi-Yi=yi-(bxi+a)(i=1,2,…,n)
(x1,y1)
这样,用这n个偏差的和来刻画 “各点与此直线的整体偏差”
变量之间的相关关系、 两个变量的线性相关 课件
(2)以下是某地搜集到的新房屋的销售价格和房屋面积 的数据:
房屋面积 /平方米
61
70
115 110 80
135 105
销售价 格/万元
36.6 45.9 74.4 64.8 55.2 87.6 66
画出数据对应的散点图,并指出销售价格与房屋面积这 两个变量是正相关还是负相关.
【解题指南】(1)可先判定是否有关,若有关则看关系是 否确定;(2)先画出散点图,再根据散点图判断即可得出 结论.
x
4
5
7
8
y
2
3
5
6
(1)请画出上表数据的散点图,并说明其相关关系. (2)请根据上表提供的数据,用最小二乘法求出y关于x 的线性回归方程 y bx a .
(3)试根据(2)求出的线性回归方程,预测燃放烟花爆竹 的天数为9的雾霾天数.
【解题指南】(1)根据表中数据,画出散点图即可. (2)根据公式,计算线性回归方程的系数即可. (3)由线性回归方程预测x=9时y的值.
由散点图可以看出两个变量的对应点集中在一条直线 的周围,具有正相关关系.因此,销售价格与房屋面积具 有正相关关系.
【方法总结】两个变量x与y具有相关关系的判断方法 (1)散点图法:通过散点图,观察它们的分布是否存在一 定规律,直观地判断;如果发现点的分布从整体上看大 致在一条直线附近,那么这两个变量就是线性相关的, 注意不要受个别点的位置的影响.
=1,
a=y
bx
=4
6=
2,
i1
故线性回归方程为 y bx a =x-2.
(3)由线性回归方程可以预测,燃放烟花爆竹的天数为9 的雾霾天数为7.
【方法总结】求线性回归方程的步骤
变量间的相关关系 课件
(2)回归直线方程求解的方法步骤 根据最小二乘法的思想和公式,利用计算器或计算机,可
以方便地求出回归方程.
(3)利用回归直线对总体进行估计 利用回归直线,我们可以进行预测,若回归直线方程为y^ = bx+a,则 x=x0 处的估计值为:y^ 0=bx0+a.
特别提示:进行回归分析,通常先进行相关性检验,若能 确定两个变量具有线性相关关系,再去求其线性回归方程,否 则所求方程毫无意义.
一般规律吗? (2)求回归直线方程; (3)预测当钢水含碳量为 1.6%时,应冶炼多少分钟?
思路点拨:先画出散点图,求出回归直线方程,再进行预 测.
【解析】(1)以 x 轴表示含碳量,y 轴表示冶炼时间,可作 散点图,如图所示:
从图中可以看出,各点散布在一条直线附近,即它们线性 相关.
(2)列出下表,并用科学计算器进行计算:
10
10
10
x =159.8, y =172,x2i =265 448,y2i =312 350,xiyi=287 640
i=1
i=1
i=1
设所求的回归直线方程为y^ =bx+a,其中 a,b 的值使 Q=
10
(yi-bxi-a)2 的值最小.
i=1
10
xiyi-10 x y
i=1
b^ =
≈1.27,
记 x =1ni=n1xi, y =1ni=n1yi,则( x , y )为样本点的中心,回归直
线一定过这一点,对于单变量样本数据而言,平均数是样本 数据的中心,类似地,对于双变量样本点而言,回归直线是 样本点的中心.
2.怎样画出散点图和回归直线?
【答案】 (1)建立直角坐标系,两轴的长度单位可以不一致. (2)将 n 个数据点(xi,yi)(n=1,2,3,…,n)描在平面直角坐 标系中. (3)描的点可以是实心点,也可以是空心点. (4)画回归直线时,一定要画在多数点经过的区域.实际画 线时,先观察有哪两个点在直线上即可. (5)具体作回归直线时,用一把透明的直尺边缘在这些点间 移动,使它尽量靠近或通过大多数点,然后画出直线.
两个变量的线性相关课件
脂肪 29.6 30.2 31.4 30.8 33.5 35.2 34.6
思考2:为了确定年龄和人体脂肪含量之间的 更明确的关系,我们需要对数据进行分析, 通过作图可以对两个变量之间的关系有一个 直观的印象.以x轴表示年龄,y轴表示脂肪含 量,你能在直角坐标系中描出样本数据对应 的图形吗?
(1)一个为可控变量,另一个为随机变量;
(2)两个都是随机变量.
知识探究(二):散点图 【问题】在一次对人体脂肪含量和年龄 关系的研究中,研究人员获得了一组样 本数据:
年龄 23 27 39 41 45 49 50
脂肪 9.5 17.8 21.2 25.9 27.5 26.3 28.2
年龄 53 54 56 57 58 60 61 脂肪 29.6 30.2 31.4 30.8 33.5 35.2 34.6
3.我们不能通过一个人的数学成绩是 多少就准确地断定其物理成绩能达到 多少,学习兴趣、学习时间、教学水 平等,也是影响物理成绩的一些因素, 但这两个变量是有一定关系的,它们 之间是一种不确定性的关系.类似于 这样的两个变量之间的关系,有必要 从理论上作些探讨,如果能通过数学 成绩对物理成绩进行合理估计,将有 着非常重要的现实意义.
脂肪含量
40 35 30 25 20 15 10 5 0
20 25 30 35 40 45 50 55 60 65 年龄
思考3:上图叫做散点图,你能描述一 下散点图的含义吗?
在平面直角坐标系中,表示具有相关关系 的两个变量的一组数据图形,称为散点图.
脂肪含量
40 35 30 25 20 15 10
变量之间的相关关系 两个变量的线性相关
问题提出
两个变量的线性相关 课件
(4)求回归方程:若两个具有线性相关关系的变量的 一组数据为:(x1,y1),(x2,y2),…,(xn,yn),则所求的 回归方程为_^_y_=__^b_x_+__^a____,其中^a,^b为待定的参数,由 最小二乘法得:
^b是回归直线斜率,^a是回归直线在 y 轴上的截距.
温馨提示:使得样本数据的点到它的距离的平方和最 小,由于平方又叫二乘方,所以这种使“偏差平方和为最 小”的方法,叫作最小二乘法.
x 22 34 54 43 39 46 64 58 72 67 y 11 13 15 16 16 17 19 20 23 24
散点图如图所示: (4 分)
(2)观察散点图可知,y 与 x 是线性相关关系.
下面求线性回归方程:
合 i 1 2 3 4 5 6 7 8 9 10
计 xi 22 34 54 43 39 46 64 58 72 67 499 yi 11 13 15 16 16 17 19 20 23 24 174
画出散点图,并判断它们是否有相关关系.如果有 相关关系,是正相关还是负相关?
解析:①身高与视力无关,不具有函数关系,也不具 有相关关系;②自由落体的物体的质量与落地时间无关, 不具有相关关系;③降雪量越大,交通事故发生率越高, 具有不确定性的相关关系.
答案:③
(2)解:散点图是分析变量相关关系的重要工具.作 出散点图如下图所示.
类型 3 线性回归方程的应用 [典例 3] 随着我国经济的发展,居民的储蓄存款逐 年增长.某地区城乡居民人民币储蓄存款(年底余额)如下 表所示.
年份
2010 2011 2012 2013 2014
时间代号t
1
2
3
4
5
储蓄存款y/千亿元 5
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
课时提升作业15变量之间的相关关系两个变量的线性相关
1.对变量x,y有观测数据(x i ,y i)(i=1,2,…,10),得散点图(1);对变量u,v有观测数据
2.已知回归直线的斜率的估计值是 1.23,样本点中心(即(,))为(4,5),则回归直线的方程是( )
A.网=1.23x+4
B.壯1.23X+5
C. =1.23x+0.08 D』;:I=0.08x+1.23
3.在下列各图中,两个变量具有较强正相关关系的散点图是( )
A.(1)
B.(2)
C.(3)
D.(4)
4.对有线性相关关系的两个变量建立的回归直线
方程」=:,+ ' x中,回归系数'( )
5.某商品销售量y(件)与销售价格x(元/件)负相关,则其回归方程可能是( )
6.四名同学根据各自的样本数据研究变量x,y之间的相关关系,并求得回归方程,分别得到以下四个
结论:①y与x负相关且 =2.347x-6.423; ②y与x负相关且「=-3.476x+5.648;
③y 与 x 正相关且•’ =5.437x+8.493;④y 与 x 正相关且•’ =-4.326x-4.578.
其中一定不正确的结论的序号是( )
A.①②
B.②③
C.③④
D.①④
7.设某大学的女生体重y(单位:kg)与身高x(单位:cm)具有线性相关关系,根据一组样本数据
(X i,y i)(i=1,2,…,n),用最小二乘法建立的回归方程为=0.85x-85.71,则下列结论中不正确的是
A.y与x具有正的线性相关关系
B.回归直线过样本点的中心(,)
(U i,V i)(i=1,2,…,10),得散点图(2).由这两个散点图可以判断
A.变量x与y正相关,u与v正相关
B. 变量x与y正相关,u 与v负
相关
C.变量x与y负相关,u与v正相关
D. 变量x与y负相关,u 与v负
相关
A.不能小于0
B.不能大于0
C.不能等于0
D.只能小于0
A. =-10x+200
B. =10x+200
C. =-10x-200
D. =10x-200
0 1 25 4 5 67 J
D.若该大学某女生身高为170cm,则可断定其体重必为 58.79kg
8.某商店统计了最近 6个月某商品的进价 x与售价y(单位:元)的对应数据如下
x 3 5 2 8 9 12
y 4 6 3 9 12 14
贝U = _______ , = _________ ,= ________ , Xi y = _______ ,回归方程为________
9.已知工厂加工零件的个数x与花费时间y(h)之间的线性回归方程为=0.01x +0.5,则加工200个
零件大约需要 _________ 小时.
10.设(x i,y i),(x 2,y 2),…,(x n,y
n)是变量x和y的n个样本点,直线l是由这些样本点通过最小二乘法得到的线性回归直
线如图所示,则以下结论正确的是
A.直线I过点(,)
B. 回归直线必通过散点图中的多个点
C.直线I的斜率必在区间(0,1)上
D.当n为偶数时,分布在I两侧的样本点的个数一定相同
11.已知变量x和y满足关系y=-0.1x+1,变量y与z正相关,下列结论中正确的是( )
A.x与y正相关,x与z负相关
B.x 与y正相关,x与z正相关
C.x与y负相关,x与z负相关
D.x与y负相关,x与z正相关
12.已知x,y间的一组数据如表:
x
2 3 4 5
6
y 3 4 6 8 9
对于表中数据,现给出如下拟合直线:①y=x+1;②y=2x-1;③y=-x--;④y=-x.则根据最小二乘法思想可得拟合程度最好的直线是 __________ .(填序号)
13.已知变量x,y有如下对应数据:
(1)作出散点图.
(2)用最小二乘法求关于 x,y的回归方程. x 1 2 3 4 y 1 3 4 5
第15课时变量之间的相关关系两个变量的线性相关
1.相关关系与函数关系不同.函数关系中的两个变量间是一种确定性关系,
相关关系是一种_______________________ 性关系.
2•从散点图上看,点散布在从左下角到右上角的区域内,两个变量的这种相关关系称为________ 点散布在从左上角到右下角的区域内,两个变量的相关关系为__________ .
3.从散点图上看,如果这些点从整体上看大致分布在过散点图中心的一条直线附近,称两个变量之间具有______________ ,这条直线叫_______________ .
4.回归方程y= bx+ a,
其中<土(XL文j
I育'
a= _________ .
a是截距.
n -
5.通过求Q=v (屮一bX j—a)2的最小值而得出回归直线的方法,即求出的回归直线使样本数据中的
i= 1
点到它的距离的平方和最小的方法叫做_____________________ .
6.在研究两个变量之间是否存在某种关系时,必须从散点图入手,对于散点图,可以作如下判断:
(1)如果所有的样本点都落在某一函数曲线上,变量之间就是函数关系;
(2)如果所有的样本点都落在某一函数曲线的附近,变量之间就有相关关系;
(3)如果所有的样本点都落在某一直线的附近,变量之间就有线性相关关系;
(4)如果散点图中的点的分布几乎没有什么规则,则这两个变量之间不具有相关关系,即两个变量之间是相互独立的.
7.画散点图时应注意合理选择单位长度,避免图形过大或过小,或者是点的坐标在坐标系中画不准,使图形失真,导致得出错误结论.
n _ _
、(X i -x)(y i -y)
8.相关性公式r = : ;(见教材92页阅读与思考)
、(X i -x)2(y^y)2
• iW
实例
1.3.设有一个回归方程为y = -1.5X+2,则变量x增加一个单位时( )
A.y平均增加1.5个单位
B.y平均增加2个单位
C.y平均减少1.5个单位
D.y平均减少2个单位
2.下面的4个散点图中,两个变量具有相关性的是(
)A.①② B.①③ C.②④ D.③④
★*-
■
■
* * * ■*
* • . ■
»2- n「
i= 1
b是回归方程的斜率,
n _ ___
v x i y i —n x y
i = 1
V C V
s
3.某产品的广告费用x与销售额y的统计数据如下表:
广告费用x (万兀) 4 2 3 5 销售额y (万元)
49
26
39
54
标准煤)的几组对照数据
x 3 4 5 6 y
2.5
3
4
4.5
(1) 请画出上表数据的散点图. (2)
请根据上表提供的数据,用最小二乘法求出回归方程
■' =• x+「
⑶ 已知该厂技改前100吨甲产品的生产能耗为
90吨标准煤.试根据 ⑵ 求出的线性回归方程,预测生
产100吨甲产品的生产能耗比技改前降低多少吨标准煤
?
6.(理)(2015高考重庆卷)随着我国经济的发展,居民的储蓄存款逐年增长•设某地区城乡居民人 民币储蓄存款(年底余额)如下表:
年份 2010 2011 2012 2013 2014 时间代号t 1 2 3 4 5 储畜存款y (千亿兀)
5
6
7
8
10
根据上表可得回归方程 y = bx + a 中的b 为9.4,据此模型预报广告费用为 6万元时销售额为(
)
B.65.5万元
C.67.7万元 y 与x 线性相
,则?=(
1 io
A.63.6万兀 4.已知x,y 的取值如下表所示:如果 关,且线性回归方程为
_1 1
A. 2
B. 2
y =bx 丄 C. _10 7
+
_
2
2
3 4 y
5
4
6
5.下表提供了某厂节能降耗技术改进后生产甲产品过程中记录的产量
回归方程y = bt + a 中,
n
___
b = z
ly i - nt y
D.72.0万元
x (吨)与相应的生产能耗 y (吨
⑴求y关于t的回归方程y= bt+ a;(2)用所求回归方程预测该地区2015年(t= 6)的人民币储蓄存款.附:
-2
-nt。