【步步高高考数学总复习】§ 10.3 变量间的相关关系

合集下载

变量间的相关关系

变量间的相关关系
这些点散布在从左下角到右上角的区域
2.正相关:在散点图中,点散布在从左下角到右上 角的区域,对于两个变量的这种相关关系,我们将 它称为正相关。
思考6:如图是高原含氧量与海拔高度的相关关系 的散点图,高原含氧量与海拔高度有何相关关系? 点的分布有何特点?
海平面以上,海拔高度 越高,含氧量越少。
点散布在从左上角到右 下角的区域内。
脂肪含量
40 35 30 25 20 15 10 5 0
20 25 30 35 40 45 50 55 60 65 年龄
思考3:上图叫做散点图,你能描述一下散点图的含 义吗?
1.散点图:在平面直角坐标系中,表示具有相关关系 的两个变量的一组数据图形,称为散点图.
脂肪含量
思考4:观察散点图的大致趋势,人的年龄的与人体 脂肪含量具有什么相关关系?
大体上看,随着年龄的增加,人体中脂肪百分比也 在增加。
年龄 23 脂肪 9.5
27 39 17.8 21.2
41 25.9
45
49 50
27.5 26.3 28.2
年龄 53 54 56 57 58 60 61 脂肪 29.6 30.2 31.4 30.8 33.5 35.2 34.6
思考2:为了确定年龄和人体脂肪含量之间的更明 确的关系,我们需要对数据进行分析,通过作图可 以对两个变量之间的关系有一个直观的印象.以x轴 表示年龄,y轴表示脂肪含量,你能在直角坐标系 中描出样本数据对应的图形吗?
销售价格 12.2 15.3 24.8 21.6 18.4 29.2 22
(万元)
画出数据对应的散点图,并指出销售价格与房屋面积 这两个变量是正相关还是负相关.
解: 35
30 25 20 15 10 5 0

2021届步步高数学大一轮复习讲义(文科)第十章 10.3变量间的相关关系、统计案例

2021届步步高数学大一轮复习讲义(文科)第十章 10.3变量间的相关关系、统计案例
(×) (4)两个变量的相关系数的绝对值越接近于1,它们的相关性越强.( √ )
题组二 教材改编
2.为调查中学生近视情况,测得某校150名男生中有80名近视,在140名女生
中有70名近视.在检验这些学生眼睛近视是否与性别有关时,用下列哪种方法
最有说服力
A.回归分析
√C.独立性检验
B.均值与方差 D.概率
n
n
xi- x yi- y xiyi-n x y
b^ =i=1
nxi- x 2i=1=,n
xi2-n x 2
i=1
i=1
a^ =_y___b_x_.
(4)回归分析 ①定义:对具有相关关系的两个变量进行统计分析的一种常用方法; ②样本点的中心 对于一组具有线性相关关系的数据(x1,y1),(x2,y2),…,(xn,yn),其中 _( _x_,__y_)_称为样本点的中心;
基础自测
题组一 思考辨析 1.判断下列结论是否正确(请在括号中打“√”或“×”)
(1)散点图是判断两个变量是否相关的一种重要方法和手段.( √ )
(2)线性回归方程y^=b^ x+a^至少经过点(x1,y1),(x2,y2),…,(xn,yn)中的一个
点.( × )
(3)若事件X,Y关系越密切,则由观测数据计算得到的K2的观测值越小.
1.变量的相关关系与变量的函数关系有什么区别? 提示 相同点:两者均是指两个变量的关系. 不同点:①函数关系是一种确定的关系,相关关系是一种非确定的关系. ②函数关系是一种因果关系,而相关关系不一定是因果关系,也可能是伴 随关系.
2.线性回归方程是否都有实际意义?根据回归方程进行预报是否一定准确? 提示 (1)不一定都有实际意义.回归分析是对具有相关关系的两个变量进行 统计分析的方法,只有在散点图大致呈线性时,求出的线性回归方程才有 实际意义,否则,求出的线性回归方程毫无意义. (2)根据回归方程进行预报,仅是一个预报值,而不是真实发生的值.

【步步高】届高三数学大一轮复习 变量间的相关关系学案 理 新人教A版

【步步高】届高三数学大一轮复习 变量间的相关关系学案 理 新人教A版

学案58 变量间的相关关系导学目标: 1.会作两个有关联变量的数据的散点图,会利用散点图认识变量间的相关关系.2.了解最小二乘法的思想,能根据给出的线性回归方程系数公式建立线性回归方程.自主梳理1.两个变量的线性相关 (1)正相关 在散点图中,点散布在从__________到________的区域,对于两个变量的这种相关关系,我们将它称为正相关.(2)负相关 在散点图中,点散布在从________到________的区域,两个变量的这种相关关系称为负相关.(3)线性相关关系、回归直线如果散点图中点的分布从整体上看大致在一条直线附近,我们就称这两个变量之间具有线性相关关系,这条直线叫做回归直线.2.回归方程 (1)最小二乘法求回归直线使得样本数据的点到它的________________________的方法叫做最小二乘法.(2)回归方程方程y ^=b ^x +a ^是两个具有线性相关关系的变量的一组数据(x 1,y 1),(x 2,y 2),…,(x n ,y n )的回归方程,其中a ^,b ^是待定参数.自我检测1.下列有关线性回归的说法,不正确的是( ) A .相关关系的两个变量不一定是因果关系 B .散点图能直观地反映数据的相关程度C .回归直线最能代表线性相关的两个变量之间的关系D .任一组数据都有回归直线方程2.(2009·海南,宁夏)对变量x ,y 有观测数据(x i ,y i )(i =1,2,…,10),得散点图(1);对变量u ,v 有观测数据(u i ,v i )(i =1,2,…,10),得散点图(2).由这两个散点图可以判断( )A .变量x 与y 正相关,u 与v 正相关B .变量x 与y 正相关,u 与v 负相关C .变量x 与y 负相关,u 与v 正相关D .变量x 与y 负相关,u 与v 负相关3.(2011·银川模拟)下表是某厂1~4月份用水量(单位:百吨)的一组数据:由散点图可知,用水量y 与月份x 之间有较好的线性相关关系,其回归直线方程是y ^=-0.7x +a ^,则a ^等于( )A .10.5B .5.15C .5.2D .5.254.(2010·广东)某市居民2005~2009年家庭年平均收入x(单位:万元)与年平均支出Y(单位:万元)的统计资料如下表所示:, 家庭年平均收入与年平均支出有______线性相关关系.5.(2011·金陵中学模拟)已知三点(3,10),(7,20),(11,24)的横坐标x 与纵坐标y 具有线性关系,则其回归方程是________________.探究点一 利用散点图判断两个变量的相关性例1 有一位同学家开了一个小卖部,他为了研究气温对热饮销售的影响,经过统计,得到一个卖出热饮杯数与当天气温的对比表:(1)(2)你能从散点图中发现气温与热饮销售杯数之间关系的一般规律吗?变式迁移1 某班5个学生的数学和物理成绩如表:探究点二求回归直线方程例2假设关于某设备的使用年限x和所支出的维修费用y(万元)有以下统计资料:若由资料知y对x呈线性相关关系.试求回归方程y=b x+a .变式迁移2 已知变量x与变量y有下列对应数据:且y对x探究点三利用回归方程对总体进行估计例3下表提供了某厂节能降耗技术改造后生产甲产品过程中记录的产量x(吨)与相应的生产能耗y(吨标准煤)的几组对照数据.(1)(2)请根据上表提供的数据,用最小二乘法求出y 关于x 的回归方程y ^=b ^x +a ^; (3)已知该厂技改前100吨甲产品的生产能耗为90吨标准煤.试根据(2)求出的回归方程,预测生产100吨甲产品的生产能耗比技改前降低多少吨标准煤?(参考数值:3×2.5+4×3+5×4+6×4.5=66.5)变式迁移3 (2011·盐城期末)某单位为了了解用电量y 度与气温x ℃之间的关系,随机统计了某4天的用电量与当天气温,并制作了对照表:由表中数据得回归方程y =b x +a 中b =-2,预测当气温为-4℃时,用电量的度数约为________.点大致分布在某一条直线的附近,就可以认为y 对x 的回归函数的类型为直线型:其中(满分:75分)一、选择题(每小题5分,共25分) 1.下列命题:①线性回归方法就是由样本点去寻找一条贴近这些样本点的直线的数学方法; ②利用样本点的散点图可以直观判断两个变量的关系是否可以用线性关系表示;③通过回归直线y ^=b ^x +a ^及回归系数b ^,可以估计和预测变量的取值和变化趋势. 其中正确的命题是( )A .①②B .①③C .②③D .①②③2.设有一个回归直线方程为y ^=2-1.5x ,则变量x 增加一个单位时( ) A .y 平均增加1.5个单位 B .y 平均增加2个单位 C .y 平均减少1.5个单位 D .y 平均减少2个单位3.(2011·陕西)设(x 1,y 1),(x 2,y 2),…,(x n ,y n )是变量x 和y 的n 个样本点,直线l 是由这些样本点通过最小二乘法得到的线性回归直线(如图),以下结论中正确的是( )A .x 和y 的相关系数为直线l 的斜率B .x 和y 的相关系数在0到1之间C .当n 为偶数时,分布在l 两侧的样本点的个数一定相同D .直线l 过点(x ,y )4.(2011·山东)某产品的广告费用x 与销售额y 的统计数据如下表:根据上表可得线性回归方程y =b x +a 中的b 为9.4,据此模型预报广告费用为6万元时销售额为( )A .63.6万元B .65.5万元C .67.7万元D .72.0万元5.(2011·青岛模拟)为了考察两个变量x 和y 之间的线性相关性,甲、乙两位同学各自独立做了10次和15次试验,并且利用线性回归方法,求得回归直线分别为l 1、l 2,已知两人所得的试验数据中,变量x 和y 的数据的平均值都相等,且分别是s 、t ,那么下列说法中正确的是( )A .直线l 1和l 2一定有公共点(s ,t)B .直线l 1和l 2相交,但交点不一定是(s ,t)C .必有l 1∥l 2D .l 1与l 2必定重合二、填空题(每小题4分,共12分)6.下列关系中,是相关关系的为________.(填序号) ①学生的学习态度与学习成绩之间的关系;②教师的执教水平与学生的学习成绩之间的关系; ③学生的身高与学生的学习成绩之间的关系; ④家庭的经济条件与学生的学习成绩之间的关系.7.已知回归直线的斜率的估计值是0.73,样本点的中心为(12.5,8.25),则回归直线的回归方程是______________.8.(2011·茂名月考)在研究硝酸钠的可溶性程度时,观测它在不同温度的水中的溶解度,得观测结果如下表:三、解答题(共38分)9.(12分)(2011·威海模拟)某车间为了规定工时定额,需要确定加工零件所花费的时间,为此做了四次试验,得到的数据如下:(1)(2)求出y 关于x 的回归方程y ^ =b ^ x +a ^,并在坐标系中画出回归直线; (3)试预测加工10个零件需要多少时间?(注:b ^=∑ni =1x i y i -n x y∑n i =1x 2i-n x2,a ^ =y -b ^x )10.(12分)(2010·许昌模拟)某种产品的宣传费支出x 与销售额y(单位:万元)之间有如下对应数据:(1)画出散点图; (2)求回归直线方程;(3)试预测宣传费支出为10万元时,销售额多大?11.(14分)(1)(2)指出产量每增加1 000件时,单位成本平均变动多少? (3)假定产量为6 000件时,单位成本为多少元?学案58 变量间的相关关系自主梳理1.(1)左下角 右上角 (2)左上角 右下角 2.(1)距离的平方和最小(2)∑ni =1i -xi-y∑n i =1 i-x 2∑ni =1x i y i -n x y∑n i =1x 2i-n x2y -b ^x 自我检测1.D 2.C 3.D4.13 正 5.y ^=74x +234课堂活动区例1 解题导引 判断变量间是否线性相关,一种常用的简便可行的方法就是作散点图.散点图是由大量数据点分布构成的,是定义在具有相关关系的两个变量基础之上的,对于性质不明确的两组数据可先作散点图,直观地分析它们有无关系及关系的密切程度.解 (1)以x 轴表示温度,以y 轴表示热饮杯数,可作散点图,如图所示.(2)从图中可以看出,各点散布在从左上角到右下角的区域里,因此,气温与热饮销售杯数之间是负相关关系,即气温越高,卖出去的热饮杯数越少.从散点图可以看出,这些点大致分布在一条直线附近.变式迁移1 解 以x 轴表示数学成绩,y 轴表示物理成绩,可得相应的散点图如下图所示:由散点图可见,两者之间具有相关关系.例2 解题导引 根据题目给出的数据,利用公式求回归系数,然后获得回归方程. 解 制表如下:于是有b ^=90-5×42=10=1.23; a ^=y -b ^x =5-1.23×4=0.08.∴回归直线方程为y ^=1.23x +0.08.变式迁移2 解 x =1+2+3+44=52,y =12+32+2+34=74,∑ni =1x 2i =12+22+32+42=30, ∑n i =1x i y i =1×12+2×32+3×2+4×3=432, ∴b ^ =∑n i =1x i y i -n x y ∑ni =1x 2i -n x 2=432-4×52×7430-4×254=0.8, a ^ =y -b ^x =74-0.8×52=-0.25,∴y ^=0.8x -0.25.例3 解题导引 利用描点法得到散点图,按求回归方程的步骤和公式,写出回归方程,最后对总体进行估计.利用回归方程可以进行预测,回归方程将部分观测值所反映的规律进行延伸,是我们对有线性相关关系的两个变量进行分析和控制,依据自变量的取值估计和预报因变量值的基础和依据,有广泛的应用.解 (1)散点图:(2)x =3+4+5+64=4.5,y =2.5+3+4+4.54=3.5, ∑4i =1x i y i =3×2.5+4×3+5×4+6×4.5=66.5.∑4i =1x 2i =32+42+52+62=86, ∴b ^=∑4i =1x i y i -4x y∑4i =1x 2i-4x2=66.5-4×4.5×3.586-4×4.52=0.7, a ^=y -b ^x =3.5-0.7×4.5=0.35. ∴所求的回归方程为y ^=0.7x +0.35. (3)现在生产100吨甲产品用煤y ^=0.7×100+0.35=70.35,∴降低90-70.35=19.65(吨标准煤). 变式迁移3 68解析 x =10,y =40,回归方程过点(x ,y ),∴40=-2×10+a ^.∴a ^=60.∴y ^=-2x +60.令x =-4,y ^=(-2)×(-4)+60=68. 课后练习区1.D [根据线性回归的含义、方法、作用分析这三个命题都是正确的.] 2.C [设(x 1,y 1),(x 2,y 2)在直线上,若x 2=x 1+1,则y 2-y 1=(2-1.5x 2)-(2-1.5x 1)=1.5(x 1-x 2)=-1.5,y 平均减少1.5个单位.]3.D [因为相关系数是表示两个变量是否具有线性相关关系的一个值,它的绝对值越接近1,两个变量的线性相关程度越强,所以A 、B 错误.C 中n 为偶数时,分布在l 两侧的样本点的个数可以不相同,所以C 错误.根据线性回归方程一定经过样本中心点可知D 正确.所以选D .]4.B [∵x =4+2+3+54=72,y =49+26+39+544=42,又y ^ =b ^ x +a ^ 必过(x ,y ),∴42=72×9.4+a ^ ,∴a ^=9.1.∴线性回归方程为y ^=9.4x +9.1.∴当x =6时,y ^=9.4×6+9.1=65.5(万元).]5.A [回归直线方程为y ^=b ^x +a ^.而a ^=y -b ^x ,即a ^=t -b ^s ,t =b ^s +a ^.∴(s,t)在回归直线上. ∴直线l 1和l 2一定有公共点(s ,t).] 6.①②解析 ①中学生的学习态度与学习成绩之间不是因果关系,但具有相关性,是相关关系.②教师的执教水平与学生的学习成绩之间的关系是相关关系.③④都不具备相关关系.7.y ^=0.73x -0.875解析 a ^=y -b ^x =8.25-0.73×12.5=-0.875. 8.0.880 9解析 x =30,y =93.6,∑5i =1x 2i=7 900,∑5i =1x i y i =17 035, ∴回归直线的斜率为 b ^=∑5i =1x i y i -5x y∑5i =1x 2i -5x 2=17 035-5×30×93.67 900-4 500≈0.880 9.9.解(1)散点图如图所示.(4分)(2)由表中数据得∑4i =1x i y i =52.5, x =3.5,y =3.5,∑4i =1x 2i =54, ∴b ^=0.7.∴a ^=y -b ^x =1.05.∴y ^=0.7x +1.05.回归直线如图中所示.(10分) (3)将x =10代入回归直线方程, 得y =0.7×10+1.05=8.05(小时),∴预测加工10个零件需要8.05小时.(12分)10.解 (1)根据表中所列数据可得散点图如图所示:(4分)(2)计算得:x =255=5,y =2505=50, ∑5i =1x 2i=145,∑5i =1x i y i =1 380. 于是可得b ^=∑5i =1x i y i -5x y∑5i =1x 2i -5x 2=1 380-5×5×50145-5×52=6.5, a ^=y -b ^x =50-6.5×5=17.5,因此,所求回归直线方程是y ^=6.5x +17.5.(10分)(3)由上面求得的回归直线方程可知,当宣传费支出为10万元时,y ^=6.5×10+17.5=82.5(万元),即这种产品的销售大约为82.5万元.(12分)11.解 (1)n =6,∑6i =1x i =21,∑6i =1y i =426,x =3.5,y =71, ∑6i =1x 2i=79,∑6i =1x i y i =1 481, b ^=∑6i =1x i y i -6x y∑6i =1x 2i -6x 2=1 481-6×3.5×7179-6×3.52≈-1.82. (3分)a ^=y -b ^x =71+1.82×3.5=77.37.(5分)∴回归方程为y ^=a ^+b ^x =77.37-1.82x.(6分)(2)因为单位成本平均变动b ^=-1.82<0,且产量x 的计量单位是千件,所以根据回归系数b 的意义有:产量每增加一个单位即1 000件时,单位成本平均减少1.82元.(10分)(3)当产量为6 000件时,即x =6,代入回归方程:y ^=77.37-1.82×6=66.45(元).∴当产量为6 000件时,单位成本为66.45元.(14分)。

变量间的相关关系高三二轮复习资料

变量间的相关关系高三二轮复习资料

变量间的相关关系复习资料一、变量间的相关关系1.常见的两变量之间的关系有两类:一类是函数关系,另一类是相关关系;与函数关系不同,相关关系是一种非确定性关系.2.从散点图上看,点分布在从左下角到右上角的区域内,两个变量的这种相关关系称为正相关,点分布在左上角到右下角的区域内,两个变量的相关关系为负相关.二、两个变量的线性相关1.从散点图上看,如果这些点从整体上看大致分布在通过散点图中心的一条直线附近,称两个变量之间具有线性相关关系,这条直线叫回归直线.2.用最小二乘法求回归方程为y ^=b ^x +a ^,其中b ^=∑∑==--=ni iini i xn xy x n yx 1221∑∑==---=ni ii ni ix xy y x x121)())(( ,且 a ^=y -b ^x .例题1.(教材习题改编)观察下列各图形其中两个变量x 、y 具有相关关系的图是( ) A .①②B .①④C .③④D .②③解析:选C 由散点图知③④具有相关关系.2.(教材习题改编)已知变量x ,y 之间具有线性相关关系,其回归方程为y ^=-3+bx , 若∑i =110x i =17,∑i =110y i =4,则b 的值为( )A .2B .1C .-2D .-1解析:选A 依题意知,x =1710=1.7,y =410=0.4,而直线y ^=-3+bx 一定经过点(x ,y ),所以-3+b ×1.7=0.4,解得b =2.3.已知变量x ,y 之间具有线性相关关系,其散点图如图所示,则其回归方程可能为( )A.y ^=1.5x +2B.y ^=-1.5x +2 C.y ^=1.5x -2 D.y ^=-1.5x -2解析:选B 设回归方程为y ^=bx +a .由散点图可知变量x 、y 之间负相关,回归直线在y 轴上的截距为正数,所以b <0,a >0,因此其回归直线方程可能为y ^=-1.5x +2.4. (2012·福建高考)某工厂为了对新研发的一种产品进行合理定价,将该产品按事先拟定的价格进行试销,得到如下数据:(1)求回归直线方程y ^=bx +a ,其中b =-20,a =y --b x -;(2)预计在今后的销售中,销量与单价仍然服从(1)中的关系,且该产品的成本是4元/件,为使工厂获得最大利润,该产品的单价应定为多少元?(利润=销售收入-成本)[自主解答] (1)由于x =16(x 1+x 2+x 3+x 4+x 5+x 6)=8.5,y =16(y 1+y 2+y 3+y 4+y 5+y 6)=80.所以a =y -b x =80+20×8.5=250,从而回归直线方程为y ^=-20x +250. (2)设工厂获得的利润为L 元,依题意得L =x (-20x +250)-4(-20x +250)=-20x 2+330x -1 000=-20⎝⎛⎭⎫x -3342+361.25. 当且仅当x =8.25时,L 取得最大值.故当单价定为8.25元时,工厂可获得最大利润. 注:1.回归直线方程必过定点(x ,y ).2.由回归方程进行预报,仅是一个预报值,而不是真实发生的值. 5.(2012·长春模拟)已知x 、y 取值如下表:从所得的散点图分析可知:y 与x 线性相关,且y =0.95x +a ,则a =( ) A .1.30 B .1.45 C .1.65D .1.80解析:选B 依题意得,x =16×(0+1+4+5+6+8)=4,y =16×(1.3+1.8+5.6+6.1+7.4+9.3)=5.25;又直线y ^=0.95x +a 必过中心点(x ,y ),即点(4,5.25),于是有5.25=0.95×4+a ,由此解得a =1.45.同步练习题1. 下列两个变量具有相关关系的是( ) A. 正方体的体积与边长 B. 人的身高与体重C. 匀速行驶车辆的行驶距离与时间D. 球的半径与体积 2. 两个变量成负相关关系时,散点图的特征是( ) A. 点散布在从左下角到右上角的区域内 B. 点散布在某带形区域内C. 点散布在某圆形区域内D. 点散布在从左上角到右下角的区域内3.(2009年高考宁夏、海南卷)对变量x 、y 有观测数据(x i ,y i )(i =1,2,…,10),得散点图1;对变量u ,v 有观测数据(u i ,v i )(i =1,2,…,10),得散点图2.由这两个散点图可以判断()A .变量x 与y 正相关,u 与v 正相关B .变量x 与y 正相关,u 与v 负相关 C.变量x 与y 负相关,u 与v 正相关 D .变量x 与y 负相关,u 与v 负相关4. 由一组样本数据(1x ,1y ),(2x ,2y ),…,(n x ,n y ),得到回归方程a bx y +=∧,那么下面说法不正确的是( )A. 直线a bx y +=∧必经过点(x ,y )B. 直线a bx y +=∧至少经过点(1x ,1y ),(2x ,2y ),…,(n x ,n y )中的一个点C. 直线a bx y +=∧的斜率为∑∑==--n1i 22in1i ii x n xyx n yxD. 直线a bx y +=∧和各点(1x ,1y ),(2x ,2y ),…,(n x ,n y )的偏差()[]∑=+-n1i 2iia bxy 是该坐标平面上所有直线与这些点的偏差中最小的直线5. 若施化肥量x (单位:kg )与水稻产量y (单位:kg )的回归方程为250x 5y +=∧,则当施化肥量为80kg 时,预计水稻产量为___________。

高考数学(文)全程复习课件:10.3 变量间的相关关系

高考数学(文)全程复习课件:10.3 变量间的相关关系

4.在一次实验中,测得(x,y)的四组值为(1,2),(2,3),(3,4), (4,5),则 y 与 x 之间的回归直线方程为( ) A.^ y=x+1 B.^ y=x+2 C.^ y=2x+1 D.^ y=x-1
^ 、a ^即可,也可注意 解析:将(x,y)的四组值代入公式求得b 到所给的四组值,发现 y 总比 x 大 1, 故回归直线方程为^ y=x+1. 答案:A
题型二 求回归直线方程 例 2 某产品的广告支出 x(单位:万元)与销售收入 y(单位: 万元)之间有下表所对应的数据: 广告支出 x(单位:万元) 1 2 3 4 销售收入 y(单位:万元) 12 28 42 56 (1)画出表中数据的散点图; (2)求出 y 对 x 的回归直线方程.
2.设(x1,y1),(x2,y2),…,(xn,yn) 是变量 x 和 y 的 n 个样本点,直线 l 是由 这些样本点通过最小二乘法得到的线性回 归直线(如图),以下结论正确的是( ) A.直线 l 过点( x , y ) B.x 和 y 的相关系数为直线 l 的斜率 C.x 和 y 的相关系数在 0 到 1 之间 D.当 n 为偶数时,分布在 l 两侧的样本点的个数一定相同
解析:由样本的中心( x , y )落在回归直线上可知 A 正确;x 和 y 的相关系数表示为 x 与 y 之间的线性相关程度,不表示直线 l 的斜率,故 B 错;x 和 y 的相关系数应在-1 到 1 之间,故 C 错;分布在回归直线两侧的样本点的个数并不绝对平均,即无论 样本点个数是奇数还是偶数,故 D 错. 答案:A
5.调查了某地若干户家庭的年收入 x(单位:万元)和年饮食 支出 y(单位:万元),调查显示年收入 x 与年饮食支出 y 具有线 ^ 性相关关系, 并由调查数据得到 y 对 x 的回归直线方程: y=0.254x +0.321,由回归直线方程可知,家庭年收入每增加 1 万元,年 饮食支出平均增加________万元.

2021届步步高数学大一轮复习讲义(文科)第十章 10.3变量间的相关关系、统计案例

2021届步步高数学大一轮复习讲义(文科)第十章 10.3变量间的相关关系、统计案例

§10.3变量间的相关关系、统计案例1.相关关系与回归方程(1)相关关系的分类①正相关在散点图中,点散布在从左下角到右上角的区域,对于两个变量的这种相关关系,我们将它称为正相关; ②负相关在散点图中,点散布在从左上角到右下角的区域,两个变量的这种相关关系称为负相关. (2)线性相关关系如果散点图中点的分布从整体上看大致在一条直线附近,就称这两个变量之间具有线性相关关系,这条直线叫做回归直线. (3)回归方程 ①最小二乘法求回归直线,使得样本数据的点到它的距离的平方和最小的方法叫做最小二乘法; ②回归方程方程y ^=b ^x +a ^是两个具有线性相关关系的变量的一组数据(x 1,y 1),(x 2,y 2),…,(x n ,y n )的回归方程,其中a ^,b ^是待定参数.⎩⎪⎨⎪⎧b ^=∑i =1n(x i-x )(y i-y )∑i =1n(x i-x )2=∑i =1nx i y i-n x y ∑i =1nx 2i-n x 2,a ^=y -b ^x .(4)回归分析①定义:对具有相关关系的两个变量进行统计分析的一种常用方法; ②样本点的中心对于一组具有线性相关关系的数据(x 1,y 1),(x 2,y 2),…,(x n ,y n ),其中(x ,y )称为样本点的中心; ③相关系数当r >0时,表明两个变量正相关; 当r <0时,表明两个变量负相关.r 的绝对值越接近于1,表明两个变量的线性相关性越强.r 的绝对值越接近于0,表明两个变量之间几乎不存在线性相关关系.通常|r |大于0.75时,认为两个变量有很强的线性相关性. 2.独立性检验(1)分类变量:变量的不同“值”表示个体所属的不同类别,像这样的变量称为分类变量. (2)列联表:列出的两个分类变量的频数表,称为列联表.假设有两个分类变量X 和Y ,它们的可能取值分别为{x1,x2}和{y1,y2},其样本频数列联表(称为2×2列联表)为2×2列联表构造一个随机变量K2=n(ad-bc)2(a+b)(c+d)(a+c)(b+d),其中n=a+b+c+d为样本容量.(3)独立性检验利用随机变量K2来判断“两个分类变量有关系”的方法称为独立性检验.概念方法微思考1.变量的相关关系与变量的函数关系有什么区别?提示 相同点:两者均是指两个变量的关系.不同点:①函数关系是一种确定的关系,相关关系是一种非确定的关系. ②函数关系是一种因果关系,而相关关系不一定是因果关系,也可能是伴随关系. 2.线性回归方程是否都有实际意义?根据回归方程进行预报是否一定准确?提示 (1)不一定都有实际意义.回归分析是对具有相关关系的两个变量进行统计分析的方法,只有在散点图大致呈线性时,求出的线性回归方程才有实际意义,否则,求出的线性回归方程毫无意义.(2)根据回归方程进行预报,仅是一个预报值,而不是真实发生的值.题组一 思考辨析1.判断下列结论是否正确(请在括号中打“√”或“×”)(1)散点图是判断两个变量是否相关的一种重要方法和手段.( √ )(2)线性回归方程y ^=b ^x +a ^至少经过点(x 1,y 1),(x 2,y 2),…,(x n ,y n )中的一个点.( × ) (3)若事件X ,Y 关系越密切,则由观测数据计算得到的K 2的观测值越小.( × ) (4)两个变量的相关系数的绝对值越接近于1,它们的相关性越强.( √ ) 题组二 教材改编2.为调查中学生近视情况,测得某校150名男生中有80名近视,在140名女生中有70名近视.在检验这些学生眼睛近视是否与性别有关时,用下列哪种方法最有说服力( ) A .回归分析 B .均值与方差 C .独立性检验 D .概率答案 C解析 “近视”与“性别”是两类变量,其是否有关,应用独立性检验判断. 3.下面是2×2列联表:则表中a ,b 的值分别为( ) A .94,72 B .52,50 C .52,74 D .74,52答案 C解析 ∵a +21=73,∴a =52. 又a +22=b ,∴b =74.4.某车间为了规定工时定额,需要确定加工零件所花费的时间,为此进行了5次试验.根据收集到的数据(如下表),由最小二乘法求得回归方程y ^=0.67x +54.9.现发现表中有一个数据看不清,请你推断出该数据的值为________. 答案 68解析 由x =30,得y =0.67×30+54.9=75. 设表中的“模糊数字”为a ,则62+a +75+81+89=75×5,∴a =68. 题组三 易错自纠5.某医疗机构通过抽样调查(样本容量n =1 000),利用2×2列联表和K 2统计量研究患肺病是否与吸烟有关.计算得K 2=4.453,经查阅临界值表知P (K 2≥3.841)≈0.05,现给出四个结论,其中正确的是( )A .在100个吸烟的人中约有95个人患肺病B .若某人吸烟,那么他有95%的可能性患肺病C .有95%的把握认为“患肺病与吸烟有关”D .只有5%的把握认为“患肺病与吸烟有关” 答案 C解析 由已知数据可得,有1-0.05=95%的把握认为“患肺病与吸烟有关”.6.设某大学的女生体重y (单位:kg)与身高x (单位:cm)具有线性相关关系,根据一组样本数据(x i ,y i )(i =1,2,…,n ),用最小二乘法建立的回归方程为y ^=0.85x -85.71,则下列结论中不正确的是________.(填序号). ①y 与x 具有正的线性相关关系; ②回归直线过样本点的中心(x ,y );③若该大学某女生身高增加1 cm ,则其体重约增加0.85 kg ; ④若该大学某女生身高为170 cm ,则可断定其体重必为58.79 kg. 答案 ④解析 ①正确;②正确;③正确.对于④,当x =170 cm 时,y ^=0.85×170-85.71=58.79,但这是预测值,不可断定其体重为58.79 kg.故不正确.相关关系的判断1.在一次对人体脂肪含量和年龄关系的研究中,研究人员获得了一组样本数据,并制作成如图所示的人体脂肪含量与年龄关系的散点图.根据该图,下列结论中正确的是()A.人体脂肪含量与年龄正相关,且脂肪含量的中位数等于20%B.人体脂肪含量与年龄正相关,且脂肪含量的中位数小于20%C.人体脂肪含量与年龄负相关,且脂肪含量的中位数等于20%D.人体脂肪含量与年龄负相关,且脂肪含量的中位数小于20%答案 B解析观察图形,可知人体脂肪含量与年龄正相关,且脂肪含量的中位数小于20%,故选B. 2.(2020·云南昆明诊断)某商家今年上半年各月的人均销售额(单位:千元)与利润率统计表如下:根据表中数据,下列说法正确的是()A.利润率与人均销售额成正相关关系B.利润率与人均销售额成负相关关系C.利润率与人均销售额成正比例函数关系D.利润率与人均销售额成反比例函数关系答案 A解析由统计表可得利润率与人均销售额不是正比例关系,也不是反比例关系,排除C和D;其属于正相关关系,A正确,B错误.思维升华判定两个变量正、负相关性的方法(1)画散点图:点的分布从左下角到右上角,两个变量正相关;点的分布从左上角到右下角,两个变量负相关.(2)相关系数:当r >0时,两个变量正相关;当r <0时,两个变量负相关. (3)线性回归方程:当b ^>0时,两个变量正相关;当b ^<0时,两个变量负相关.回归分析命题点1 线性回归分析例1 (2020·广西南宁模拟)某地区某农产品近几年的产量统计如下表:(1)根据表中数据,建立y 关于t 的线性回归方程y ^=b ^t +a ^; (2)根据线性回归方程预测2020年该地区该农产品的年产量.附:对于一组数据(t 1,y 1),(t 2,y 2),…,(t n ,y n ),其回归直线y ^=b ^t +a ^的斜率和截距的最小二乘估计分别为b ^=∑i =1n(t i -t )(y i -y )∑i =1n(t i -t )2,a ^=y -b ^t .(参考数据:∑i =16(t i -t )(y i -y )=2.80,计算结果保留小数点后两位)解 (1)由题意可知,t =1+2+3+4+5+66=3.5,y =6.6+6.7+7+7.1+7.2+7.46=7,∑i =16(t i -t )2=(-2.5)2+(-1.5)2+(-0.5)2+0.52+1.52+2.52=17.50,∴b ^=∑i =16(t i -t )(y i -y )∑i =16(t i -t )2=2.8017.50=0.16, 又a ^=y -b ^t =7-0.16×3.5=6.44, ∴y 关于t 的线性回归方程为y ^=0.16t +6.44.(2)由(1)可得,当年份为2020年时,年份代码t =9,此时y ^=0.16×9+6.44=7.88, ∴可预测2020年该地区该农产品的年产量约为7.88万吨. 命题点2 非线性回归例2 某公司为确定下一年度投入某种产品的宣传费,需了解年宣传费x (单位:千元)对年销售量y (单位:t)和年利润z (单位:千元)的影响,对近8年的年宣传费x i 和年销售量y i (i =1,2,…,8)数据作了初步处理,得到下面的散点图及一些统计量的值.表中w i =x i ,w =18∑i =18w i .(1)根据散点图判断y =a +bx 与y =c +d x 哪一个适宜作为年销售量y 关于年宣传费x 的回归方程类型?(给出判断即可,不必说明理由)(2)根据(1)的判断结果及表中数据,建立y 关于x 的回归方程;(3)已知这种产品的年利润z 与x ,y 的关系为z =0.2y -x .根据(2)的结果回答下列问题: ①年宣传费x =49时,年销售量及年利润的预报值是多少? ②年宣传费x 为何值时,年利润的预报值最大?附:对于一组数据(u 1,v 1),(u 2,v 2),…,(u n ,v n ),其回归直线v ^=α^+β^u 的斜率和截距的最小二乘估计分别为β^=∑i =1n(u i -u )(v i -v )∑i =1n(u i -u )2,α^=v -β^u .解 (1)由散点图可以判断,y =c +d x 适宜作为年销售量y 关于年宣传费x 的回归方程类型. (2)令w =x ,先建立y 关于w 的线性回归方程,由于d ^=∑i =18(w i -w )·(y i -y )∑i =18 (w i -w )2=108.81.6=68, c ^=y -d ^w =563-68×6.8=100.6,所以y 关于w 的线性回归方程为y ^=100.6+68w , 因此y 关于x 的回归方程为y ^=100.6+68x . (3)①由(2)知,当x =49时,年销售量y 的预报值y ^=100.6+6849=576.6, 年利润z 的预报值z ^=576.6×0.2-49=66.32. ②根据(2)的结果知,年利润z 的预报值 z ^=0.2(100.6+68x )-x =-x +13.6x +20.12.所以当x =13.62=6.8,即x =46.24时,z ^ 取得最大值.故年宣传费为46.24千元时,年利润的预报值最大. 思维升华 回归分析问题的类型及解题方法 (1)求回归方程①根据散点图判断两变量是否线性相关,如不是,应通过换元构造线性相关. ②利用公式,求出回归系数b ^.③待定系数法:利用回归直线过样本点的中心求系数a ^.(2)利用回归方程进行预测,把线性回归方程看作一次函数,求函数值. (3)利用回归直线判断正、负相关,决定正相关还是负相关的是系数b ^.(4)回归方程的拟合效果,可以利用相关系数判断,当|r |越趋近于1时,两变量的线性相关性越强.跟踪训练1 (2018·全国Ⅱ)下图是某地区2000年至2016年环境基础设施投资额y (单位:亿元)的折线图.为了预测该地区2018年的环境基础设施投资额,建立了y 与时间变量t 的两个线性回归模型.根据2000年至2016年的数据(时间变量t 的值依次为1,2,…,17)建立模型①:y ^=-30.4+13.5t ;根据2010年至2016年的数据(时间变量t 的值依次为1,2,…,7)建立模型②:y ^=99+17.5t .(1)分别利用这两个模型,求该地区2018年的环境基础设施投资额的预测值; (2)你认为用哪个模型得到的预测值更可靠?并说明理由.解 (1)利用模型①,可得该地区2018年的环境基础设施投资额的预测值为y ^=-30.4+13.5×19=226.1(亿元).利用模型②,可得该地区2018年的环境基础设施投资额的预测值为y ^=99+17.5×9=256.5(亿元).(2)利用模型②得到的预测值更可靠. 理由如下:(ⅰ)从折线图可以看出,2000年至2016年的数据对应的点没有随机散布在直线y =-30.4+13.5t 上下,这说明利用2000年至2016年的数据建立的线性模型①不能很好地描述环境基础设施投资额的变化趋势.2010年相对2009年的环境基础设施投资额有明显增加,2010年至2016年的数据对应的点位于一条直线的附近,这说明从2010年开始环境基础设施投资额的变化规律呈线性增长趋势,利用2010年至2016年的数据建立的线性模型y ^=99+17.5t 可以较好地描述2010年以后的环境基础设施投资额的变化趋势,因此利用模型②得到的预测值更可靠.(ⅱ)从计算结果看,相对于2016年的环境基础设施投资额220亿元,由模型①得到的预测值226.1亿元的增幅明显偏低,而利用模型②得到的预测值的增幅比较合理,说明利用模型②得到的预测值更可靠.独立性检验例3 (2019·全国Ⅰ)某商场为提高服务质量,随机调查了50名男顾客和50名女顾客,每位顾客对该商场的服务给出满意或不满意的评价,得到下面列联表:(1)分别估计男、女顾客对该商场服务满意的概率;(2)能否有95%的把握认为男、女顾客对该商场服务的评价有差异? 附:K 2=n (ad -bc )2(a +b )(c +d )(a +c )(b +d ).解 (1)由调查数据,男顾客中对该商场服务满意的频率为4050=0.8,因此男顾客对该商场服务满意的概率的估计值为0.8. 女顾客中对该商场服务满意的频率为3050=0.6,因此女顾客对该商场服务满意的概率的估计值为0.6. (2)K 2的观测值k =100×(40×20-30×10)250×50×70×30≈4.762.由于4.762>3.841,故有95%的把握认为男、女顾客对该商场服务的评价有差异. 思维升华 独立性检验的一般步骤 (1)根据样本数据制成2×2列联表. (2)根据公式K 2=n (ad -bc )2(a +b )(a +c )(b +d )(c +d )计算K 2的观测值k .(3)比较k 与临界值的大小关系,作统计推断.跟踪训练2 (2017·全国Ⅱ)海水养殖场进行某水产品的新、旧网箱养殖方法的产量对比,收获时各随机抽取了100个网箱,测量各箱水产品的产量(单位:kg),其频率分布直方图如下:(1)记A 表示事件“旧养殖法的箱产量低于50 kg ”,估计A 的概率;(2)填写下面列联表,并根据列联表判断是否有99%的把握认为箱产量与养殖方法有关:(3)根据箱产量的频率分布直方图,对两种养殖方法的优劣进行比较. 附:K 2=n (ad -bc )2(a +b )(c +d )(a +c )(b +d ).解 (1)旧养殖法的箱产量低于50 kg 的频率为 (0.012+0.014+0.024+0.034+0.040)×5=0.62. 因此,事件A 的概率估计值为0.62.(2)根据箱产量的频率分布直方图得列联表如下:K 2的观测值k =200×(62×66-34×38)2100×100×96×104≈15.705.由于15.705>6.635,故有99%的把握认为箱产量与养殖方法有关.(3)箱产量的频率分布直方图表明:新养殖法的箱产量平均值(或中位数)在50 kg到55 kg之间,旧养殖法的箱产量平均值(或中位数)在45 kg到50 kg之间,且新养殖法的箱产量分布集中程度较旧养殖法的箱产量分布集中程度高,因此,可以认为新养殖法的箱产量较高且稳定,从而新养殖法优于旧养殖法.数据分析是指针对研究对象获得相关数据,运用统计方法对数据中的有用信息进行分析和推断,形成知识的过程.主要包括:收集数据、整理数据、提取信息、构建模型对信息进行分析、推断、获得结论.例(2019·全国Ⅲ)为了解甲、乙两种离子在小鼠体内的残留程度,进行如下试验:将200只小鼠随机分成A,B两组,每组100只,其中A组小鼠给服甲离子溶液,B组小鼠给服乙离子溶液.每只小鼠给服的溶液体积相同、摩尔浓度相同.经过一段时间后用某种科学方法测算出残留在小鼠体内离子的百分比.根据试验数据分别得到如下直方图:记C为事件“乙离子残留在体内的百分比不低于5.5”,根据直方图得到P(C)的估计值为0.70.(1)求乙离子残留百分比直方图中a ,b 的值;(2)分别估计甲、乙离子残留百分比的平均值(同一组中的数据用该组区间的中点值为代表). 解 (1)由已知得0.70=a +0.20+0.15, 故a =0.35.b =1-0.05-0.15-0.70=0.10.(2)甲离子残留百分比的平均值的估计值为2×0.15+3×0.20+4×0.30+5×0.20+6×0.10+7×0.05=4.05. 乙离子残留百分比的平均值的估计值为3×0.05+4×0.10+5×0.15+6×0.35+7×0.20+8×0.15=6.00.素养提升 考题从所给直方图中的数据来进行求甲、乙离子残留百分化的平均值的过程体现的就是数据分析素养.1.已知变量x 和y 满足关系y ^=-0.1x +1,变量y 与z 正相关.下列结论中正确的是( )A .x 与y 正相关,x 与z 负相关B .x 与y 正相关,x 与z 正相关C .x 与y 负相关,x 与z 负相关D .x 与y 负相关,x 与z 正相关 答案 C解析 因为y ^=-0.1x +1,-0.1<0,所以x 与y 负相关.又y 与z 正相关,故可设z ^=b ^y +a ^(b ^>0),所以z ^=-0.1b ^x +b ^+a ^,-0.1b ^<0,所以x 与z 负相关.故选C. 2.(2020·四川成都外国语学校诊断)根据如表所示的样本数据:得到了回归方程y ^=b ^x +a ^,则( ) A.a ^>0,b ^>0 B.a ^<0,b ^>0 C.a ^>0,b ^<0 D.a ^<0,b ^<0答案 C解析 由表中的数据可知,随着x 的增大,y 逐渐减小,则b ^<0; 因为当x =0时,y ^=a ^,由表中数据可推出a ^>0.3.(2020·蓉城名校联盟联考)某校高三数学月活动记录了4名学生改进数学学习方法后,每天增加学习时间x (分钟)与月考成绩增加分数y (分)的几组对应数据:根据表中提供的数据,若求出y 关于x 的线性回归方程为y ^=0.8x +0.35,则表中m 的值为( ) A .4 B .4.15 C .4.8 D .4.35 答案 C解析 根据线性回归方程过样本点的中心⎝⎛⎭⎫3+4+5+64,2+4+m +54,即⎝⎛⎭⎫92,11+m 4, 可得11+m 4=0.8×92+0.35⇒11+m =15.8⇒m =4.8.4.以下五个命题:①在匀速传递的产品生产流水线上,质检员每20分钟从中抽取一件产品进行某项指标检测,这样的抽样是分层抽样;②两个随机变量相关性越强,则相关系数的绝对值越接近于1;③回归直线y ^=b ^x +a ^必过点(x ,y );④在线性回归方程y ^=0.2x +12中,当解释变量x 每增加1个单位时,预报变量平均增加0.2个单位;⑤分类变量X 与Y ,对它们的随机变量K 2的观测值k 来说,k 越小,“X 与Y 有关系”的把握程度越大. 其中假命题为( )A .①④B .①⑤C .②③D .③④ 答案 B解析 ①为系统抽样;⑤分类变量X 与Y ,对它们的随机变量K 2的观测值k 来说,k 越大,“X 与Y 有关系”的把握程度越大.5.下表是我国某城市在2017年1月份至10月份期间各月最低温度与最高温度(单位:℃)的数据一览表.已知该城市的各月最低温与最高温具有相关关系,根据该一览表,则下列结论错误的是( ) A .最低温度与最高温度为正相关B .每月最高温度与最低温度的平均值在前8个月逐月增加C .月温差(最高温度减最低温度)的最大值出现在1月D .1月至4月的月温差(最高温度减最低温度)相对于7月至10月,波动性更大 答案 B解析 将最高温度、最低温度、温差列表如下:由表格可知,最低温度大致随最高温度的升高而升高,A 正确; 每月最高温度与最低温度的平均值在前8个月不是逐月增加,B 错误; 月温差的最大值出现在1月,C 正确;1月至4月的月温差相对于7月至10月,波动性更大,D 正确.6.2018世界特色魅力城市200强新鲜出炉,包括黄山市在内的28个中国城市入选,美丽的黄山风景和人文景观迎来众多宾客.现在很多人喜欢“自助游”,某调查机构为了了解“自助游”是否与性别有关,在黄山旅游节期间,随机抽取了100人,得如下所示的列联表:参考公式:K 2=n (ad -bc )2(a +b )(c +d )(a +c )(b +d ),其中n =a +b +c +d .参照公式,得到的正确结论是( )A .有99.5%以上的把握认为“赞成‘自助游’与性别无关”B .有99.5%以上的把握认为“赞成‘自助游’与性别有关”C .在犯错误的概率不超过0.1的前提下,认为“赞成‘自助游’与性别无关”D .在犯错误的概率不超过0.1的前提下,认为“赞成‘自助游’与性别有关” 答案 D解析 将2×2列联表中的数据代入计算,得K 2=100×(30×10-45×15)245×55×75×25≈3.030,∵2.706<3.030<3.841,∴在犯错误的概率不超过0.1的前提下,可以认为“赞成‘自助游’与性别有关”.7.根据下表中的数据可以得到线性回归方程y ^=0.7x +0.35,则实数m ,n 应满足( )A.n -0.7m =1.7 B .n -0.7m =1.5 C .n +0.7m =1.7 D .n +0.7m =1.5 答案 A解析 x =14(3+m +5+6)=14(14+m ),y =14(2.5+3+4+n )=14(9.5+n ),故14(9.5+n )=0.7×14(14+m )+0.35, 解得n -0.7m =1.7.8.某市居民2015~2019年家庭年平均收入x (单位:万元)与年平均支出y (单位:万元)的统计资料如下表所示:根据统计资料,居民家庭年平均收入的中位数是______,家庭年平均收入与年平均支出有________相关关系.(填“正”或“负”) 答案 13 正解析 中位数是13.由相关性知识,根据统计资料可以看出,当年平均收入增多时,年平均支出也增多,因此两者之间具有正相关关系.9.为了判断高中三年级学生选修文科是否与性别有关,现随机抽取50名学生,得到如图所示2×2列联表:已知P (K 2≥3.841)≈0.05,P (K 2≥5.024)≈0.025.根据表中数据,得到K 2的观测值k =50×(13×20-10×7)223×27×20×30≈4.844,则有________的把握认为选修文科与性别有关.答案 95% 解析由题意,K 2=50×(13×20-10×7)223×27×20×30≈4.844,因为4.844>3.841,所以有95%的把握认为选修文科与性别有关.10.某公司为确定明年投入某产品的广告支出,对近5年的年广告支出m 与年销售额t (单位:百万元)进行了初步统计,得到下列表格中的数据:经测算,年广告支出m 与年销售额t 满足线性回归方程t ^=6.5m +17.5,则p =________. 答案 60解析 由于回归直线过样本点的中心,m =5,t =190+p5,代入t ^=6.5m +17.5,解得p =60.11.(2020·西南大学附中月考)下表是某地一家超市在2017年一月份某一周内周2到周6的时间x 与每天获得的利润y (单位:万元)的有关数据.(1)根据上表提供的数据,用最小二乘法求线性回归方程y ^=b ^x +a ^; (2)估计星期日获得的利润为多少万元. 参考公式:线性回归方程是:y ^=b ^x +a ^,⎩⎪⎨⎪⎧b ^=∑i =1n(x i-x )(y i-y )∑i =1n(x i-x )2=∑i =1nx i y i-n x y ∑i =1nx 2i-n x 2,a ^=y -b ^x .解 (1)由题意可得x =2+3+4+5+65=4,y =2+3+5+6+95=5,因此b ^=2×2+3×3+4×5+5×6+6×9-5×4×54+9+16+25+36-5×16=1.7,所以a ^=y -b ^x =5-6.8=-1.8,所以y ^=1.7x -1.8. (2)由(1)可得,当x =7时,y ^=1.7×7-1.8=10.1(万元), 即估计星期日获得的利润为10.1万元.12.某淘宝店经过对春节七天假期的消费者的消费金额进行统计,发现在消费金额不超过1 000元的消费者中男女比例为1∶4,该店按此比例抽取了100名消费者进行进一步分析,得到下表: 女性消费情况:男性消费情况:若消费金额不低于600元的网购者为“网购达人”,低于600元的网购者为“非网购达人”. (1)分别计算女性和男性消费的平均数,并判断平均消费水平高的一方“网购达人”出手是否更阔绰?(2)根据列表中统计数据填写如下2×2列联表,并判断能否在犯错误的概率不超过0.005的前提下认为“是否为‘网购达人’与性别有关”.附:K 2=n (ad -bc )2(a +b )(c +d )(a +c )(b +d ),其中n =a +b +c +d .解 (1)女性消费者消费的平均数为180×(100×5+300×10+500×15+700×47+900×3)=582.5.男性消费者消费的平均数为120×(100×2+300×3+500×10+700×3+900×2)=500. “女网购达人”消费的平均数为150×(700×47+900×3)=712.“男网购达人”消费的平均数为15×(700×3+900×2)=780.虽然女性消费者平均消费水平较高,但“女网购达人”平均消费水平低于“男网购达人”平均消费水平,所以“平均消费水平”高的一方“网购达人”出手不一定更阔绰. (2)2×2列联表如下所示:K 2的观测值k =100×(50×15-30×5)280×20×55×45≈9.091,因为9.091>7.879,所以能在犯错误的概率不超过0.005的前提下认为“是否为‘网购达人’与性别有关”.13.某汽车的使用年数x 与所支出的维修总费用y 的统计数据如表:根据上表可得y 关于x 的线性回归方程y ^=b ^x -0.69,若该汽车维修总费用超过10万元就不再维修,直接报废,据此模型预测该汽车最多可使用(不足1年按1年计算)( ) A .8年 B .9年 C .10年 D .11年 答案 D解析 由回归直线y ^=b ^x -0.69过样本点的中心(3,2.34),得b ^=1.01, 即线性回归方程为y ^=1.01x -0.69, 由y ^=1.01x -0.69=10得x ≈10.6, 所以预测该汽车最多可使用11年,故选D.14.某工厂为了对一种新研究的产品进行合理定价,将该产品按事先拟定的价格进行试销,得到如下数据:由表中数据,求得线性回归方程为y ^=-4x +a ^.若在这些样本点中任取一点,则它在回归直线左下方的概率为________. 答案 13解析 由表中数据得x =6.5,y =80,由y =-4x +a ^,得a ^=106,故线性回归方程为y ^=-4x +106.将(4,90),(5,84),(6,83),(7,80),(8,75),(9,68)分别代入回归方程,可知有6个基本事件,因84<-4×5+106=86,68<-4×9+106=70,故(5,84)和(9,68)在回归直线的左下方,满足条件的只有2个,故所求概率为26=13.15.在一组样本数据(x 1,y 1),(x 2,y 2),…,(x 6,y 6)的散点图中,若所有样本点(x i ,y i )(i =1,2,…,6)都在曲线y =bx 2-12附近波动.经计算∑6i =1x i =12,∑6i =1y i =14,∑6i =1x 2i =23,则实数b 的值为______. 答案1723解析 令t =x 2,则曲线的回归方程变为线性的回归方程,即y =bt -12,此时t =∑6i =1x 2i 6=236,y =∑6i =1y i 6=146,代入y =bt -12,得146=b ×236-12,解得b =1723.16.某电视厂家准备在元旦举行促销活动,现根据近七年的广告费与销售量的数据确定此次广告费支出.广告费支出x (万元)和销售量y (万台)的数据如下:(1)若用线性回归模型拟合y 与x 的关系,求出y 关于x 的线性回归方程;(2)若用y =c +d x 模型拟合y 与x 的关系,可得回归方程y ^=1.63+0.99x ,经计算线性回归模型和该模型的R 2分别为0.75和0.88,请用R 2说明选择哪个回归模型更好; (3)已知利润z 与x ,y 的关系为z =200y -x .根据(2)的结果回答下列问题: ①广告费x =20时,销售量及利润的预报值是多少? ②广告费x 为何值时,利润的预报值最大?(精确到0.01)参考公式:回归直线y ^=a ^+b ^x 的斜率和截距的最小二乘估计值分别为b ^=∑i =1nx i y i -n x y∑i =1nx 2i -n x2=∑i =1n(x i -x )(y i -y )∑i =1n(x i -x )2,a ^=y -b ^x .参考数据:5≈2.24.解 (1)∵x =8,y =4.2,∑i =17x i y i =279.4,∑i =17x 2i =708,∴b ^=∑i =17x i y i -7x y∑i =17x 2i -7x2=279.4-7×8×4.2708-7×82=0.17,a ^=y -b ^x =4.2-0.17×8=2.84, ∴y 关于x 的线性回归方程为y ^=0.17x +2.84.(2)∵0.75<0.88且R 2越大,反映残差平方和越小,模型的拟合效果越好, ∴选用y ^=1.63+0.99x 更好. (3)由(2)知,①当x =20时,销售量的预报值y ^=1.63+0.9920≈6.07(万台), 利润的预报值z =200×(1.63+0.9920)-20≈1 193.04(万元). ②z =200(1.63+0.99x )-x =-x +198x +326 =-(x )2+198x +326=-(x -99)2+10 127, ∴当x =99,即x =9 801时,利润的预报值最大, 故广告费为9 801万元时,利润的预报值最大.。

变量之间的相互关系

变量之间的相互关系

变量之间的相互关系一、引言在研究数据科学、统计学、经济学以及其他众多领域时,变量间的相互关系是不可或缺的议题。

这种关系描述了不同变量如何互相影响,从而帮助我们理解和预测现象。

本文将深入探讨变量间相互关系的概念、类型和测量方法。

二、变量间的关系类型1.因果关系:如果一个变量(原因)的变化导致了另一个变量(结果)的变化,则存在因果关系。

这种关系是有方向的,原因必定在前,结果只能在后。

2.相关关系:当两个或多个变量同时发生变化,但不表示因果方向时,我们称之为相关关系。

相关关系可以是正相关(一个变量增加时,另一个也增加)或负相关(一个变量增加时,另一个减少)。

3.函数关系:当一个变量(自变量)完全确定另一个变量(因变量)的值时,我们称之为函数关系。

这种情况下,因变量的变化完全依赖于自变量的变化。

三、测量变量间关系强度的方法1.皮尔逊相关系数:衡量两个连续变量的线性相关程度,取值范围在-1到1之间。

接近1表示强正相关,接近-1表示强负相关,接近0表示无相关。

2.斯皮尔曼秩相关系数:与皮尔逊相关系数类似,但适用于非参数数据。

它衡量的是两个连续变量之间的秩次相关性。

3.偏相关系数:当存在多个变量影响因变量时,偏相关系数可以用来衡量特定自变量与因变量之间的线性关系。

四、应用场景理解并测量变量间的相互关系在众多实际场景中都有应用价值。

例如,在市场营销中,通过分析消费者行为、购买历史等变量与购买决策之间的相互关系,可以更有效地制定营销策略。

在医学研究中,了解疾病症状、患者生理指标等变量之间的关系,有助于疾病的诊断和治疗。

五、结论理解并测量变量间的相互关系是数据科学和统计学中的重要概念。

通过明确关系的类型和测量方法,我们可以更好地理解和预测现象,从而在各个领域中做出更有效的决策。

随着技术的发展和数据的丰富,变量间相互关系的研究将继续深化和拓展,为我们提供更多的洞见和可能。

高考数学——变量间的相关关系-考点复习

高考数学——变量间的相关关系-考点复习
i =1
10
(wi − w)( yi − y)
i =1
i =1
i =1
1.47 20.6 0.78
2.35
0.81
−19.3
16.2
∑ 表中= wi
x1= i2 , w
1 10
10
wi
i =1
.
(1)根据散点图判断, y=
a + bx 与 y=
c + d 哪一个更适宜作烧水时间 y 关于开关旋钮旋转的弧度数 x2
3.已知线性回归方程
,当变量 每增加一个单位时,则 的变化情况正确的是
A. 平均增加约 1.2 个单位
B. 平均增加约 3 个单位
C. 平均减少约 1.2 个单位
D. 平均减少约 3 个单位
4.炼钢是一个氧化降碳的过程,由于钢水含碳量的多少直接影响冶炼时间的长短,因此必须掌握钢水含碳
量和冶炼时间的关系.现已测得炉料熔化完毕时钢水的含碳量 与冶炼时间 (从炉料熔化完毕到出钢的时
=i 1=i 1 =i 1
∑ ∑
10
xi2
−10x
= i 1= i 1
考向三 非线性回归方程及应用
求非线性回归方程的步骤: 1.确定变量,作出散点图. 2.根据散点图,选择恰当的拟合函数. 3.变量置换,通过变量置换把非线性回归问题转化为线性回归问题,并求出线性回归方程. 4.分析拟合效果:通过计算相关指数或画残差图来判断拟合效果. 5.根据相应的变换,写出非线性回归方程. 学@#
(2)当两变量具有线性相关关系时,求回归系数 aˆ、bˆ ,写出回归直线方程.
(3)根据方程进行估计.
典例 2 某车间加工的零件数 x 与加工时间 y 的统计数据如下表:

【走向高考】高三数学一轮总复习 10-3变量间的相关关系课件 北师大版

【走向高考】高三数学一轮总复习 10-3变量间的相关关系课件 北师大版

(2)回归直线方程 回归直线方程 y=a+bx 中
i=1
xi- x yi- y xi- x 2
nnBiblioteka b=i=1i=1
xiyi-n x y
2 - n x x2 i n
n

i=1
a= y -b x x1+x2+…+xn y1+y2+…yn 其中 x = ,y= n n
走向高考· 数学
北师大版 ·高考一轮总复习
路漫漫其修远兮 吾将上下而求索
第十章
统计、统计案例
第十章
第三节 变量间的相关关系
高考目标
3
课堂典例讲练
课前自主预习
4
思想方法点拨
5
课后强化作业
高考目标
考纲解读 1.会作两个有关联变量的数据的散点图,会利用散点图 认识变量间的相关关系. 2.了解最小二乘法的思想,能根据给出的线性回归方程 系数公式建立线性回归方程.
3.(2012· 南昌模拟)某商品销售量 y(件)与销售价格 x(元/ 件)负相关,则其回归方程可能是( ^ A.y=-10x+200 ^ C.y=-10x-200 )
^ B.y=10x+200 ^ D.y=10x-200
[答案]
A
[解析]
因为销量与价格负相关,由函数关系考虑为减函
数,又因为 x,y 不能为负数,再排除 C,故选 A.
[答案] C
[解析]
回归直线必过点(4,5),故其方程为 y-5=1.23(x
-4),即 y=1.23x+0.08,故选 C.
5. (2011· 辽宁理, 14)调查了某地若干户家庭的年收入 x(单 位:万元)和年饮食支出 y(单位:万元),调查显示年收入 x 与 年饮食支出 y 具有线性相关关系, 并由调查数据得到 y 对 x 的 ^ 回归直线方程:y=0.254x+0.321.由回归直线方程可知,家庭 年收入每增加 1 万元,年饮食支出平均增加________万元.

变量之间的关系知识点

变量之间的关系知识点

变量之间的关系知识点
以下是 6 条关于变量之间关系知识点:
1. 相关关系可是很重要的哦!就像你和你的好朋友,有时候你成绩好,他成绩也不错,这就是一种正相关呀!比如说温度升高时,冰淇淋的销量往往也会增加,这不是很神奇吗?
2. 因果关系得搞清楚呀!不是所有相关的都是因果哦,就好比你今天穿了红色衣服,然后下雨了,这可不能说你穿红色导致了下雨呀!举个例子,努力学习可能会导致成绩提高,这就是真正的因果关系嘞!
3. 变量之间还可能有复杂关系呢!哎呀,就像人际关系一样,有时候很难一下子明白。

比如汽车的速度、重量和油耗之间的关系,可不是那么简单直接就能搞懂的哟!
4. 线性关系不陌生吧?这就好像走在一条直直的路上一样。

像是身高和体重,在一定范围内可能就有比较明显的线性关系呢。

5. 非线性关系也很有意思呀!不是所有事情都那么规规矩矩的,有时候会出人意料呢。

比如说股票价格的波动和各种因素的关系,那可复杂啦!
6. 多种变量相互影响可常见啦!就像一场精彩的戏剧,每个人物都相互作用。

比如一个城市的经济、人口、环境等变量,它们之间相互交织,影响着城市的发展呢,你说神奇不神奇?
我的观点结论是:掌握变量之间的关系对理解很多事情都非常重要,能让我们更好地分析和解决问题呢!。

高二数学《变量间的相关关系》知识点

高二数学《变量间的相关关系》知识点

高二数学《变量间的相关关系》知识点
数学是研究数量、结构、变化、空间以及信息等概念的一门学科,下面是小编整理的高二数学《变量间的相关关系》知识点,希望对大家有帮助!
一、变量间的相关关系
1.常见的两变量之间的关系有两类:一类是函数关系,另一类是相关关系;与函数关系不同,相关关系是一种非确定*关系.
2.从散点图上看,点分布在从左下角到右上角的区域内,两个变量的这种相关关系称为正相关,点分布在左上角到右下角的区域内,两个变量的相关关系为负相关.
二、两个变量的线*相关
1.从散点图上看,如果这些点从整体上看大致分布在通过散点图中心的一条直线附近,称两个变量之间具有线*相关关系,这条直线叫回归直线.
当r>0时,表明两个变量正相关;
当r<0时,表明两个变量负相关.
r的绝对值越接近于1,表明两个变量的线*相关*越强.r的绝对值越接近于0时,表明两个变量之间几乎不存在线*相关关系.通常|r|大于
0.75时,认为两个变量有很强的线*相关*.
三、解题方法
1.相关关系的判断方法一是利用散点图直观判断,二是利用相关系数作出判断.
2.对于由散点图作出相关*判断时,若散点图呈带状且区域较窄,说明两个变量有一定的线*相关*,若呈曲线型也是有相关*.
3.由相关系数r判断时|r|越趋近于1相关*越强.。

2025年高考数学一轮复习-10.3-变量的相关性与一元线性回归模型【课件】

2025年高考数学一轮复习-10.3-变量的相关性与一元线性回归模型【课件】
三种题型都会出现.
预测
预计2025年高考仍会在相关系数、经验回归方程方面出题.
必备知识·逐点夯实
知识梳理·归纳
1.变量的相关关系
有关系
(1)相关关系:两个变量____________,但又没有确切到可由其中的一个去精确地
决定另一个的程度,这种关系称为相关关系.
正相关
负相关
(2)相关关系的分类:____________和___________.
(4)样本相关系数的绝对值越接近 1,成对样本数据的线性相关程度越强.(
提示: (4)由相关系数的大小与样本相关关系可知(4)正确.

)
2.(选修第三册P101例1改编)对于x,y两个变量,有四组成对样本数据,分别算出它
们的样本相关系数r如下,则线性相关性最强的是(
A.-0.82
B.0.78
C.-0.69

57
万元.
2+3+5+6
【解析】由题中表格,得=
=
28+31+41+48
4
4
第十章
第三节
统计与成对数据的统计分析
变量的相关性与一元线性回归模型
必备知识·逐点夯实
核心考点·分类突破
【课标解读】
【课程标准】
1.结合实例,了解样本相关系数的统计含义,了解样本相关系数与标准化数据向量
夹角的关系.
2.结合实例,会通过相关系数比较多组成对数据的相关性.
3.结合具体实例,了解一元线和体重呈正相关.
)
4.(误认为经验回归直线过样本点)某互联网公司借助某平台推广自己的产品,对今
年前 5 个月的月平台推广费用 x(单位:百万元)与月利润额 y(单位:百万元)进行了初

【数学课件】高考数学(文)全程复习变量间的相关关系

【数学课件】高考数学(文)全程复习变量间的相关关系

解析:本题考查相关关系的正相关和负相关.夹在带状区域 内的点,总体上呈上升趋势的属于正相关,总体呈下降趋势的属 于负相关.由这两个散点图可以判断,变量 x 与 y 负相关,u 与 v 正相关,选 C.
答案:C
题型二 求回归直线方程 例 2 某产品的广告支出 x(单位:万元)与销售收入 y(单位: 万元)之间有下表所对应的数据:
变式探究 1 对变量 x,y 有观测数据(xi,yi)(i=1,2,…,10), 得散点图(1);对变量 u,v 有观测数据(ui,vi)(i=1,2,…,10), 得散点图(2).由这两个散点图可以判断( )
A.变量 x 与 y 正相关,u 与 v 正相关 B.变量 x 与 y 正相关,u 与 v 负相关 C.变量 x 与 y 负相关,u 与 v 正相关 D.变量 x 与 y 负相关,u 与 v 负相关
2.对回归分析的理解 回归分析是处理变量相关关系的一种数学方法,它主要解决 三个问题: (1)确定两个变量之间是否有相关关系,如果有就找出它们之 间贴近的数学表达式; (2)根据一组观察值,预测变量的取值及判断变量取值的变化 趋势; (3)求出回归直线方程.
题型探究
题型一 利用散点图判断两个变量的相关关系
故回归直线方程为^y=x+1. 答案:A
5.调查了某地若干户家庭的年收入 x(单位:万元)和年饮食 支出 y(单位:万元),调查显示年收入 x 与年饮食支出 y 具有线 性相关关系,并由调查数据得到 y 对 x 的回归直线方程:^y=0.254x +0.321,由回归直线方程可知,家庭年收入每增加 1 万元,年 饮食支出平均增加________万元.
10.3 变量间的相关关系
考点梳理
1.变量间的相关关系 (1)常见的两变量之间的关系有两类:一类是函数关系,另一 类是_相__关__关__系___;与函数关系不同,相关关系是一种_非___确__定__性__ 关系.

高中数学_变量间的相关关系

高中数学_变量间的相关关系

变量间的相关关系知识图谱变量的相关性知识精讲一.变量间的相关关系1.两个变量之间的关系:(1)常见的关系有两类:①确定性的函数关系;②相关关系:变量间存在关系,但又不具备函数关系所要求的确定性,它们的关系是带有一定随机性的;当一个变量取值一定时,另一个变量的取值带有一定随机性的两个变量之间的关系叫做相关关系.(2)相关关系与函数关系的异同点:相同点:两者均是指两个变量的关系.不同点:①函数关系是一种确定的关系,相关关系是一种非确定的关系.②函数关系是一种因果关系,而相关关系不一定是因果关系,也可能是伴随关系.2.散点图:将样本中的n 个数据点()(12)i i x y i n = ,,,,描在平面直角坐标系中,就得到了散点图.散点图形象地反映了各个数据的密切程度,根据散点图的分布趋势可以直观地判断分析两个变量的关系.3.正相关与负相关:(1)正相关:如果当一个变量的值变大时,另一个变量的值也在变大,则这种相关称为正相关;此时,散点图中的点在从左下角到右上角的区域.(2)负相关:如果一个变量的值变大时,另一个变量的值由大变小,这种相关称为负相关.此时,散点图中的点在从左上角到右下角的区域.二.两个变量的线性相关1.回归分析:对于具有相关关系的两个变量进行统计分析的方法叫做回归分析,即回归分析就是寻找相关关系中这种非确定关系的某种确定性.2.回归直线:如果散点图中的各点都大致分布在一条直线附近,就称这两个变量之间具有线性相关关系,这条直线叫做回归直线.3.最小二乘法(1)最小二乘法设(),Q a b 是直线y bx a =+与各对应数据表示的散点在纵轴方向上的距离的平方和,可以用来衡量直线y bx a =+与图中各点的接近程度,设法取,a b 的值,使(),Q a b 达到最小值.这种方法叫做最小二乘法.(2)用最小二乘法求回归直线方程用最小二乘法求回归系数a b ,有如下的公式:1221ˆniii nii x yn x y bxn x ==⋅-⋅⋅=-⋅∑∑,ˆˆa y b x =-⋅.(11n i i x x n ==∑,11ni i y y n ==∑)其中a b ,上方加“^”,表示是由观察值按最小二乘法求得的回归系数.由此得到的直线ˆˆybx a =+ 就称为回归直线方程.其中ˆa ,b 分别为a ,b 的估计值,b 称为回归系数,ˆa称为回归截距,ˆy 称为回归值.三点剖析一.注意事项1.回归直线方程的求法根据最小二乘法的思想和公式,通过计算就可以方便地求出回归方程;(1)先求2,,x y x x y ⋅(2)求1ni ii x y =∑(3)求21n i i x =∑(4)代入公式求^121ni ii ni i x ynxyb x nx==-=-∑∑(5)代入公式^^a yb x=-(6)代入直线方程得:ˆˆybx a =+ 2.散点图的制作方法对于两条轴的长度单位可以取得不一致;点既可以是实心点,也可以是空心点,;回归直线时,一定要画在多数点经过的区域,实际画线时,先观察有哪两点在直线上即可.3.回归直线的另外两种求法(1)选点法:作出散点图,用一条透明的直尺边缘在这些点间移动,选出直线上的两点或最靠近直线的两点(选点不当,精确度就比较低).(2)平均值法:首先设出方程y kx b =+,把观测值代入得几个关于,k b 的一次方程,将其平均分为两组,分别相加得到 k b ,的两个方程,联立解出 k b ,.两变量间的相关关系例题1、一次调查男女学生喜欢语文学科情况,共调查了90人,具体如下:据此材料,你认为喜欢语文学科与性喜欢不喜欢男2025女3015A.有关B.无关C.不确定D.无法判断例题2、四名同学根据各自的样本数据研究变量x ,y 之间的相关关系,并求得回归直线方程,分别得到以下四个结论:①y 与x 负相关且y=2.347x-6.423;②y 与x 负相关且y =-3.476x+5.648;③y 与x 正相关且y =5.437x+8.493;④y 与x 正相关且y =-4.326x-4.578.其中一定不正确的结论的序号是()A.①②B.②③C.③④D.①④例题3、根据如图给出的2004年至2013年我国二氧化硫年排放量(单位:万吨)柱形图,以下结论中不正确的是()A.逐年比较,2008年减少二氧化硫排放量的效果最显著B.2007年我国治理二氧化硫排放显现成效C.2006年以来我国二氧化硫年排放量呈减少趋势D.2006年以来我国二氧化硫年排放量与年份正相关随练1、对变量,有观测数据(),得散点图1;对变量,有观测数据(),得散点图2.由这两个散点图可以判断()A.变量与正相关,与正相关B.变量与正相关,与负相关C.变量与负相关,与正相关D.变量与负相关,与负相关随练2、某人研究中学生的性别与成绩、视力、智商、阅读量这4个变量的关系,随机抽查了52名中学生,得到统计数据如表1至表4,则与性别有关联的可能性最大的变量是()表1成绩/性别不及格及格总计男61420女102232总计163652表2视力/性别好差总计男41620女122032总计163652表3智商/性别偏高正常总计男81220女82432总计163652表4阅读量/性别丰富不丰富总计男14620女23032总计163652A.成绩B.视力C.智商D.阅读量线性回归x014m3y m3 5.57根据数据可求得y关于x的线性回归方程为ˆy=2.1x+0.85,则m的值为______________.例题2、已知x 、y 取值如表:,则实数m=.例题3、已知x 、y 取值如表:,则m=()A.1.5B.1.55C.3.5D.1.8随练1、某产品在某零售摊位的零售价x (单位:元)与每天的销售量y (单位:个)的统计资料如表所示:由表可得回归直线方程ˆy=ˆb x+ˆa 中的ˆb =﹣4,据此模型预测零售价为20元时,每天的销售量为()A.26个B.27个C.28个D.29个y 的统计数据如表:根据上表可得回归方程y=bx+a 的b 为9.2,据此模型预报广告费用为6万元时销售额为()A.63.6万B.65万C.66.1万D.67.7万数学成绩(x )(1)求物理成绩y 对数学成绩x 的线性回归方程;(2)当某位学生的数学成绩为70分时,预测他的物理成绩.参考公式:用最小二乘法求线性回归方程ˆˆˆy bx a =+的系数公式:1221ˆniii nii x ynxybxnx==-=-∑∑,ˆa y ax =-.参考数据:832+782+732+682+632+732=32224,83×75+78×65+73×75+68×65+63×60+73×80=30810.拓展1、5个学生的数学和物理成绩如下表:学生A B C D E学科数学8075706560物理7065686462画出散点图,判断它们是否具有相关关系.2、下列关系中,是相关关系的为()①学生的学习态度与学习成绩之间的关系;②教师的执教水平与学生的学习成绩之间的关系;③学生的身高与学生的学习成绩之间的关系;④家庭的经济条件与学生的学习成绩之间的关系.A.①②B.①③C.②③D.②④3、两个随机变量x,y的取值表为x0134y 2.2 4.3 4.8 6.7若x,y具有线性相关关系,且 y= b x+2.6,则下列四个结论错误的是()A.x与y是正相关B.当x=6时,y的估计值为8.3C.x每增加一个单位,y增加0.95个单位D.样本点(3,4.8)的残差为0.564、已知变量x和y满足关系y=﹣0.1x+1,变量y与z正相关,下列结论中正确的是()A.x与y负相关,x与z负相关B.x与y正相关,x与z正相关C.x与y正相关,x与z负相关D.x与y负相关,x与z正相关5、已知变量x与y正相关,且由观测数据算得样本平均数x=3,y=3.5,则由该观测数据算得的线性回归方程可能是()A.ˆy=0.4x+2.3B.ˆy=2x﹣2.4C.ˆy=﹣2x+9.5D.ˆy=﹣0.3x+4.46、某产品的广告费用x与销售额y的统计数据如表:根据表格已得回归方程为ˆy=9.4x+9.1,表中有一数据模糊不清,请推算该数据的值为________7、某产品的广告费用x与销售额y的统计数据如表:根据表格已得回归方程为ˆy=9.4x+9.1,表中有一数据模糊不清,请推算该数据的值为________。

  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
相关文档
最新文档