高中数学学业分层测评1回归分析的基本思想及其初步应用含解析新人教A版选修1-2
新课标人教A版高中数学选修1-2 《1.1 回归分析的基本思想及其初步应用》(共45张PPT)
n
n
ˆ = 0.849是回归直线的斜率的估计值,说明身高x b 每增加1个单位,体重y就增加0.849个单位,这表明体重 与身高具有正的线性相关关系.
图1.1 1
ˆ 和a ˆ, 未知参数 b 和 a 的最小二乘估计分别为 b 其计算公式如下:
ˆ b
x
i 1 n
n
i
x yi y
i
x
i 1
x
,
2
ˆ x, ˆ = y-b a
1 1 其中 x = xi ,y = yi . x,y 称为样本点 的 中心 . n i=1 n i=1
思考:如何发现数据中的错误?如何衡量模型的拟 合效果? 可以通过残差发现原始数据中的可疑数据,判 断所建立模型的拟合效果.下表列出了女大学生身 高和体重的原始数据以及相应的残差数据.
编号 1 2 3 4 170 5 6 7 155 8 170
身 高 / cm 165
165 157
175 165
体 重 / kg 48 57Fra bibliotek50 54 64 61 43 59 ˆ 6 .373 2 .627 2 .419 4 .618 1 .137 6 .627 2 .883 0 .382 残 差e
我们可以利用图形来分析残差特性.作图时纵 坐标为残差, 横坐标可以选为样本编号, 或身高数据, 或 体重估计值等, 这样作出的图形为残差图.下图 是以 样本编号为横坐标的残差图.
所以 ,对身高为 172 cm的女大学生 , 由回归方程可以 预报其体重为 ˆ = 0.849 172 - 85.712 = 60.316 ( kg) . y
人教版高中数学选修1-2《回归分析的基本思想及其初步应用》
ˆ e
x 166.125
n
y 54
R2 1
2 ˆ ( y y ) i 2 ( y y ) i i 1 i 1 n
0.893
学以致用
关于x与y有如下数据: x 2 4 5 6 8
y
30
40
60
50
70
为了对x、y两个变量进行统计分析,现有以下两种 ˆ 6.5x 17.5 , y ˆ 7 x 17 ,试比较哪一个 线性模型: y 模型拟合的效果更好.
甲 乙
0.78
A
ˆ 0.3x 4.4 D. y
2、甲、乙、丙、丁4位同学建立变量x, y的回归模型时,பைடு நூலகம்别选择了4种
丙
0.50
丁
0.85
R2
0.98
哪位同学建立的回归模型的拟合效果最好? A. 甲 B.乙 C.丙 D.丁
A
1 x +1上,则这组样 2
3、在一组样本数据( x1 , y1 ), ( x2 , y2 ), L , ( xn , yn )(n 2, x1 , x2 , L , xn 不全相等)的 散点图中, 若所有样本点( xi , yi )(i 1, 2, L n)都在直线y 本的相关指数为______.
能不能用一次函数模型y=bx+a准确描述身高与 体重的关系?
建构新知
线性回归模型:y=bx+a+e, (其中a和b为模型的未知参数,e称为随机误差) 函数模型:y bx a 二者有什么区别? 回归模型:y bx a e
自变量x x 解释变量 因变量y y 预报变量
随机误差e
问题探究
课堂小结
高中数学人教A版选修1-2教学案第一章 1.1 回归分析的基本思想及其初步应用 Word版含答案
预习课本~,思考并完成以下问题.什么是回归分析?.什么是线性回归模型?.求线性回归方程的步骤是什么?.回归分析()回归分析相关关系回归分析是对具有的两个变量进行统计分析的一种常用方法.()回归方程的相关计算对于两个具有线性相关关系的变量的一组数据(,),(,),…,(,).设其回归直线方程为=+,其中,是待定参数,由最小二乘法得==,=-.()线性回归模型线性回归模型(\\(=++,((=,((=σ)),其中,为模型的未知参数,通常为随机变随机误差.量称为,称为变量,称为变量.预报解释[点睛]对线性回归模型的三点说明()非确定性关系:线性回归模型=++与确定性函数=+相比,它表示与之间是统计相关关系(非确定性关系),其中的随机误差提供了选择模型的准则以及在模型合理的情况下探求最佳估计值,的工具.()线性回归方程=+中,的意义是:以为基数,每增加个单位,相应地平均增加个单位..线性回归分析()残差:对于样本点(,)(=,…,)的随机误差的估计值=-称为相应于点(,)的残差,(-)称为残差平方和.()残差图:利用图形来分析残差特性,作图时纵坐标为残差,横坐标可以选为样本编号,或身高数据,或体重的估计值等,这样作出的图形称为残差图.()=-越接近,表示回归的效果越好..判断下列命题是否正确.(正确的打“√”,错误的打“×”)()残差平方和越小,线性回归方程的拟合效果越好.( ) ()在画两个变量的散点图时,预报变量在轴上,解释变量在轴上.( )()越小,线性回归方程的拟合效果越好.( )答案:()√()×()×.从散点图上看,点散布在从左下角到右上角的区域内,两个变量的这种相关关系称为.答案:正相关.在残差分析中,残差图的纵坐标为.答案:残差.如果发现散点图中所有的样本点都在一条直线上,则残差平方和等于,解释变量和预报变量之间的相关系数等于.答案:或-[典例] 某研究机构对高三学生的记忆力和判断力进行统计分析,得下表数据()()请根据上表提供的数据,用最小二乘法求出关于的线性回归方程=+;()试根据求出的线性回归方程,预测记忆力为的同学的判断力.[解]()散点图如图:()=×+×+×+×=,==,==,。
2018-2019学年人教A版高中数学选修1-2检测:第一章 1.1回归分析的基本思想及其初步应用 Word版含答案
第一章 统计案例1.1 回归分析的基本思想及其初步应用A 级 基础巩固一、选择题1.如图四个散点图中,适合用线性回归模型拟合其中两个变量的是( )A .①②B .①③C .②③D .③④解析:图①,③中的点大致在一条直线附近,适合用线性回归模型拟合. 答案:B2.四名同学根据各自的样本数据研究变量x ,y 之间的相关关系,并求得回归直线方程,分别得到以下四个结论:①y 与x 负相关且y ^=2.347x -6.423; ②y 与x 负相关且y ^=-3.476x -5.648; ③y 与x 正相关且y ^=5.437x +8.493; ④y 与x 正相关且y ^=-4.326x -4.578. 其中一定不正确的结论的序号是( ) A .①② B .②③ C .③④D .①④解析:①中y 与x 负相关而斜率为正,不正确;④中y 与x 正相关而斜率为负,不正确. 答案:D3.甲、乙、丙、丁四位同学在建立变量x ,y 的回归模型时,分别选择了4种不同模型,计算可得它们的相关指数R 2分别如表:建立的回归模型拟合效果最好的同学是( ) A .甲 B .乙 C .丙D .丁解析:相关指数R 2越大,表示回归模型的效果越好. 答案:A4.已知x 与y 之间的一组数据如下表:已求得y 关于x 的线性回归方程为y =2.1x +0.85,则m 的值为( ) A .1 B .0.85 C .0.7D .0.5解析:因为x -=0+1+2+34=32,y -=m +3+5.5+74=m +15.54.所以这组数据的样本中心点是⎝ ⎛⎭⎪⎫32,m +15.54. 因为y 关于x 的线性回归方程为y ^=2.1x +0.85, 所以m +15.54=2.1×32+0.85,解得m =0.5.答案:D5.为了解某社区居民的家庭年收入与年支出的关系,随机调查了该社区5户家庭,得到如下统计数据表:根据上表可得回归直线方程y =b x +a ,其中b =0.76,a =y -b x .据此估计,该社区一户年收入为15万元家庭的年支出为( )A .11.4万元B .11.8万元C .12.0万元D .12.2万元解析:先求a ^,再利用回归直线方程预测.由题意知,x -=8.2+8.6+10.0+11.3+11.95=10,y -=6.2+7.5+8.0+8.5+9.85=8,∴a ^=8-0.76×10=0.4,∴当x =15时,y ^=0.76×15+0.4=11.8(万元). 答案:B 二、填空题6.如果散点图中的所有的点都在一条斜率不为0的直线上,则残差为________,相关指数R 2=________.解析:由题意知,y i =y ^i ∴相应的残差e ^i =y i -y ^i =0.相关指数R 2=1-答案:0 17.某脑科研究机构对高中学生的记忆力x 和判断力y 进行统计分析,得到下表数据:根据上表可得回归直线方程y =b x +a ,其中a =-2.3,则b =________.解析:由表格中数据得x -=6+8+10+124=9,y -=2+3+5+64=4,故样本中心点的坐标为(9,4),因为线性回归方程为y ^=b ^x -2.3, 所以4=b ^×9-2.3,解得b ^=0.7. 答案:0.7注:根据学生用书选用8.已知方程y ^=0.85x -85.71是根据女大学生的身高预报她的体重的回归直线方程,其中x 的单位是cm ,y ^的单位是kg ,那么针对某个体(160,53)的残差是________.解析:将x =160代入y ^=0.85x -85.71, 得y ^=0.85×160-85.71=50.29 所以残差e ^=y -y ^=53-50.29=3.29.答案:3.298.已知方程y ^=0.85x -82.71是根据女大学生的身高预报她的体重的回归直线方程,其中x 的单位是cm ,y ^的单位是kg ,那么针对某个体(160,53)的残差是________.解析:将x =160代入y ^=0.85x -82.71, 得y ^=0.85×160-82.71=53.29, 所以残差e ^=y -y ^=53-53.29=-0.29. 答案:-0.29 三、解答题9.某工厂为了对新研发的一种产品进行合理定价,将该产品按事先拟定的价格进行试销,得到如表数据:(1)求回归直线方程y =b x +a ,其中b =-20,a =y -b x ;(2)预计在今后的销售中,销售与单价仍然服从(1)中的关系,且该产品的成本是4元/件,为使工厂获得最大利润,该产品的单价应定为多少元?(利润=销售收入-成本)解:(1)由于x -=16(8+8.2+8.4+8.6+8.8+9)=8.5,y -=16(90+84+83+80+75+68)=80,又b ^=-20,所以a ^=y --b ^x -=80+20×8.5=250, 从而回归直线方程为y ^=-20x +250. (2)设工厂获得的利润为L 元,依题意得L =x (-20x +250)-4(-20x +250)=-20x 2+330x -1 000 =-20(x -8.25)2+361.25.当且仅当x =8.25时,L 取得最大值.故当单价定为8.25元时,工厂可获得最大利润.10.某企业每天由空气污染造成的经济损失y (单位:元)与空气污染指数(API)x 的数据统计如下:(1)求出y 与x 的线性回归方程y =b x +a ;(2)若该地区某天的空气污染指数为800,预测该企业当天由空气污染造成的经济损失; (3)若相关指数R 2=0.958 7,请说明其含义.解:(1)x -=14(150+200+250+300)=225,y -=14(200+350+550+800)=475.所以b ^=50 00012 500=4,a ^=y --b ^x -=475-4×225=-425,所以y ^=4x -425.(2)当x =800时,y ^=4×800-425=2 775.即当空气污染指数为800时,预测该企业当天造成的经济损失是2 775元.(3)R 2=0.9587,说明该企业每天空气污染造成经济损失的95.87%是由空气污染指数API 引起的,所以回归模型的拟合效果较好.B 级 能力提升1.如图所示的是四个残差图,其中回归模型的拟合效果最好的是( )解析:残差图中,只有A ,B 是水平带状区域分布,且B 中残差点散点分布集中在更狭窄的范围内,所以B 项中回归模型的拟合效果最好.答案:B2.某商场为了了解某品牌羽绒服的月销售量(单位:件)与月平均气温x (单位:℃)之间的关系,随机统计了某4个月的月销售量与当月平均气温,数据如下表:由表中数据算出线性回归方程y =b x +a 中的b ≈-2.气象部门预测下个月的平均气温约为6 ℃,据此统计,该商场下个月该品牌羽绒服的销售量的件数约为________.解析:由表格中数据可得x -=17+13+8+24=10,y -=24+33+40+554=38.又因为b ^≈-2所以a ^=y --b ^x -≈38+2×10=58, 所以y ^=-2x +58.当x =6时,y ^=-2×6+58=46. 答案:463.如图是x 和y 的一组样本数据的散点图,去掉一组数据________后,剩下的4组数据的相关指数最大.解析:由图可知:去掉D (3,10)这一组数据后,其他4组数据对应的点都集中在某一条直线附近,即两变量的线性相关性最强,此时相关指数最大.答案:D (3,10)4.已知某商品的价格x (元)与需求量y (件)之间的关系有如下一组数据:(1)画出y 关于x (2)求出回归直线方程;(3)计算R 2的值,并说明回归模型拟合程度的好坏.解:(1)散点图如图所示:(2)因为x -=18,y -=7.4,=1 660,=327,x i y i =620,所以R 2=1-≈0.994,故回归模型的拟合效果较好.。
高中数学 第一章回归分析的基本思想及其初步应用教案3 新人教A版选修1-2
第三课时1.1回归分析的基本思想及其初步应用(三)教学要求:通过典型案例的探究,进一步了解回归分析的基本思想、方法及初步应用. 教学重点:通过探究使学生体会有些非线性模型通过变换可以转化为线性回归模型,了解在解决实际问题的过程中寻找更好的模型的方法.教学难点:了解常用函数的图象特点,选择不同的模型建模,并通过比较相关指数对不同的模型进行比较. 教学过程:一、复习准备:1. 给出例3:一只红铃虫的产卵数y 和温度x 有关,现收集了7组观测数据列于下表中,试建立y 与x 之间的回归方程./y 个 2. 讨论:观察右图中的散点图,发现样本点并没有分布在某个带状区域内,即两个变量不呈线性相关关系,所以不能直接用线性回归方程来建立两个变量之间的关系. 二、讲授新课: 1. 探究非线性回归方程的确定: ① 如果散点图中的点分布在一个直线状带形区域,可以选线性回归模型来建模;如果散点图中的点分布在一个曲线状带形区域,就需选择非线性回归模型来建模.② 根据已有的函数知识,可以发现样本点分布在某一条指数函数曲线y =2C 1e x C 的周围(其中12,c c 是待定的参数),故可用指数函数模型来拟合这两个变量.③ 在上式两边取对数,得21ln ln y c x c =+,再令ln z y =,则21ln z c x c =+,而z 与x 间的方程来拟合.④ 利用计算器算得 3.843,0.272a b =-=,z 与x 间的线性回归方程为0.272 3.843z x =-,因此红铃虫的产卵数对温度的非线性回归方程为0.272 3.843x y e-=.⑤ 利用回归方程探究非线性回归问题,可按“作散点图→建模→确定方程”这三个步骤进行.其关键在于如何通过适当的变换,将非线性回归问题转化成线性回归问题.2. 小结:用回归方程探究非线性回归问题的方法、步骤. 三、巩固练习:(1(2)试求出预报变量对解释变量的回归方程.(答案:所求非线性回归方程为0.69 1.112ˆy =e x +.)。
2017-2018学年高中数学 第一章 1.1 回归分析的基本思想及其初步应用(含解析)新人教A版选修1-2
回归分析的基本思想及其初步应用预习课本P2~8,思考并完成以下问题 1.什么是回归分析?2.什么是线性回归模型?3.求线性回归方程的步骤是什么?[新知初探]1.回归分析 (1)回归分析回归分析是对具有相关关系的两个变量进行统计分析的一种常用方法. (2)回归方程的相关计算对于两个具有线性相关关系的变量的一组数据(x 1,y 1),(x 2,y 2),…,(x n ,y n ).设其回归直线方程为y ^=b ^x +a ^,其中a ^,b ^是待定参数,由最小二乘法得b ^=∑i =1nx i -xy i -y∑i =1nx i -x2=∑i =1nx i y i -nx y∑i =1nx 2i -n x 2,a ^=y -b ^x .(3)线性回归模型线性回归模型⎩⎪⎨⎪⎧y =bx +a +e ,E e =0,De =σ2,其中a ,b 为模型的未知参数,通常e 为随机变量,称为随机误差.x 称为解释变量,y 称为预报变量.[点睛] 对线性回归模型的三点说明(1)非确定性关系:线性回归模型y =bx +a +e 与确定性函数y =a +bx 相比,它表示y 与x 之间是统计相关关系(非确定性关系),其中的随机误差e 提供了选择模型的准则以及在模型合理的情况下探求最佳估计值a ,b 的工具.(2)线性回归方程y ^=b ^x +a ^中a ^,b ^的意义是:以a ^为基数,x 每增加1个单位,y 相应地平均增加b ^个单位.2.线性回归分析(1)残差:对于样本点(x i ,y i )(i =1,2,…,n )的随机误差的估计值 e ^i =y i -y ^i 称为相应于点(x i ,y i )的残差,∑i =1n(y i -y ^i )2称为残差平方和.(2)残差图:利用图形来分析残差特性,作图时纵坐标为残差, 横坐标可以选为样本编号,或身高数据,或体重的估计值等,这样作出的图形称为残差图.(3)R 2=1-∑i =1ny i -y ^i2∑i =1ny i -y2越接近1,表示回归的效果越好.[小试身手]1.判断下列命题是否正确.(正确的打“√”,错误的打“×”) (1)残差平方和越小, 线性回归方程的拟合效果越好.( )(2)在画两个变量的散点图时, 预报变量在x 轴上,解释变量在y 轴上.( ) (3)R 2越小, 线性回归方程的拟合效果越好.( ) 答案:(1)√ (2)× (3)×2.从散点图上看,点散布在从左下角到右上角的区域内, 两个变量的这种相关关系称为________.答案:正相关3.在残差分析中, 残差图的纵坐标为________. 答案:残差4.如果发现散点图中所有的样本点都在一条直线上, 则残差平方和等于________, 解释变量和预报变量之间的相关系数等于________.答案:0 1或-1[典例] 某研究机构对高三学生的记忆力x 和判断力y 进行统计分析,得下表数据x 6 8 10 12 y2356(1)(2)请根据上表提供的数据,用最小二乘法求出y 关于x 的线性回归方程 y ^=b ^x +a ^; (3)试根据求出的线性回归方程,预测记忆力为9的同学的判断力. [解] (1)散点图如图:(2)∑i =1nx i y i =6×2+8×3+10×5+12×6=158,x =6+8+10+124=9,y =2+3+5+64=4,∑i =1nx 2i =62+82+102+122=344. b ^=158-4×9×4344-4×92=1420=0.7,a ^=y -b ^x =4-0.7×9=-2.3, 故线性回归方程为y ^=0.7x -2.3.(3)由(2)中线性回归方程知,当x =9时,y ^=0.7×9-2.3=4,故预测记忆力为9的同学的判断力约为4.求线性回归方程的三个步骤(1)画散点图:由样本点是否呈条状分布来判断两个量是否具有线性相关关系. (2)求回归系数:若存在线性相关关系,则求回归系数.(3)写方程:写出线性回归方程,并利用线性回归方程进行预测说明. [活学活用]某工厂1~8月份某种产品的产量与成本的统计数据见下表:月份 12345678产量(吨) 5.6 6.0 6.1 6.4 7.0 7.5 8.0 8.2 成本(万元)130136143149157172183188以产量为x ,成本为y . (1)画出散点图;(2)y 与x 是否具有线性相关关系?若有,求出其回归方程. 解:(1)由表画出散点图,如图所示.(2)从上图可看出,这些点基本上散布在一条直线附近,可以认为x 和y 线性相关关系显著,下面求其回归方程,首先列出下表.计算得x =6.85,y =157.25.∴b ^=∑i =18x i y i -8xy∑i =18x 2i -8x 2=8 764.5-8×6.85×157.25382.02-8×6.852≈22.17, a ^=y -b ^x =157.25-22.17×6.85≈5.39,故线性回归方程为y ^=22.17x +5.39.1.在一段时间内,某种商品的价格x 元和需求量y 件之间的一组数据为:求出y 对x 解:x =15(14+16+18+20+22)=18,y =15(12+10+7+5+3)=7.4.∑i =15x 2i =142+162+182+202+222=1 660, ∑i =15x i y i =14×12+16×10+18×7+20×5+22×3=620,可得回归系数b ^=∑i =15x i y i -5xy∑i =15x 2i -5x 2=620-5×18×7.41 660-5×182=-1.15.所以a ^=7.4+1.15×18=28.1所以回归直线方程:y ^=-1.15x +28.1. 列出残差表:则∑i =15(y i -y ^i )2=0.3,∑i =15(y i -y )2=53.2.R 2=1-∑i =15y i -y ^i2∑i =15y i -y2≈0.994.所以回归模型的拟合效果很好. 题点二:非线性回归分析2.为了研究某种细菌随时间x 变化繁殖个数y 的变化,收集数据如下繁殖个数y 612254995190(1)(2)求y与x之间的回归方程.解:(1)散点图如图所示:(2)由散点图看出样本点分布在一条指数函数y1=c1e c2x的周围,于是令z=ln y,则x 12345 6z 1.792.483.223.894.555.25由计算器算得,z=0.69x+1.112,则有y=e0.69x+1.112.(1)当两个变量已明显呈线性相关关系时,则无需作散点图,就可直接求回归直线方程,否则要先判定相关性再求回归方程.判断拟合效果的好坏需要利用R2确定,R2越接近1,说明拟合效果越好.(2)非线性回归方程的求法①根据原始数据(x,y)作出散点图;②根据散点图,选择恰当的拟合函数;③作恰当的变换,将其转化成线性函数,求线性回归方程;④在③的基础上通过相应的变换,即可得非线性回归方程.层级一学业水平达标1.在对两个变量x,y进行线性回归分析时,有下列步骤:①对所求出的回归直线方程作出解释;②收集数据(x i,y i),i=1,2,…,n;③求线性回归方程;④求相关系数;⑤根据所搜集的数据绘制散点图.如果根据可行性要求能够作出变量x,y具有线性相关的结论,则在下列操作顺序中正确的是( )A.①②⑤③④B.③②④⑤①C .②④③①⑤D .②⑤④③①解析:选D 对两个变量进行回归分析时,首先收集数据(x i ,y i ),i =1,2,…,n ;根据所搜集的数据绘制散点图.观察散点图的形状,判断线性相关关系的强弱,求相关系数,写出线性回归方程,最后依据所求出的回归直线方程作出解释;故正确顺序是②⑤④③①, 故选D .2.有下列说法:①在残差图中,残差点比较均匀地落在水平的带状区域内,说明选用的模型比较合适; ②R 2来刻画回归的效果,R 2值越大,说明模型的拟合效果越好;③比较两个模型的拟合效果, 可以比较残差平方和的大小,残差平方和越小的模型,拟合效果越好.其中正确命题的个数是( ) A .0 B .1 C .2D .3解析:选D ①选用的模型是否合适与残差点的分布有关; 对于②③, R 2的值越大, 说明残差平方和越小, 随机误差越小,则模型的拟合效果越好.3.下图是根据变量x ,y 的观测数据(x i ,y i )(i =1,2,…,10)得到的散点图,由这些散点图可以判断变量x ,y 具有相关关系的图是( )A .①②B .①④C .②③D .③④解析:选D 根据散点图中点的分布情况,可判断③④中的变量x ,y 具有相关的关系. 4.(重庆高考)已知变量x 与y 正相关,且由观测数据算得样本平均数x =3,y =3.5,则由该观测数据算得的线性回归方程可能为( )A .y ^=0.4x +2.3B .y ^=2x -2.4 C .y ^=-2x +9.5 D .y ^=-0.3x +4.4解析:选A 依题意知,相应的回归直线的斜率应为正,排除C ,D .且直线必过点(3,3.5)代入A ,B 得A 正确.5.为了解某社区居民的家庭年收入与年支出的关系,随机调查了该社区5户家庭,得到如下统计数据表:根据上表可得回归直线方程y =b x +a ,其中b =0.76,a =y -b x .据此估计,该社区一户年收入为15万元家庭的年支出为( )A .11.4万元B .11.8万元C .12.0万元D .12.2万元解析:选B 由题意知,x =8.2+8.6+10.0+11.3+11.95=10,y =6.2+7.5+8.0+8.5+9.85=8,∴a ^=8-0.76×10=0.4,∴当x =15时,y ^=0.76×15+0.4=11.8(万元). 6.以下是某地区的降雨量与年平均气温的一组数据:或“不具有”)解析:画出散点图,观察可知,降雨量与年平均气温没有相关关系.答案:不具有7.在一组样本数据(x 1,y 1),(x 2,y 2),…,(x n ,y n )(n ≥2,x 1,x 2,…,x n 不全相等)的散点图中,若所有样本点(x i ,y i )(i =1,2,…,n )都在直线y =12x +1上,则这组样本数据的样本相关系数为________.解析:根据样本相关系数的定义可知, 当所有样本点都在直线上时, 相关系数为1. 答案:18.下列说法正确的命题是________(填序号). ①回归直线过样本点的中心(x ,y );②线性回归方程对应的直线y ^=b ^x +a ^至少经过其样本数据点(x 1,y 1),(x 2,y 2),…,(x n ,y n )中的一个点;③在残差图中,残差点分布的带状区域的宽度越宽,其模型拟合的精度越高; ④在回归分析中,R 2为0.98的模型比R 2为0.80的模型拟合的效果好. 解析:由回归分析的概念知①④正确,②③错误. 答案:①④9.某工厂为了对新研发的一种产品进行合理定价,将该产品按事先拟定的价格进行试销,得到如下数据:(1)求回归直线方程y =b x +a ,其中b =-20,a =y -b x ;(2)预计在今后的销售中,销量与单价仍然服从(1)中的关系,且该产品的成本是4元/件,为使工厂获得最大利润,该产品的单价应定为多少元?(利润=销售收入-成本)解:(1)x =16(8+8.2+8.4+8.6+8.8+9)=8.5,y =16(90+84+83+80+75+68)=80,从而a ^=y +20x =80+20×8.5=250, 故y ^=-20x +250.(2)由题意知, 工厂获得利润z =(x -4)y =-20x 2+330x -1 000=-20⎝⎛⎭⎪⎫x -3342+361.25,所以当x =334=8.25时,z max =361.25(元).即当该产品的单价定为8.25元时,工厂获得最大利润.10.关于x 与y 有以下数据:已知x 与y 线性相关,由最小二乘法得b ^=6.5, (1)求y 与x 的线性回归方程;(2)现有第二个线性模型:y ^=7x +17,且R 2=0.82.若与(1)的线性模型比较,哪一个线性模型拟合效果比较好,请说明理由. 解:(1)依题意设y 与x 的线性回归方程为y ^=6.5x +a ^.x =2+4+5+6+85=5,y =30+40+60+50+705=50,∵y ^=6.5x +a ^经过(x ,y ), ∴50=6.5×5+a ^,∴a ^=17.5,∴y 与x 的线性回归方程为y ^=6.5x +17.5. (2)由(1)的线性模型得y i -y ^i 与y i -y 的关系如下表:所以∑i =15(y i -y ^i )2=(-0.5)2+(-3.5)2+102+(-6.5)2+0.52=155.∑i =15(y i -y )2=(-20)2+(-10)2+102+02+202=1 000.所以R 21=1-∑i =15y i -y ^i2∑i =15y i -y2=1-1551 000=0.845.由于R 21=0.845,R 2=0.82知R 21>R2, 所以(1)的线性模型拟合效果比较好.层级二 应试能力达标1.在建立两个变量y 与x 的回归模型中,分别选择4个不同模型,求出它们相对应的R 2如表,则其中拟合效果最好的模型是( )A .模型1B .模型2C .模型3D .模型4解析:选B 线性回归分析中,相关系数为r ,|r |越接近于1, 相关程度越大; |r |越小, 相关程度越小,故其拟合效果最好. 故选B .2.如果某地的财政收入x 与支出y 满足线性回归方程y =bx +a +e (单位:亿元),其中b =0.8,a =2,|e |≤0.5,如果今年该地区财政收入为10亿元,则年支出预计不会超过( )A .10亿B .9亿C .10.5亿D .9.5亿解析:选C ∵x =10时,y =0.8×10+2+e =10+e , 又∵|e |≤0.5,∴y ≤10.5.3.某咖啡厅为了了解热饮的销售量y (个)与气温x (℃)之间的关系,随机统计了某4天的销售量与气温,并制作了对照表:由表中数据,得线性回归方程y =-2x +a .当气温为-4 ℃时,预测销售量约为( ) A .68 B .66 C .72D .70解析:选A ∵x =14(18+13+10-1)=10,y =14(24+34+38+64)=40,∴40=-2×10+a ,∴a =60,当x =-4时,y =-2×(-4)+60=68.4.甲、乙、丙、丁4位同学各自对A ,B 两变量进行回归分析,分别得到散点图与残差平方和i =1n (y i -y ^i )2如下表:哪位同学的试验结果体现拟合A ,B 两变量关系的模型拟合精度高( ) A .甲 B .乙 C .丙D .丁解析:选D 根据线性相关的知识,散点图中各样本点条状分布越均匀,同时保持残差平方和越小(对于已经获取的样本数据,R 2的表达式中 i =1n(y i -y )2为确定的数,则残差平方和越小,R 2越大),由回归分析建立的线性回归模型的拟合效果越好,由试验结果知丁要好些.故选D .5.在研究两个变量的相关关系时,观察散点图发现样本点集中于某一条指数曲线y =ebx +a的周围,令z ^=ln y ,求得回归直线方程为z ^=0.25x -2.58,则该模型的回归方程为________.解析:因为z ^=0.25x -2.58,z ^=ln y ,所以y =e 0.25x -2.58. 答案:y =e 0.25x -2.586.调查了某地若干户家庭的年收入x (单位:万元)和年饮食支出y (单位:万元),调查显示年收入x 与年饮食支出y 具有线性相关关系,并由调查数据得到y 对x 的回归直线方程:y ^=0.254x +0.321.由回归直线方程可知,家庭年收入每增加1万元,年饮食支出平均增加________万元.解析:以x +1代x ,得y ^=0.254(x +1)+0.321,与y ^=0.254x +0.321相减可得,年饮食支出平均增加0.254万元.答案:0.2547.下表是某年美国旧轿车价格的调查资料.解:设x 表示轿车的使用年数,y 表示相应的平均价格,作出散点图.由散点图可以看出y 与x 具有指数关系, 令z =ln y ,变换得作出散点图:由图可知各点基本上处于一直线,由表中数据可求出线性回归方程: z ^=8.166-0.298x .因为旧车的平均价格与使用年数具有指数关系,其非线性回归方程为y ^=e 8.166-0.298x.8.某公司利润y (单位:千万元)与销售总额x (单位:千万元)之间有如下对应数据:(1)画出散点图;(2)求回归直线方程;(3)估计销售总额为24千万元时的利润. 解:(1)散点图如图:(2)列下表,并利用科学计算器进行有关计算.于是b ^=346.3-7×21×2.13 447-7×212≈0.104. a ^=2.1-0.104×21=-0.084,因此回归直线方程为y ^=0.104x -0.084.(3)当x =24时,y =0.104×24-0.084=2.412(千万元).。
2020年高中数学人教A版选修1-2练习(一) 回归分析的基本思想及其初步应用 Word版含解析
课时跟踪检测(一) 回归分析的基本思想及其初步应用一、选择题1.(重庆高考)已知变量x 与y 正相关,且由观测数据算得样本平均数x -=3,y -=3.5,则由该观测数据算得的线性回归方程可能为( )A.y ^=0.4x +2.3B.y ^=2x -2.4 C.y ^=-2x +9.5 D.y ^=-0.3x +4.4解析:选A 依题意知,相应的回归直线的斜率应为正,排除C 、D.且直线必过点(3,3.5),代入A 、B 得A 正确.2.甲、乙、丙、丁四位同学在建立变量x ,y 的回归模型时,分别选择了4种不同模型,计算可得它们的相关指数R 2分别如下表:甲 乙 丙 丁 R 20.980.780.500.85建立的回归模型拟合效果最好的同学是( ) A .甲 B .乙 C .丙D .丁解析:选A 相关指数R 2越大,表示回归模型拟合效果越好.3.设某大学的女生体重y (单位:kg)与身高x (单位:cm)具有线性相关关系.根据一组样本数据(x i ,y i )(i =1,2,…,n ),用最小二乘法建立的回归方程为y ^=0.85x -85.71.则下列结论中不正确的是( )A .y 与x 具有正的线性相关关系B .回归直线过样本点的中心(x -,y -)C .若该大学某女生身高增加1 cm ,则其体重约增加0.85 kgD .若该大学某女生身高为170 cm ,则可断定其体重必为58.79 kg解析:选D 回归方程中x 的系数为0.85>0,因此y 与x 具有正的线性相关关系,A 正确;由回归方程系数的意义可知回归直线过样本点的中心(x -,y -),B 正确;依据回归方程中b ^的含义可知,x 每变化1个单位,y ^相应变化约0.85个单位,C 正确; 用回归方程对总体进行估计不能得到肯定结论,故D 不正确.4.甲、乙、丙、丁4位同学各自对A ,B 两变量做回归分析,分别得到散点图与残差平方和∑i =1n(y i -y ^i )2,如下表:甲 乙 丙 丁散点图残差平方和 115106124103哪位同学的试验结果体现拟合A ,B 两变量关系的模型拟合精度高?( ) A .甲 B .乙 C .丙D .丁解析:选D 从题中的散点图上来看,丁同学的散点图中的点更加近似在一条直线附近;从残差平方和来看,丁同学的最小,说明拟合精度最高.5.(福建高考)已知x 与y 之间的几组数据如下表:x 1 2 3 4 5 6 y21334假设根据上表数据所得线性回归直线方程为y =b x +a ,若某同学根据上表中的前两组数据(1,0)和(2,2)求得的直线方程为y =b ′x +a ′,则以下结论正确的是( )A.b ^>b ′,a ^>a ′ B.b ^>b ′,a ^<a ′ C.b ^<b ′,a ^>a ′D.b ^<b ′,a ^<a ′解析:选C 由两组数据(1,0)和(2,2)可求得直线方程为y =2x -2,b ′=2,a ′=-2. 而利用线性回归方程的公式与已知表格中的数据,可求得b ^=∑i =16x i y i -6x - y-∑i =16x 2i -6x -2=58-6×72×13691-6×⎝⎛⎭⎫722=57,a ^=y --b ^x -=136-57×72=-13,所以b ^<b ′,a ^>a ′. 二、填空题6.在一组样本数据(x 1,y 1),(x 2,y 2),…,(x n ,y n )(n ≥2,x 1,x 2,…,x n 不全相等)的散点图中,若所有样本点(x i ,y i )(i =1,2,…,n )都在直线y =12x +1上,则这组样本数据的样本相关系数为_________.解析:根据样本相关系数的定义可知,当所有样本点都在直线上时,相关系数为1. 答案:17.为了解儿子身高与其父亲身高的关系,随机抽取5对父子的身高数据如下表:则y 对x 的线性回归方程为________________. 解析:设y 对x 的线性回归方程为y ^=b ^x +a ^, 由表中数据得x -=176,y -=176,b ^=12,a ^=176-12×176=88,所以y 对x 的线性回归方程为y ^=12x +88.答案:y ^=12x +888.关于x 与y 有如下数据:为了对x ,y 两个变量进行统计分析,现有以下两种线性模型:甲:y ^=6.5x +17.5,乙:y ^=7x +17,则____________(填“甲”或“乙”)模型拟合的效果更好.解析:设甲模型的相关指数为R 21,则R 21=1-∑i =15(y i -y ^i )2∑i =15(y i -y -)2=1-1551 000=0.845; 设乙模型的相关指数为R 22, 则R 22=1-1801 000=0.82. 因为0.845>0.82,即R 21>R 22,所以甲模型拟合效果更好. 答案:甲三、解答题9.(新课标全国卷Ⅱ)某地区2007年至2013年农村居民家庭人均纯收入y (单位:千元)的数据如下表:(2)利用(1)中的回归方程,分析2007年至2013年该地区农村居民家庭人均纯收入的变化情况,并预测该地区2015年农村居民家庭人均纯收入.附:回归直线的斜率和截距的最小二乘估计公式分别为b ^=∑i =1n(t i -t -)(y i -y -)∑i =1n(t i -t -)2,a ^=y --b^t -.解:(1)由所给数据计算得t -=17×(1+2+3+4+5+6+7)=4,y -=17×(2.9+3.3+3.6+4.4+4.8+5.2+5.9)=4.3,∑i =17(t i -t -)2=9+4+1+0+1+4+9=28,∑i =17 (t i -t -)(y i -y -)=(-3)×(-1.4)+(-2)×(-1)+(-1)×(-0.7)+0×0.1+1×0.5+2×0.9+3×1.6=14,b ^=∑i =17(t i -t -)(y i -y -)∑i =17 (t i -t -)2=1428=0.5, a ^=y --b ^t -=4.3-0.5×4=2.3, 所求回归方程为y ^=0.5t +2.3.(2)由(1)知,b ^=0.5>0,故2007年至2013年该地区农村居民家庭人均纯收入逐年增加,平均每年增加0.5千元.将2015年的年份代号t =9代入(1)中的回归方程,得y ^=0.5×9+2.3=6.8,故预测该地区2015年农村居民家庭人均纯收入为6.8千元.10.在一段时间内,某种商品的价格x (元)和需求量y (件)之间的一组数据如下表:价格x /元 14 16 18 20 22 需求量y /件5650434137求出y 关于x 的线性回归方程,并说明拟合效果的好坏.(参考数据:∑5i =1x 2i =1 660,∑5i =1x i y i =3 992)解:从作出的散点图(图略)可看出,这些点在一条直线附近,可用线性回归模型来拟合数据.由数据可得x -=18,y -=45.4.由计算公式得b ^=-2.35,a ^=y --b ^x -=87.7. 故y 关于x 的线性回归方程为y ^=-2.35x +87.7. 列表:y i -y ^i 1.2 -0.1 -2.4 0.3 1 y i -y -10.64.6-2.4-4.4-8.4所以∑5i =1 (y i -y i )2=8.3,∑i =1(y i-y )2=229.2. 相关指数R 2=1-∑5i =1(y i -y ^i )2∑5i =1(y i -y -)2≈0.964.因为0.964很接近于1,所以该模型的拟合效果好......................................使用本文档删除后面的即可致力于打造全网一站式文档服务需求,为大家节约时间文档来源网络仅供参考欢迎您下载可以编辑的word文档谢谢你的下载本文档目的为企业和个人提供下载方便节省工作时间,提高工作效率,打造全网一站式精品需求!欢迎您的下载,资料仅供参考!(本文档收集于网络改编,由于文档太多,审核难免疏忽,如有侵权或雷同,告知本店马上删除)。
高中数学 第一章 统计案例 学业分层测评1 回归分析的基本思想及其初步应用 新人教A版选修12
【课堂新坐标】2016-2017学年高中数学 第一章 统计案例 学业分层测评1 回归分析的基本思想及其初步应用 新人教A 版选修1-2(建议用时:45分钟)[学业达标]一、选择题1.在画两个变量的散点图时,下面叙述正确的是( ) A .预报变量在x 轴上,解释变量在y 轴上 B .解释变量在x 轴上,预报变量在y 轴上 C .可以选择两个变量中任意一个变量在x 轴上 D .可以选择两个变量中任意一个变量在y 轴上【解析】 结合线性回归模型y =bx +a +e 可知,解释变量在x 轴上,预报变量在y 轴上,故选B.【答案】 B2.(2016·泰安高二检测)在回归分析中,相关指数R 2的值越大,说明残差平方和( ) A .越大 B .越小 C .可能大也可能小D .以上均错【解析】 ∵R 2=1-∑i =1ny i -y ^i2∑i =1ny i -y2,∴当R 2越大时,∑i =1n(y i -y ^i )2越小,即残差平方和越小,故选B.【答案】 B3.(2016·西安高二检测)已知x 和y 之间的一组数据则y 与x 的线性回归方程y ^=b x +a ^必过点( ) A .(2,2) B.⎝ ⎛⎭⎪⎫32,0 C .(1,2)D.⎝ ⎛⎭⎪⎫32,4【解析】 ∵x =14(0+1+2+3)=32,y =14(1+3+5+7)=4,∴回归方程y ^=b ^x +a ^必过点⎝ ⎛⎭⎪⎫32,4.【答案】 D4.已知人的年龄x 与人体脂肪含量的百分数y 的回归方程为y ^=0.577x -0.448,如果某人36岁,那么这个人的脂肪含量( )【导学号:19220003】A .一定是20.3%B .在20.3%附近的可能性比较大C .无任何参考数据D .以上解释都无道理【解析】 将x =36代入回归方程得y ^=0.577×36-0.448≈20.3.由回归分析的意义知,这个人的脂肪含量在20.3%附近的可能性较大,故选B.【答案】 B5.某产品的广告费用x 与销售额y 的统计数据如下表:根据上表可得回归方程y ^=b x +a ^中的b 为9.4,据此模型预报广告费用为6万元时销售额为( )A .63.6万元B .65.5万元C .67.7万元D .72.0万元【解析】 样本点的中心是(3.5,42),则a ^=y -b ^x =42-9.4×3.5=9.1,所以回归直线方程是y ^=9.4x +9.1,把x =6代入得y ^=65.5.【答案】 B 二、填空题6.在一组样本数据(x 1,y 1),(x 2,y 2),…,(x n ,y n )(n ≥2,x 1,x 2,…,x n 不全相等)的散点图中,若所有样本点(x i ,y i )(i =1,2,…,n )都在直线y =12x +1上,则这组样本数据的样本相关系数为________.【解析】 根据样本相关系数的定义可知,当所有样本点都在直线上时,相关系数为1.【答案】 17.已知回归直线的斜率的估计值为 1.23,样本点的中心为(4,5),则回归直线方程是________.【解析】 由斜率的估计值为1.23,且回归直线一定经过样本点的中心(4,5),可得y ^-5=1.23(x -4),即y ^=1.23x +0.08.【答案】 y ^=1.23x +0.087.某学生课外活动兴趣小组对两个相关变量收集到5组数据如下表:由最小二乘法求得回归方程为y =0.67x +54.9,现发现表中有一个数据模糊不清,请推断该点数据的值为________.【解析】 由题意可得x =15(10+20+30+40+50)=30,设要求的数据为t ,则有y =15(62+t +75+81+89)=307+t 5,因为回归直线y ^=0.67x+54.9过样本点的中心(x ,y ),所以307+t5=0.67×30+54.9,解得t =68. 【答案】 688.调查了某地若干户家庭的年收入x (单位:万元)和年饮食支出y (单位:万元),调查显示年收入x 与年饮食支出y 具有线性相关关系,并由调查数据得到y 对x 的回归直线方程:y ^=0.254x +0.321.由回归直线方程可知,家庭年收入每增加1万元,年饮食支出平均增加________万元.【解析】 以x +1代x ,得y ^=0.254(x +1)+0.321,与y ^=0.254x +0.321相减可得,年饮食支出平均增加0.254万元.【答案】 0.254 三、解答题9.(2016·包头高二检测)关于某设备的使用年限x 和所支出的维修费用y (万元),有如下的统计资料:(1)线性回归方程:⎝ ⎛⎭⎪⎪⎫a ^=y -b ^x -,b ^=∑i =1nx i y i -n x -y -∑i =1nx 2i-n x 2(2)估计使用年限为10年时,维修费用是多少? 【解】 (1)x =2+3+4+5+65=4,y =2.2+3.8+5.5+6.5+7.05=5,∑i =15x 2i =90,∑i =15x i y i =112.3,b ^=∑i =15x i y i -5x -y-∑i =15x 2i -5x 2=112.3-5×4×590-5×42=1.23. 于是a ^=y -b ^x =5-1.23×4=0.08. 所以线性回归方程为y ^=1.23x +0.08.(2)当x =10时,y ^=1.23×10+0.08=12.38(万元), 即估计使用10年时维修费用是12.38万元. 10.关于x 与y 有如下数据:为了对x ,y 两个变量进行统计分析,现有以下两种线性模型:甲模型y =6.5x +17.5,乙模型y ^=7x +17,试比较哪一个模型拟合的效果更好.【解】 R 2甲=1-∑i =15y i -y ^i2∑i =15y i -y2=1-1551 000=0.845,R 2乙=1-∑i =15y i -y ^i2∑i =15y i -y2=1-1801 000=0.82,因为84.5%>82%,所以甲模型拟合效果更好.[能力提升]1.某学生四次模拟考试时,其英语作文的减分情况如下表:( )A .y =0.7x +5.25B .y =-0.6x +5.25C .y =-0.7x +6.25D .y =-0.7x +5.25【解析】 由题意可知,所减分数y 与模拟考试次数x 之间为负相关,所以排除A.考试次数的平均数为x =14×(1+2+3+4)=2.5,所减分数的平均数为y =14×(4.5+4+3+2.5)=3.5.即直线应该过点(2.5,3.5),代入验证可知直线y =-0.7x +5.25成立,选D.【答案】 D2.已知x 与y 之间的几组数据如下表:假设根据上表数据所得线性回归直线方程为y ^=b x +a ^.若某同学根据上表中的前两组数据(1,0)和(2,2)求得的直线方程为y =b ′x +a ′,则以下结论正确的是( )A.b ^>b ′,a ^>a ′ B.b ^>b ′,a ^<a ′ C.b ^<b ′,a ^>a ′D.b ^<b ′,a ^<a ′【解析】 根据所给数据求出直线方程y =b ′x +a ′和回归直线方程的系数,并比较大小.由(1,0),(2,2)求b ′,a ′.b ′=2-02-1=2,a ′=0-2×1=-2.求b ^,a ^时,∑i =16x i y i =0+4+3+12+15+24=58,x =3.5,y =136,∑i =16x 2i =1+4+9+16+25+36=91, ∴b ^=58-6×3.5×13691-6×3.52=57, a ^=136-57×3.5=136-52=-13,∴b ^<b ′,a ^>a ′. 【答案】 C3.(2016·江西吉安高二检测)已知x ,y 的取值如下表所示,由散点图分析可知y 与x 线性相关,且线性回归方程为y =0.95x +2.6,那么表格中的数据m 的值为________.【解析】 x =4=2,y =4=4,把(x -,y -)代入回归方程得11.3+m4=0.95×2+2.6,解得m =6.7.【答案】 6.74.某农科所对冬季昼夜温差大小与某反季节大豆新品种发芽多少之间的关系进行分析研究,他们分别记录了12月1日至12月5日的每天昼夜温差与实验室每天每100棵种子中的发芽数,得到如下资料:2组数据用于回归方程检验.(1)若选取的是12月1日与12月5日的2组数据,请根据12月2日至12月4日的数据,求出y 关于x 的线性回归方程y ^=b ^x +a ^;(2)若由线性回归方程得到的估计数据与所选出的检验数据的误差均不超过2颗,则认为得到的线性回归方程是可靠的,试问(1)中所得的线性回归方程是否可靠?(3)请预测温差为14 ℃的发芽数.【解】 (1)由数据求得,x =12,y =27,∑i =13x 2i =434,∑i =13x i y i =977.由公式求得,b ^=52,a ^=y -b ^x =-3.所以y 关于x 的线性回归方程为y ^=52x -3.(2)当x =10时,y ^=52×10-3=22,|22-23|<2;当x =8时,y ^=52×8-3=17,|17-16|<2.所以该研究所得到的线性回归方程是可靠的. (3)当x =14时,有y ^=52×14-3=35-3=32,所以当温差为14 ℃时的发芽数约为32颗.。
人教A版高中数学选修1-2:1.1回归分析的基本思想及其初步应用(二)
1.1 回归分析的基本思想及其初步应用(二)一、选择题1.下列说法正确的是( )①线性回归方程适用于一切样本和总体;②线性回归方程一般都有时间性; ③样本的取值范围会影响线性回归方程的适用范围; ④根据线性回归方程得到的预测值是预测变量的精确值. A .①③④ B .②③ C .①② D .③④2.在一组样本数据(x 1,y 1),(x 2,y 2),…,(x n ,y n )(n ≥2,x 1,x 2,…,x n 不全相等)的散点图中,若所有样本点(x i ,y i )(i =1,2,…,n )都在直线y =12x +1上,则这组样本数据的样本相关系数为( )A .-1B .0 C.12D .13.某地财政收入x 与支出y 满足回归方程y =bx +a +e (单位:亿元),其中b =0.8,a =2,|e |<0.5,如果今年该地区财政收入10亿元,年支出预计不会超过( )A .10亿B .9亿C .10.5亿D .9.5亿 4.有下列说法:①在残差图中,残差点比较均匀地落在水平的带状区域内,说明选用的模型比较合适;②相关指数R 2来刻画回归的效果,R 2值越大,说明模型的拟合效果越好; ③比较两个模型的拟合效果,可以比较残差平方和的大小,残差平方和越小的模型,拟合效果越好. 其中正确命题的个数是( )A .0B .1C .2D .35.为了考察两个变量x 和y 之间的线性相关性,甲、乙两个同学各自独立地做10次和15次试验,并且利用线性回归方法,求得回归直线分别为l 1和l 2.已知在两个人的试验中发现对变量x 的观测数据的平均值恰好相等,都为s ,对变量y 的观测数据的平均值也恰好相等,都为t .那么下列说法正确的是( )A .直线l 1和l 2有交点(s ,t )B .直线l 1和l 2相交,但是交点未必是点(s ,t )C .直线l 1和l 2由于斜率相等,所以必定平行D .直线l 1和l 2必定重合6.一次实验中,当变量x 取值分别为1111,,,234时,变量y 的值依次为2,3,4,5,则x 与y 之间的回归曲线方程为()1ˆ.1A yx =+2ˆ.3B y x =+ˆ.21C y x =+ˆ.1D y x =+ 二、填空题7.如果散点图的所有点都在一条直线上,则残差均为____,残差平方和为____,相关指数为____.8.某化工厂为预测某产品的回收率y ,需要研究它和原料有效成分含量之间的相关关系,现取了8对观测值,计算得:∑8i =1x i =52,∑8i =1y i =228,∑8i =1x 2i =478,∑8i =1x i y i =1849,则y 与x 的线性回归方程是________________.三、解答题9.某种产品的广告费支出x (单位:百万元)与销售额y (单位:百万元)之间有如下对应数据:(1)画出散点图;(2)求y 关于x 的线性回归方程.10.某地最近十年粮食需求量逐年上升,下表是部分统计数据:(1)利用所给数据求年需求量与年份之间的线性回归方程y =b x +a ^;(2)利用(1)中所求出的线性回归方程预测该地2012年的粮食需求量.参考答案§1.1(一)1.D 2.D 3.B 4.D 5.C 6.C7.y ^=-10+6.5x 8.1 9.解 (1)散点图如下图所示:(2)因为x =15×9=1.8,y =15×37=7.4,∑5i =1x i y i =62,∑5i =1x 2i =16.6, 所以b ^=∑5i =1x i y i -5x y∑5i =1x 2i -5x2=62-5×1.8×7.416.6-5×1.82=-11.5,a ^=y -b ^x =7.4+11.5×1.8=28.1,故y 对x 的回归方程为y ^=28.1-11.5x .(3)当x =1.9时,y ^=28.1-11.5×1.9=6.25(t). 故当价格定为1.9万元时,需求量大约是6.25t.10.解 由①可得y i -y ^i 与y i -y 的关系如下表:y i -y ^i -0.5 -3.5 10 -6.5 0.5 y i -y-20-101020所以∑5i =1(y i -y ^i )2=(-0.5)2+(-3.5)2+102+(-6.5)2+0.52=155, ∑5i =1(y i -y )2=(-20)2+(-10)2+102+02+202=1000. 所以R 21=1-∑5i =1 y i -y ^i2∑5i =1y i -y 2=1-1551 000=0.845.由②可得y i -y ^i 与y i -y 的关系如下表:y i -y ^i -1 -5 8 -9 -3 y i -y-20-101020所以∑5i =1(y i -y ^i )2=(-1)2+(-5)2+82+(-9)2+(-3)2=180, ∑5i =1(y i -y )2=(-20)2+(-10)2+102+02+202=1000. 所以R 22=1-∑5i =1 y i -y ^i2∑5i =1y i -y 2=1-1801 000=0.82.由于R 21=0.845,R 22=0.82,0.845>0.82,所以R 21>R 22.故①的拟合效果好于②的拟合效果.。
(教师用书)高中数学 1.1 回归分析的基本思想及其初步应用课件 新人教A版选修1-2
刻画回归效果的方式
残差 对于样本点(xi,yi)(i=1,2,…,n)的随机误差的估 计值^ ei=yi-^ yi,称为相应于点(xi,yi)的残差 利用图形来分析残差特性,作图时纵坐标为 残差 , 残差图 横坐标可以选为 样本编号 ,或 身高数据 ,
或 体重估计值 等,这样作出的图形称为残差图 残差 图法 残差点比较均匀地落在水平的带状区域内,说明选 用的模型比较适合,这样的带状区域的宽度越窄, 说明模型拟合精度越高
【思路探究】 可借助于线性相关概念及性质逐一作出 判断.
【自主解答】 ①反映的正是最小二乘法思想,故正 确.②反映的是画散点图的作用,也正确.③解释的是回归 ^ x+ a ^ 的作用,故也正确.④是不正确的,在求回归 方程 ^ y =b 方程之前必须进行相关性检验,以体现两变量的关系.
【答案】 C
关于变量y与x之间的回归直线方程叙述正确的是( A.表示y与x之间的一种确定性关系 B.表示y与x之间的相关关系 C.表示y与x之间的最真实的关系 D.表示y与x之间真实关系的一种效果最好的拟合
)
【解析】
回归直线方程能最大可能地反映y与x之间的
真实关系,故选项D正确.
【答案】 D
线性回归分析
已知某种商品的价格x(元)与需求量y(件)之间的 关系有如下一组数据: x 14 16 18 20 22 y 12 10 7 5 3
i=1
xi- x yi- y
n
n
1n xi ^= y a n ^ , -b x , x = i=1,
xi- x 2
yi n y = i=1 .
i=1 1n
(2)变量样本点中心: ( x , y ) ,回归直线过样本点的中 心. (3)线性回归模型:y=bx+a+e,其中e称为 随机误差, a和b是模型的未知参数,自变量x称为 解释变量 ,因变量y称 为 预报变量 .
2016-2017学年高二数学人教A版选修1-2第1.1 回归分析的基本思想及其初步应用 含解析 精品
绝密★启用前1.1回归分析的基本思想及其初步应用一、选择题1.【题文】对变量x 、y 有观测数据(x i ,y i )(i =1,2,…,10),得散点图①;对变量u 、v 有观测数据(u i ,v i )(i =1,2,…,10),得散点图②.由这两个散点图可以判断( )A .变量x 与y 正相关,u 与v 正相关B .变量x 与y 正相关,u 与v 负相关C .变量x 与y 负相关,u 与v 正相关D .变量x 与y 负相关,u 与v 负相关2.【题文】一项研究要确定是否能够根据施肥量预测作物的产量,这里的解释变量是( )A .作物的产量B .施肥量C .试验者D .降雨量或其他解释产量的变量3.【题文】已知x 和y 之间的一组数据如下表:则y 与x 的线性回归方程ˆˆybx a =+必过点( ) A .(2,2) B .(32,0)C .(1,2) D .(32,4)4.【题文】四名同学根据各自的样本数据研究变量x ,y 之间的相关关系,并求得回归直线方程,分别得到以下四个结论:①y 与x 负相关且ˆy=2.347x -6.423;②y 与x 负相关且ˆy=-3.476x +5.648;③y 与x 正相关且ˆy =5.347x +8.493; ④y 与x 正相关且ˆy=-4.326x -4.578.其中一定不正确的结论的序号是() A .①②B .②③C .③④D .①④5.【题文】某学校开展研究性学习活动,某同学获得一组实验数据如下表:( ) A .y =2x -2 B .12xy ⎛⎫= ⎪⎝⎭C .2log y x =D .()2112y x =-6.【题文】为了解某社区居民的家庭年收入与年支出的关系,随机调查了该社区5户家庭,得到如下统计表:据此估计,该社区一户年收入为15万元家庭的年支出为( )A .11.4万元B .11.8万元C .12.0万元D .12.2万元7.【题文】具有线性相关关系的变量x ,y 有一组观测数据(x i ,y i )(i =1,2,…,8),其回归直线方程是1ˆ3y x a =+且1281286,3,x x x y y y +++=+++=则实数a的值是() A.116B.18C. 14D.128.【题文】已知具有线性相关关系的两个变量x 、y 之间的一组数据如下表:且回归方程ˆˆ 3.6ybx =+,则当x =6时,y 的预测值为() A.8.46 B.6.8 C.6.3 D.5.76二、填空题9.【题文】已知x 、y 的取值如下表:若x 、y a ,则的值为________.10.【题文】某市居民2011~2015年家庭年平均收入x (单位:万元)与年平均支出y (单位:万元)的统计资料如下表:年平均支出有________线性相关关系.11.【题文】关于x 与y 有如下数据:为了对x ,y ˆy =6.5x +17.5,乙:ˆy =7x +17,则________(填“甲”或“乙”)模型拟合的效果更好.三.解答题12.【题文】随着我国经济的发展,居民的储蓄存款逐年增长.设某地区城乡居民人民币储蓄存款(年底余额)如下表:(1)求y 关于t 的回归方程ˆˆybt a =+; (2)用所求回归方程预测该地区2016年(t =6)的人民币储蓄存款.附:回归方程ˆˆˆybt a =+中,1221ˆˆˆ,.ni ii ni i t y nt yb ay bt t nt==-==--∑∑13.【题文】以下是某地收集到的新房屋的销售价格y 和房屋的面积x 的数据:(1)(2)求线性回归方程,并在散点图中加上回归直线;(3)根据(2)的结果估计当房屋面积为150m2时的销售价格.14.【题文】某电脑公司有6名产品推销员,其工作年限与年推销金额的数据如下表:(1)(2)求年推销金额y关于工作年限x的线性回归方程;(3)若第6名推销员的工作年限为11年,试估计他的年推销金额.1.1回归分析的基本思想及其初步应用参考答案与解析一、选择题1.【答案】C【解析】题图①中的数据y随x的增大而减小,因此变量x与y负相关;题图②中,随着u的增大,v也增大,因此变量u与v正相关,故选C.考点:线性相关.【题型】选择题【难度】较易2.【答案】B【解析】作物的产量为预报变量,故施肥量为解释变量.考点:解释变量、预报变量.【题型】选择题【难度】较易 3. 【答案】D 【解析】∵()()1310123,13574,424x y =+++==+++=∴回归方程ˆˆˆy bx a =+必过点(32,4).考点:线性回归方程. 【题型】选择题 【难度】较易4. 【答案】D【解析】由回归直线方程ˆˆˆybx a =+,知当>0时,y 与x 正相关;当<0时,y 与x 负相关,∴①④一定错误.故选D. 考点:线性回归方程. 【题型】选择题 【难度】一般 5. 【答案】D【解析】可以代入检验,当x 取相应的值时,所求y 与已知y 相差平方和最小的便是拟合程度最高的. 考点:曲线的拟合程度. 【题型】选择题 【难度】一般 6. 【答案】B 【解析】8.28.61011.311.9105x ++++==, 6.27.58.08.59.885y ++++==,ˆˆ80.76100.4,ay bx =-=-⨯=线性回归方程为ˆ0.760.4y x =+,所以当x =15时,ˆ0.76150.411.8.y =⨯+= 考点:线性回归方程. 【题型】选择题 【难度】一般 7. 【答案】B 【解析】∵1281286,3,x x x y y y +++=+++=∴633,,848x y === ∴这组数据的样本中心点是(34,38), 把样本中心点代入回归直线方程1ˆ3y x a =+得,313,834a =⨯+ 解得18a =,故选B .考点:线性回归方程. 【题型】选择题 【难度】一般 8. 【答案】C 【解析】∵01234 2.2 4.3 4.5 4.8 6.72, 4.555x y ++++++++====.将点(),x y 代入回归方程ˆˆ 3.6ybx =+得,ˆ2 3.6 4.5b ⨯+=, 解得ˆ0.45b=,∴ˆ0.45 3.6y x =+,当x =6时,ˆ 6.3y =,故选C . 考点:线性回归方程. 【题型】选择题 【难度】一般二、填空题 9. 【答案】2.6【解析】由已知得2, 4.5,x y ==而回归方程过点(),x y ,则4.5=0.95×2+,∴a =2.6.考点:线性回归方程. 【题型】填空题 【难度】较易10.【答案】13;正【解析】把2011~2015年家庭年平均收入按从小到大顺序排列为11.5,12.1,13,13.5,15,因此中位数为13,由统计资料可以看出,当年平均收入增多 时,年平均支出也增多,因此两者之间具有正线性相关关系. 考点:线性相关性. 【题型】填空题 【难度】一般 11. 【答案】甲【解析】设甲模型的相关指数为21R ,则21R =1-()()521521ˆi i i ii y yy y ==--∑∑=1-1551 000=0.845;设乙模型的相关指数为22R ,则22R =1-1801000=0.82.因为0.845>0.82,即21R >22R ,所以甲模型拟合效果更好. 考点:线性回归模型的模拟效果. 【题型】填空题 【难度】一般三.解答题 12.【答案】(1)ˆy =1.2t +3.6 (2)10.8千亿元 【解析】 (1)由上表得,211363,7.2,55,1205i i i i i t y t t y =======∑∑.∴120537.2ˆ 1.25559b-⨯⨯==-⨯, ˆˆ7.2 1.23 3.6.ay bt =-=-⨯= ∴所求回归直线方程ˆy=1.2t +3.6. (2)当t =6时,ˆy =1.2×6+3.6=10.8(千亿元).∴预测该地区2016年的人民币储蓄存款为10.8千亿元. 考点:线性回归方程. 【题型】解答题 【难度】一般13.【答案】(1)略(2)ˆy=0.196 2x +1.8142(3)31.2442万元 【解析】(1)散点图如图所示:(2)511109,5i i x x ===∑()2511570,ii x x =-=∑()()5123.2,308i i i y x x y y ==--=∑.设所求回归直线方程为ˆˆˆybx a =+, 则308ˆˆˆ0.1962, 1.8142.1570ba y bx =≈=-= 故所求回归直线方程为ˆy=0.196 2x +1.8142.(3)当x =150m 2时,销售价格的估计值为ˆy =0.196 2×150+1.8142=31.2442(万元). 考点:线性回归方程. 【题型】解答题 【难度】一般 14.【答案】(1)略(2)ˆy=0.5x +0.4 (3)5.9万元 【解析】(1)画出散点图如图所示:(2)从散点图可以看出,这些点大致在一条直线附近,则可设所求的线性回归方程为ˆˆˆybx a =+. 由题意可得3567965x ++++==,233453.45y ++++==,∴()()5110i i i x xy y =--=∑,()52120i i x x=-=∑,∴()()()5152110ˆˆˆ0.5,0.4,20iii ii x x y y bay bx x x ==--====-=-∑∑ ∴年推销金额y 关于工作年限x 的线性回归方程为ˆy =0.5x +0.4. (3)当x =11时,ˆy =0.5x +0.4=0.5×11+0.4=5.9(万元). ∴可以估计第6名推销员的年销售金额为5.9万元. 考点:线性回归方程. 【题型】解答题 【难度】一般。
(教师用书)高中数学 1.1 回归分析的基本思想及其初步应用教案 新人教A版选修1-2
1.1回归分析的基本思想及其初步应用(教师用书独具)●三维目标1.知识与技能通过典型案例的探究,了解回归分析的基本思想,会对两个变量进行回归分析,明确解决回归模型的基本步骤,并对具体问题进行回归分析以解决实际应用问题.了解最小二乘法的推导,解释残差变量的含义,了解偏差平方和分解的思想,了解判断刻画模型拟合效果的方法——相关指数和残差分析.掌握利用计算器求线性回归直线方程参数及相关系数的方法.2.过程与方法通过收集数据作散点图,分析散点图,求回归直线方程,分析回归效果,利用方程进行预报.3.情感、态度与价值观培养学生利用整体的观点和互相联系的观点来分析问题,进一步加强数学的应用意识,培养学生学好数学、用好数学的信心,加强与现实生活的联系,以科学的态度评价两个变量的相互关系.●重点难点重点:回归分析的基本方法、随机误差e的认识、残差图的概念、用残差及R2来刻画线性回归模型的拟合效果.难点:回归分析的基本方法、残差概念的理解及拟合效果的判定、非线性回归向线性回归的转化.教学时要以残差分析为重点,突出残差表和R2的计算,通过举例说明相关关系与确定性关系的区别,说明回归分析的必要性及其方法.借助例题使学生掌握作散点图、求回归直线方程的方法,通过作残差图、计算R2让学生掌握拟合效果的判断方法.对于非线性回归问题重点在如何转换,引导学生分析总结转化方法和技巧,从而化解难点.(教师用书独具)●教学建议本节课建议教师采取探究式教学,把“关注知识”转向“关注学生”,在教学过程中,把“给出知识”的过程转变为“引起活动,让学生探究知识的过程”,把“完成教学任务”转向“促进学生发展”,让学生成为课堂上的真正主人.在教学中,知识点可由学生通过探索“发现”,让学生充分经历探索与发现的过程,并引导学生积极解决探索过程中发现的问题.教学中不要以练习为主,而是定位在知识形成过程的探索,例题的解答也要由学生探讨、教师点拨,共同完成.要注重数学的思想性,如统计思想、随机观念、函数思想、数形结合的思想方法等,引导学生体验数学中的理性精神,加强数学形式下的思考和推理能力.●教学流程创设问题情境,引出问题,引导学生探讨,从而引出回归分析、线性回归模型、刻画回归效果的有关概念及解决方法.利用填一填的形式,使学生自主学习本节基础知识,并反馈了解,对理解有困难的概念加以讲解.引导学生在学习基础知识的基础上分析回答例题1的问题,并总结规律方法,完成变式训练.引导学生分析例题2,根据图中的数据计算系数,求出回归方程,列出残差表,求出R2并判断拟合效果,完成变式训练.完成当堂双基达标,巩固所学知识及应用方法,并进行反馈矫正.归纳整理,进行课堂小结,整体认识本节所学知识,强调重点内容和规律方法.通过老师启发引导,完成例题3,并要求学生借鉴例题3的解法完成变式训练.引导学生分析例题3,让学生作出散点图,观察相关性,引出问题,即如何使问题转化为相关关系并用线性回归分析二者关系.【问题导思】一台机器由于使用时间较长,生产的零件有一些会有缺陷.按不同转速生产出有缺陷的零件的统计数据如下:1.【提示】2.从散点图中判断x 和y 之间是否具有相关关系? 【提示】 有.3.若转速为10转/秒,能否预测机器每小时生产缺陷的零件件数? 【提示】 可以.根据散点图作出一条直线,求出直线方程后可预测. (1)回归直线方程: y ^=b ^x +a ^,其中:b ^=∑i =1nx i -xy i -y∑i =1nx i -x2,a ^=y -b ^x ,x =1n ∑i=1n x i ,y =1n ∑i =1ny i . (2)变量样本点中心:(x ,y ),回归直线过样本点的中心.(3)线性回归模型:y =bx +a +e ,其中e 称为随机误差,a 和b 是模型的未知参数,自变量x 称为解释变量,因变量y 称为预报变量.R 2=1-∑i =1ny i -y ^i2∑i =1ny i -y2,R 2表示解释变量对预报变量变化的贡献率,R 2越接近于1,表示回归的效果越好①线性回归分析就是由样本点去寻找一条直线,使之贴近这些样本点的数学方法;②利用样本点的散点图可以直观判断两个变量的关系是否可以用线性关系表示;③通过回归方程y ^=b ^x +a ^,可以估计和观测变量的取值和变化趋势;④因为由任何一组观测值都可以求得一个线性回归方程,所以没有必要进行相关性检验.其中正确命题的个数是( )A .1B .2C .3D .4【思路探究】 可借助于线性相关概念及性质逐一作出判断.【自主解答】 ①反映的正是最小二乘法思想,故正确.②反映的是画散点图的作用,也正确.③解释的是回归方程y ^=b ^x +a ^的作用,故也正确.④是不正确的,在求回归方程之前必须进行相关性检验,以体现两变量的关系.【答案】 C1.解答例1中④时,必须明确具有线性相关关系的两个变量间才能求得一个线性回归方程,否则求得的方程无实际意义.因此必须先进行线性相关性判断,后求线性回归方程.2.回归分析的过程:(1)随机抽取样本,确定数据,形成样本点;(2)由样本点形成散点图,判断是否具有线性相关关系;(3)由最小二乘法确定线性回归方程; (4)由回归方程观察变量的取值及变化趋势.关于变量y 与x 之间的回归直线方程叙述正确的是( ) A .表示y 与x 之间的一种确定性关系 B .表示y 与x 之间的相关关系 C .表示y 与x 之间的最真实的关系D .表示y 与x 之间真实关系的一种效果最好的拟合【解析】 回归直线方程能最大可能地反映y 与x 之间的真实关系,故选项D 正确. 【答案】 D求y 关于x【思路探究】 回归模型拟合效果的好坏可以通过计算R 2来判断,其值越大,说明模型的拟合效果越好.【自主解答】 x =15(14+16+18+20+22)=18,y =15(12+10+7+5+3)=7.4,∑i =15x 2i =142+162+182+202+222=1 660, ∑i =15x i y i =14×12+16×10+18×7+20×5+22×3=620,所以b ^=∑i =15x i y i -5x y∑i =15x 2i -5x 2=620-5×18×7.41 660-5×182=-1.15,a ^=7.4+1.15×18=28.1,所以所求回归直线方程是y ^=-1.15x +28.1.列出残差表:所以∑i =15(y i -y ^i )2=0.3,∑i =15(y i -y )2=53.2,R 2=1-∑i =15y i -y ^i2∑i =15y i -y2≈0.994,所以回归模型的拟合效果很好.1.回归直线方程能定量地描述两个变量的关系,系数a ^,b ^刻画了两个变量之间的变化趋势,其中b ^表示x 变化一个单位时,y 的平均变化量.利用回归直线可以对问题进行预测,由一个变量的变化去推测另一个变量的变化.2.线性回归分析中:(1)残差平方和越小,预报精确度越高.(2)相关指数R 2取值越大,说明模型的拟合效果越好.某运动员训练次数与运动成绩之间的数据关系如下:(1)(2)求出线性回归方程;(3)作出残差图,并说明模型的拟合效果; (4)计算R 2,并说明其含义.【解】 (1)作出该运动员训练次数(x )与成绩(y )之间的散点图,如图所示.(2)可求得x =39.25,y =40.875,∑i =18x 2i =12 656,∑i =18y 2i =13 731,∑i =18x i y i =13 180,∴b ^=∑i =18x i -xy i -y∑i =18x i -x2=∑i =18x i y i -8x y∑i =18x 2i -8x 2≈1.041 5,a ^=y -b ^x =-0.003 875,∴线性回归方程为y ^=1.041 5x -0.003 875. (3)作残差图如图所示,由图可知,残差点比较均匀地分布在水平带状区域中,说明选用的模型比较合适. (4)相关指数R 2=0.985 5.说明了该运动员的成绩的差异有98.55%的可能性是由训练次数引起的.(1)作出x (2)建立x 与y 的关系,预报回归模型并计算残差; (3)利用所得模型,预报x =40时y 的值.【思路探究】 (1)画出散点图或进行相关性检验,确定两变量x 、y 是否线性相关.由散点图得x 、y 之间的回归模型.(2)进行拟合,预报回归模型,求回归方程.【自主解答】 (1)作出散点图如图,从散点图可以看出x 与y 不具有线性相关关系,根据已有知识可以发现样本点分布在某一条指数函数曲线y =c 1e c 2x 的周围,其中c 1、c 2为待定的参数.(2)对两边取对数把指数关系变为线性关系,令z =ln y ,则有变换后的样本点应分布在直线z =bx +a ,a =ln c 1,b =c 2的周围,这样就可以利用线性回归模型来建立y 与x 之间的非线性回归方程了,数据可以转化为:求得回归直线方程为z =0.272x -3.849, ∴y ^=e 0.272x -3.849. 残差如下表:两个变量不具有线性关系,不能直接利用线性回归方程建立两个变量的关系,可以通过变换的方法转化为线性回归模型,如y =c 1e c 2x ,我们可以通过对数变换把指数关系变为线性关系,令z =ln y ,则变换后样本点应该分布在直线z =bx +a (a =ln c 1,b =c 2)的周围.有一个测量水流量的实验装置,测得试验数据如下表:【解】 由表中测得的数据可以作出散点图,如图.观察散点图中样本点的分布规律,可以判断样本点分布在某一条曲线附近,表示该曲线的函数模型是Q =m ·h n(m ,n 是正的常数).两边取常用对数,则lg Q =lg m +n ·lg h .令y =lg Q ,x =lg h ,那么y =nx +lg m ,即为线性函数模型y =bx +a 的形式(其中b =n ,a =lg m ).由下面的数据表,用最小二乘法可求得b ^≈2.509 7,a ^=-0.707 7,所以n ≈2.51,m ≈0.196.没有理解相关指数R 2的意义而致误关于x 与y 有如下数据:为了对x 、y 两个变量进行统计分析,现有以下两种线性模型:甲模型y ^=6.5x +17.5,乙模型y ^=7x +17,试比较哪一个模型拟合的效果更好.【错解】 ∵R 21=1-∑i =15y i -y ^i2∑i =15y i -y2=1-1551 000=0.845.R 22=1-∑i =15y i -y ^i2∑i =15y i -y2=1-1801 000=0.82.又∵84.5%>82%,∴乙选用的模型拟合的效果更好.【错因分析】 没有理解R 2的意义是致错的根源,用相关指数R 2来比较模型的拟合效果,R 2越大,模型的拟合效果越好,并不是R 2越小拟合效果更好.【防范措施】 R 2=1-∑i =1ny i -y ^i2∑i =1ny i -y2,R 2越大,残差平方和越小,从而回归模型的拟合效果越好.在线性回归模型中,R 2表示解释变量对于预报变量变化的贡献率,R 2越接近1,表示回归的效果越好(因为R 2越接近1,表示解释变量和预报变量的线性相关性越强).从根本上理解R 2的意义和作用,就可防止此类错误的出现.【正解】 R 21=1-∑i =15y i -y ^i2∑i =15y i -y2=1-1551 000=0.845,R 22=1-∑i =15y i -y ^i2∑i =15y i -y2=1-1801 000=0.82,84.5%>82%,所以甲模型拟合效果更好.1.在研究两个变量间的关系时,首先要根据散点图来粗略判断它们是否线性相关,是否可以用线性回归模型来拟合数据.然后,可以通过残差e ^1,e ^2,…,e ^n 来判断模型拟合的效果,判断原始数据中是否存在可疑数据.这方面的分析工作称为残差分析.2.我们还可以用相关指数R 2来反映回归的效果,其计算公式是:R 2=1-∑i =1ny i -y ^i2∑i =1ny i -y2.显然,R 2取值越大,意味着残差平方和越小,也就是说模型的拟合效果越好.在线性回归模型中,R 2表示解释变量对于预报变量变化的贡献率.1.已知x 和y 之间的一组数据则y 与x 的线性回归方程y ^=b x +a 必过点( ) A .(2,2) B .(32,0)C .(1,2)D .(32,4)【解析】 ∵x =14(0+1+2+3)=32,y =14(1+3+5+7)=4,∴回归方程y ^=b ^x +a ^必过点(32,4).【答案】 D2.(2013·青岛高二检测)在下列各组量中:①正方体的体积与棱长;②一块农田的水稻产量与施肥量;③人的身高与年龄;④家庭的支出与收入;⑤某户家庭的用电量与电价.其中量与量之间的关系是相关关系的是( )A .①②B .②④C .③④D .②③④【解析】 ①是函数关系V =a 3;⑤电价是统一规定的,与用电量有一定的关系,但这种关系是确定的关系.②③④中的两个量之间的关系都是相关关系,因为水稻的产量与施肥量在一定范围内是正比、反比或其他关系,并不确定;人的身高一开始随着年龄的增加而增大,之后则不变化或降低,在身高增大时,也不是均匀增大的;家庭的支出与收入有一定的关系,在一开始,会随着收入的增加而支出也增加,而当收入增大到一定的值后,家庭支出趋向于一个常数值,也不是确定关系.【答案】 D3.下列命题正确的有________.①在线性回归模型中,e 是bx +a 预报真实值y 的随机误差,它是一个可观测的量; ②残差平方和越小的模型,拟合的效果越好; ③用R 2来刻画回归方程,R 2越小,拟合的效果越好;④在残差图中,残差点比较均匀地落在水平的带状区域中,说明选用的模型比较合适,若带状区域宽度越窄,说明拟合精度越高,回归方程的预报精度越高.【解析】 对于①随机误差e 是一个不可观测的量,③R 2越趋于1,拟合效果越好,故①③错误.对于②残差平方和越小,拟合效果越好,同理当残差点比较均匀地落在水平的带状区域时,拟合效果越好,故②④正确.【答案】 ②④4.下表提供了某厂节能降耗技术改造后生产甲产品过程中记录的产量x (吨)与相应的生产能耗y (吨标准煤)的几组对照数据:(1)(2)请根据上表提供的数据,用最小二乘法求出y 关于x 的线性回归方程;(3)已知该厂技改前100吨甲产品的生产能耗为90吨标准煤.试根据(2)求出的线性回归方程,预测技改后生产100吨甲产品比技改前少消耗多少吨标准煤.(参考数值:3×2.5+4×3+5×4+6×4.5=66.5) 【解】 (1)如下图.(2)∑i =14x i y i =3×2.5+4×3+5×4+6×4.5=66.5,x =3+4+5+64=4.5,y =2.5+3+4+4.54=3.5, ∑i =14x 2i =32+42+52+62=86. b ^=66.5-4×4.5×3.586-4×4.52=66.5-6386-81=0.7, a ^=y -b ^x =3.5-0.7×4.5=0.35,因此,所求的线性回归方程为y ^=0.7x +0.35.(3)根据回归方程预测,现在生产100吨产品消耗的标准煤的数量为0.7×100+0.35=70.35(吨),故耗能减少了90-70.35=19.65(吨标准煤).一、选择题1.在画两个变量的散点图时,下面叙述正确的是( ) A .预报变量在x 轴上,解释变量在y 轴上 B .解释变量在x 轴上,预报变量在y 轴上 C .可以选择两个变量中任意一个变量在x 轴上 D .可以选择两个变量中任意一个变量在y 轴上【解析】 结合线性回归模型y =bx +a +e 可知,解释变量在x 轴上,预报变量在y 轴上,故选B.【答案】 B2.(2013·泰安高二检测)在回归分析中,相关指数R 2的值越大,说明残差平方和( ) A .越大 B .越小 C .可能大也可能小D .以上均错【解析】 ∵R 2=1-∑i =1ny i -y ^i2∑i =1ny i -y2,∴当R 2越大时,∑i =1n(y i -y ^i )2越小,即残差平方和越小.【答案】 B3.设变量y 对x 的线性回归方程为y ^=2-2.5x ,则变量x 每增加一个单位时,y 平均( )A .增加2.5个单位B .增加2个单位C .减少2.5个单位D .减少2个单位【解析】 回归直线的斜率b ^=-2.5,表示x 每增加一个单位,y 平均减少2.5个单位. 【答案】 C4.(2012·湖南高考)设某大学的女生体重y (单位:kg)与身高x (单位:cm)具有线性相关关系,根据一组样本数据(x i ,y i )(i =1,2,…,n ),用最小二乘法建立的回归方程为y ^=0.85x -85.71,则下列结论中不正确...的是( ) A .y 与x 具有正的线性相关关系 B .回归直线过样本点的中心(x ,y )C .若该大学某女生身高增加1 cm ,则其体重约增加0.85 kgD .若该大学某女生身高为170 cm ,则可断定其体重必为58.79 kg【解析】 由于线性回归方程中x 的系数为0.85,因此y 与x 具有正的线性相关关系,故A 正确.又线性回归方程必过样本中心点(x ,y ),因此B 正确.由线性回归方程中系数的意义知,x 每增加1 cm ,其体重约增加0.85 kg ,故C 正确.当某女生的身高为170 cm 时,其体重估计值是58.79 kg ,而不是具体值,因此D 不正确.【答案】 D5.在判断两个变量y 与x 是否相关时,选择了4个不同的模型,它们的相关指数R 2分别为:模型1的相关指数R 2为0.98,模型2的相关指数R 2为0.80,模型3的相关指数R 2为0.50,模型4的相关指数R 2为0.25.其中拟合效果最好的模型是( )A .模型1B .模型2C .模型3D .模型4【解析】 相关指数R 2能够刻画用回归模型拟合数据的效果,相关指数R 2的值越接近于1,说明回归模型拟合数据的效果越好.【答案】 A 二、填空题6.在研究身高和体重的关系时,求得相关指数R 2≈________,可以叙述为“身高解释了64%的体重变化,而随机误差贡献了剩余的36%”,所以身高对体重的效应比随机误差的效应大得多.【解析】 结合相关指数的计算公式R 2=1-∑i =1ny i -y ^i2∑i =1ny i -y2可知,当R 2=0.64时,身高解释了64%的体重变化.【答案】 0.647.调查了某地若干户家庭的年收入x (单位:万元)和年饮食支出y (单位:万元),调查显示年收入x 与年饮食支出y 具有线性相关关系,并由调查数据得到y 对x 的回归直线方程:y ^=0.254x +0.321.由回归直线方程可知,家庭年收入每增加1万元,年饮食支出平均增加________万元.【解析】 以x +1代x ,得y ^=0.254(x +1)+0.321,与y ^=0.254x +0.321相减可得,年饮食支出平均增加0.254万元.【答案】 0.2548.已知回归直线的斜率的估计值为 1.23,样本点的中心为(4,5),则回归直线方程是________.【解析】 由斜率的估计值为1.23,且回归直线一定经过样本点的中心(4,5),可得y ^-5=1.23(x -4),即y ^=1.23x +0.08. 【答案】 y ^=1.23x +0.08 三、解答题9.某省2013年的阅卷现场有一位质检老师随机抽取5名学生的总成绩和数学成绩(单位:分)如下表所示:(1)(2)对x 与y 作回归分析;(3)求数学成绩y 对总成绩x 的回归直线方程;(4)如果一个学生的总成绩为500分,试预测这个学生的数学成绩. 【解】 (1)散点图如图所示:(2)x =2 0125,y =3395,∑5 i =1x 2i =819 794, ∑5i =1y 2i =23 167,∑5i =1x i y i =137 760. ∴r =错误! ·错误!)=错误!≈0.989. 因此可以认为y 与x 有很强的线性相关关系.(3)回归系数b ^=∑5i =1x i y i -5 x y∑5i =1x 2i -5x2=0.132 452,a ^=y -b ^x =14.501 315.∴回归方程为y ^=0.132 452x +14.501 315.(4)当x =500时,y ^≈81.即当一个学生的总成绩为500分时,他的数学成绩约为81分. 10.(2012·福建高考)某工厂为了对新研发的一种产品进行合理定价,将该产品按事先拟定的价格进行试销,得到如下数据:(1)求回归直线方程y =bx +a ,其中b =-20,a =y -b x ;(2)预计在今后的销售中,销量与单价仍然服从(1)中的关系,且该产品的成本是4元/件,为使工厂获得最大利润,该产品的单价应定为多少元?(利润=销售收入-成本)【解】 (1)由于x =16(8+8.2+8.4+8.6+8.8+9)=8.5,y =16(90+84+83+80+75+68)=80,又b =-20,所以a =y -b x =80+20×8.5=250,从而回归直线方程为y ^=-20x +250. (2)设工厂获得的利润为L 元,依题意得L =x (-20x +250)-4(-20x +250)=-20x 2+330x -1 000 =-20(x -8.25)2+361.25.当且仅当x =8.25时,L 取得最大值.故当单价定为8.25元时,工厂可获得最大利润.11.在关于人的脂肪含量(百分比)和年龄的关系的研究中,研究人员获得了一组数据如下表:(2)求相关指数R 2,并说明其含义; (3)给出37岁时人的脂肪含量的预测值.【解】 (1)散点图如图所示.由散点图可知样本点呈条状分布,脂肪含量与年龄有比较好的线性相关关系,因此可以用线性回归方程来刻画它们之间的关系.设线性回归方程为y ^=b ^x +a ^,则由计算器算得b ^≈0.576,a ^≈=-0.448, 所以线性回归方程为y ^=0.576x -0.448. (2)残差平方和: ∑i=114e ^2i =∑i =114(y i -y ^i )2≈37.78.总偏差平方和:∑i =114(y i -y -)2≈644.99.R 2=1-37.78644.99≈0.941. R 2≈0.941,表明年龄解释了94.1%的脂肪含量变化.(3)当x =37时,y ^=0.576×37-0.448≈20.9,故37岁时人的脂肪含量约为20.9%.(教师用书独具)为研究重量x (单位:克)对弹簧长度y (单位:厘米)的影响,对不同重量的6个物体进行测量,数据如下表所示:(1)(2)求出R 2; (3)进行残差分析.【思路探究】 (1)由表作出散点图,求出系数值,即可写出回归方程. (2)列出残差表,计算R 2,由R 2的值判断拟合效果. (3)由(2)中残差表中数值,进行回归分析. 【自主解答】 (1)散点图如图.x =16(5+10+15+20+25+30)=17.5, y =16(7.25+8.12+8.95+9.90+10.9+11.8)≈9.487,∑i =16x 2i =2 275,∑i =16x i y i =1 076.2.计算得,b ^≈0.183,a ^≈6.285, 所求线性回归方程为y ^=6.285+0.183x . (2)列表如下:所以∑i =16(y i -y ^i )2≈0.013 18,∑i =16(y i -y )2=14.678 4.所以,R 2=1-0.013 1814.678 4≈0.999 1,回归模型的拟合效果较好.(3)由残差表中的数值可以看出第3个样本点的残差比较大,需要确认在采集这个数据的时候是否有人为的错误,如果有的话,需要纠正数据,重新建立回归模型;由表中数据可以看出残差点比较均匀地落在不超过0.15的狭窄的水平带状区域中,说明选用的线性回归模型的精度较高,由以上分析可知,弹簧长度与拉力成线性关系.建立回归模型的基本步骤: (1)确定解释变量和预报变量;(2)画散点图,观察是否存在线性相关关系; (3)确定回归方程的类型,如y =bx +a ; (4)按最小二乘法估计回归方程中的参数;(5)得结果后分析残差图是否异常,若存在异常,则检查数据是否有误,或模型是否合适.假设关于某设备的使用年限x (年)和所支出的维修费用y (万元)有关的统计资料如下表所示.若由资料知y (1)线性回归方程y ^=b ^x +a ^的回归系数a ^、b ^; (2)求相关指数R 2;(3)估计使用年限为10年时,维修费用是多少? 【解】 (1)由已知数据制成下表.由此可得x =4,y =5,21 b ^=∑i =15 x i -xy i -y∑i =15 x i -x 2=1.23, a ^=y -b ^x =5-1.23×4=0.08,∴y ^=1.23x +0.08.(2)R 2=1-∑i =15 y i -y ^i2∑i =15 y i -y 2=1-0.65115.78≈0.958 7. (3)回归直线方程为y ^=1.23x +0.08,当x =10(年)时,y ^=1.23×10+0.08=12.38(万元),即估计使用10年时维修费用是12.38万元.。
高中数学 第一章回归分析的基本思想及其初步应用教案1 新人教A版选修1-2
第一章 统计案例第一课时1.1回归分析的基本思想及其初步应用(一)教学要求:通过典型案例的探究,进一步了解回归分析的基本思想、方法及初步应用. 教学重点:了解线性回归模型与函数模型的差异,了解判断刻画模型拟合效果的方法-相关指数和残差分析.教学难点:解释残差变量的含义,了解偏差平方和分解的思想.教学过程:一、复习准备:1. 提问:“名师出高徒”这句彦语的意思是什么?有名气的老师就一定能教出厉害的学生吗?这两者之间是否有关?2. 复习:函数关系是一种确定性关系,而相关关系是一种非确定性关系. 回归分析是对具有相关关系的两个变量进行统计分析的一种常用方法,其步骤:收集数据→作散点图→求回归直线方程→利用方程进行预报.二、讲授新课:1. 教学例题:的体重. (分析思路→教师演示→学生整理)第一步:作散点图第二步:求回归方程第三步:代值计算 ② 提问:身高为172cm 的女大学生的体重一定是60.316kg 吗?不一定,但一般可以认为她的体重在60.316kg 左右.③ 解释线性回归模型与一次函数的不同事实上,观察上述散点图,我们可以发现女大学生的体重y 和身高x 之间的关系并不能用一次函数y bx a =+来严格刻画(因为所有的样本点不共线,所以线性模型只能近似地刻画身高和体重的关系). 在数据表中身高为165cm 的3名女大学生的体重分别为48kg 、57kg 和61kg ,如果能用一次函数来描述体重与身高的关系,那么身高为165cm 的3名女在学生的体重应相同. 这就说明体重不仅受身高的影响还受其他因素的影响,把这种影响的结果e (即残差变量或随机变量)引入到线性函数模型中,得到线性回归模型y bx a e =++,其中残差变量e 中包含体重不能由身高的线性函数解释的所有部分. 当残差变量恒等于0时,线性回归模型就变成一次函数模型. 因此,一次函数模型是线性回归模型的特殊形式,线性回归模型是一次函数模型的一般形式.2. 相关系数:相关系数的绝对值越接近于1,两个变量的线性相关关系越强,它们的散点图越接近一条直线,这时用线性回归模型拟合这组数据就越好,此时建立的线性回归模型是有意义.3. 小结:求线性回归方程的步骤、线性回归模型与一次函数的不同.。
高中数学 1.1回归分析的基本思想及其初步应用课件 新人教A版选修1-2
a
18
基础预习点拨 要基点础探预究习归点纳拨 知要能点达探标究演归练纳 课知后能巩达固标作演业练 课后巩固作业
a
19
基础预习点拨 要基点础探预究习归点纳拨 知要能点达探标究演归练纳 课知后能巩达固标作演业练 课后巩固作业
a
20
基础预习点拨 要基点础探预究习归点纳拨 知要能点达探标究演归练纳 课知后能巩达固标作演业练 课后巩固作业
a
30
基础预习点拨 要基点础探预究习归点纳拨 知要能点达探标究演归练纳 课知后能巩达固标作演业练 课后巩固作业
a
31
基础预习点拨 要基点础探预究习归点纳拨 知要能点达探标究演归练纳 课知后能巩达固标作演业练 课后巩固作业
a
32
基础预习点拨 要基点础探预究习归点纳拨 知要能点达探标究演归练纳 课知后能巩达固标作演业练 课后巩固作业
a
66
基础预习点拨 要基点础探预究习归点纳拨 知要能点达探标究演归练纳 课知后能巩达固标作演业练 课后巩固作业
a
67
基础预习点拨 要基点础探预究习归点纳拨 知要能点达探标究演归练纳 课知后能巩达固标作演业练 课后巩固作业
a
68
基础预习点拨 要基点础探预究习归点纳拨 知要能点达探标究演归练纳 课知后能巩达固标作演业练 课后巩固作业
基础预习点拨 要基点础探预究习归点纳拨 知要能点达探标究演归练纳 课知后能巩达固标作演业练 课后巩固作业
a
1
基础预习点拨 要基点础探预究习归点纳拨 知要能点达探标究演归练纳 课知后能巩达固标作演业练 课后巩固作业
a
2
基础预习点拨 要基点础探预究习归点纳拨 知要能点达探标究演归练纳 课知后能巩达固标作演业练 课后巩固作业
2020-2021学年人教A版数学选修1-2课时素养评价 1.1 回归分析的基本思想及其初步应用
温馨提示:此套题为Word版,请按住Ctrl,滑动鼠标滚轴,调节合适的观看比例,答案解析附后。
关闭Word文档返回原板块。
课时素养评价一回归分析的基本思想及其初步应用(15分钟30分)1.设某大学的女生体重y(单位:kg)与身高x(单位:cm)具有线性相关关系,根据一组样本数据(x i,y i)(i=1,2,…,n)用最小二乘法建立的回归直线方程为=0.85x-85.71,则下列结论中不正确的是( )A.y与x具有正的线性相关关系B.回归直线过样本点的中心(,)C.若该大学某女生身高增加1 cm,则其体重约增加0.85 kgD.若该大学某女生身高为170 cm,则可断定其体重必为58.79 kg 【解析】选D.因为回归直线方程中的=0.85>0,所以y与x具有正的线性相关关系,A选项正确;又因为回归直线过样本点的中心(,),所以选项B正确;又因为线性回归直线方程得出的值是近似值,所以选项C 正确,选项D不正确.2.如表是某厂1~4月份用水量(单位:百吨)的一组数据:由表中数据可知,用水量y与月份x之间有较好的线性相关关系,其线性回归直线方程是=-0.7x+a,则a= ( )A.5.25B.5.15C.5.2D.10.5【解析】选 A.因为=2.5,=3.5,回归直线方程必过定点(,),所以3.5=-0.7×2.5+a,所以a=5.25.3.某学校开展研究性学习活动,某同学获得一组实验数据如表:对于表中数据,现给出下列拟合曲线,其中拟合程度最好的是( ) A.y=2x-2 B.y=C.y=log2xD.y=(x2-1)【解析】选D.可以代入检验,残差平方和最小的拟合程度最高.4.在研究身高和体重的关系时,求得R2≈________,可以叙述为“身高解释了64%的体重变化,而随机误差贡献了剩余的36%”,所以身高对体重的效应比随机误差的效应大得多.【解析】结合相关指数的计算公式R2=1-可知,当R2≈0.64时,身高解释了64%的体重变化.答案:0.645.高二(3)班学生每周用于数学学习的时间x(单位:h)与数学成绩y(单位:分)之间有如表所示数据:若某同学每周用于数学学习的时间为18 h,试预测该同学的数学成绩.【解析】显然学习时间与学习成绩间具有相关关系,可以列出下表,并用科学计算器进行计算.设回归方程为=x+,于是可得==≈3.53,=-≈74.9-3.53×17.4≈13.5.因此可求得回归方程为=3.53x+13.5.当x=18时,=3.53×18+13.5≈77.故预测该同学可得77分.【补偿训练】某农场对单位面积化肥用量x(kg)和水稻相应产量y(kg)的关系进行了统计,得到数据如下:如果x和y之间具有线性相关关系,求出回归直线方程,并预测当单位面积化肥用量为32 kg时,水稻的产量大约是多少?(精确到0.01 kg) 【解析】用列表的方法计算与回归系数.=×210=30,=×2 795≈399.3,=≈4.746,=399.3-4.746×30=256.92,y对x的回归直线方程为=+x=256.92+4.746x,当x=32时,=256.92+4.746×32≈408.79.答:回归直线方程为=256.92+4.746x,当单位面积化肥用量为32 kg时,水稻的产量大约为408.79 kg.(30分钟60分)一、选择题(每小题5分,共25分)1.某产品的宣传费用x与销售额y的统计数据如表:根据表格可得回归方程=x+中的为9.4,据此模型预报宣传费用为6万元时,销售额为( )A.63.6万元B.65.5万元C.67.7万元D.72.0万元【解析】选B.因为=-=-9.4×=9.1,所以回归方程为=9.4x+9.1.令x=6,得=9.4×6+9.1=65.5(万元).2.下列四个命题中正确的是( )①在线性回归模型中,e是bx+a预报真实值y的随机误差,它是一个观测的量;②残差平方和越小的模型,拟合的效果越好;③用R2来刻画回归方程,R2越小,拟合的效果越好;④在残差图中,残差点比较均匀地落在水平的带状区域中,说明选用的模型比较合适,带状区域宽度越窄,说明模型拟合精度越高,回归方程的预报精度越高.A.①③B.②④C.①④D.②③【解析】选B.e是预报变量y的随机误差,故①不正确;R2越接近1,拟合的效果越好,故③不正确.3.若一函数模型为y=sin2α+2sinα+1,为将y转化为t的回归直线方程,则需作变换t等于( )A.sin2αB.(sin α+1)2C. D.以上都不对【解析】选B.因为y是关于t的回归直线方程,实际上就是y关于t 的一次函数,又因为y=(sin α+1)2,若令t=(sin α+1)2,则可得y与t的函数关系式为y=t,此时变量y与变量t是线性相关关系.4.两个变量的散点图如图,可考虑用如下函数进行拟合比较合理的是( )A.y=a·x bB.y=a+bln xC.y=a·e bxD.y=a·【解析】选B.由散点图知,此曲线类似对数函数型曲线,因此可用函数y=a+bln x模型进行拟合.5.已知x与y之间的几组数据如表:假设根据表中数据所得线性回归方程为=x+,若某同学根据表中的前两组数据(1,0)和(2,2)求得的直线方程为y′=b′x+a′,则以下结论正确的是 ( )A.>b′,>a′B.>b′,<a′C.<b′,>a′D.<b′,<a′【解析】选C.过(1,0)和(2,2)的直线方程为y′=2x-2,画出六点的散点图,回归直线的大概位置如图所示,显然,b′>,>a′.二、填空题(每小题5分,共15分)6.如果某地的财政收入x与支出y满足线性回归方程y=bx+a+e(单位:亿元),其中b=0.8,a=2,|e|≤0.5,如果今年该地区财政收入为10亿元,则年支出预计不会超过________亿元.【解析】因为当x=10时,y=0.8×10+2+e=10+e,又因为|e|≤0.5,所以y ≤10.5.答案:10.57.已知x,y取值如表:若x,y具有线性相关关系,且回归方程为=0.95x+,则当x=10时,y的值是________.【解析】由已知=2,=4.5,而回归方程过点(,).则4.5=0.95×2+,所以=2.6.所以当x=10时,y=0.95×10+2.6=12.1.答案:12.18.已知方程=0.85x-82.71是根据女大学生的身高预报她的体重的回归方程,其中x的单位是cm,的单位是kg,那么针对某个体(160,53)的残差是__________.【解析】将x=160代入=0.85x-82.71,得=0.85×160-82.71=53.29,所以残差=y-=53-53.29=-0.29.答案:-0.29三、解答题(每小题10分,共20分)9.关于x与y有以下数据:已知x与y线性相关,由最小二乘法得=6.5,(1)求y与x的线性回归方程.(2)现有第二个线性模型:=7x+17,且R2=0.82.若与(1)的线性模型比较,哪一个线性模型拟合效果比较好,请说明理由.【解析】(1)依题意,设y与x的线性回归方程为=6.5x+.==5,==50,因为=6.5x+经过(,),所以50=6.5×5+,所以=17.5,所以y与x的线性回归方程为=6.5x+17.5.(2)由(1)的线性模型得y i-i与y i-的关系如表:所以(y i-i)2=(-0.5)2+(-3.5)2+102+(-6.5)2+0.52=155.(y i-)2=(-20)2+(-10)2+102+02+202=1 000.所以=1-=1-=0.845.由于=0.845,R2=0.82知>R2,所以(1)的线性模型拟合效果比较好.10.某个服装店经营某种服装,在某周内获纯利y(单位:元)与该周每天销售这种服装件数x之间的一组数据关系见表:已知=280,=45 309,x i y i=3 487.(1)求,;(2)已知纯利y与每天销售件数x之间线性相关,求出y关于x的线性回归方程;(3)求残差平方和、相关指数.【解析】(1)==6,=≈79.86.(2)由于y与x有线性相关关系,可设线性回归方程为=x+,则≈≈4.75,≈79.86-6×4.75=51.36,所以y关于x的线性回归方程为=4.75x+51.36.(3)列出残差表如下:i 1 2 3 4 5 6 7y i66 69 73 81 89 90 91i65.61 70.3675.1179.8684.6189.3694.11i0.39 -1.36-2.111.14 4.39 0.64-3.11所以残差平方和为0.392+(-1.36)2+(-2.11)2+1.142+4.392+0.642+(-3.11)2=37.107 2.相关指数R2=1-≈0.944 5.1.为了考查两个变量x和y之间的线性相关性,甲、乙两位同学各自独立地做了100次和150次试验,并且利用线性回归方法,求得回归直线分别为l1和l2.已知两个人在试验中发现对变量x的观测数据的平均值都是s,对变量y的观测数据的平均值都是t,那么下列说法正确的是( )A.l1和l2有交点(s,t)B.l1与l2相交,但交点不一定是(s,t)C.l1与l2必定平行D.l1与l2必定重合【解析】选A.l1,l2都过样本点的中心(s,t),但斜率不确定.2.随着新型冠状病毒肺炎疫情好转,某地为方便市民出行,推出利用支付宝和微信扫码支付乘车活动,并采用随机优惠鼓励市民扫码支付乘车.该公司某线路公交车队统计了第一周内使用扫码支付的情况,其中x(单位:天)表示活动推出的天数,y(单位:十人次)表示当天使用扫码支付的人次,整理后得到如图所示的统计表1和散点图.表1:x第1天第2天第3天第4天第5天第6天第7天y 7 12 20 33 54 90 148由散点图分析后,可用y=作为该线路公交车使用扫码支付的人次y关于活动推出天数x的回归方程,根据表2的数据,求此回归方程,并预报第8天使用扫码支付的人次(精确到整数).表2:x i y i x i z i4 52 3.5 140 2 069 112其中z=ln y,=z i.参考数据:e5.3≈200.34,e5.5≈244.69,e5.7≈298.87.【解析】由题意得z=ln y=ln e bx+a=bx+a,所以===0.5,所以=-=3.5-0.5×4=1.5,所以z关于x的线性回归方程为=0.5x+1.5,所以y关于x的回归方程为=,当x=8时,=e5.5≈244.69,所以第8天使用扫码支付的人次约为2 447.关闭Word文档返回原板块。
数学人教A版选修1-21.1 回归分析的基本思想及其初步应用
§1.1回归分析的基本思想及其初步应用学习目标 1.了解回归分析的必要性及其一般步骤.2.了解随机误差的概念.3.会作散点图,并会求线性回归方程.4.利用残差分析来判断线性回归模型的拟合效果.5.掌握建立回归模型的基本步骤,并通过实例进一步学习回归分析的基本思想及其初步应用.知识点一回归分析的相关概念思考1 相关关系是确定性关系吗?函数关系呢?答案相关关系是一种非确定性关系,而函数关系是一种确定性关系.思考2 请问产生随机误差的主要原因有哪些?答案(1)所选用的模型不恰当;(2)忽略了某些因素的影响;(3)存在测量误差.梳理(1)回归分析是对具有相关关系的两个变量进行统计分析的一种常用方法.若两个变量之间具有线性相关关系,则称相应的回归分析为线性回归分析.(2)线性回归方程为y ^=b ^x +a ^,且b ^=i =1n(x i -x )(y i -y )i =1n(x i -x )2,a ^=y -b ^x ,其中x =1n ∑i =1n x i ,y =1n ∑i =1ny i ,(x ,y )称为样本点的中心,回归直线一定过样本点的中心.(3)样本点散布在某一条直线的附近,而不是在一条直线上,所以不能用一次函数y =bx +a 来描述它们之间的关系,而是用线性回归模型y =bx +a +e 来表示,其中a 和b 为模型的未知参数,e 称为随机误差,自变量x 称为解释变量,因变量y 称为预报变量.预报变量y 的值由解释变量x 和随机误差e 共同确定,即解释变量x 只能解释部分预报变量y 的变化.知识点二 回归模型的模拟效果思考 如何评价回归模型拟合效果的优劣?答案 计算相关指数R 2的值,R 2越接近于1,效果就越好. 梳理1.回归方程y ^=b ^x +a ^中的b ^表示当x 每增加一个单位时,y ^的变化量.( √ )2.R 2越大,残差平方和越小,即模型的拟合效果越好;R 2越小,残差平方和越大,即模型的拟合效果越差.( √ )3.散点图是判断两个变量是否有相关关系的工具之一.( √ )4.在一组样本数据(x 1,y 1),(x 2,y 2),…,(x n ,y n )(n ≥2,x 1,x 2,…,x n 不全相等)的散点图中,若所有点(x i ,y i )(i =1,2,…,n)都在直线y =12x +1上,则这组样本数据的样本相关系数为1.( √ )5.回归直线y ^=b ^x +a ^不一定过点(x ,y ).( × )类型一 线性回归方程的求解例1 现有某高新技术企业年研发费用投入x(百万元)与企业年利润y(百万元)之间具有线性相关关系,近5年的年科研费用和年利润具体数据如下表:(1)画出散点图;(2)求y 对x 的线性回归方程. 考点 回归分析题点 建立回归模型的基本步骤 解 (1)散点图如下图所示:(2)由题意可知,x =1+2+3+4+55=3,y =2+3+4+4+75=4,∑i =15x i y i =1×2+2×3+3×4+4×4+5×7=71,∑i =15x 2i =12+22+32+42+52=55, 根据公式,可求得b ^=71-5×3×455-5×32=1.1,a ^=4-1.1×3=0.7,故所求线性回归方程为y ^=1.1x +0.7. 引申探究在例1基础上,试估计当x =10时,企业所获利润为多少?解 依上例得y ^=1.1x +0.7,将x =10代入,得y ^=11.7(百万元). 故估计企业所获利润为11.7百万元. 反思与感悟 (1)求线性回归方程的基本步骤①列出散点图,从直观上分析数据间是否存在线性相关关系.②计算:x ,y ,∑i =1nx 2i,∑i =1nx i y i .③代入公式求出y ^=b ^x +a ^中参数b ^,a ^的值. ④写出线性回归方程并对实际问题作出估计.(2)需特别注意的是,只有在散点图大致呈线性时,求出的回归方程才有实际意义,否则求出的回归方程毫无意义.跟踪训练1 假设关于某设备的使用年限x(年)和所支出的维修费用y(万元)有如下的统计数据:由此资料可知y 对x 呈线性相关关系. (1)求线性回归方程;(2)求使用年限为10年时,该设备的维修费用为多少? 考点 线性回归方程 题点 求线性回归方程 解 (1)由上表中的数据可得x =4,y =5,∑i =15x 2i=90,∑i =15x i y i =112.3,∴b ^=∑i =15x i y i -5x·y∑i =15x 2i -5x 2=112.3-5×4×590-5×42=1.23, ∴a ^=y -b ^x =5-1.23×4=0.08.∴线性回归方程为y ^=1.23x +0.08.(2)当x =10时,y ^=1.23×10+0.08=12.38.即使用年限为10年时,该设备的维修费用为12.38万元.类型二 回归模型的效果例2 某运动员训练次数与运动员成绩之间的数据关系如下:(1)作出散点图; (2)求出线性回归方程;(3)作出残差图,并说明模型的拟合效果; (4)计算R 2,并说明其含义. 考点 残差分析与相关指数 题点 残差及相关指数的应用解 (1)该运动员训练次数(x)与成绩(y)之间的散点图如图所示.(2)可求得x =39.25,y =40.875,∑i =18x 2i=12656,∑i =18x i y i =13180,∴b ^=i =18(x i -x )(y i -y )i =18(x i -x )2=∑i =18x i y i -8xy∑i =18x 2i -8x 2≈1.0415,a ^=y -b ^x =-0.003875,∴线性回归方程为y ^=1.0415x -0.003875.(3)作残差图如图所示,由图可知,残差点比较均匀地分布在水平的带状区域中,说明选用的模型比较合适.(4)R 2=1-i =18(y i -y ^i )2i =18(y i -y )2=0.9855,说明了该运动员成绩差异有98.55%是由训练次数引起的.反思与感悟 (1)该类题属于线性回归问题,解答本题应先通过散点图来分析两变量间的关系是否线性相关,然后再利用求回归方程的公式求解回归方程,并利用残差图或相关指数R 2来分析函数模型的拟合效果,在此基础上,借助回归方程对实际问题进行分析. (2)刻画回归效果的三种方法①残差图法,残差点比较均匀地落在水平的带状区域内说明选用的模型比较合适.②残差平方和法:残差平方和i =1n(y i -y ^i )2越小,模型的拟合效果越好.③相关指数法:R 2=1-i =1n(y i -y ^i )2i =1n(y i -y )2越接近1,表明回归的效果越好.跟踪训练2 (1)甲、乙、丙、丁4位同学各自对A ,B 两变量进行回归分析,分别得到散点图与残差平方和i =1n (y i -y ^i )2如下表:则________同学的试验结果体现拟合A ,B 两变量间关系的模型的拟合效果最好. 考点 残差分析与相关指数 题点 残差及相关指数的应用 答案 丁解析 残差平方和越小,模型的拟合效果越好,因丁对应的残差平方和最小,故丁所对应的模型拟合效果最好.(2)关于x 与y 有如下数据:现有两个线性模型:(1)y ^=6.5x +17.5;(2)y =7x +17.试比较哪一个拟合效果更好. 考点 残差分析与相关指数 题点 残差及相关指数的应用解 由(1)可得y i -y ^i 与y i -y 的关系如下表:∴i =15(y i -y ^i )2=(-0.5)2+(-3.5)2+102+(-6.5)2+0.52=155,i =15(y i -y )2=(-20)2+(-10)2+102+02+202=1000.∴R 21=1-i =15(y i -y ^i )2i =15(y i -y )2=1-1551000=0.845. 由(2)可得y i -y ^i 与y i -y 的关系如下表:∴i =15(y i -y ^i )2=(-1)2+(-5)2+82+(-9)2+(-3)2=180,i =15(y i -y )2=(-20)2+(-10)2+102+02+202=1000.∴R 22=1-i =15(y i -y ^i )2i =15(y i -y )2=1-1801000=0.82. 由于R 21=0.845,R 22=0.82,0.845>0.82, ∴R 21>R 22.∴(1)的拟合效果好于(2)的拟合效果.1.设回归方程为y ^=7-3x ,当变量x 增加两个单位时( ) A .y 平均增加3个单位 B .y 平均减少3个单位 C .y 平均增加6个单位 D .y 平均减少6个单位考点 线性回归分析 题点 回归直线的概念 答案 D解析 因为两个相关变量为负相关关系. 2.已知x 与y 之间的一组数据:则y 与x 的线性回归方程y ^=b ^x +a ^必过点( ) A .(2,2) B .(1,2) C .(1.5,0) D .(1.5,4)考点 线性回归方程题点 样本点中心的性质 答案 D解析 过样本点中心.3.在回归分析中,相关指数R 2的值越大,说明残差平方和( ) A .越大B .越小C .可能大也可能小D .以上均不正确考点 残差分析与相关指数 题点 残差及相关指数的概念 答案 B解析 因为R 2=1-i =1n(y i -y ^i )2i =1n(y i -y )2,所以当R 2越大时,i =1n (y i -y ^i )2越小,即残差平方和越小,故选B.4.某学生课外活动兴趣小组对两个相关变量收集到5组数据如表:由最小二乘法求得回归方程为y ^=0.67x +54.9,现发现表中有一个数据模糊不清,请推断该点数据的值为________. 考点 线性回归方程 题点 样本点中心的性质 答案 68解析 由题意可得x =15(10+20+30+40+50)=30,设要求的数据为t ,则有y =15(62+t +75+81+89)=307+t5,因为回归直线y ^=0.67x +54.9过样本点的中心(x ,y ), 所以307+t5=0.67×30+54.9,解得t =68.5.已知方程y ^=0.85x -82.71是根据女大学生的身高预报她的体重的回归方程,其中x 的单位是cm ,y ^的单位是kg ,那么针对某个体(160,53)的残差是________.考点 残差分析与相关指数 题点 残差及相关指数的运算 答案 -0.29解析 把x =160代入y ^=0.85x -82.71,可得y ^=0.85×160-82.71=53.29,所以残差e ^=y -y ^=53-53.29=-0.29.回归分析的步骤(1)确定研究对象,明确哪个变量是解释变量,哪个变量是预报变量;(2)画出确定好的解释变量和预报变量的散点图,观察它们之间的关系(如是否存在线性关系等);(3)由经验确定回归方程的类型(如果呈线性关系,则选用线性回归方程y ^=b ^x +a ^); (4)按一定规则估计回归方程中的参数;(5)得出结果后分析残差图是否有异常(个别数据对应的残差过大,或残差呈现不随机的规律性等),若存在异常,则检查数据是否有误或模型是否合适等.一、选择题1.某同学在研究性学习中,收集到某制药厂今年前5个月甲胶囊生产产量(单位:万盒)的数据如下表所示:若x ,y 线性相关,线性回归方程为y ^=0.7x +a ^,估计该制药厂6月份生产甲胶囊产量为( ) A .8.0万盒 B .8.1万盒 C .8.9万盒 D .8.6万盒考点 线性回归方程 题点 样本点中心的性质 答案 B解析 回归直线一定过样本点的中心.由已知数据可得x =3,y =6,代入线性回归方程,可得a ^=y -0.7x=3.9,即线性回归方程为y ^=0.7x +3.9.把x =6代入,可近似得y ^=8.1,故选B. 2.如图所示,由这两个散点图可以判断( )A .变量x 与y 正相关,u 与v 正相关B .变量x 与y 正相关,u 与v 负相关C .变量x 与y 负相关,u 与v 正相关D .变量x 与y 负相关,u 与v 负相关 考点 线性回归分析 题点 回归直线的概念 答案 C解析 图(1)中的数据随着x 的增大y 减小,因此变量x 与变量y 负相关; 图(2)中的数据随着u 的增大v 增大,因此u 与v 正相关.3.已知变量x 与y 负相关,且由观测数据求得样本平均数x =3,y =3.5,则由该观测数据求得的线性回归方程可能是( )A.y ^=-2x +9.5B.y ^=2x -2.4C.y ^=-0.3x -4.4 D.y ^=0.4x +2.3考点 线性回归方程 题点 求线性回归方程 答案 A解析 因为变量x 与y 负相关,所以排除B ,D ,将样本平均数x =3,y =3.5代入选项验证可知,选项A 符合题意.4.对具有线性相关关系的变量x ,y ,有一组观测数据(x i ,y i )(i =1,2,…,8),其线性回归方程是y ^=16x+a ^,若x 1+x 2+x 3+…+x 8=3,y 1+y 2+y 3+…+y 8=6,则实数a ^的值是( )A.116 B.18 C.14D.1116考点 线性回归方程 题点 样本点中心的性质 答案 D解析 由x 1+x 2+x 3+…+x 8=3,y 1+y 2+y 3+…+y 8=6可知样本点的中心为⎝ ⎛⎭⎪⎫38,34,将该点坐标代入回归方程y ^=16x +a ^,得a ^=1116.5.若对某地区人均工资x(万元)与该地区人均消费y(万元)进行调查统计得y 与x 具有线性相关关系,且线性回归方程为y ^=0.7x +2.1,若该地区人均消费水平为10.5,则估计该地区人均消费额占人均工资收入的百分比约为( ) A .75% B .87.5% C .70%D .10.5%考点 线性回归方程 题点 线性回归方程的应用 答案 B解析 y =10.5时,由y ^=0.7x +2.1得x =10.5-2.10.7=12,故得10.512×100%=87.5%.6.甲、乙、丙、丁四位同学各自对A ,B 两变量的线性相关试验用回归分析的方法分别求得相关系数r 如下表:则这四位同学的试验结果能体现出A ,B 两变量有更强的线性相关性的是( ) A .甲 B .乙 C .丙D .丁考点 线性相关系数题点 线性相关系数的概念及计算 答案 D解析 由相关系数的意义可知,相关系数的绝对值越接近于1,相关性越强,结合题意可知丁的线性相关性更强,故选D.7.某化工厂为预测某产品的回收率y ,而要研究它和原料有效成分含量之间的相关关系,现取了8对观测值,计算得∑i =18x i =52,∑i =18y i =228,∑i =18x 2i=478,∑i =18x i y i =1849,则y 与x 的线性回归方程是( )A.y ^=11.47+2.62xB.y ^=-11.47+2.62xC.y ^=2.62+11.47xD.y ^=11.47-2.62x 考点 线性回归方程 题点 求线性回归方程 答案 A解析 由题中数据得x =6.5,y =28.5,∴b ^=∑i =18x i y i -8x·y∑i =18x 2i -8x 2=1849-8×6.5×28.5478-8×6.52=367140≈2.62, a ^=y -b ^x ≈28.5-2.62×6.5=11.47,∴y 与x 的线性回归方程是y ^=2.62x +11.47,故选A. 二、填空题8.若一个样本的总偏差平方和为80,残差平方和为60,则相关指数R 2为________. 考点 残差分析与相关指数 题点 残差及相关指数的运算 答案 0.25解析 R 2=1-6080=0.25.9.已知样本数据点(x i ,y i )(i =1,2,3,…,n)在某一条直线上,则相关系数r 的值为________. 考点 线性相关系数题点 线性相关系数的概念及计算 答案 ±1解析 由题意知r =±1.10.关于随机误差产生的原因分析正确的有________.(填序号)①用线性回归模型来近似真实模型所引起的误差; ②忽略某些因素的影响所产生的误差; ③对样本数据观测时产生的误差; ④计算错误所产生的误差. 考点 回归分析题点 回归分析的概念和意义 答案 ①②③解析 理解线性回归模型y =bx +a +e 中随机误差e 的含义是解决此问题的关键,随机误差可能由于观测工具及技术产生,也可能因忽略某些因素而产生,也可以是回归模型产生,但不是计算错误.故随机误差产生的原因分析正确的是①②③. 三、解答题11.已知x ,y 之间的一组数据如下表:(1)分别计算:x ,y ,x 1y 1+x 2y 2+x 3y 3+x 4y 4,x 21+x 22+x 23+x 24; (2)已知变量x 与y 线性相关,求出回归方程. 考点 线性回归方程 题点 求线性回归方程 解 (1)x =0+1+2+34=1.5,y =1+3+5+74=4, x 1y 1+x 2y 2+x 3y 3+x 4y 4=0×1+1×3+2×5+3×7=34, x 21+x 22+x 23+x 24=02+12+22+32=14.(2)b ^=34-4×1.5×414-4×1.52=2,a ^=y -b ^x =4-2×1.5=1,故y ^=2x +1.12.某服装批发市场1-5月份的服装销售量x 与利润y 的统计数据如下表:(1)从这五个月的利润中任选2个,分别记为m ,n ,求事件“m ,n 均不小于30”的概率;(2)已知销售量x 与利润y 大致满足线性相关关系,请根据前4个月的数据,求出y 关于x 的线性回归方程y ^=b ^x +a ^;(3)若由线性回归方程得到的利润的估计数据与真实数据的误差不超过2万元,则认为得到的利润的估计数据是理想的.请用表格中第5个月的数据检验由(2)中回归方程所得的第5个月的利润的估计数据是否理想?参考公式:b ^=∑i =1nx i y i -n xy∑i =1nx 2i -n x 2,a ^=y -b ^x .考点 线性回归分析 题点 回归直线的应用解 (1)所有的基本事件为(19,34),(19,26),(19,41),(19,46),(34,26),(34,41),(34,46),(26,41),(26,46),(41,46),共10个.记“m ,n 均不小于30”为事件A ,则事件A 包含的基本事件为(34,41),(34,46),(41,46),共3个. 所以P(A)=310.(2)由前4个月的数据可得,x =5,y =30,∑i =14x i y i =652,∑i =14x 2i =110.所以b ^=∑i =14x i y i -4xy∑i =14x 2i -4x 2=652-4×5×30110-4×52=5.2, a ^=30-5.2×5=4,所以线性回归方程为y ^=5.2x +4, (3)由题意得,当x =8时,y ^=45.6,|45.6-46|=0.4<2;所以利用(2)中的回归方程所得的第5个月的利润估计数据是理想的. 13.在一段时间内,某种商品的价格x 元和需求量y 件之间的一组数据为:求出y 对x 的线性回归方程,并说明拟合效果的程度. 考点 残差分析与相关指数 题点 残差及相关指数的应用解 x =15(14+16+18+20+22)=18,y =15(12+10+7+5+3)=7.4.∑i =15x 2i =142+162+182+202+222=1 660, ∑i =15x i y i =14×12+16×10+18×7+20×5+22×3=620,可得回归系数b ^=∑i =15x i y i -5xy∑i =15x 2i -5x 2=620-5×18×7.41 660-5×182=-1.15,所以a ^=7.4+1.15×18=28.1,所以线性回归方程为y ^=-1.15x +28.1. 列出残差表:则i =15(y i -y ^i )2=0.3,i =15(y i -y )2=53.2.R 2=1-i =15(y i -y ^i )2i =15(y i-y )2≈0.994.所以回归模型的拟合效果很好. 四、探究与拓展14.某公司的广告费支出x(万元)与销售额y(万元)之间有下表所示的对应数据,由资料显示y 对x 呈线性相关关系,根据下表提供的数据得到回归方程y ^=b ^x +a ^中的b ^=6.5,预测销售额为115万元时,约需________万元广告费. 考点 线性回归分析 题点 回归直线的应用 答案 15解析 因为x =15×(2+4+5+6+8)=5,y =15×(30+40+60+50+70)=50,所以50=6.5×5+a ^,则a ^=17.5,所以当y =115时,6.5x =115-17.5,得x =15, 即约需广告费为15万元.15.某车间为了规定工时定额,需要确定加工零件所花费的时间,为此作了四次试验,得到的数据如下:(1)在给定的坐标系中画出表中数据的散点图;(2)求出y 关于x 的线性回归方程y ^=b ^x +a ^,并在坐标系中画出回归直线; (3)试预测加工10个零件需要多少时间?⎝ ⎛⎭⎪⎪⎫注:b ^=∑i =1nx i y i-n x y )∑i =1nx 2i-n x 2,a ^=y -b ^x 考点 线性回归方程 题点 求线性回归方程 解 (1)散点图如图.(2)由表中数据得∑i =14x i y i =52.5,x =3.5,y =3.5,∑i =14x 2i =54,所以b ^=∑i =1nx i y i -n xy∑i =1nx 2i -n x 2=52.5-4×3.5×3.554-4×3.52=0.7, 所以a ^=y -b ^x =3.5-0.7×3.5=1.05.所以y ^=0.7x +1.05. 回归直线如图中所示.(3)将x =10代入线性回归方程,得y ^=0.7×10+1.05=8.05, 所以预测加工10个零件需要8.05小时.。
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
________万元.
^
^
【解析】 以 x+1 代 x,得y=0.254(x+1)+0.321,与y=0.254x+0.321 相减可得,
年饮食支出平均增加 0.254 万元.
【答案】 0.254
三、解答题
9.(2016·包头高二检测)关于某设备的使用年限 x 和所支出的维修费用 y(万元),有
如下的统计资料:
^ 乙模型y=7x+17,试比较哪一个模型拟合的效果更好.
5
∑^ yi-yi2
i=1
【解】 R甲2 =1- 5
155 =1- =0.845,
1 000
∑yi-y2
i=1
5
∑^ yi-yi2
i=1
R乙2 =1- 5
180 =1- =0.82,
1 000
∑yi-y2
i=1
因为 84.5%>82%,所以甲模型拟合效果更好.
2
所以当温差为 14 ℃时的发芽数约为 32 颗.
【解析】 结合线性回归模型 y=bx+a+e 可知,解释变量在 x 轴上,预报变量在 y 轴
上,故选 B.
【答案】 B
2.(2016·泰安高二检测)在回归分析中,相关指数 R2 的值越大,说明残差平方和( )
A.越大
B.越小Байду номын сангаас
C.可能大也可能小
D.以上均错
n
∑^ yi-yi2
i=1
【解析】 ∵R2=1- n
某人 36 岁,那么这个人的脂肪含量( ) 【导学号:19220003】
A.一定是 20.3% B.在 20.3%附近的可能性比较大 C.无任何参考数据 D.以上解释都无道理
^ 【解析】 将 x=36 代入回归方程得y=0.577×36-0.448≈20.3.由回归分析的意义
知,这个人的脂肪含量在 20.3%附近的可能性较大,故选 B.
D.72.0 万元
^^ 【解析】 样本点的中心是(3.5,42),则a=y-bx=42-9.4×3.5=9.1,所以回归直
^
^
线方程是y=9.4x+9.1,把 x=6 代入得y=65.5.
【答案】 B
二、填空题
6.在一组样本数据(x1,y1),(x2,y2),…,(xn,yn)(n≥2,x1,x2,…,xn 不全相等)
【答案】 B
5.某产品的广告费用 x 与销售额 y 的统计数据如下表:
广告费用 x(万元)
4
2
3
5
销售额 y(万元)
49
26
39
54
^^ ^ ^ 根据上表可得回归方程y=bx+a中的b为 9.4,据此模型预报广告费用为 6 万元时销售
额为( )
A.63.6 万元
B.65.5 万元
C.67.7 万元
【解析】 由题意可知,所减分数 y 与模拟考试次数 x 之间为负相关,所以排除 A.考
1
1
试次数的平均数为x= ×(1+2+3+4)=2.5,所减分数的平均数为y= ×(4.5+4+3+
4
4
2.5)=3.5.即直线应该过点(2.5,3.5),代入验证可知直线 y=-0.7x+5.25 成立,选 D.
,∴当 R2 越大时,
∑yi-y2
i=1
n
∑^ (yi-yi)2 越小,即残差平方和越小,故选 B.
i=1
【答案】 B
3.(2016·西安高二检测)已知 x 和 y 之间的一组数据
x
0
1
2
3
y
1
3
5
7
^^ ^ 则 y 与 x 的线性回归方程y=bx+a必过点( )
A.(2,2)
5
5
307+t
54.9 过样本点的中心(x,y),所以
=0.67×30+54.9,
5
解得 t=68.
【答案】 68
8.调查了某地若干户家庭的年收入 x(单位:万元)和年饮食支出 y(单位:万元),调查
显示年收入 x 与年饮食支出 y 具有线性相关关系,并由调查数据得到 y 对 x 的回归直线方程:
^ y=0.254x+0.321.由回归直线方程可知,家庭年收入每增加 1 万元,年饮食支出平均增加
x
2
3
4
5
6
y
2.2
3.8
5.5
6.5
7.0
如由资料可知 y 对 x 呈线性相关关系.试求:
n
-- xiyi-n x y
∑ ^
^- ^ i=1
(1)线性回归方程: a=y-b x ,b= n
( ∑ )x2i-nx2
i=1
(2)估计使用年限为 10 年时,维修费用是多少?
2+3+4+5+6
【解】 (1)x=
1
的散点图中,若所有样本点(xi,yi)(i=1,2,…,n)都在直线
y= x+1 2
上,则这组样本数
据的样本相关系数为________.
【解析】 根据样本相关系数的定义可知,当所有样本点都在直线上时,相关系数为 1.
【答案】 1
7.已知回归直线的斜率的估计值为 1.23,样本点的中心为(4,5),则回归直线方程是
■
75
81
89
^ 由最小二乘法求得回归方程为y=0.67x+54.9,现发现表中有一个数据模糊不清,请推
断该点数据的值为________.
1 【解析】 由题意可得x= (10+20+30+40+50)=30,
5
1
307+t
^
设要求的数据为 t,则有y= (62+t+75+81+89)=
,因为回归直线y=0.67x+
[能力提升]
1.某学生四次模拟考试时,其英语作文的减分情况如下表:
考试次数 x
1
2
3
4
所减分数 y
4.5
4
3
2.5
显然所减分数 y 与模拟考试次数 x 之间有较好的线性相关关系,则其线性回归方程为
( )
A.y=0.7x+5.25
B.y=-0.6x+5.25
C.y=-0.7x+6.25
D.y=-0.7x+5.25
^
^
C.b<b′,a>a′
^
^
D.b<b′,a<a′
【解析】 根据所给数据求出直线方程 y=b′x+a′和回归直线方程的系数,并比较 大小.
由(1,0),(2,2)求 b′,a′. 2-0
b′= =2, 2-1
a′=0-2×1=-2.
^^ 求b,a时,
6
∑xiyi=0+4+3+12+15+24=58,
^ 所以线性回归方程为y=1.23x+0.08.
^ (2)当 x=10 时,y=1.23×10+0.08=12.38(万元),
即估计使用 10 年时维修费用是 12.38 万元.
10.关于 x 与 y 有如下数据:
x
2
4
5
6
8
y
30
40
60
50
70
^ 为了对 x,y 两个变量进行统计分析,现有以下两种线性模型:甲模型y=6.5x+17.5,
i=1
13 x=3.5,y= ,
6
6
∑x2i=1+4+9+16+25+36=91,
i=1
13
58-6 × 3.5 ×
^
65
∴b=
=,
91-6 × 3.52 7
^ 13 5
13 5 1
a= - ×3.5= - =- ,
67
62 3
^
^
∴b<b′,a>a′.
【答案】 C
3.(2016·江西吉安高二检测)已知 x,y 的取值如下表所示,由散点图分析可知 y 与 x
10
11
13
12
8
发芽 y(颗)
23
25
30
26
16
该农科所确定的研究方案是:先从这 5 组数据中选取 3 组数据求线性回归方程,剩下的 2
组数据用于回归方程检验.
(1)若选取的是 12 月 1 日与 12 月 5 日的 2 组数据,请根据 12 月 2 日至 12 月 4 日的数据, ^^ ^
求出 y 关于 x 的线性回归方程y=bx+a;
【答案】 D
2.已知 x 与 y 之间的几组数据如下表:
x
1
2
3
4
5
6
y
0
2
1
3
3
4
^^ ^ 假设根据上表数据所得线性回归直线方程为y=bx+a.若某同学根据上表中的前两组数
据(1,0)和(2,2)求得的直线方程为 y=b′x+a′,则以下结论正确的是( )
^
^
A.b>b′,a>a′
^
^
B.b>b′,a<a′
线性相关,且线性回归方程为 y=0.95x+2.6,那么表格中的数据 m 的值为________.
x
0
1
3
4
y
2.2
4.3
4.8
m
0+1+3+4
2.2+4.3+4.8+m 11.3+m - -
【解析】 x=
=2,y=
=
,把( x , y )代入回归
4
4
4
11.3+m
方程得
=0.95×2+2.6,解得 m=6.7.
( )3
B. ,0 2
C.(1,2)
( )3
D. ,4 2
1
31
【解析】 ∵x= (0+1+2+3)= ,y= (1+3+5+7)=4,
4
24