回归分析知识导航 学案 高中数学选修1-2 苏教版
2019-2020学年苏教版选修1-2 回归分析 学案
①线性回归分析就是由样本点去寻找一条直线,使之贴近这些样本点的数学方法;②利用样本点的散点图可以直观判断两个变量的关系是否可以用线性关系表示;③通过回归方程y ^=bx +a ,可以估计和观测变量的取值和变化趋势;④因为由任何一组观测值都可以求得一个线性回归方程,所以没有必要进行相关性检验.其中正确命题的个数是( ) A .1 B .2 C .3D .4(2)如果某地的财政收入x 与支出y 满足线性回归方程y ^=bx +a +ε(单位:亿元),其中b ^=0.8,a ^=2,|ε|≤0.5,如果今年该地区财政收入10亿元,则今年支出预计不会超过________亿.[解] (1)①反映的是最小二乘法思想,故正确.②反映的是画散点图的作用,故正确.③解释的是回归方程y ^=bx +a 的作用,故正确.④是不正确的,在求回归方程之前必须进行相关性检验,以发现两变量的关系.(2)由题意可得:y ^=0.8x +2+ε,当x =10时,y ^=0.8×10+2+ε=10+ε,又|ε|≤0.5,∴7.5≤y ^≤8.3.故今年支出预计不会超过8.5亿. [答案] (1)C (2)8.51.在分析两个变量的相关关系时,可根据样本数据散点图确定两个变量之间是否存在相关关系,然后利用最小二乘法求出回归直线方程.2.由线性回归方程给出的是一个预报值而非精确值. 1.随机误差的主要来源.(1)线性回归模型与真实情况引起的误差; (2)省略了一些因素的影响产生的误差; (3)观测与计算产生的误差.1.下列有关线性回归的说法,不正确的是________(填序号).①自变量取值一定时,因变量的取值带有一定随机性的两个变量之间的关系叫做相关关系;②在平面直角坐标系中用描点的方法得到表示具有相关关系的两个量的一组数据的图形叫做散点图;③线性回归方程最能代表观测值x ,y 之间的关系; ④任何一组观测值都能得到具有代表意义的回归直线方程.[解析] 只有具有线性相关的两个观测值才能得到具有代表意义的回归直线方程. [答案] ④测得如下表中的数据:(2)如果散点图中的各点大致分布在一条直线的附近,求y 与x 之间的回归直线方程. [思路探究] 作散点图→得到x ,y 有较好线性关系→ 代入公式求得线性回归方程 [解] (1)散点图如图所示.(2)将已知表中的数据列成下表:x =15.5,y ≈7.49,∑i =16x i y i =1 074.2,∑i =16x 2i =2 273.∴b ^=∑x i y i -6x -y -∑x 2i -6x -2=1 076.2-6×17.5×9.492 275-6×17.52≈0.18, a ^=y -b ^x =7.49-0.18×15.5=4.32.∴回归直线方程为y ^=0.18x +4.32.1.散点图是定义在具有相关关系的两个变量基础上的,对于性质不明确的两组数据,可先作散点图,在图上看它们有无关系,关系的密切程度,然后再进行相关回归分析.2.求回归直线方程时,首先应注意到,只有在散点图大致呈线性时,求出的回归直线方程才有实际意义,否则,求出的回归直线方程毫无意义.1.已知x 和y 之间的一组数据,则下列四个函数中,哪一个作为回归模型最好?①y 2③y =4x;④y =x 2.[提示] 观察散点图中样本点的分布规律可判断样本点分布在曲线y =3×2x -1附近.①作为回归模型最好.2.如何解答非线性回归问题?[提示] 非线性回归问题有时并不给出经验公式.这时我们可以画出已知数据的散点图,把它与学过的各种函数(幂函数、指数函数、对数函数等)图象作比较,挑选一种跟这些散点拟合得最好的函数,然后采用适当的变量变换,把问题化为线性回归分析问题,使之得到解决.其一般步骤为:【例3】某地区不同身高的未成年男性的体重平均值如下表:(2)如果一名在校男生身高为168 cm,预测他的体重约为多少?[思路探究]先由散点图确定相应的函数模型,再通过对数变换将非线性相关转化为线性相关的两个变量来求解.[解](1)根据表中的数据画出散点图,如下:由图看出,这些点分布在某条指数型函数曲线y=c1e c2x的周围,于是令z=ln y,列表如下:由表中数据可求得z 与x 之间的回归直线方程为z ^=0.693+0.020x ,则有y ^=e 0.693+0.020x. (2)由(1)知,当x =168时,y ^=e 0.693+0.020×168≈55.57,所以在校男生身高为168 cm ,预测他的体重约为55.57 kg.两个变量不具有线性关系,不能直接利用线性回归方程建立两个变量的关系,可以通过变换的方法转化为线性回归模型,如y =c 1ec 2x,我们可以通过对数变换把指数关系变为线性关系,令z =ln y ,则变换后样本点应该分布在直线z =bx +a a =ln c 1,b =c 2的周围.2.有一个测量水流量的实验装置,测得试验数据如下表:[解] 由表中测得的数据可以作出散点图,如图.观察散点图中样本点的分布规律,可以判断样本点分布在某一条曲线附近,表示该曲线的函数模型是Q =m ·h n(m ,n 是正的常数).两边取常用对数,则lg Q =lg m +n ·lg h ,令y =lg Q ,x =lg h ,那么y =nx +lg m ,即为线性函数模型y =bx +a 的形式(其中b =n ,a =lg m ).由下面的数据表,用最小二乘法可求得b ^≈2.509 7,a ^=-0.707 7,所以n ≈2.51,m ≈0.194.1.下表是x和y之间的一组数据,则y关于x的线性回归方程必过点( )A.C.(2.5,4) D.(2.5,5)[解析]线性回归方程必过样本点的中心(x,y),即(2.5,4),故选C.[答案] C2.在两个变量y与x的回归模型中,分别选择了4个不同的模型.它们的相关指数R2如下,其中拟合效果最好的模型是( )A.模型1的相关指数R2为0.98B.模型2的相关指数R2为0.80C.模型3的相关指数R2为0.50D.模型4的相关指数R2为0.25[解析]相关指数R2越接近于1,则该模型的拟合效果就越好,精度越高.[答案] A1.如图所示,有5组(x,y)数据,去掉________这组数据后,剩下的4组数据的线性相关系数最大.[答案]D(3,10)2.为了考查两个变量Y 与x 的线性相关性,测是x ,Y 的13对数据,若Y 与x 具有线性相关关系,则相关系数r 绝对值的取值范围是________.[解析] 相关系数临界值r 0.05=0.553,所以Y 与x 若具有线性相关关系,则相关系数r 绝对值的范围是(0.553,1].[答案] (0.553,1]3.某种产品的广告费支出x 与销售额y (单位:百万元)之间有如下对应数据:(1)(2)对两个变量进行相关性检测; (3)求回归直线方程. [解] (1)散点图如图所示(2)计算各数据如下:r =(145-5×52)(13 500-5×502)≈0.92,查得r 0.05=0.878,r >r 0.05,故有95%的把握认为该产品的广告费支出与销售额之间具有线性相关关系.(3)b ^=∑x i y i -5x y ∑x 2i -5x 2=1 380-5×5×50145-5×52=4.5, a ^=y -b ^x =50-4.5×5=15.5,于是所求的回归直线方程是y ^=4.5x +15.3.。
2019高中数学 第1章 统计案例 1.2 回归分析(一)学案 苏教版选修1-2
§1.2 回归分析(一)课时目标1.掌握建立线性回归模型的步骤.2.了解回归分析的基本思想和初步应用.1.对于n 对观测数据(x i ,y i )(i =1,2,3,…,n ),直线方程__________________称为这n 对数据的线性回归方程.其中________称为回归截距,______称为回归系数,________称为回归值.2.a ^,b ^的计算公式⎩⎨⎧b ^=∑ni =1x i y i -n x y ∑ni =1x 2i-n x 2a ^ =y -b ^x3.相关系数r 的性质 (1)|r |≤1;(2)|r |越接近于1,x ,y 的线性相关程度越强; (3)|r |越接近于0,x ,y 的线性相关程度越弱.一、填空题1.下列关系中正确的是________(填序号). ①函数关系是一种确定性关系; ②相关关系是一种非确定性关系;③回归分析是对具有函数关系的两个变量进行统计分析的一种方法; ④回归分析是对具有相关关系的两个变量进行统计分析的一种常用方法.2.回归直线y ^=a ^+b ^x 恒经过定点________.3.为了解决初中二年级平面几何入门难的问题,某校在初中一年级代数教学中加强概念和推理教学,并设有对照班,下表是初中二年级平面几何期中测试成绩统计表的一部分,其χ2≈________(保留小数点后两位).4.从某学校随机选取8名女大学生,其身高x (cm)和体重y (kg)的线性回归方程为y ^=0.849x -85.712,则身高172 cm 的女大学生,由线性回归方程可以估计其体重为________ kg.5.设两个变量x 和y 之间具有线性相关关系,它们的相关系数是r ,且y 关于x 的回归直线的斜率是b ^,那么b ^与r 的符号________(填写“相同”或“相反”).6.某小卖部为了了解冰糕销售量y (箱)与气温x (℃)之间的关系,随机统计了某4天卖出的冰糕的箱数与当天气温,并制作了对照表(如下表所示),且由表中数据算得线性回归方程y ^=b ^x +a ^中的b ^=2,则预测当气温为25℃时,冰糕销量为________箱.7y (件)与月平均气温x (℃)之间的关系,随机统计了某4个月的月销售量与当月平均气温,数据如下表:由表中数据算出线性回归方程y =b x +a 中的b ≈-2.气象部门预测下个月的平均气温约为6℃,据此估计,该商场下个月羽绒服的销售量的件数约为______________________.8.已知线性回归方程为y ^=0.50x -0.81,则x =25时,y 的估计值为________.二、解答题9.某企业上半年产品产量与单位成本资料如下:(1)(2)指出产量每增加1 000件时,单位成本平均变动多少? (3)假定产量为6 000件时,单位成本为多少元?10.某电脑公司有6名产品推销员,其工作年限与年推销金额数据如下表:(1)求年推销金额(2)若第6名推销员的工作年限为11年,试估计他的年推销金额.能力提升11.下表提供了某厂节能降耗技术改造后,生产甲产品过程中记录的产量x(吨)与相应的生产能耗y(吨标准煤)的几组对照数据.________.12.以下是某地搜集到的新房屋的销售价格y和房屋的面积x的数据:(1)(2)求线性回归方程,并在散点图中加上回归直线;(3)根据(2)的结果估计当房屋面积为150 m2时的销售价格.1.(1)求线性回归方程的步骤为①作出散点图;②利用公式计算回归系数b ^ 及a ^的值;③写出线性回归方程. (2)一般地,我们可以利用线性回归方程进行预测,这里所得到的值是预测值,但不是精确值.2.计算相关系数r 可以判断变量x ,y 的线性相关程度.§1.2 回归分析(一)答案知识梳理1.y ^=a ^+b ^x a ^b ^y ^作业设计1.①②④ 2.(x ,y ) 3.16.23 4.60.316解析 当x =172时,y ^=0.849×172-85.712 =60.316. 5.相同解析 可以分析b ^、r 的计算公式. 6.70解析 由线性回归方程必过点(x ,y ),且b ^=2,得a ^=20,所以当x =25时,y ^=70. 7.46解析 ∵样本点的中心为(10,38),∴38=-2×10+a ^,∴a ^=58,∴当x =6时,y ^=-2×6+58=46. 8.11.69解析 y 的估计值就是当x =25时的函数值, 即0.50×25-0.81=11.69.9.解 (1)n =6,∑6i =1x i =21,∑6i =1y i =426,x =3.5, y =71,∑6i =1x 2i =79,∑6i =1x i y i =1 481,b ^=∑6i =1x i y i -6x y∑6i =1x 2i -6x2=1 481-6×3.5×7179-6×3.52≈-1.82. a ^=y -b ^x =71+1.82×3.5=77.37.线性回归方程为y ^=a ^+b ^x =77.37-1.82x .(2)因为单位成本平均变动b ^=-1.82<0,且产量x 的计量单位是千件,所以根据回归系数b ^的意义有:产量每增加一个单位即1 000件时,单位成本平均减少1.82元. (3)当产量为6 000件时,即x =6,代入线性回归方程:y ^=77.37-1.82×6=66.45(元).当产量为6 000件时,单位成本为66.45元.10.解 (1)设所求的线性回归方程为y ^=b ^x +a ^,则b ^=∑5i =1x i -xy i -y∑5i =1x i -x2=1020=0.5, a ^=y -b ^x =0.4.所以年推销金额y 关于工作年限x 的线性回归方程为y ^=0.5x +0.4.(2)当x =11时,y ^=0.5×11+0.4=5.9(万元). 所以可以估计第6名推销员的年推销金额为5.9万元.11.y ^=0.7x +0.35解析 对照数据,计算得:∑4i =1x 2i =86, x =3+4+5+64=4.5,y =2.5+3+4+4.54=3.5. 已知∑4i =1x i y i =66.5, 所以b ^=∑4i =1x i y i -4x y ∑4i =1x 2i -x2=66.5-4×4.5×3.586-4×4.52=0.7. a ^=y -b ^x =3.5-0.7×4.5=0.35.因此,所求的线性回归方程为y ^=0.7x +0.35. 12.解 (1)散点图如图所示:(2)x =15∑5i =1x i =109,∑5i =1 (x i -x )2=1 570, y =23.2,∑5i =1(x i -x )(y i -y )=308. 设所求线性回归方程为y ^=b ^x +a ^, 则b ^ =3081 570≈0.196 2,a ^=y -b ^x =23.2-109×3081 570≈1.816 6. 故所求线性回归方程为y ^=0.196 2x +1.816 6. (3)据(2),当x =150 m 2时,销售价格的估计值为 y ^=0.196 2×150+1.816 6=31.246 6(万元).。
苏教版选修(1-2)1.2《回归分析》word学案
1.2回归分析BCA案主备人:史玉亮审核人:吴秉政使用时间:2012.2.6 学习目标:1.通过对典型案例的探究,进一步了解回归分析的基本思想、方法及初步应用。
2.结合具体的实际问题,了解非线性回归问题的解决思路。
3.通过回归分析的学习,提高对现代计算技术与统计方法的应用意识。
B案一、基础整合1.召与回归系数b?的计算方法b?= _______________________ ,a?= ________________________ 。
2.样本相关系数(1)对于变量x与y随机抽取到的n对数据(x1,y1),(x2,y2),……,(x n,y n),检验统计量是样本相关系数r= ______________________________________________(2)_____________________________________________________________ r具有以下性质:r w 1,并且r越接近1,线性相关程度___________________________________ ;r越接近0,线性相关程度_______________________ 。
(3)检验的步骤如下:①作统计假设:x与y不具有_____________________ 关系。
②根据 __________ 与______________ 在附表中查出r的一个临界值r0.05。
③根据 ____________________ 计算公式算出r的值。
④作统计推断。
如果r| > “a,表明有____________ 的把握认为x与y之间具有线性相关关系;如果|r w r o.05,我们没有理由拒绝__________ 。
这时寻找回归直线方程是毫无意义的。
二、预习检测1.下列两变量具有相关关系的是( )A.正方体的体积与棱长B.匀速行驶的车辆的行驶距离与时间C.人的身高与体重D.人的身高与视力2.下列两变量是线性相关的是( )A.如果变量X与Y之间存在着线性相关关系,则我们根据试验数据得到的点(X i, yj(i =1,2,3,...,n)将散布在某一条直线附近B.如果两个变量X与Y之间不存在线性关系,那么根据试验数据不能写出一个线性方程C.设x、y是具有线性相关关系的两个变量,且回归直线方程是(•召,则b?叫回归系数D.为使求出的回归直线方程有意义,可用统计假设检验的方法判断变量X与Y之间是否存在线性相关关系4.在一次试验中,测得(x, y)的四组值分别是A(1,2), B(2,3),C(3,4), D(4,5),则y 与x之间的回归直线方程为()A. y?=x1B. ?=x 2C. ? = 2x1D. y? = x-1C案合作探究1.回归直线方程的适用范围是什么?2.建立回归直线方程的一般步骤是什么?3.由回归直线方程得到的变量的值是真实值吗?例某工厂月份某种产品的产量与成本的统计数据见下表。
苏教版数学高二数学苏教版选修1-2课前引导1.2回归分析
1.2 回归分析课前导引问题导入19世纪德国统计学家恩格尔根据统计资料,对消费结构的变化得出一个规律:一个家庭收入越少,家庭收入中(或总支出中)用来购买食物的支出所占的比例就越大,随着家庭收入的增加,家庭收入中(或总支出中)用来购买食物的支出则会下降.推而广之,一个国家越穷,每个国民的平均收入中(或平均支出中)用于购买食物的支出所占比例就越大,随着国家的富裕,这个比例呈下降趋势.恩格尔系数是根据恩格尔定律得出的比例数,是表示生活水平高低的一个指标.其计算公如下:总支出金额食物支出金额恩格尔系数= 在我国,判定生活发展阶段的标准为:贫困>60%,温饱50%~60%小康40%~50%,富裕<40%据国家统计局统计显示,随着中国经济不断增长,城镇居民家庭恩格尔系数不断下降,恩格尔系数(%) 57.5 54.2 53.8 50.0 48.8 44.7 39.4 37.7 37.1年份 1978 1990 1992 1994 1996 1998 2000 2002 2003求:(1)根据年份预报恩格尔系数的回归方程;(2)预报2006年的恩格尔系数.解析:由于问题中要求根据年份预报恩格尔系数,因此选取年份为自变量x ,恩格尔系数为因变量y ,作散点图如下:(1)由最小二乘法得线性回归方程:yˆ=-0.901 8x +1 845.9 (2)有回归方程可知,2006年的恩格尔系数为-0.901 8×2 006+1 845.9=36.9.知识预览1.回归分析是对有__________的两个变量进行统计分析的常用方法,对两个具有__________关系的变量进行回归分析,我们采用求回归直线方程的方法.2.函数关系是一种__________关系,而相关关系是一种__________关系.3.在回归模型中,y 的值由x 和随机变量ε共同确定,x 称为是__________,ε称为是__________,y 称为是__________,总偏差平方和由__________和__________的总效应组成.4.由部分观测值得到的回归直线,可以对两个变量间的线性相关关系进行估计,这实际上是将__________转化成__________来进行研究.答案:1.相关关系 相关2.确定性 非确定性3.解释变量 随机误差 预报变量 误差平方和 回归平方和4.整体 部分5.对于x , y 随机取到的n 对数据(x i , y i )(i=1,2,…,n),样本相关系数r 的计算公为 ))y n(y )()x n(x ()y -)(y x -(x r n 1i 22i n1i 22i n 1i i i ∑∑∑===--= ))y n(y )()x n(x (y x n y x n 1i 22i n1i 22i n 1i i i∑∑∑===---= r 具有如下性质:(1)|r|≤1;(2)|r|越接近于1,x ,y 的线性相关程度越强;(3)|r|越接近于0,x , y 的线性相关程度越弱.。
2019-2020学年苏教版选修1-2 回归分析 学案
【例1】 ①线性回归分析就是由样本点去寻找一条直线,使之贴近这些样本点的数学方法; ②利用样本点的散点图可以直观判断两个变量的关系是否可以用线性关系表示; ③通过回归方程y ^=b ^x +a ^,可以估计和观测变量的取值和变化趋势;④因为由任何一组观测值都可以求得一个线性回归方程,所以没有必要进行相关性检验. 其中正确的命题是__________(填序号).(2)如果某地的财政收入x 与支出y 满足线性回归方程y ^=b ^x +a ^+e (单位:亿元),其中b ^=0.8,a ^=2,|e |≤0.5,如果今年该地区财政收入10亿元,则今年支出预计不会超过________亿.(1)①②③ (2)8.5 [(1)①反映的正是最小二乘法思想,故正确.②反映的是画散点图的作用,也正确.③解释的是回归方程y ^=b ^x +a ^的作用,故也正确.④在求回归方程之前必须进行相关性检验,以体现两变量的关系,故不正确.(2)由题意可得:y ^=0.8x +2+e ,当x =10时,y ^=0.8×10+2+e =10+e ,又|e |≤0.5,∴7.5≤y ^≤8.3.故今年支出预计不会超过8.5亿.]1.在分析两个变量的相关关系时,可根据样本数据散点图确定两个变量之间是否存在相关关系,然后利用最小二乘法求出回归直线方程.2.由线性回归方程给出的是一个预报值而非精确值. 1.随机误差的主要来源(1)线性回归模型与真实情况引起的误差; (2)省略了一些因素的影响产生的误差; (3)观测与计算产生的误差.1.下列有关线性回归的说法,不正确的是________(填序号).①自变量取值一定时,因变量的取值带有一定随机性的两个变量之间的关系叫做相关关系;②在平面直角坐标系中用描点的方法得到表示具有相关关系的两个量的一组数据的图形叫做散点图;③线性回归方程最能代表观测值x ,y 之间的关系; ④任何一组观测值都能得到具有代表意义的回归直线方程.④ [只有具有线性相关的两个观测值才能得到具有代表意义的回归直线方程.]【例2】(2)求物理成绩y 对数学成绩x 的回归直线方程; (3)一名学生的数学成绩是96,试预测他的物理成绩.[思路探究] 先画散点图,分析物理与数学成绩是否有线性相关关系,若相关,再利用线性回归模型求解.[解] (1)散点图如图所示.(2)由散点图可知y 与x 之间具有线性相关关系. 因为x -=15×(88+76+73+66+63)=71.2,y -=15×(78+65+71+64+61)=65.8,∑5i =1x i y i =88×78+76×65+73×71+66×64+63×61=25 054,∑5i =1x 2i =882+762+732+662+632=27 172.所以b ^=∑5i =1x i y i -5 x - y-∑5i =1x 2i -5(x -)2=25 054-5×73.2×67.827 174-5×73.22≈0.625, a ^=y --b ^x -≈65.8-0.625×71.2=22.03.所以y 对x 的回归直线方程是y ^=0.625x +22.03.(3)当x =96时,y ^=0.625×96+22.05≈82,即可以预测他的物理成绩是82.1.求线性回归方程的基本步骤2.需特别注意的是,只有在散点图大致呈直线时,求出的线性回归方程才有实际意义,否则求出的回归方程毫无意义.2.某商场经营一批进价是30元/台的小商品,在市场调查中发现,此商品的销售单价x (x 取整数)元与日销售量y 台之间有如下关系:方程的回归系数保留一位有效数字)(2)设经营此商品的日销售利润为P 元,根据(1)写出P 关于x 的函数关系式,并预测当销售单价x 为多少元时,才能获得最大日销售利润.[解] (1)散点图如图所示,从图中可以看出这些点大致分布在一条直线附近,因此两个变量线性相关.设回归直线为y ^=b ^x +a ^,由题知x -=42.5,y -=34,则求得b ^=∑4i =1x i y i -4x - y-∑4i =1x 2i -4(x -)2=-370125≈-3,a ^=y --b ^x -=34-(-3)×42.5=161.5,∴y ^=-3x +161.3.(2)依题意有P =(-3x +161.5)(x -30)=-3x 2+251.5x -4 845=-3⎝ ⎛⎭⎪⎫x -251.562+251.5212-4 843. ∴当x =251.56≈42时,P 有最大值,约为426,即预测销售单价为42元时,能获得最大日销售利润.[探究问题]1.作散点图的目的是什么?[提示] 直观分析数据是否存在线性相关关系.2.下表显示出变量y 随变量x 变化的一组数据,由此判断表示y 与x 之间的关系最可能的是________.(填序号)[提示] 画出散点图(图略),可以得到这些样本点在一条直线附近,故最可能是线性函数模型.故填①.【例3】 10名同学在高一和高二的数学成绩如下表:(1)y 与x 是否具有相关关系?(2)如果y 与x 具有线性相关关系,求回归直线方程.[思路探究] 可先计算线性相关系数r 的值,然后与r 0.05比较,进而对x 与y 的相关性做出判断.[解] (1)由已知表格中的数据,求得x =71,y =72.3,r =∑i =110(x i -x )(y i -y)∑i =110(x i -x )2∑i =110(y i -y)2≈0.76.由检验水平0.05及n -2=8,在课本附录2中查得r 0.05=0.632,因为0.78>0.632, 所以y 与x 之间具有很强的线性相关关系. (2)y 与x 具有线性相关关系,设回归直线方程为y ^=a ^+b ^x ,则有b ^=∑i =110(x i -x )(y i -y)∑i =110(x i -x )2≈1.22,a ^=y --b ^x -=72.3-1.22×71=-10.32.所以y 关于x 的回归直线方程为y ^=1.22x -10.32.1.线性回归分析必须进行相关性检验;若忽略,则所求回归方程没有实际意义. 2.|r |越接近于1,两变量相关性越强,|r |越接近于0,两变量相关性越弱.1.关于两个变量x 和y 的7组数据如下表所示:试判断x[解] x -=17×(21+23+25+27+29+32+35)≈25.4,y -=17×(7+11+21+24+66+115+325)≈81.3,∑7i =1x 2i =210+232+252+272+292+322+352=5 414,∑7i =1x i y i =21×7+23×11+25×21+27×24+29×66+32×115+35×325=18 542,∑7i =1y 2i =72+110+210+242+662+1152+3252=104 393,∴r =∑7i =1x i y i -7 x - y-(∑7i =1x 2i -7(x -)2)(∑7i =1y 2i -7(y -)2)=18 542-7×27.4×81.3(5 414-7×27.42)(124 393-7×81.32)≈0.837 3. ∵0.837 5>0.755,∴x 与y 之间具有线性相关关系.1.本节课的重点是线性回归方程的求法,及线性回归分析,相关关系;难点是恰当选择模型,求解回归方程.2.注意,回归直线方程一定过样本中心点(x ,y ).1.判断(正确的打“√”,错误的打“×”) (1)求回归直线方程前必须进行相关性检验.( ) (2)两个变量的相关系数越大,它们的相关程度越强.( ) (3)若相关系数r =0,则两变量x ,y 之间没有关系.( ) [答案] (1)√ (2)× (3)√2.某产品的广告费用x 与销售额y 的统计数据如下表:根据上表可得回归方程y =b x +a 中的b 为7.4,据此模型预报广告费用为6万元时销售额为( )A .61.6万元B .63.5万元C .65.7万元D .72.0万元B [样本点的中心是(1.5,42),则a ^=y --b ^x -=42-7.4×1.5=7.1,所以回归直线方程是y ^=7.4x +7.1,把x =6代入得y ^=63.3.]1.设某大学生的女生体重y (单位:kg)与身高x (单位:cm)具有线性相关关系.根据一组样本数据(x i ,y i )(i =1,2,…,n ),用最小二乘法建立的回归方程为y ^=0.85x -83.71,则下列结论中正确的是________(填序号).(1)y 与x 具有正的线性相关关系; (2)回归直线过样本点的中心(x ,y );(3)若该大学某女生身高增加1 cm ,则其体重约增加0.85 kg ; (4)若该大学某女生身高为170 cm ,则可断定其体重必为56.79 kg.(1)(2)(3) [回归方程中x 的系数为0.85>0,因此y 与x 具有正的线性相关关系,(1)正确;由回归方程系数的意义可知回归直线过样本点的中心(x ,y ),B 正确;∵回归方程y ^=0.85x -83.71,∴该大学某女生身高增加1 cm ,则其体重约增加0.85 kg ,(3)正确;(4)不正确.]2.某工厂为了对新研发的一种产品进行合理定价,将该产品按事先拟定的价格进行试销,得到如下数据:(1)求回归直线方程y =b x +a ,其中b =-20,a =y -b x ;(2)预计在今后的销售中,销量与单价仍然服从(1)中的关系,且该产品的成本是4元/件,为使工厂获得最大利润,该产品的单价应定为多少元?(利润=销售收入-成本)[解] (1)x =16(8+6.2+6.4+6.6+6.8+9)=6.5,y =16(90+84+83+80+75+68)=80.∵b ^=-20,a ^=y -b ^x , ∴a ^=80+20×6.5=250,∴回归直线方程为y ^=-20x +250.(2)设工厂获得的利润为L 元,则L =x (-20x +250)-4(-20x +250)=-20⎝⎛⎭⎪⎫x -3342+361.25,∴该产品的单价应定为334元时,工厂获得的利润最大.。
第3课时 回归分析 教案 高中数学苏教版 选修1-2
第一章统计案例
第3课时回归分析
教学目标:
1. 判断两个变量是否线性相关;
教学难点:
来研究两类变量是否相关;
会用统计量2
教学过程:
Ⅰ.问题情境
对一作直线运动的质点的运动过程作了8次观测,得到下表,试估计x=9s时的位置y的
Ⅱ.建构数学
1.线性回归模型
2.相关系数r的计算公式
Ⅲ.数学应用
例1 表中给出了我国从1949年至1999年人口数据资料,试根据表中数据估计我国2004年的
变式练习:某动物的5个化石标本中,股骨与肱骨的长度如下表所示,试计算两个变量的相关关系数,并求线性回归方程.
例2.表中是随机抽取的8对母女的身高数据,试根据这些数据探讨y与x之间的关系。
变式练习:为了研究大豆脂肪含量(x)和蛋白质含量(y)的关系,测定了9种大豆品种籽粒内的脂肪含量和蛋白质含量,得到如下表的数据,试求出y关于x的线性回归方程。
Ⅳ. 课时小结:
Ⅴ. 课堂检测
Ⅵ.课后作业
书本P20 1,2。
高中数学选修1-2教案:1.1回归分析的基本思想及其初步应用(二)
教学方案精美句子1、善思则能“从无字句处读书”。
读沙漠,读出了它坦荡豪放的胸怀;读太阳,读出了它普照万物的无私;读春雨,读出了它润物无声的柔情。
读大海,读出了它气势磅礴的豪情。
读石灰,读出了它粉身碎骨不变色的清白。
2、幸福幸福是“临行密密缝,意恐迟迟归”的牵挂;幸福是“春种一粒粟,秋收千颗子”的收获. 幸福是“采菊东篱下,悠然见南山”的闲适;幸福是“奇闻共欣赏,疑义相与析”的愉悦。
幸福是“随风潜入夜,润物细无声”的奉献;幸福是“夜来风雨声,花落知多少”的恬淡。
幸福是“零落成泥碾作尘,只有香如故”的圣洁。
幸福是“壮志饥餐胡虏肉,笑谈渴饮匈奴血”的豪壮。
幸福是“先天下之忧而忧,后天下之乐而乐”的胸怀。
幸福是“人生自古谁无死,留取丹心照汗青”的气节。
3、大自然的语言丰富多彩:从秋叶的飘零中,我们读出了季节的变换;从归雁的行列中,我读出了集体的力量;从冰雪的消融中,我们读出了春天的脚步;从穿石的滴水中,我们读出了坚持的可贵;从蜂蜜的浓香中,我们读出了勤劳的甜美。
4、成功与失败种子,如果害怕埋没,那它永远不能发芽。
鲜花,如果害怕凋谢,那它永远不能开放。
矿石,如果害怕焚烧(熔炉),那它永远不能成钢(炼成金子)。
蜡烛,如果害怕熄灭(燃烧),那它永远不能发光。
航船,如果害怕风浪,那它永远不能到达彼岸。
5、墙角的花,当你孤芳自赏时,天地便小了。
井底的蛙,当你自我欢唱时,视野便窄了。
笼中的鸟,当你安于供养时,自由便没了。
山中的石!当你背靠群峰时,意志就坚了。
水中的萍!当你随波逐流后,根基就没了。
空中的鸟!当你展翅蓝天中,宇宙就大了。
空中的雁!当你离开队伍时,危险就大了。
地下的煤!你燃烧自己后,贡献就大了6、朋友是什么?朋友是快乐日子里的一把吉它,尽情地为你弹奏生活的愉悦;朋友是忧伤日子里的一股春风,轻轻地为你拂去心中的愁云。
朋友是成功道路上的一位良师,热情的将你引向阳光的地带;朋友是失败苦闷中的一盏明灯,默默地为你驱赶心灵的阴霾。
高中数学选修1-2《回归分析基本思想及其初步应用》教案
高中数学选修1-2《回归分析基本思想及其初步应用》教案Teaching plan of 1-2 "basic idea of regression analysis and its p reliminary application" as an elective course in high school mat hematics高中数学选修1-2《回归分析基本思想及其初步应用》教案前言:数学是研究数量、结构、变化、空间以及信息等概念的一门学科,从某种角度看属于形式科学的一种,在人类历史发展和社会生活中,数学发挥着不可替代的作用,是学习和研究现代科学技术必不可少的基本工具。
本教案根据数学课程标准的要求和教学对象的特点,将教学诸要素有序安排,确定合适的教学方案的设想和计划、并以启迪发展学生智力为根本目的。
便于学习和使用,本文档下载后内容可按需编辑修改及打印。
教学要求:通过典型案例的探究,进一步了解回归分析的基本思想、方法及初步应用.教学重点:了解评价回归效果的三个统计量:总偏差平方和、残差平方和、回归平方和.教学难点:了解评价回归效果的三个统计量:总偏差平方和、残差平方和、回归平方和.教学过程:一、复习准备:1.由例1知,预报变量(体重)的值受解释变量(身高)或随机误差的影响.2.为了刻画预报变量(体重)的变化在多大程度上与解释变量(身高)有关?在多大程度上与随机误差有关?我们引入了评价回归效果的三个统计量:总偏差平方和、残差平方和、回归平方和.二、讲授新课:1.教学总偏差平方和、残差平方和、回归平方和:(1)总偏差平方和:所有单个样本值与样本均值差的平方和,即 .残差平方和:回归值与样本值差的平方和,即 .回归平方和:相应回归值与样本均值差的平方和,即 .(2)学习要领:①注意、、的区别;②预报变量的变化程度可以分解为由解释变量引起的变化程度与残差变量的变化程度之和,即 ;③当总偏差平方和相对固定时,残差平方和越小,则回归平方和越大,此时模型的拟合效果越好;④对于多个不同的模型,我们还可以引入相关指数来刻画回归的效果,它表示解释变量对预报变量变化的贡献率. 的值越大,说明残差平方和越小,也就是说模型拟合的效果越好.2.教学例题:例2 关于与有如下数据:2 4 5 6 830 40 60 50 70为了对、两个变量进行统计分析,现有以下两种线性模型:,,试比较哪一个模型拟合的效果更好.分析:既可分别求出两种模型下的总偏差平方和、残差平方和、回归平方和,也可分别求出两种模型下的相关指数,然后再进行比较,从而得出结论.-------- Designed By JinTai College ---------。
高中数学选修1-2《回归分析的基本思想及其初步应用》教案
高中数学选修1-2《回归分析的基本思想及其初步应用》教案教学目标:1.了解回归分析的基本概念和方法,学会使用回归分析方法对一些实际问题作出预测和分析。
2.能够正确理解和使用回归分析的基本统计量,包括相关系数、判定系数和残差等。
3.能够理解和描述回归分析的假设条件和前提条件,掌握回归分析的模型建立过程,并能正确应用到实际问题中。
教学重点:1.回归分析的基本概念和方法。
2.回归分析的统计量及其含义。
3.回归分析的模型建立过程。
教学难点:1.应用回归分析方法对实际问题进行预测和分析。
2.掌握回归分析模型的建立方法。
教学方法:1.讲授法2.实例分析法3.互动式教学法教学内容:第一节回归分析的基本概念和方法1.回归分析的概念和意义。
2.回归分析的基本模型和方程式。
3.单变量和多变量回归分析的区别和应用。
4.回归分析的基本假设条件和前提条件。
第二节回归分析的统计量及其含义1.相关系数的概念和计算方法。
2.判定系数的定义和计算方法。
3.残差的概念和含义。
4.其他相关统计量的应用。
第三节回归分析的模型建立过程1.数据的收集和清理。
2.变量的筛选和筛选标准。
3.模型的构建和检验。
4.模型的应用和预测。
教学方式:1.讲授。
通过讲解回归分析的概念、方法、统计量和模型建立过程等内容,让学生了解回归分析的基本概念和方法,为后续的案例分析打下基础。
2.案例分析。
通过实例分析法,将回归分析的理论知识与实际问题相结合,并引导学生从实际问题中理解和掌握回归分析的方法和应用。
3.互动式教学。
引导学生在互动交流中,理解和掌握回归分析的基本概念和方法,加深对回归分析的理解和认识。
教学评估:教师根据学生在课堂上的表现和课下的练习情况,对学生进行综合评价。
主要考核内容包括:学生对回归分析的概念和方法的理解程度、学生对回归分析应用的掌握情况、学生对回归分析的模型建立和检验能力、学生的综合分析和判断能力等。
据此评价学生的成绩,并作出相应的教学反思和改进。
2018-2019学年高中数学(苏教版)选修1-2同步学案:第1章 1.2 回归分析Word版含答案
1.2 回归分析学习目标 1.会建立线性回归模型分析两个变量间的相关关系.2.能通过相关系数判断两个变量间的线性相关程度.3.了解非线性回归分析.知识点一 线性回归模型思考 某电脑公司有5名产品推销员,其工作年限与年推销金额数据如下表:请问如何表示年推销金额y 与工作年限x 之间的相关关系?y 关于x 的线性回归方程是什么? 答案 画出散点图,由图可知,样本点散布在一条直线附近,因此可用回归直线表示两变量之间的相关关系.设所求的线性回归方程为y ^=b ^x +a ^,则b ^=i =15(x i -x )(y i -y )i =15(x i -x )2=1020=0.5, a ^=y -b ^x =0.4.所以年推销金额y 关于工作年限x 的线性回归方程为y ^=0.5x +0.4. 梳理 线性回归模型 (1)随机误差具有线性相关关系的两个变量的取值x ,y ,y 的值不能由x 完全确定,可将x ,y 之间的关系表示为y =a +bx +ε,其中a +bx 是确定性函数,ε称为随机误差.(2)随机误差产生的主要原因①所用的确定性函数不恰当引起的误差. ②忽略了某些因素的影响. ③存在观测误差.(3)线性回归模型中a ,b 值的求法 y =a +bx +ε称为线性回归模型.a ,b 的估计值为a ^,b ^,则⎩⎪⎨⎪⎧b ^=∑i =1n x i y i -n x y ∑i =1n x 2i-n (x )2,a ^=y -b ^x .(4)回归直线和线性回归方程直线y ^=a ^+b ^x 称为回归直线,此直线方程即为线性回归方程,a ^称为回归截距,b ^称为回归系数,y ^称为回归值. 知识点二 样本相关系数r具有相关关系的两个变量的线性回归方程为y ^=b ^x +a ^.思考1 变量y ^与真实值y 一样吗? 答案 不一定.思考2 变量y ^与真实值y 之间误差大了好还是小了好? 答案 越小越好.梳理 样本相关系数r 及其性质(1)r =∑i =1nx i y i -n x y(∑i =1nx 2i -n (x )2)(∑i =1ny 2i -n (y )2).(2)r 具有以下性质: ①|r |≤1.②|r |越接近于1,x ,y 的线性相关程度越强. ③|r |越接近于0,x ,y 的线性相关程度越弱.知识点三 对相关系数r 进行显著性检验的基本步骤 1.提出统计假设H 0:变量x ,y 不具有线性相关关系.2.如果以95%的把握作出判断,那么可以根据1-0.95=0.05与n -2在教材附录1中查出一个r 的临界值r 0.05(其中1-0.95=0.05称为检验水平). 3.计算样本相关系数r .4.作出统计推断:若|r |>r 0.05,则否定H 0,表明有95%的把握认为x 与y 之间具有线性相关关系;若|r |≤r 0.05,则没有理由拒绝原来的假设H 0,即就目前数据而言,没有充分理由认为y 与x 之间有线性相关关系.1.求线性回归方程前可以不进行相关性检验.( × )2.在残差图中,纵坐标为残差,横坐标可以选为样本编号.( √ ) 3.利用线性回归方程求出的值是准确值.( ×)类型一 求线性回归方程例1 某研究机构对高三学生的记忆力x 和判断力y 进行统计分析,得下表数据:(1)请画出上表数据的散点图;(2)请根据上表提供的数据,用最小二乘法求出y 关于x 的线性回归方程y ^=b ^x +a ^; (3)试根据求出的线性回归方程,预测记忆力为9的同学的判断力.⎝ ⎛⎭⎪⎪⎫相关公式:b ^=∑i =1n x i y i-n x y ∑i =1n x 2i-n (x )2,a ^=y -b ^x 考点 线性回归方程 题点 求线性回归方程解 (1)如图:(2)∑i =14x i y i =6×2+8×3+10×5+12×6=158,x =6+8+10+124=9,y =2+3+5+64=4,∑i =14x 2i =62+82+102+122=344,b ^=158-4×9×4344-4×92=1420=0.7,a ^=y -b ^x =4-0.7×9=-2.3,故线性回归方程为y ^=0.7x -2.3.(3)由(2)中线性回归方程可知,当x =9时,y ^=0.7×9-2.3=4,预测记忆力为9的同学的判断力约为4.反思与感悟 (1)求线性回归方程的基本步骤①列出散点图,从直观上分析数据间是否存在线性相关关系. ②计算:x ,y,∑i =1nx 2i ,∑i =1nx i y i . ③代入公式求出y ^=b ^x +a ^中参数b ^,a ^的值. ④写出线性回归方程并对实际问题作出估计.(2)需特别注意的是,只有在散点图大致呈线性时,求出的回归方程才有实际意义. 跟踪训练1 某班5名学生的数学和物理成绩如下表:。
高中数学第1章统计案例1.2回归分析学案苏教版选修1-2(2021年整理)
2018年高中数学第1章统计案例1.2 回归分析学案苏教版选修1-2 编辑整理:尊敬的读者朋友们:这里是精品文档编辑中心,本文档内容是由我和我的同事精心编辑整理后发布的,发布之前我们对文中内容进行仔细校对,但是难免会有疏漏的地方,但是任然希望(2018年高中数学第1章统计案例1.2 回归分析学案苏教版选修1-2)的内容能够给您的工作和学习带来便利。
同时也真诚的希望收到您的建议和反馈,这将是我们进步的源泉,前进的动力。
本文可编辑可修改,如果觉得对您有帮助请收藏以便随时查阅,最后祝您生活愉快业绩进步,以下为2018年高中数学第1章统计案例1.2 回归分析学案苏教版选修1-2的全部内容。
1.2 回归分析1.线性回归模型(1)线性回归模型y=a+bx+ε,其中a+bx是确定性函数,ε称为随机误差.(2)随机误差产生的原因主要有以下几种:①所用的确定性函数不恰当引起误差;②忽略了某种因素的影响;③存在观测误差.(3)在线性回归方程错误!=错误!+错误!x中错误!=错误!=错误!,错误!=错误!-错误!错误!(其中错误!=错误!错误!i,错误!=错误!错误!i).其中,错误!,错误!分别为a,b的估计值,错误!称为回归截距,错误!称为回归系数,错误!称为回归值.2.相关系数(1)计算两个随机变量间线性相关系数的公式错误!错误!=错误!(2)r具有如下性质:①|r|≤1;②|r|越接近于1,x,y的线性相关程度越强;③|r|越接近于0,x,y的线性相关程度越弱.3.对相关系数进行显著性检验的基本步骤(1)提出统计假设H0:变量x,y不具有线性相关关系;(2)如果以95%的把握作出判断,那么可以根据1-0.95=0。
05与n-2在教材附录1中查出一个r的临界值r0。
05(其中1-0。
95=0。
05称为检验水平);(3)计算样本相关系数r;(4)作出统计推断:若|r|〉r0.05,则否定H0,表明有95%的把握认为x与y之间具有线性相关关系;若|r|≤r0.05,则没有理由拒绝原来的假设H0,即就目前数据而言,没有充分理由认为y与x之间有线性相关关系.我们把相关关系(不确定性关系)转化为函数关系(确定性关系),当两个具有相关关系的变量近似地满足一次函数关系时,我们所求出的函数关系式错误!=错误!+错误!x就是回归直线方程.求回归直线方程的一般方法是借助于工作软件求出回归直线方程,也可以利用计算器计算出错误!,再由错误!=错误!-错误!错误!求出错误!,写出回归直线方程错误!=错误!x+错误!.计算时应注意:(1)求错误!时,利用公式错误!=错误!,先求出错误!=错误!(x1+x2+…+x n),错误!=错误!(y1+y2+…+y n),错误!i y i=x1y1+x2y2+…+x n y n,错误!错误!=x错误!+x错误!+…+x错误!.再由错误!=错误!-错误!错误!求出错误!的值,并写出回归直线方程.(2)线性回归方程中的截距错误!和斜率错误!都是通过样本估计而来的,存在着误差,这种误差可能导致估计结果的偏差.(3)回归直线方程错误!=错误!+错误!x中的错误!表示x增加1个单位时,错误!的变化量为错误!,而错误!表示错误!不随x的变化而变化的部分.(4)可以利用回归直线方程错误!=错误!+错误!x求在x取某一个值时y的估计值.[例1]假设关于某设备的使用年限x(年)和所支出的维修费用y(万元)有如下的统计资料:x23456y2。
苏教版数学高二- 选修1-2教案 1.2回归分析的基本思想2
教学总偏差平方和、残差平方和、回归平方和:
总偏差平方和:所有单个样本值与样本均值差的平方和,即 .
残差平方和:回归值与样本值差的平方和,即 .
回归平方和:相应回归值与样本均值差的平方和,即 .
三、质疑探究
学习要领:
①注意 、 、 的区别;
②预报变量的变化程度可以分解为由解释变量引起的变化程度与残差变量的变化程度之和,即 ;
③当总偏差平方和相对固定时,残差平方和越小,则回归平方和越大,此时模型的拟合效果越好;
④对于多个不同的模型,我们还可以引入相关指数 来刻画回归的效果,它表示解释变量对预报变量变化的贡献率. 的值越大,说明残差平方和越小,也就是说模型拟合的效果越好.
四、精讲点拨
关于 与 有如下数据:
2
4
5
6
8
30
40
五、当堂检测
1.在两个变量的回归分析中,做散点图的目的是什么?
2.在回归分析中,分析残差能够帮助我们解决哪些问题?
六、作业布置课本P9第3题
板
书
设
计
1.总偏差平方和、残差平方和、回归平方和
2.学习要领:①注意 、 、 的区别;
②预报变量的变化程度可以分解为由解释变量引起的变化程平方和相对固定时,残差平方和越小,则回归平方和越大,此时模型的拟合效果越好;
[例2]为了对 、 两个变量进行统计分析,现有以下两种线性模型: , ,试比较哪一个模型拟合的效果更好.
教学反思
教学难点解释残差变量的含义,了解偏差平方和分解的思想.
教学设想
教法
引导探究
学法
合作交流
教具
多媒体,直尺
课堂设计
一、目标展示
高中数学 12 回归分析教案 苏教版选修1-2 教案
图 #0!0"
!
统计案例
第章
变量3 与2 之间的关系!
$ 本相关系数通过公式算出" 的值作出 统 计 推 断若#"#&
!! 点 拨 散点图能帮 助 我 们 发 现 变 量 之 间 的 线 性 关 系 直 $ ")!)'则否定 #)表明有-'.的把握认为3 与2 之间具有线
观地反映了数据的变化规律!
合计
工作积极
'%
工作一般
"!
%)
-%
("
-'
合计
,(
#)"
#,-
&!'提 出 假 设
#)!企业的全体员工对待企业改 革 的 态 度 与 其 工 作 积
极性无关!
根 据 &#'中 列 联 表 的 数 据 #可 以 求 得
!
*#,--$%&$'%-'$$(",(*$%)#)$""!'!
+
%34'#我们希望 总 误 差 越 小 越 好#即 要 使 )4! 4*#
越 小 越 好!于
$ $
+
$
12*1$&1%3*)!(-%,1)!+""3! &!'由上述&#'中 求 出 的 回 归 直 线 方 程#把 3*#!-' 代
是 #只 要 求 出 使
5&#'* ) &24)34)'! 4*#
#)!+'-+!,+-#
高中数学第1章统计案例1.2回归分析课堂导学案苏教版选修1-2(2021学年)
高中数学第1章统计案例1.2回归分析课堂导学案苏教版选修1-2 编辑整理:尊敬的读者朋友们:这里是精品文档编辑中心,本文档内容是由我和我的同事精心编辑整理后发布的,发布之前我们对文中内容进行仔细校对,但是难免会有疏漏的地方,但是任然希望(高中数学第1章统计案例1.2 回归分析课堂导学案苏教版选修1-2)的内容能够给您的工作和学习带来便利。
同时也真诚的希望收到您的建议和反馈,这将是我们进步的源泉,前进的动力。
本文可编辑可修改,如果觉得对您有帮助请收藏以便随时查阅,最后祝您生活愉快业绩进步,以下为高中数学第1章统计案例 1.2 回归分析课堂导学案苏教版选修1-2的全部内容。
1.2 回归分析课堂导学三点剖析各个击破一、求线性回归方程【例1】研究某灌溉渠道水的流速y与水深x之间的关系,测得一组数据如下:水深x(m)1。
401。
501。
601.701.801。
902。
00 2.10流速y(m/s)1.701。
791.881。
952。
03 2.102.162。
21(1)求y对x的回归直线方程;(2)预测水深为1。
95 m时水的流速是多少?解:(1)散点图如下图所示。
列表计算aˆ与回归系数bˆ。
序号xiyixi2yi2xiyi11。
401.701。
962。
890 2.38021。
50 1.792。
253。
20412。
6853 1.601。
882。
56 3.53443。
0084 1.701。
952.893。
8025 3.315 51.802。
033.244.1209 3.654于是75.1148x =⨯=,9775.182.158y =⨯=,∑x i 2=24。
92,∑y i 2=31.511 6,∑xi y i =27.993, ∴275.1892.249775.175.18993.27ˆ⨯-⨯⨯-=b≈0.733, x ˆ-y ˆb a==1.977 5-0.733×1.75=0.694 8, ∴y 对x 的回归直线方程为x ˆˆˆb a y+==0.694 8+0。
近年高中数学第1章统计案例1.2回归分析(二)学案苏教版选修1-2(2021年整理)
2018高中数学第1章统计案例1.2 回归分析(二)学案苏教版选修1-2 编辑整理:尊敬的读者朋友们:这里是精品文档编辑中心,本文档内容是由我和我的同事精心编辑整理后发布的,发布之前我们对文中内容进行仔细校对,但是难免会有疏漏的地方,但是任然希望(2018高中数学第1章统计案例1.2 回归分析(二)学案苏教版选修1-2)的内容能够给您的工作和学习带来便利。
同时也真诚的希望收到您的建议和反馈,这将是我们进步的源泉,前进的动力。
本文可编辑可修改,如果觉得对您有帮助请收藏以便随时查阅,最后祝您生活愉快业绩进步,以下为2018高中数学第1章统计案例1.2 回归分析(二)学案苏教版选修1-2的全部内容。
§1.2回归分析(二)课时目标 1.会对变量x与y进行相关性检验.2.进一步理解回归分析的基本思想.1.根据给定的样本数据,求得的线性回归方程未必有实际意义.2.对相关系数r进行显著性检验的基本步骤如下:(1)提出统计假设H0:变量x,y________________;(2)如果以95%的把握作出推断,可以根据1-0。
95=0。
05与n-2在附录1中查出一个r的__________(其中1-0.95=0.05称为____________);(3)计算__________________;(4)作出统计推断:若__________,则否定H0,表明有________的把握认为x与y之间具有__________________;若________,则没有理由拒绝原来的假设H0,即就目前数据而言,没有充分理由认为x与y之间有__________________.一、填空题1.下列说法正确的是________.(填序号)①y=2x2+1中的x、y是具有相关关系的两个变量②正四面体的体积与其棱长具有相关关系③电脑的销售量与电脑的价格之间是一种确定性的关系④传染病医院感染甲型H1N1流感的医务人员数与医院收治的甲型流感人数是具有相关关系的两个变量2.某考察团对全国10大城市进行职工人均工资水平x(千元)与居民人均消费水平y(千元)统计调查,y与x具有相关关系,线性回归方程为错误!=0.66x+1.562,若某城市居民人均消费水平为7。
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
1.2 回归分析知识梳理1.回归直线方程为______________________,其中aˆ=___________,bˆ=___________.2.回归直线不能精确地反映x与y之间的关系,y的值不能由x完全确定,它们之间是___________关系,y=a+bx+ε,其中___________是确定性函数,ε称为___________,将___________称为线性回归模型.3.随机误差产生的主要原因有:(1)所用的确立性函数不恰当引起的误差;(2)____________________________________________________________________;(3)____________________________________________________________________.4.对于x、y随机取到的n对数据(x i,y i)(i=1,2,…,n),样本相关系数γ的计算公式为γ=____________________________________________________________________=____________________________________________________________________.5.线性相关系数γ的性质:(1)|γ|≤1;(2)|γ|越接近于__________,y的线性相关程序越强;(3)|γ|越接近于__________,y的线性相关程序越弱.知识导学在研究两个变量之间的关系时,首先可以利用散点图来粗略判断它们是否线性相关,是否可以用线性回归模型来拟合数据.作相关检验的依据可以利用样本相关系数γ,当γ>0时,表明x与y正相关;γ<0时,表明x与y负相关;当|γ|→1时,表明x与y的线性相关性越强;当|γ|→0时,表明x与y的线性相关性越弱,几乎不存在线性相关的关系.疑难突破1.建立回归模型的基本步骤是什么呢?一般地,建立回归模型的基本步骤是:(1)确定研究对象,明确哪个变量是解释变量,哪个变量是预报变量.(2)画出确定好的解释变量和预报变量的散点图,观察它们之间的关系.(例如是否存在线性关系等)(3)由经验确定回归方程的类型(如果我们观察到数据是线性关系,则选用线性回归方程y=bx+a).(4)按一定的规则估计回归方程中的参数(如最小二乘法).2.在应用回归直线方程解决问题时,应注意些什么呢?(1)回归直线方程只适合于我们所研究的样本的总体.例如:不能用女大学生的身高与体重之间的回归直线方程,描述女运动员的身高和体重之间的关系.同样,不能用生长在南方多雨地区的树木的高与直径之间的回归直线方程,来描述北方干旱地区树木的高与直径之间的关系.(2)我们所建立的回归直线方程一般都有时间性.例如:不能用20世纪80年代人的身高、体重数据所建立的回归方程,描述现在人的身高、体重间的关系.(3)样本取值的范围会影响回归方程的适用范围,例如:我们的回归直线方程是由女大学生身高和体重的数据建立的,那么用它来描述一个人幼儿时期的身高和体重之间的关系就不恰当. (4)不能认为回归直线方程得到的预报值就是预报变量的精确值.事实上,它是预报变量可能取值的平均值. 典题精讲 【例1】 为了了解某地母亲身高x 与女儿身高y 的相关关系,现随机测得10对母女的身高,所得数据如下表所示:母亲身高x(cm) 159 160 160 163 159 154 159 158 159 157 女儿身高y(cm) 158 159 160 161 161 155 162 157 162 156试对x 与y 进行线性回归分析,并预测当母亲身高为161 cm 时,女儿的身高为多少? 思路分析:这是一个回归分析类问题,解决这一类问题,首先应对问题进行必要的相关性检验,如果x 与y 之间具有相关关系,再求出对应的回归直线方程,最后利用回归直线方程来预报当x=161 cm 时y 的值,当γ>0时,表明x 与y 正相关,γ<0时,表明x 与y 负相关,当|γ|→1时,表明x 与y 的线性相关越强,当|γ|→0时,表明x 与y 的相关性越弱,几乎不存在相关关系,通常认为当γ>0.75时,变量x 、y 有很强的相关关系,因而求回归直线方程才有意义,也才可以预测取值的情况. 解:作线性相关性检验,x =101×(159+160+…+157)=158.8. y =101×(158+159+…+156)=159.1 ∑2ix-102x =(1592+1602+…+1572)-10×158.82=47.6∑iiyx -y x 10=(159×158+160×159+…+157×156)-10×158.8×159.1=37.2∑2iy -102y =(1582+1592+…+1562)-10×159.12=56.9 因此γ=∑∑∑---)()((2222y n y x n x yx n yx i i ii=9.466.472.37⨯≈0.71由于0.71接近于1,表明x 与y 有较强的相关关系,因而求回归直线方程有必要.又bˆ=6.472.3722=--∑∑x n x y x n y x ii i =0.78 aˆ=159.1-0.78×158.8=35.2 由此得回归直线方程为yˆ=35.2+0.78x;回归系数=0.78反映出当母亲身高每增加1 cm 时女儿身高平均增加0.78 cm, aˆ=35.2可以理解为女儿身高中不受母亲身高影响的部分,当母亲身高为161 cm 时预报女儿身高为:y ˆ=0.78×161+35.2=160.78≈161 cm,这就是说当母亲身高为161 cm 时,女儿身高大致也为161 cm.绿色通道:判断x 与y 是否具有线性相关关系,还可以先作出散点图,从点的分布特征来判定是否线性相关.黑色陷阱:有些同学不对问题进行必要的相关性检验,直接求x 与y 的回归直线方程,它就没有任何实际价值,也就不能发现变量x 与y 间的变化规律,另外,要注意计算的正确性. 【变式训练】某班5名学生的数学和化学成绩如下表所示,对x 与y 进行回归分析,并预报某学生数学成绩为75分时,他的化学成绩是多少?学生学科 A B C D E数学成绩(x) 88 76 73 66 63 化学成绩(y) 78 65 71 64 61 解:对x 与y 作相关性判断.x =51×(88+76+73+66+63)=73.2 y =51×(78+65+71+64+61)=67.8 2i x z =882+762+732+662+632=27 174 2i y z =782+652+712+642+612=23 167i i y x z =88×78+76×65+71×73+64×66+61×63=25 054∴2i x z -25x =27 174-5×73.22=382.8i i y x z -y x 5=25 054-5×73.2×67.8=239.2 2i y z -y 5=23 167-5×67.82=182.8∴r=8.1828.3822.239⨯≈0.904.由于|r |=0.904接近于1,表明两个变量之间存在着线性相关关系.∴22.735271742.239ˆ⨯-=b≈0.625, x b y aˆˆ-==67.8-73.2×0.625=22.05 yˆ=0.625x+22.05 ∴当x=75时,≈69. 故次时他的化学成绩为69分.【例2】 一个车间为了规定工时定额,需要确定加工零件所花费的时间,为此进行了10次试验,测得数据如下: 零件数x(个) 10 20 30 40 50 60 70 80 90 100 加工时间y(个) 62 68 75 81 89 95 102 108 115 122 (1)y 与x 是否具有线性相关关系;(2)如果y 与x 具有线性相关关系,求回归直线方程;(3)根据求出的回归直线方程,预测加工200个零件所用的时间为多少.思路分析:这是一个回归分析问题,应先进行线性相关检验或作散点图来判断x 与y 是否具有线性相关关系,如果线性相关,才可以求解后面的问题,否则就使得求回归直线方程没有意义.要作相关性检验,应先利用γ. γ=∑∑∑--∙-)()(2222y n y x n xyx n yx iii i求出样本相关系数γ,利用当γ>0时,两个变量正相关;当γ<0时,两个变量负相关;当|γ|→1时,表明两个变量的线性相关性越强;当|γ|→0时,表明两个变量之间几乎不存在线性相关关系;当γ>0.75时,认为两个变量有很强的线性相关关系. 解:(1)列出下表: i 1 2 3 4 5 6 7 8 9 10 x i 10 20 30 40 50 60 70 80 90 100 y i 62 68 75 81 89 95 102 108 115 122 x i y i 620 1 360 2 250 3 240 4 450 5 700 7 140 8 640 10350 12200 ∴x =55, y =91.7∑∑∑======10110121012.55950,87777,38500i i i i i i iy x y x∴γ=∑∑∑===---1012210122101)10()10(10i i i i i iiy y x x yx yx=22)7.911987777()551038500(7.91551055950⨯-⨯⨯-⨯⨯-≈0.999 8由于γ=0.999 8>0.75,因此x 与y 之间有很强的线性相关关系,因而可求回归直线方程.(2)设所求的回归直线方程为=a x b yˆˆˆ+=. 则有bˆ=2101221015510385007.915510559501010⨯-⨯⨯-=--∑∑==i ii ii x x yx yx ≈0.668 x b y a-=ˆ=91.7-0.668×55=54.96. 因此,所求的回归直线方程为y=0.668x+54.96.(3)这个回归直线方程的意义是当x 每增大1时,y 的值约增加0.668,而54.96是y 不随x 增加而变化的部分,因此,当x=200时,y 的估计值为y=0.668×200+54.96=188.56≈189. 因此,加工200个零件时所用的工时约为189个. 【变式训练】 对于x 与y 有如下观测数据: X 18 25 30 39 41 42 49 52 Y 3 5 6 7 8 8 9 10 (1)作出散点图;(2)对x 与y 作回归分析;(3)求出x 对y 的回归直线方程___________________; (4)根据回归直线方程,预测y=20时的x 值. 解:(1)作出散点图(如下图所示)(2)作相关性检验.81=x ×(18+25+30+39+41+42+49+52)=8296=37 81=y ×(3+5+6+7+8+8+9+10)=7.∑=812i ix=182+252+302+392+412+422+492+522=11 920∑=812i iy=32+52+62+72+82+82+92+102=428∑=81i ii yx =18×3+25×5+30×6+39×7+41×8+42×8+49×9+52×10=2 257∴∑=81i ii yx -y x 8=2 257-8×37×7=185∑=812i ix-28x =11 920-8×372=968.∑=812i iy-28y =428-8×72=36∴r=)((2222y n y z x n x y x n y x z iii i ---∑=36968185⨯≈0.991由于r=0.991>0.75,因此,认为两个变量有很强的相关关系;(3)回归系数=2223781192073782257ˆ⨯-⨯⨯-=--=∑∑x n xy x n yx biii≈0.191x b y aˆˆ-==7-0.191×37=-0.067. 所以y 对x 的回归直线方程yˆ=0.191x-0.067; (4)当y=20时,有20=0.191x-0.067, ∴x=191.0067.20≈105.因此在y 的值为20时,x 的值约为105.【例3】 某种图书每册的成本费y(元)与印刷册数x(千册)有关,经统计得到数据如下, x 1 2 3 5 10 20 30 50 100 200 y 10.15 5.52 4.08 2.85 2.11 1.62 1.41 1.30 1.21 1.15 检测每册书的成本费y 与印刷册数的倒数x1之间是否具有线性相关关系,如有,求出y 对x 的回归方程.思路分析:本题与前面的问题有所不同,y 与x 之间不具有线性回归关系,因而是非线性回归问题,对于非线性回归问题有时不给出经验公式,这时我们可以画出已知数据的散点图,把它与必修1中学过的基本初等函数(幂函数、指数函数、对数函数)图象作比较,挑选一种跟这些散点拟合得最好的函数,然后采用适当的变量置换,把问题化为线性回归分析问题,使其得到解决.对于本题不妨设变量u=x1,题意要求对u 与y 作相关性检验,如果他们具有线性相关关系,就可以进一步求出y 对u 的回归直线方程,这时再回代u=x1,就得到了y对x 的回归曲线方程. 解:首先作变量置换u=x1,题目所给数据变成如下表所示的数据. u i 1 0.5 0.33 0.2 0.1 0.05 0.03 0.02 0.01 0.005 y i10.15 5.524.082.85 2.11 1.62 1.41 1.30 1.21 1.15可以求得,γ=∑∑∑===----ni in i ini iiy y x x y y x x 12121)()())((=0.999 8由γ=0.999 8>0.75,因此,变量y 与u i 间具有较强的线性相关关系,并且bˆ=8.973, x b y aˆˆ-==1.125. 最后回代a=x 1可得y ˆ=1.125+x973.8因此,y 与x 的回归方程为yˆ=1.125+x973.8. 【变式训练】 一只红铃虫的产卵数y 和温度x 有关,现收集了7组观测数据列成下表,试建立y 与x 之间的回归方程. 温度x/℃ 21 23 25 27 29 32 35 产卵数y/个 7 11 21 24 66 115 325解:根据收集的数据,作散点图,如下图.从图中可以看出,样本点并没有分布在某个带状区域内,因此两个变量不呈线性相关关系,所以不能直接利用线性回归方程来建立两个变量之间的关系,根据已有的函数知识,可以发现样本点分布在某一条直数函数曲线y=xC eC 21附近,其中C 1、C 2为待定的参数,我们可以通过对数变换把指数关系变为线性关系,令z=lgy,则变换后样本点分布在直线z=bx+a(a=lnC 1,b=lnC 2)的附近,这样可以利用线性回归建立y 与x 的非线性回归方程了.变换的样本点分布在一条直线的附近,因此可以用线性回归方程来拟合. 由上表中的数据可得到变换的样本数据表如下表:x 21 23 25 27 29 32 35 y 1.946 2.398 3.045 3.178 4.190 4.745 5.784可以求得线性回归直线方程为zˆ=0.272x-3.843 因此红铃虫的产卵数对温度的非线性回归方程为yˆ=e 0.272x-3.843,另一方面,可以认为图中的样本点集中在某二次曲线y=423C x C 的附近,其中C 3、C 4为待定参数,因此可以对温度变量进行变换,令t=x 2,然后建立y 与t 之间的线性回归方程.从而得到y 与x 之间的非线性回归方程.下表是红铃虫的产卵数和对应温度的平方的线性回归模型拟合表,作出相应的散点图如下图所示:t 441 529 625 729 841 1 024 1 225 y 7 11 21 24 66 115 325从图中可以看出,y 与t 的散点图并不分布在一条直线的周围,因此不宜用线性回归方程来拟合它,即不宜用二次函数y=C 3x 2+C 4来拟合x 与y 之间的关系,因此利用=e 0.272x-3.843来拟合效果较好. 问题探究问题:在利用线性回归模型解决实际问题的时候,应怎样合理建模,形成规律,总结方法呢?导思:在解决实际问题时,如何理解实际背景呢?线性回归模型与一次函数有什么不同呢?产生随机误差的原因是什么呢?探究:在解决实际问题时,常需要推断,在推断时,不能仅凭主观意愿作出结论,而是需要理清实际背景,要通过实验来收集数据,并根据独立性检验的原理做出合理的推断.散点图可以形象地展示两个变量的关系,把数据用散点图表示出来,可以直观地了解两个变量的关系,常用横坐标表示解释变量,用纵坐标表示预报变量.在散点图上画回归直线,回归直线与原始数据拟合的情况,直观地反应了回归直线和散点间的关系.在实际问题中,线性回归模型适用的范围要比一次函数大得多.当残差变量恒等于0时,线性回归模型就变成一次函数模型.因此,一次函数模型是线性回归模型的特殊形式,线性回归模型是一次函数模型的一般形式.随机误差产生的主要原因:一是所用的确定性函数不恰当引起的误差;二是忽略了某种因素的影响;三是存在观测误差,由于测量工具等原因,导致y的观测值产生误差.但误差越小,说明回归模型的拟合效果越好.。