2018年苏教版版数学选修2-3第3章 3.2 回归分析 学业分层测评
江苏省高二数学苏教版选修2-3教案:3.2 回归分析3
3.2回归分析(1)教学目标(1)通过实例引入线性回归模型,感受产生随机误差的原因;(2)通过对回归模型的合理性等问题的研究,渗透线性回归分析的思想和方法; (3)能求出简单实际问题的线性回归方程. 教学重点,难点线性回归模型的建立和线性回归系数的最佳估计值的探求方法. 教学过程 一.问题情境1. 情境:对一作直线运动的质点的运动过程观测了次,得到如下表所示的数据,试估计当先作散点图,如下图所示:从散点图中可以看出,样本点呈直线趋势,时间与位置观测值y 之间有着较好的线性关系.因此可以用线性回归方程来刻画它们之间的关系.根据线性回归的系数公式,1221()ni i i ni i x y nx y b x n x a y bx==⎧-⎪⎪=⎪⎨-⎪⎪=-⎪⎩∑∑ 可以得到线性回归方为 3.5361 2.1214y x =+,所以当9x =时,由线性回归方程可以估计其位置值为22.6287y =2.问题:在时刻9x =时,质点的运动位置一定是22.6287cm 吗?二.学生活动思考,讨论:这些点并不都在同一条直线上,上述直线并不能精确地反映与y 之间的关系,y 的值不能由完全确定,它们之间是统计相关关系,y 的实际值与估计值之间存在着误差. 三.建构数学1.线性回归模型的定义:我们将用于估计y 值的线性函数a bx +作为确定性函数;y 的实际值与估计值之间的误差记为,称之为随机误差;将y a bx ε=++称为线性回归模型. 说明:(1)产生随机误差的主要原因有:①所用的确定性函数不恰当引起的误差; ②忽略了某些因素的影响; ③存在观测误差.(2)对于线性回归模型,我们应该考虑下面两个问题: ①模型是否合理(这个问题在下一节课解决); ②在模型合理的情况下,如何估计,? 2.探求线性回归系数的最佳估计值:对于问题②,设有对观测数据(,)i i x y (1,2,3,,)i n =,根据线性回归模型,对于每一个i x ,对应的随机误差项()i i i y a bx ε=-+,我们希望总误差越小越好,即要使21nii ε=∑越小越好.所以,只要求出使21(,)()niii Q y x αββα==--∑取得最小值时的α,β值作为,的估计值,记为,.注:这里的i ε就是拟合直线上的点(),i i x a bx +到点(),i i i P x y 的距离.用什么方法求,?回忆《数学3(必修)》“2.4线性回归方程”P71“热茶问题”中求,的方法:最小二乘法.利用最小二乘法可以得到,的计算公式为1122211()()()()nni i iii i nni ii i x x y y x ynx yb x x xn x a y bx====⎧---⎪⎪==⎪⎨--⎪⎪=-⎪⎩∑∑∑∑,其中11n i i x x n ==∑,11ni i y y n ==∑由此得到的直线y a bx =+就称为这对数据的回归直线,此直线方程即为线性回归方程.其中,分别为,的估计值,称为回归截距,称为回归系数,y 称为回归值. 在前面质点运动的线性回归方程 3.5361 2.1214y x =+中, 3.5361a =, 2.1214b =. 3. 线性回归方程y a bx =+中,的意义是:以为基数,每增加1个单位,y 相应地平均增加个单位;4. 化归思想(转化思想)在实际问题中,有时两个变量之间的关系并不是线性关系,这就需要我们根据专业知识或散点图,对某些特殊的非线性关系,选择适当的变量代换,把非线性方程转化为线性回归方程,从而确定未知参数.下面列举出一些常见的曲线方程,并给出相应的化为线性回归方程的换元公式.(1)b y a x =+,令'y y =,1'x x=,则有''y a bx =+. (2)by ax =,令'ln y y =,'ln x x =,'ln a a =,则有'''y a bx =+. (3)bxy ae =,令'ln y y =,'x x =,'ln a a =,则有'''y a bx =+. (4)b x y ae =,令'ln y y =,1'x x=,'ln a a =,则有'''y a bx =+. (5)ln y a b x =+,令'y y =,'ln x x =,则有''y a bx =+.四.数学运用 1.例题:例1.下表给出了我国从1949年至1999年人口数据资料,试根据表中数据估计我国2004年的人口数.解:为了简化数据,先将年份减去1949,并将所得值用表示,对应人口数用y 表示,得807 909 975 1035 1107 1177 1246作出11个点(),x y 构成的散点图,由图可知,这些点在一条直线附近,可以用线性回归模型y a bx ε=++来表示它们之间的关系.根据公式(1)可得14.453,527.591.b a ⎧≈⎪⎨≈⎪⎩ 这里的,a b 分别为,a b 的估 计值,因此线性回归方程 为527.59114.453y x =+由于2004年对应的55x =,代入线性回归方程527.59114.453y x =+可得1322.50y =(百万),即2004年的人口总数估计为13.23亿.例2. 某地区对本地的企业进行了一次抽样调查,下表是这次抽查中所得到的各企业的人均资本(万元)与人均产出y (万元)的数据:(1)设y 与之间具有近似关系by ax ≈(,a b 为常数),试根据表中数据估计和的值; (2)估计企业人均资本为16万元时的人均产出(精确到0.01).分析:根据,y 所具有的关系可知,此问题不是线性回归问题,不能直接用线性回归方程处理.但由对数运算的性质可知,只要对by ax ≈的两边取对数,就能将其转化为线性关系.解(1)在by ax ≈的两边取常用对数,可得lg lg lg y a b x ≈+,设lg y z =,lg a A =,lg x X =,则z A bX ≈+.相关数据计算如图327--所示.仿照问题情境可得A ,的估计值A ,分别为0.2155,1.5677,A b ⎧=-⎪⎨=⎪⎩由lg 0.2155a =-可得0.6088a ≈,即,的估计值分别为0.6088和1.5677.(2)由(1)知1.56770.6088y x =.样本数据及回归曲线的图形如图328--(见书本102P页)当16x =时, 1.56770.60881647.01y =⨯≈(万元),故当企业人均资本为16万元时,人均产值约为47.01万元. 2.练习:104P 练习第题. 五.回顾小结:1. 线性回归模型y a bx ε=++与确定性函数y a bx =+相比,它表示y 与之间是统计相关关系(非确定性关系)其中的随机误差提供了选择模型的准则以及在模型合理的情况下探求最佳估计值,的工具;2. 线性回归方程y a bx =+中,的意义是:以为基数,每增加1个单位,y 相应地平均增加个单位;3.求线性回归方程的基本步骤. 六.课外作业:.。
高中数学选修2-3第三章课后习题解答
新课程标准数学选修2—3第三章课后习题解答第三章统计案例3.1回归分析的基本思想及其初步应用练习(P89)1、画散点图的目的是通过变量的散点图判断两个变量更近似于什么样的函数关系,以确定是否直接用线性回归模型来拟合原始数据.说明:学生在对常用的函数图象比较了解的情况下,通过观察散点图可以判断两个变量的关系更近似于哪种函数.2、分析残差可以帮助我们解决以下两个问题:①寻找异常点,就是残差特别大的点,考察相应的样本数据是否有错.②分析残差图可以发现模型选择是否合适.说明:分析残差是回归诊断的一部分,可以帮助我们发现样本数据中的错误,分析模型选择是否合适,是否有其他变量需要加入到模型中,模型的假设是否正确等. 本题只要求学生能回答上面两点即可,主要让学生体会残差和残差图可以用于判断模型的拟合效果.3、(1)解释变量和预报变量的关系式线性函数关系.R=.(2)21说明:如果所有的样本点都在一条直线上,建立的线性回归模型一定是该直线,=+,没所以每个样本点的残差均为0,残差平方和也为0,即此时的模型为y bx aR=.有随机误差项,是严格的一次函数关系. 通过计算可得21习题3.1 (P89)1、(1)由表中数据制作的散点图如下:从散点图中可以看出GDP值与年份近似呈线性关系.y表示GDP值,t表示年份. 根据截距和斜率的最小二乘计算公式,(2)用t得ˆ14292537.729a≈-,ˆ7191.969b≈从而得线性回归方程ˆ7191.96914292537.729yt =-. 残差计算结果见下表.GDP 值与年份线性拟合残差表2003年实际GDP 值为117251.9,所以预报与实际相差4275.540-.(4)上面建立的回归方程的20.974R =,说明年份能够解释约97%的GDP 值变化,因此所建立的模型能够很好地刻画GDP 和年份的关系. 2、说明:本题的结果与具体的数据有关,所以答案不唯一. 3、由表中数据得散点图如下:从散点图中可以看出,震级x 与大于或等于该震级的地震数N 之间不呈线性相关关系,随着x 的减少,所考察的地震数N 近似地以指数形式增长. 做变换lg y N =, 得到的数据如下表所示.x 和y 的散点图如下:从这个散点图中可以看出x 和y 之间有很强的线性相关性,因此可以用线性回归模型拟合它们之间的关系. 根据截距和斜率的最小二乘计算公式,得ˆ 6.704a≈,ˆ0.741b ≈-, 故线性回归方程为 ˆ0.741 6.704y x =-+. 20.997R ≈,说明x 可以解释y 的99.7%的变化. 因此,可以用回归方程 0.741 6.704ˆ10x N-+= 描述x 和N 之间的关系. 3.2独立性检验的基本思想及其初步应用练习(P97)(1)画等高条形图. 由图及表直观判断好像“成绩与班级有关系”.(2)因为2K 的观测值0.6536.63k ≈<,由教科书中表3—11知2( 6.635)0.01P K ≥≈,所以在犯错误的概率不超过0.01的前提下不能认为“成绩与班级有关系”. 说明:(1)教师在布置该题目时,应该明确要求学生们制作等高条形图,并从图形上判断两个分类变量之间是否有关系.(2)通过图形的直观感觉的结果可能会出现错误. (3)本题与例题不同,本题计算得到的2K 的观测值比6.635小,所以没有理由说明“成绩与班级有关系”. 独立性检验与反证法有类似的地方,在使用反证法证明结论时,在假设结论不成立的条件下,如果没有推出矛盾,并不能说明结论成立,也不能说明结论不成立. 在独立性检验中,没有推出小概率事件发生类似于反证法中没有推出矛盾. 习题3.2 (P97)1、如果“服药与患病之间没有关系”,则2K 的值应该比较小;如果2K 的观测值很大,则说明很可能“服药与患病之间有关系”. 由题目中所给数据计算得 6.109k ≈,而由表3-11,得2( 5.024)0.025P K ≥≈,而6.1090.025>,所以在犯错误的概率不超过0.025的前提下可以认为“服药与患病之间有关系”. 再由服药群体中患病的频率0.182小于没有服药群体中患病的频率0.400,所以“服药与患病之间关系”可以解释为药物对于疾病有预防作用. 因此在犯错误的概率不超过0.025的前提下,可以认为药物有效.说明:学生很容易完成此题,但希望学生能理解独立性检验在这里的具体含义,即“服药与患病之间关系”可以解释为“药物对于疾病有预防作用”.2、如果“性别与读营养说明之间没有关系”,则2K 的观测值应比较小. 如果2K 的观测值很大,则说明“性别与读营养说明之间有关系”. 按题目中所给数据计算,得2K 的观测值为8.416k ≈,而由教科书中表3-11知2(7.879)0.005P K ≥≈,8.4167.879>,所以在犯错误的概率不超过0.005的前提下认为“性别与读营养说明之间有关系”. 说明:如果问题为“性别与读营养说明之间有没有关系?”则下面表述同样正确:虽然2K 的观测值8.4167.879k ≈>,而2( 6.635)0.010P K ≥≈,所以在犯错误的概率不超过0.01的前提下认为“性别与读营养说明之间有关系”. 3、需要收集数据,所有没有统一答案.说明:第一步,要求学生收集并整理数据后得到列联表;第二步,类似上面的习题做出判断.4、需要从媒体上收集数据,学生关心的问题不同,收集的数据会不同.说明:第一步,要求学生收集并整理数据后得到列联表;第二步,类似上面的习题做出判断.第一章 复习参考题A 组(P19)根据散点图,可以认为中国人口总数与年份呈现很强的线性相关关系,因此选用线性回归模型建立回归方程.由最小二乘法的计算公式,得 2095141.503a ≈-,1110.903b ≈,则线性回归方程为 ˆ1110.9032095141.503yx =-. 由2R 的计算公式,得 20.994R ≈,明线性回归模型对数据的拟合效果很好.根据回归方程,,预计2003年末中国人口总数约为129997万人,而实际情况为129227万人,预测误差为-770万人;预计2004年末中国人口总数约为131108万人,而实际情况为129988万人,预测误差为-1120万人. 2、(1)将销售总额作为横轴,利润作为纵轴,根据表中数据绘制散点图如下:由于散点图中的样本点基本上在一个带形区域内分布,猜想销售总额与利润之间呈现线性相关关系.(2)由最小二乘法的计算公式,得 ˆ1334.5a≈,ˆ0.026b ≈, 则线性回归方程为 ˆ0.0261334.5y x =+ 其残差值计算结果见下表:(3)对于(2)中所建立的线性回归方程,20.457R ≈,说明在线性回归模型中销售总额只能解释利润变化的46%,所以线性回归模型不能很好地刻画销售总额和利润之间的关系.说明:此题也可以建立对数模型或二次回归模型等,只要计算和分析合理,就算正确.3、由所给数据计算得2K 的观测值为 3.689k ≈,而由教科书中表1-11知2( 2.706)0.10P K ≥=所以在犯错误的概率不超过0.10的前提下认为“婴儿的性别与出生的时间有关系”.第一章 复习参考题B 组(P19)1、总偏差平方和21()ni i y y =-∑表示总的效应,即因变量的变化效应;残差平方和21ˆ()nii yy =-∑表示随机误差的效应,即随机误差的变化效应;回归平方和21ˆ()ni yy =-∑表示表示变量的效应,即自变量的变化效应. 等式222111ˆˆ()()()nn niii i i y y y yy y ===-=-+-∑∑∑表示因变量的变化总效应等于随机误差的变化效应与自变量的变化效应之和. 3、本题主要是考察学生应用回归分析模型解决实际问题的能力,解答应该包括如何获取数据,如何根据散点图寻找合适的模型去拟合数据,以及所得结果的解释三方面的内容.。
数学苏教版选修2-3优化训练:3.2回归分析含解析
3。
2 回归分析五分钟训练(预习类训练,可用于课前)1。
若回归直线方程中的回归系数b ˆ=0,则相关系数( )A 。
r=1B 。
r=-1 C.r=0 D 。
无法确定答案:C 解析:∑∑==---n i i n i i i x xy y x x b 121)())((ˆ, r=∑∑∑===-•---n i n i i i n i i i y y x xy y x x11221)()())((.若b ˆ=0,则r=0. 2。
若某地财政收入x 与支出y 满足线性回归方程y=bx+a+e (单位:亿元),其中b=0.8,a=2,|e|<0。
5,如果今年该地区财政收入10亿元,年支出预计不会超过( )A 。
10亿B 。
9亿 C.10.5亿D.9。
5亿答案:C解析:代入数据y=10+e ,因为|e |<0。
5,所以|y |<10。
5,故不会超过10。
5亿.3。
两相关变量满足如下关系:两变量回归直线方程为( )A.yˆ=0.56x+997.4 B 。
y ˆ=0.63x-231.2C.yˆ=50.2x+501.4D.yˆ=60。
4x+400答案:A4.用身高(cm)预测体重(kg)满足y=0.849x-85.712,若要找到41.638 kg的人,身高____________是150 cm.答案:不一定解析:体重不只受身高的影响,还可能受其他因素的影响。
十分钟训练(强化类训练,可用于课中)1。
下列两个变量之间的关系不是函数关系的是()A.正方体的棱长和体积B.角的弧度数和它的正弦值C.单产为常数时,土地面积和总产量D.日照时间与水稻的亩产量答案:D解析:相关关系是一种不确定的关系.2.散点图在回归分析过程中的作用是( )A。
查找个体个数B。
比较个体数据大小关系C。
探究个体分类 D.粗略判断变量是否线性相关答案:D解析:散点图在回归分析中,能粗略进行判断变量间的相关关系.3.在回归分析中,如果随机误差对预报变量没有影响,那么散点图中所有的点将_____________回归直线上。
苏教高一下数学选修2-3 第三章 3.2回归分析练习题课件
刷基础
的周围,于是令z=ln y,则
由最小二乘法计算得
,则有
.
即解释变量(时间)对预报变量(细菌繁殖的个数)变化解释了99.99%.
3.2 回归分析
刷易错
易错点1 线性相关系数理解不正确致错
14.如果散点图中的所有样本点都落在一条斜率为非零实数的直线上,R2是相关指数,则( A
数学 选修2-2,2-3 合订 苏教版
3.2 回归分析
刷基础
题型1 线性回归分析
1.[河南濮阳2018高二联考]已知一组样本点(xi,yi),其中i=1,2,3,…,30,根据最小二乘
法求得的回归方程是
,则下列说法正确的是( D )
A.若所有样本点都在
上,则变量间的相关系数为1
B.至少有一个样本点落在回归直线
3.2 回归分析
刷能力
4.(多选)[湖南师大附中2019月考]下列说法正确的是(ACD) A.在回归模型中,预报变量y的值不能由解释变量x唯一确定 B.若变量x,y满足关系y=-0.1x+1,且变量y与z正相关,则x与z也正相关 C.在残差图中,残差点分布的带状区域的宽度越狭窄,其模型拟合的精度越高 D.以模型y=cekx去拟合一组数据时,为了求出回归方程,设z=ln y,将其变换后得到线性方 程z=0.3x+4,则c=e4,k=0.3
,
所以当x=5时, =6.5×5+17.5=50.
由表格知当广告支出5万元时,销售额为60万元,所以随机误差的效应(残差)为60-50=10.故选A.
3.2 回归分析
题型2 回归效果的刻画
刷基础
10.[贵州思南中学2019高二月考]设某大学的女生体重y(单位:kg)与身高x(单位:cm)具有线
苏教版高中数学选修2-3同步训练回归分析
3.2 回归分析1、已知变量x 和y 满足关系0.11y x =-+,变量y 与z 正相关。
下列结论中正确的是( ) A.x 与y 负相关,x 与z 负相关 B.x 与y 正相关,x 与z 正相关 C.x 与y 正相关,x 与z 负相关D.x 与y 负相关,x 与z 正相关2、在一组样本数据11(,)x y ,22(,)x y ,…(),n n x y ,(2n ≥,12,,,n x x x ⋅⋅⋅不全相等)的散点图中,若所有样本点(,)i i x y ()1,2,,i n =⋅⋅⋅都在直线112y x =+上,则这组样本数据的样本相关系数为( ) A. 1-B.0C. 12D. 13、某产品的广告费用x 与销售额y 的统计数据如下表:根据上表可得回归方程ˆˆˆybx a =+中的ˆb 为9.4,据此模型预报广告费用为6万元时销售额为( )A. 63.6万元B. 65.5万元C. 67.7万元D. 72.0万元4、已知变量x 与y 正相关,且由观测数据算得样本平均数3, 2.5x y ==,则由该观测数据算得的线性回归方程可能是( ) A.0.4.3ˆ2yx =+ B.2 2.4ˆy x =- C.9ˆ2.5y x =-+ D.0.3 4.4ˆyx =-+ 5、下表是某厂1到4月份用水量情况(单位:百吨)的一组数据用水量y 与月份x 之间具有线性相关关系,其线性回归方程为0.7y x a ∧=-+,则a 的值为( ) A.5.25 B.5 C.2.5 D.3.56、对四组数据进行统计,获得以下散点图,关于其相关系数的比较,正确的是( )A.24310r r r r <<<<B.42130r r r r <<<<C.42310r r r r <<<<D.24130r r r r <<<<7、已知x 与y 之间的几组数据如下表: x 1 2 3 4 5 6 y21334假设根据上表数据所得线性回归直线方程为+ˆa ˆˆybx =,若某同学根据上表中的前两组数据()1,0和()2,2求得的直线方程为y b x a ='+',则以下结论正确的是( )A.',ˆˆ'bb a a >> B.',ˆˆ'bb a a >< C.',ˆˆ'bb a a << D.',ˆˆ'bb a a <> 8、登山族为了了解某山高y (km )与气温x (℃)之间的关系,随机统计了4次山高与相应的气温,并制作了对照表: 气温x (℃)18 13 101-y (km ) 2434 38 64由表中数据,得到线性回归方程ˆˆ2()ˆyx a a R =-+∈,由此估计山高为72km 处气温的度数为( )A.-10℃B.-8℃C.-4℃D.-6℃9、为了解某社区居民的家庭年收入与年支出的关系,随机调査了该社区5户家庭,得到如下统计数据表:根据上表可得回归直线方程$y bx a =+,其中0.76,b a y bx ==-,据此估计,该社区一户年收入为15万元家庭的年支出为( ) A.11.4万元 B.11.8万元 C.12.0万元 D.12.2万元10、工人月工资(元)依劳动生产率(千元)变化的回归直线方程为$6090y x =+,下列判断正确的是( )A.劳动生产率为1000元时,工资为50元B.劳动生产率提高1000元时,工资提高150元C.劳动生产率提高1000元时.工资提高90元D.劳动生产率为1000元时,工资为90元11、调查了某地若干户家庭的年收入x (单位:万元)和年饮食支出y (单位:万元),调查显示年收入x 与年饮食支出y 具有线性相关关系,并由调查数据得到y 对x 的回归直线方程:0.25402ˆ.31yx =+,由回归直线方程可知,家庭年收入每增加1万元,年饮食支出平均增加__________万元.12、对具有线性相关关系的变量x 和y ,由测得的数据已求得回归直线的斜率为6.5,且恒过点(2,3),则回归直线的方程为 .13、为预测某种产品的回收率y ,需要研究它和原料有效成分含量 x 之间的相关关系,现取了8组观察值.计算知: 881152,228ii i i xy ====∑∑,88211478,1849ii i i i x x y ====∑∑则y 对x 的线性回归方程是__________.14、为考虑广告费用 x 与销售额y 之间的关系.抽取了5家餐厅,得到如下数据:现要使销售额达到6万元,则需广告费用为__________万元.(精确到0.1)15、某工厂为了对新研发的一种产品进行合理定价,将该产品按事先拟定的价格进行试销,得到如下数据:(1)求回归直线方程ˆˆˆybx a =+,其中ˆ20b =-,ˆˆa y bx =-; (2)预计在今后的销售中,销量与单价仍然服从题(1)中的关系,且该产品的成本是4元/件,为使工厂获得最大利润,该产品的单价应定为多少元?(利润=销售收入-成本)答案以及解析1答案及解析: 答案:A解析:由回归直线方程定义知,x 与y 负相关。
高中数学苏教版选修2-3练习:3.2 回归分析2 Word版含答案
回归分析一.选择题:本大题共5小题,每小题5分,共25分.1. 在画两个变量的散点图时,下面叙述正确的是 ( B ) A.预报变量在x 轴上,解释变量在y 轴上 B.解释变量在x 轴上,预报变量在y 轴上 C.可以选择两个变量中任意一个变量在x 轴上 D.可以选择两个变量中任意一个变量在y 轴上2. 一位母亲记录了她儿子3到9岁的身高,数据如下表:由此她建立了身高与年龄的回归模型x y 19.793.73+=,她用这个模型预测儿子10岁时的身高,则下列的叙述正确的是 ( C ) A.她儿子10岁时的身高一定是145.83㎝ B.她儿子10岁时的身高在145.83㎝以上 C.她儿子10岁时的身高在145.83㎝左右 D.她儿子10岁时的身高在145.83㎝以下 3. 在建立两个变量Y 与x 的回归模型中,分别选择了4个不同模型,它们的相关指数R 2如下,其中拟合得最好的模型是 ( A ) A.模型1的相关指数R 2为0.98 B.模型2的相关指数R 2为0.80 C.模型3的相关指数R 2为0.50 D.模型4的相关指数R 2为0.254. 下列说法正确的有 ( B ) ①回归方程适用于一切样本和总体。
②回归方程一般都有时间性。
③样本取值的范围会影响回归方程的适用范围。
④回归方程得到的预报值是预报变量的精确值。
A. ①② B. ②③ C. ③④ D. ①③5. 在回归分析中,代表了数据点和它在回归直线上相应位置的差异的是 ( B )A.总偏差平方和B.残差平方和C.回归平方和D.相关指数R 2二.填空题(本大题共4小题,每小题5分,共20分)6. 在回归分析中,通过模型由解释变量计算预报变量时,应注意什么问题 (1) ; (2) ; (3) ; (4) .7. 许多因素都会影响贫穷,教育也许是其中之一,在研究这两个因素的关系时收集了美国50个州的成年人受过9年或更少教育的百分比()和收入低于官方规定的贫困线的人数占本州人数的百分比(y )的数据,建立的回归直线方程如下ˆ0.8 4.6yx =+,斜率的估计等于0.8说明 ,成年人受过9年或更少教育的百分比()和收入低于官方的贫困线的人数占本州人数的百分比(y)之间的相关系数 (填充“大于0”或“小于0”)8.已知回归直线的斜率的估计值是1.23,样本点的中心为(4,5),则回归直线的方程是9.线性回归模型y=bx+a+e中,b=_____________,a=______________e称为_________ .三.解答题:本大题共5小题,共55分.解答应写出文字说明,证明过程或演算步骤.10. (本小题10分) 为了决定在白鼠中血糖的减少量和注射胰岛素A的剂量间的关系,将同样条件下繁殖的7只白鼠注射不同剂量的胰岛素A.所得数据如下:(1)求出y对x的线性回归方程;(2)x与y之间的线性相关关系有无统计意义(可靠性不低于95%)(1)求年推销金额y与工作年限x之间的相关系数;(2)求年推销金额y关于工作年限x的线性回归方程;(3)分别估计工作年限为7年和11年时的年推销金额.12. (本小题11分) 在7块大小及条件相同的试验田上施肥,做肥量对小麦产量影响的试验,(1)画出散点图;(2)对x与y进行线性回归分析,并预测施肥量30时小麦的产量为多少?13. (本小题12分) 适当饮用葡萄酒可以预防心脏病,下表中的信包是19个发达国家一年中平均每人喝葡萄酒摄取酒精的升数z 以及一年中每10万人因心脏病死亡的人数,(1)画出散点图,说明相关关系的方向、形式及强度;(2)求出每10万人中心脏病死亡人数,与平均每人从葡萄酒得到的酒精x(L)之间的线性回归方程.(3)用(2)中求出的方程来预测以下两个国家的心脏病死亡率,其中一个国家的成人每年平均从葡萄酒中摄取1L 的酒精,另一国则是8 L.14. (本小题12分) 在某化学实验中,测得如下表所示的6组数据,其中x(min)表示化学反应进行的时,y(mg)表示未转化物质的量(1)设x 与z 之问具有关系xy cd ,试根据测量数据估计c 和d 的值; (2)估计化学反应进行到10 min 时未转化物质的量.参考答案一、选择题:1. B2. C3. A4. B5. B 二、填空题:6. 【答案】 (1)回归模型只适用于所研究的总体(2)回归方程具有时效性(3)样本的取值范围影响回归方程的适用范围(4)预报值是预报变量可能取值的平均值.7. 【答案】一个地区受过9年或更少教育的百分比每增加1%,收入低于官方规定的贫困线的人数占本州人数的百分比将增加0.8%左右;大于0 . 8. 【答案】y ∧=1.23x+0.089. 【答案】b =nii i=1n 2ii=1(xx)(y y)(xx)---∑∑ , a =ˆy bx-,e 称为随机误差 三、解答题:10. 【 解】 (1) 5.814110.54y x ∧=+ (2)由r=0. 9301>0.754.即0.05r r >,故x ,y 之间的线性相关关系有统计意义.11. 【 解】12. 【 解】 (1) 画出散点图如图:(2)根据已知数据表得拓展表如下:由表易得210279530,,399.377x y ====代人线性相关系数公式得770.9733i ix y x yr -=≈∑因此y 与x 有紧密的线性相关关系, 回归系数711722211()()7 4.75()7niii ii i niii i x x y y x y x yb x x xx∧====---==≈--∑∑∑∑所以回归直线方程为:256.8 4.75y x ∧=+当x=50时,256.8 4.7550494.3y ∧=+⨯=也自是说当施化肥量为50时,小麦的产量大致接近494.3. 回归系数=4.75反映出当化肥施加量增加1个单位,小麦的产量将增加4.75,而256.8是不受施化肥量影响的部分 13. 【 解】 (1) 散点图负相关,中等强度,线性或者稍微有些弯曲(2) 260.5622.969y x ∧=-(3)这两个国家的心脏率死亡率分别为每10万人238人和77人 14. 【 解】 (1)在xy cd =的两边取自然对数,可得lny=ln c+xlnd ,设lny=z ,ln c=a, lnd=b ,则z=a+bx ,由已知数据有由公式得a ≈3.905 5,b ≈0. 221 9,线性回归方程为z ∧=3.9055+ 0.221 9x ,即lnc ≈3.905 5,lad ≈0.221 9,故c ≈49.675,d ≈0.801 0,所以c ,d 的估计值分别为 49. 675,0. 801 0. (2)54mg。
苏教版高中数学选修2-33.2 回归分析作业
3.2 回归分析一、基础达标1.已知方程y ^=0.85x -82.71是根据女大学生的身高预报她的体重的回归方程,其中x 的单位是cm ,y ^的单位是kg ,那么针对某个体(160,53)的随机误差是________. 2.对于相关系数r ,以下4个叙述错误的是________.①|r |∈(0,+∞),|r |越大,线性相关程度越大,反之,线性相关程度越小; ②r ∈(-∞,+∞),r 越大,线性相关程度越大,反之,线性相关程度越小; ③|r |≤1,|r |越接近1,线性相关程度越大,|r |越接近0,线性相关程度越小.3.已知变量x 与y 正相关,且由观测数据算得样本平均数x =3,y =3.5,则由该观测数据算得的线性回归方程可能是________.①y ^=0.4x +2.3;②y ^=2x -2.4;③y ^=-2x +9.5;④y ^=-0.3x +4.4.4.某小卖部为了了解冰糕销售量y (箱)与气温x (℃)之间的关系,随机统计了某4天卖出的冰糕的箱数与当天气温,并制作了对照表(如下表所示),且由表中数据算得线性回归方程y ^=b ^x +a ^中的b ^=2,则预测当气温为25 ℃时,冰糕销量为________箱.5.已知对一组观测值(x i ,y i )(i =1,2,…,n )作出散点图后,确定具有线性相关关系,若对于y ^=a ^+b ^x ,求得b ^=0.51,x =61.75,y =38.14,则线性回归方程为________________. 6.以下关于线性回归的判断,正确的是________.①散点图中所有点都在一条直线附近,这条直线为回归直线;②散点图中的绝大多数点都在回归直线的附近,个别特殊点不影响线性回归性; ③已知直线方程为y ^=0.50x -0.81,则x =25时,y ^为11.69; ④线性回归方程的意义是它反映了样本整体的变化趋势.7.在某种产品表面进行腐蚀性刻线试验,得到腐蚀深度y 与腐蚀时间x 之间相应的一组观察值,如下表:二、能力提升8.四名同学根据各自的样本数据研究变量x ,y 之间的相关关系,并求得线性回归方程,分别得到以下四个结论:①y 与x 负相关且y ^=2.347x -6.423;②y 与x 负相关且y ^=-3.476x +5.648;③y 与x 正相关且y ^=5.437x +8.493;④y 与x 正相关且y ^=-4.326x -4.578. 其中一定不正确的结论的序号是________.9.对具有线性相关关系的变量x 、y 有观测数据(x i ,y i )(i =1,2,…,10),它们之间的线性回归方程是y ^=3x +20,若∑i =110x i =18,则∑i =110y i =________.10.一唱片公司欲知唱片费用x (十万元)与唱片销售量Y (千张)之间的关系,从其所发行的唱片中随机抽选了10张,得如下的资料:∑i =110x i =28,∑i =110x 2i =303.4,∑i =110y i =75,∑i =110y 2i =598.5,∑i =110x i y i =237,则y 与x 的相关系数r 的绝对值为________.11.为了对新产品进行合理定价,对该产品进行了试销试验,以观察需求量y (单位:千件)对于价格x (单位:千元)的反应,得数据如下:(1)若y 与x (2)若成本X =y +500,试求:①在盈亏平衡条件下(利润为零)的价格;②在利润为最大的条件下,定价为多少?12.一个车间为了规定工时定额,需要确定加工零件所花费的时间,为此进行了10次试验.测得的数据如下:(1)y 与x 是否具有线性相关关系?(2)如果y 与x 具有线性相关关系,求线性回归方程;(3)根据求出的线性回归方程,预测加工200个零件所用的时间为多少?三、探究与创新13.从某居民区随机抽取10个家庭,获得第i 个家庭的月收入x i (单位:千元)与月储蓄y i (单位:千元)的数据资料,算得∑i =110x i =80,∑i =110y i =20,∑i =110x i y i =184,∑i =110x 2i =720.(1)求家庭的月储蓄y 对月收入x 的线性回归方程y ^=b ^x +a ^; (2)判断变量x 与y 之间是正相关还是负相关;(3)若该居民区某家庭月收入为7千元,预测该家庭的月储蓄.附:线性回归方程y ^=b ^x +a ^中,b ^=∑i =1nx i y i -n x y∑i =1nx 2i -n x2,a ^=y -b x ,其中x ,y 为样本平均值.答案精析1.-0.292.①②3.①解析 因为变量x 和y 正相关,则回归直线的斜率为正,故可以排除选项③和④.因为样本点的中心在回归直线上,把点(3,3.5)分别代入选项①和②中的直线方程进行检验,可以排除②,故选①. 4.70解析 由线性回归方程必过点(x ,y ),且=2,得=20. ∴当x =25时,=70. 5.=0.51x +6.65解析 ∵=y -x =38.14-0.51×61.75 =6.647 5≈6.65. ∴=0.51x +6.65. 6.②③④解析 对于①,回归直线应使样本点总体距回归直线最近,而不是所有点都在一条直线附近,故①不正确,②③④均正确. 7.解 (1)作出如图所示的散点图.从散点图可看出腐蚀深度y (μm)与腐蚀时间x (s)之间存在着较强的线性相关关系.(2)相关系数r =∑i =1nx i y i -n x y⎝ ⎛⎭⎪⎪⎫∑i =1n x 2i -n (x )2⎝ ⎛⎭⎪⎪⎫∑i =1n y 2i -n (y )2≈0.98,显然|r |>r 0.05=0.602.所以,腐蚀深度y 与腐蚀时间x 之间有很强的线性相关关系. 8.①④解析 ①中,回归方程中x 的系数为正,不是负相关;④方程中的x 的系数为负,不是正相关,∴①④一定不正确.9.254解析 由∑i =110x i =18,得x =1.8.因为点(x ,y )在直线=3x +20上,则y =25.4. 所以∑i =110y i =25.4×10=254.10.0.3解析 r =∑i =110x i y i -10x ·y∑i =110x 2i -10x 2·∑i =110y 2i -10y2=237-10×2.8×7.5303.4-10×2.82·598.5-10×7.52=0.3.11.解 (1)y 与x 之间有线性相关关系,=∑i =1nx i y i -n x y∑i =1nx 2i -n x2=-1.286 6,=y -x =169.772 4,∴线性回归方程为=-1.286 6x +169.772 4. (2)①在盈亏平衡条件下,x =+500, 即-1.286 6x 2+169.772 4x =-1.286 6x +169.772 4+500, 1.286 6x 2-171.059x +669.772 4=0, 解得x 1=128.916 2,x 2=4.038 1(舍去), ∴此时新产品的价格为128.916 2千元. ②在利润最大的条件下,Q =x -X =-1.286 6x 2+169.772 4x +1.286 6x -169.772 4-500=-1.286 6x 2+171.059x -669.772 4.要使Q 取得最大值,x =66.477 1, 即此时新产品应定价为66.477 1千元. 12.解 (1)列出下表:x =55,y =91.7,∑i =110x 2i =38 500,∑i =110y 2i =87 777,∑i =110x i y i =55 950, 因此r =∑i =110x i y i -10x y(∑i =110x 2i -10x 2)(∑i =110y 2i -10y 2)=55 950-10×55×91.7(38 500-10×552)×(87 777-10×91.72)≈0.999 8.由于|r |=0.999 8>r 0.05=0.632, 因此x 与y 之间有很强的线性相关关系. (2)设所求的线性回归方程为=x +,则有=∑i =110x i y i -10x y ∑i =110x 2i -10x2=55 950-10×55×91.738 500-10×552≈0.668,=y -x =91.7-0.668×55=54.96, 因此,所求的线性回归方程为=0.668x +54.96.(3)这个线性回归方程的意义是当x 每增大1时,y 的值约增加0.668,而54.96是y 不随x 增加而变化的部分.因此,当x =200时,y 的估计值为=0.668×200+54.96=188.56≈189. 因此,加工200个零件所用的工时约为189分钟. 13.解 (1)由题意知n =10,x =1n ∑i =1n x i =8010=8,y =1n ∑i =1n y i =2010=2,又l xx =∑i =1nx 2i -n x 2=720-10×82=80,l xy = i =1nx i y i -n x y =184-10×8×2=24,由此得=l xy l xx =2480=0.3,=y -x =2-0.3×8=-0.4,故所求回归方程为=0.3x -0.4.(2)由于变量y 的值随x 的值增加而增加(b =0.3>0), 故x 与y 之间是正相关.(3)将x =7代入回归方程可以预测该家庭的月储蓄为=0.3×7-0.4=1.7(千元).。
高中数学(苏教版 选修2-3)文档第3章 3.1 独立性检验 学业分层测评 Word版含答案
学业分层测评
(建议用时:分钟)
[学业达标]
一、填空题
.为了检验两个事件与是否相关,经计算得χ=,我们有的把握认为事件与相关.
【答案】
.为了考查高中生的性别与是否喜欢数学课程之间的关系,某市在该辖区内的高中学生中随机地抽取名学生进行调查,得到表中数据:
【解析】由χ=≈.
【答案】
.通过随机询问名性别不同的大学生是否爱好某项运动,得到如下的列联表:
由χ
χ=≈.
附表:
①有以上的把握认为“爱好该项运动与性别有关”;
②有以上的把握认为“爱好该项运动与性别无关”;
③在犯错误的概率不超过的前提下,认为“爱好该项运动与性别有关”;
④在犯错误的概率不超过的前提下,认为“爱好该项运动与性别无关”.
【解析】由附表可得知当χ≥时,有=-=,当χ≥时,有=-=,而此时的χ≈.显然有<<,故可以得到有以上的把握认为“爱好该项运动与性别有关”.
【答案】①
.某电视台在一次对收看文艺节目和新闻节目观众的抽样调查中,随机抽取了名电视观众,相关的数据如下表所示:
“否”)
【解析】因为在至岁的名观众中有名观众收看新闻节目,而大于岁的名观众中有名观众收看新闻节目,即=,=,两者相差较大,所以经直观分析,收看新闻节目的观众与年龄是有关的.
【答案】是
.为了评价某个电视栏目的改革效果,在改革前后分别从某居民点抽取了位居民进行调查,经过计算得χ≈,根据这一数据分析,下列说法正确的是.
①有的人认为该栏目优秀;
②有的人认为该栏目是否优秀与改革有关系;
③
在犯错误的概率不超过的前提下认为该电视栏目是否优秀与改革有关系;
④没有理由认为该电视栏目是否优秀与改革有关系.
参考数据如表:。
2018-2019学年高中数学苏教版选修2-3课件:第3章 章末小结与测评
建立回归模型的基本步骤: (1)确定两个变量; (2)画出散点图; (3)进行相关系数检验; (4)确定线性回归方程类型,求出回归方程. 建立回归模型的基本步骤,不仅适用于线性回归模型,也适 用于非线性回归模型的建立.
一、独立性检验 1.独立性检验的思想及方法 独立性检验的基本思想类似于数学中的反证法,要确认“两 个分类变量有关系”这一结论成立的可信程度,首先假设该结论 不成立,即假设结论“两个对象没有关系”成立,在该假设下构 造的随机变量 χ2 应该很小,如果由观测数据计算得到的 χ2 的观 测值很大,则在一定程度上说明假设不合理.根据随机变量 X 的 含义,可以通过概率来评价假设不合理程度.
2.独立性检验的一般步骤 (1)提出2 n ad - bc 计算 χ2= ; a+ba+cb+dc+d
(3)比较 χ2 与临界值的大小并作出判断. 二、回归分析 回归分析是对具有相关关系的两个变量进行统计分析的一种 常用方法.
高中数学(苏教版 选修2-3)文档第3章 3.2 回归分析 Word版含答案
回归分析.会作出两个有关联变量的散点图,并利用散点图认识变量间的相关关系..了解线性回归模型,能根据给出的线性回归方程系数公式建立线性回归方程.(重点、难点).了解回归分析的基本思想、方法及简单应用.[基础·初探]教材整理线性回归模型阅读教材~“例”以上部分,完成下列问题..线性回归模型的概念:将=++ε称为线性回归模型,其中+是确定性函数,ε称为随机误差..线性回归方程:直线=+称为线性回归方程,其中称为回归截距,称为回归系数,称为回归值,其中错误!其中=,=.设某大学生的女生体重(单位:)与身高(单位:)具有线性相关关系.根据一组样本数据(,)(=,…,),用最小二乘法建立的回归方程为=-,则下列结论中正确的是(填序号).()与具有正的线性相关关系;()回归直线过样本点的中心(,);()若该大学某女生身高增加,则其体重约增加;()若该大学某女生身高为,则可断定其体重必为 .【解析】回归方程中的系数为>,因此与具有正的线性相关关系,()正确;由回归方程系数的意义可知回归直线过样本点的中心(,),正确;∵回归方程=-,∴该大学某女生身高增加,则其体重约增加,()正确;()不正确.【答案】()()()教材整理相关关系阅读教材~“例”以上部分,完成下列问题..相关系数是精确刻画线性相关关系的量..相关系数=错误!=错误!..相关系数具有的性质:()≤;()越接近于,,的线性相关程度越强;()越接近于,,的线性相关程度越弱..相关性检验的步骤:()提出统计假设:变量,不具有线性相关关系;()如果以的把握作出推断,那么可以根据-=与-在附录中查出一个的临界值(其中-=称为检验水平);()计算样本相关系数;()作出统计推断:若>,则否定,表明有的把握认为与之间具有线性相关关系;若≤,则没有理由拒绝原来的假设,即就目前数据而言,没有充分理由认为与之间有线性相关关系.判断(正确的打“√”,错误的打“×”)()求回归直线方程前必须进行相关性检验.( )()两个变量的相关系数越大,它们的相关程度越强.( )()若相关系数=,则两变量,之间没有关系.( )【答案】()√()×()√[质疑·手记]预习完成后,请将你的疑问记录,并与“小伙伴们”探讨交流:疑问:解惑:。
2018版高中数学苏教版选修2-⒊学案:第三章 统计案例 3.2 回归分析 Word版含答案
学习目标 1.会建立线性回归模型分析两个变量间的相关关系.2.能通过相关系数判断两个变量间的线性相关程度.3.了解非线性回归分析.知识点一线性回归模型思考某电脑公司有5名产品推销员,其工作年限与年推销金额数据如下表:推销员编号1234 5工作年限x/年35679推销金额y/万元2334 5请问如何表示推销金额y与工作年限x之间的相关关系?y关于x的线性回归方程是什么?梳理 线性回归模型 (1)随机误差具有线性相关关系的两个变量的取值x 、y ,y 的值不能由x 完全确定,可将x ,y 之间的关系表示为y =a +bx +ε,其中________是确定性函数,________称为随机误差. (2)随机误差产生的主要原因①所用的______________不恰当引起的误差; ②忽略了________________; ③存在________误差.(3)线性回归模型中a ,b 值的求法 y =__________称为线性回归模型. a ,b 的估计值为a ^,b ^,则{b ^= ,a ^= .(4)回归直线和线性回归方程直线y ^=a ^+b ^x 称为回归直线,此直线方程即为线性回归方程,a ^称为____________,b ^称为____________,y ^称为__________. 知识点二 样本相关系数r具有相关关系的两个变量的线性回归方程y ^=b ^x +a ^. 思考1 变量y ^与真实值y 一样吗?思考2 变量y ^与真实值y 之间误差大了好还是小了好?梳理 样本相关系数r 及其性质(1)r =________________________________. (2)r 具有以下性质: ①|r |≤________;②|r |越接近于________,x ,y 的线性相关程度越强;。
苏教版高中数学选修2-3同步课堂精练:3.2回归分析含答案
1.对某种机器购置后运营年限次序x(1,2,3,…),与当年增加利润y的统计分析知具备线性相关关系,回归方程为:y=10.47-1.3x,估计该台机器使用__________年最合算.2.假设关于某设备的使用年限x与所支出的维修费用y(万元)有如下的统计数据若由此资料知y与x呈线性关系,则线性回归方程是__________.3.假设关于某市房屋面积x(平方米)与购房费用y(万元),有如下的统计数据:由资料表明y对x呈线性相关,若在该市购买120平方米的房屋,估计购房费用是__________万元.∴估计购买120平方米的房屋时,购买房屋费用是64.5万元.4.下表是关于某设备的使用年限(年)和所需要的维修费用y(万元)的几组统计数据:请根据上表提供的数据,用最小二乘法求出y关于x的线性回归方程__________.5.某车间为了规定工时定额,需要确定加工零件所花费的时间,为此作了四次试验,得到的数据如下:试预测加工10个零件需要多少时间?6.某研究性学习小组对春季昼夜温差大小与某花卉种子发芽多少之间的关系进行研究,他们分别记录了3月1日至3月5日的每天昼夜温差与实验室每天每100颗种子浸泡后的发芽数,得到如下资料:(1)若选取的是3月1日与3月5日的两组数据,请根据3月2日至3月4日的数据,求出y关于x的线性回归方程y bx a=+;(2)若由线性回归方程得到的估计数据与所选出的检验数据的误差均不超过2颗,则认为得到的线性回归方程是可靠的,试问(1)中所得的线性回归方程是否可靠?7.某种产品的广告费支出x与销售额y(单位:百万元)之间有如下对应数据:如果y与x之间具有线性相关关系.(1)作出这些数据的散点图;(2)求这些数据的线性回归方程;(3)预测当广告费支出为9百万元时的销售额.8.有一个同学家开了一个小卖部,他为了研究气温对热饮销售的影响,经过。
江苏省高二数学苏教版选修2-3学案:3.2 回归分析
§3.2 回归分析(一)课时目标1.掌握建立线性回归模型的步骤.2.了解回归分析的基本思想和初步应用.1.对于n 对观测数据(x i ,y i )(i =1,2,3,…,n ),直线方程____________称为这n 对数据的线性回归方程.其中________称为回归截距,________称为回归系数,________称为回归值.2.a ^,b ^的计算公式⎩⎨⎧b ^=∑ni =1x i y i-n x y ∑ni =1x 2i-n (x )2,a ^ =y -b ^x .3.相关系数r 的性质 (1)|r |≤1;(2)|r |越接近于1,x ,y 的线性相关程度越强; (3)|r |越接近于0,x ,y 的线性相关程度越弱.一、填空题1.下列关系中正确的是________(填序号). ①函数关系是一种确定性关系; ②相关关系是一种非确定性关系;③回归分析是对具有函数关系的两个变量进行统计分析的一种方法;④回归分析是对具有相关关系的两个变量进行统计分析的一种常用方法.2.回归直线y ^=a ^+b ^x 恒经过定点________.3.为了解决初中二年级平面几何入门难的问题,某校在初中一年级代数教学中加强概念和推理教学,并设有对照班,下表是初中二年级平面几何期中测试成绩统计表的一部分,其χ2≈________(保留小数点后两位).4.从某学校随机选取8名女大学生,其身高x (cm)和体重y (kg)的回归方程为y ^=0.849x -85.712,则身高172 cm 的女大学生,由线性回归方程可以估计其体重为________ kg.5.设两个变量x 和y 之间具有线性相关关系,它们的相关系数是r ,且y 关于x 的回归直线的斜率是b ^,那么b ^与r 的符号________(填写“相同”或“相反”).6.某小卖部为了了解冰糕销售量y (箱)与气温x (℃)之间的关系,随机统计了某4天卖出的冰糕的箱数与当天气温,并制作了对照表(如下表所示),且由表中数据算得线性回归方程y ^=b ^x+a ^中的b ^=27.今年一轮又一轮的寒潮席卷全国.某商场为了了解某品牌羽绒服的月销售量y (件)与月平均气温x (℃)由表中数据算出线性回归方程y =b x +a 中的b ≈-2.气象部门预测下个月的平均气温约为6℃,据此估计,该商场下个月羽绒服的销售量的件数约为________.8.已知线性回归方程为y ^=0.50x -0.81,则x =25时,y 的估计值为________.二、解答题9.某企业上半年产品产量与单位成本资料如下:(1)求出线性回归方程;(2)指出产量每增加1 000件时,单位成本平均变动多少? (3)假定产量为6 000件时,单位成本为多少元?10(1)求年推销金额(2)若第6名推销员的工作年限为11年,试估计他的年推销金额.能力提升11.下表提供了某厂节能降耗技术改造后,生产甲产品过程中记录的产量x (吨)与相应的生产能耗y (吨标准煤)的几组对照数据.________. 12(1)(2)求线性回归方程,并在散点图中加上回归直线;(3)根据(2)的结果估计当房屋面积为150 m 2时的销售价格.1.(1)求线性回归方程的步骤为①作出散点图;②利用公式计算回归系数b ^及a ^的值;③写出线性回归方程.(2)一般地,我们可以利用线性回归方程进行预测,这里所得到的值是预测值,但不是精确值.2.计算相关系数r 可以判断变量x ,y 的线性相关程度.3.2 回归分析(一)答案知识梳理1.y ^=a ^+b ^x a ^b ^y ^作业设计 1.①②④ 2.(x ,y ) 3.16.23 4.60.316解析 当x =172时,y ^=0.849×172-85.172=60.316. 5.相同解析 可以分析b ^、r 的计算公式. 6.70解析 由线性回归方程必过点(x ,y ),且b ^=2,得a ^=20,所以当x =25时,y ^=70.7.46解析 ∵样本点的中心为(10,38),∴38=-2×10+a ^,∴a ^=58,∴当x =6时,y ^=-2×6+58=46. 8.11.69解析 y 的估计值就是当x =25时的函数值,即0.50×25-0.81=11.69.9.解 (1)n =6,∑6i =1x i =21,∑6i =1y i =426,x =3.5, y =71,∑6i =1x 2i =79,∑6i =1x i y i =1 481, b ^=∑6i =1x i y i -6x y ∑6i =1x 2i -6x 2=1 481-6×3.5×7179-6×3.52≈-1.82. a ^=y -b ^x =71+1.82×3.5=77.37.线性回归方程为y ^=a ^+b ^x =77.37-1.82x .(2)因为单位成本平均变动b ^=-1.82<0,且产量x 的计量单位是千件,所以根据回归系数b ^的意义有:产量每增加一个单位即1 000件时,单位成本平均减少1.82元. (3)当产量为6 000件时,即x =6,代入线性回归方程:y ^=77.37-1.82×6=66.45(元)当产量为6 000件时,单位成本约为66.45元.10.解 (1)设所求的线性回归方程为y ^=b ^x +a ^,则b ^=∑5i =1(x i -x )(y i -y )∑5i =1(x i -x )2=1020=0.5,a ^ =y -b ^ x =0.4. 所以年推销金额y 关于工作年限x 的线性回归方程为y ^=0.5x +0.4.(2)当x =11时,y ^=0.5×11+0.4=5.9(万元).所以可以估计第6名推销员的年推销金额为5.9万元.11.y ^=0.7x +0.35解析 对照数据,计算得:∑4i =1x 2i =86, x =3+4+5+64=4.5,y =2.5+3+4+4.54=3.5. 已知∑4i =1x i y i =66.5, 所以b ^=∑4i =1x i y i -4x y∑4i =1x 2i -4(x )2=66.5-4×4.5×3.586-4×4.52=0.7. a ^=y -b ^x =3.5-0.7×4.5=0.35.因此,所求的线性回归方程为y ^=0.7x +0.35. 12.解 (1)散点图如图所示:(2)x =15∑5i =1x i =109,∑5i =1 (x i -x )2=1 570, y =23.2,∑5i =1(x i -x )(y i -y )=308. 设所求线性回归方程为y ^=b ^x +a ^,则b ^=3081 570≈0.196 2, a ^=y -b ^x =23.2-109×3081 570≈1.816 6. 故所求线性回归方程为y ^=0.196 2x +1.816 6.(3)根据(2),当x =150 m 2时,销售价格的估计值为y ^=0.196 2×150+1.816 6=31.246 6≈31.2(万元).。
苏教版选修23高中数学3.2回归分析课后知能检测
【课堂新坐标】(教师用书)2013-2014学年高中数学 回归分析课后知能检测 苏教版选修2-3一、填空题1.已知回归直线的斜率的估量值为,样本点的中心为(4,5),则回归直线方程是________.【解析】 回归直线方程为:y ^-5=(x -4) 即y ^=+ 【答案】 y ^=+2.(2013·启东中学高二检测)已知x ,y 的取值如下表所示:x 0134 y从散点图分析,y 与x 线性相关,且y =+a ,则a 的值为________. 【解析】 x =2,y =,∴a =-×2=. 【答案】3.调查了某地若干户家庭的年收入x (单位:万元)和年饮食支出y (单位:万元),调查显示年收入x 与年饮食支出y 具有线性相关关系,并由调查数据取得y 对x 的回归直线方程:y ^=+.由回归直线方程可知,家庭年收入每增加1万元,年饮食支出平均增加_______________________________万元.【解析】 由回归方程中斜率为,知x 每增加一个单位,y 平均增加单位. 【答案】4.某数学老师身高176 cm ,他爷爷、父亲和儿子的身高别离是173 cm 、170 cm 和182 cm.因儿子的身高与父亲的身高有关,该老师用线性回归分析的方式预测他孙子的身高为________cm.【解析】 设父切身高为x cm ,儿子身高为y cm ,则x173170176y170176182x =173,y =176,由公式计算得b =1,a =y -b x =176-1×173=3,则y ^=x +3,当x=182时,y ^=185.故预测该老师孙子的身高为185 cm.【答案】 1855.下列关于相关系数r 的叙述正确的是 ________.①|r |∈(0,+∞),|r |越大,相关程度越强,反之,相关程度越弱; ②|r |∈(-∞,+∞),|r |越大,相关程度越强,反之,相关程度越弱; ③|r |≤1,且|r |越接近于1,相关程度越强,|r |越接近于0,相关程度越弱; ④|r |≤1,且|r |越接近于1,相关程度越弱,|r |越接近于0,相关程度越强. 【解析】 |r |≤1,且|r |越接近于1,相关程度越强;|r |越接近于0,相关程度越弱. 【答案】 ③6.下表提供了某厂节能降耗技术改造后在生产A 产品进程中记录的产量x (吨)与相应的生产能耗y (吨)的几组对应数据:x 345 6 yt4按照上表提供的数,求出y 关于x 的线性回归方程为y =+,那么表中t 的值为________. 【解析】 由y =+,得错误!=×错误!+错误!=t =3.【答案】 37.(2012·课标全国卷)在一组样本数据(x 1,y 1),(x 2,y 2),…,(x n ,y n )(n ≥2,x 1,x 2,…,x n 不全相等)的散点图中,若所有样本点(x i ,y i )(i =1,2,…,n )都在直线y =12x+1上,则这组样本数据的样本相关系数为_____________.【解析】 按照样本相关系数的概念可知,当所有样本点都在直线上时,这组样本数据完全正相关,相关系数为1.【答案】 18.(2013·合肥模拟)下列四个命题:①从匀速传递的产品生产流水线上,质检员每20分钟从中抽取一件产品进行某项指标检测,这种抽样是分层抽样;②两个随机变量相关性越强,则相关系数的绝对值越接近于1;③在回归直线方程y ^=+12中,当解释变量x 每增加一个单位时,预报变量y ^平均增加个单位;④对分类变量X 与Y ,它们的随机变量χ2越小,“X 与Y 有关系”的把握程度越大.其中正确命题是 ________.【解析】 从匀速传递的产品生产流水线上,质检员每20分钟从中抽取一件产品进行某项指标检测,如此的抽样是系统抽样,即①不正确;两个随机变量相关性越强,则相关系数的绝对值越接近于1,即②正确,在回归直线方程y ^=+12中,当解释变量x 每增加一个单位时,预报变量y ^平均增加单位,即③正确,对分类变量X 与Y ,它们的随机变量χ2越小,“X 与Y 有关系”的把握程度越小,即④不正确,综上可得正确的命题序号为②③.【答案】 ②③ 二、解答题9.某种产品的广告费支出x (单位:百万元)与销售额y (单位:百万元)之间有如下对应数据:(1) (2)若广告费支出1 000万元时的实际销售额为8 500万元,求误差.【解】 (1)画出所给数据的散点图(图略),可知这些点在一条直线周围,能够成立销售额y 对广告费支出x 的线性回归方程.由数据计算可得x =5,y =50,由公式计算得b ^=,a ^=,所以y 对x 的线性回归方程为y ^=+.因此,对于广告费支出为1 000万元(即10百万元),由线性回归方程能够估量销售额为y ^=×10+=(百万元).(2)8 500万元即85百万元,实际数据与估量值的误差为85-=(百万元). 10.观察两个变量x ,y ,取得的数据如下表:(1)对变量y 与x (2)若是y 与x 之间具有线性相关关系,求回归直线方程. 【解】 (1)r =错误!≈ 7,=,故y 与x 之间显著线性相关 (2)y ^=-.11.高二(3)班学生每周用于数学学习的时刻x (单位:小时)与数学成绩Y (单位:分)之间有如下数据:x 24152319161120161713Y 92799789644783687159 若某同窗每周用于数学学习的时刻为18小时,试预测该同窗数学成绩.【解】因为学习时刻与学习成绩间具有相关关系,能够列出下表,并用科学计算器进行计算.i 12345678910 x i24152319161120161713 y i92799789644783687159 x i y i 2 208 1 185 2 231 1 691 1 024517 1 660 1 088 1 207767a∧=y-bx=-×≈.因此可求得回归直线方程为y∧=+.当x=18时,y∧=×18+=77.故该同窗估计可得77分左右.。
高中数学(苏教版 选修2-3)第3章 章末综合测评 Word版含答案
章末综合测评(三)统计案例(时间分钟,满分分)一、选择题(本大题共小题,每小题分,共分.将答案填在题中的横线上).在直线回归方程=+中,表示(填序号).①当增加一个单位时,增加的数量;②当增加一个单位时,增加的数量;③当增加一个单位时,的平均增加量;④当增加一个单位时,的平均增加量.【答案】③.线性回归方程=+所表示的直线必经过点.【答案】(,).经调查某地若干户家庭的年收入(万元)和年饮食支出(万元)具有线性相关关系,并得到关于的线性回归直线方程:=+,由线性回归直线方程可知,家庭年收入每增加万元,年饮食支出平均增加万元.【解析】∵关于的线性回归直线方程:=+,①∴年收入增加万元时,年饮食支出=(+)+,②②-①可得:年饮食支出平均增加万元.【答案】.对于线性回归方程=+,下列说法中不正确的序号是.①增加一个单位时,平均增加个单位;②样本数据中=时,可能=;③样本数据中=时,一定有=.【解析】线性回归方程=+中,增加一个单位时,平均增加个单位,故①正确;线性回归方程=+中,样本数据中=时,可能有=,也可能有≠,故②正确,③不正确.【答案】③.已知,的取值如下表,如果与呈线性相关,且线性回归方程为=+,则=.【解析】又∵线性回归方程过样本中心点,且==,==,∴回归方程过点(),∴=+,∴=-.【答案】-.若线性回归直线方程中的回归系数=,则相关系数等于.【导学号:】【解析】由于在回归系数的计算公式中,与相关系数的计算公式中,它们的分子相同,所以=.【答案】.在一组样本数据(,),(,),…,(,)(≥,,,…,不全相等)的散点图中,若所有样本点(,)(=,…,)都在直线=+上,则这组样本数据的样本相关系数为.(填序号)①-;②;③;④【解析】当所有样本点都在一条直线上时,相关系数为.故填④.【答案】④.观察图中各图形:图其中两个变量,具有相关关系的图是.【解析】由散点图知③④具有相关关系.【答案】③④。
苏教版数学高二-【优化课堂】数学苏教版选修2-3练测 3.2 回归分析
3.2 回归分析 同步练测1.为了考察两个变量x,y之间的线性相关性,甲,乙两个同学各自独立做10次和15次的试验,并利用线性回归方法,求得回归直线l 1和l 2.已知两人在试验中,发现变量x的观测数据的平均值刚好相等,都为a;变量y的观测数据的平均值刚好也相等,都为b.则下列说法正确的是 .①直线l 1和l 2有交点(a ,b );②直线l 1和l 2相交,但是交点未必是(a ,b );③直线l 1和l 2的斜率相等,所以必定平行; ④直线l 1和l 2必定重合.2.设有一个回归方程yˆ¿2−2.5x ,变量x增加一个单位时,变量yˆ平均减少 个单位.3.已知x 与y 之间的一组数据:(0,1),(1,3),(2,5),(3,7),则y 与x 的线性回归方程必过点 .4.已知回归直线斜率的估计值是1.23,样本平均数x =4,y =5,则该回归直线方程为 .kg )的数据,若两个变现取了8对观测值,计算得8152ii x ==å,81228i i y ==å,821478ii x ==å,811849i i i x y ==å,则y与x的回归直线方程是 .二、解答题(本题共4小题,共64分)7.(16分)某小卖部为了了解热茶销售量与气温之间的关系,随机统计并制作了某6天卖出的画出散点图并判断热茶销售量与气温之间是否具有线性相关关系.8.(16分)对于x与y有如下观测数据:(1)对x与y作回归分析;(2)求出x与y的回归方程.9.(16分)调查某市出租车使用年限x和该年支出维修费用y(万元),得到数据如下:(1)求线性回归方程;(2)由(1)中结论预测第10年所支出的维修费用.10.(16分)某车间为了规定工时定额,需要确定加工零件所花费的时间,为此进行了10次试验,测得的数据如下:如果y与x是线性相关的,求.3.2 回归分析同步练测答题纸得分:一、填空题1. 2. 3.4. 5. 6.二、解答题7.8.9.10.3.2 回归分析同步练测参考答案一、填空题a;变量y的观测1.① 解析:∵ 变量x的观测数据的平均值刚好相等,都为(a,b).根数据的平均值刚好也相等,都为b,∴ 两组数据的样本中心点是相同的,都是据线性回归直线过样本中心点,得两条直线有交点(a ,b ).2.2.5 解析:回归方程yˆ¿2−2.5x ,变量x增加一个单位时,变量yˆ平均变化2−5(x +1)−(2−5x )=−25,∴ 变量yˆ平均减少2.5个单位.3.(1.5,4) 解析:∵ ,447531,5.143210=+++==+++=y x∴ 本组数据的样本中心点是(1.5,4),∴y与x的线性回归方程必过点(1.5,4).4.yˆ=1.23x+0.08 解析:∵ 回归直线斜率的估计值是1.23,∴ 线性回归方程可设为y =1.23x +a .∵ 样本平均数x=4,y =5,∴ 样本中心点是(4,5),∴ 5=1.23×4+a ,∴ a =0.08,∴ 线性回归方程是yˆ¿1.23x +0.08.5.−121.04解析:∵,7556585708075,1695160178166171170=++++==++++=y x∴ 这组数据的样本中心点是(169,75).∵ 两个变量间的回归直线方程为yˆ¿1.16x +a ,∴ 75=1.16×169+a ,∴a =−121.04.6.$11.472.62y x =+二、解答题7.解:以x 表示气温,y 表示热茶杯数,画出散点图如图所示.622222221261813104(1)1286ii x==+++++-=∑,6126201824133410384501641910i ii x y==⨯+⨯+⨯+⨯+⨯-⨯=∑,62222222120243438506410172i i y ==+++++=∑,所以0.97r =-.,所以x 与y 具有很强的线性相关关系.8.解:(1)作相关性检验.,82111920ii x==∑,821428ii y==∑,812257i ii x y==∑,由于0.9910.707r =>,因此认为两个变量有很强的线性相关关系. (2)由公式得b ≈0.191,a =y −b x =7−019×37=−067,所以0.1910.067y x =-.(2)当x=10时,38.1208.1023.1^=+⨯=y(万元),即估计使用10年时维修费用是12.38万元.10.解用计算器求得x=55,y=91.7,ˆb==25510385007.91551055950⨯-⨯⨯-≈0.668,=y-x=91.7-0.668×55=54.96.故所求的回直线方程为yˆ=0.668x+54.96.。
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
学业分层测评
(建议用时:45分钟)
[学业达标]
一、填空题
1.如图3-2-2所示,对变量x,y有观测数据(x i,y i)(i=1,2,…,10),得散点图(1);对变量u,v有观测数据(u i,v i)(i=1,2,…,10),得散点图(2).由这两个散点图可以判断________.
图3-2-2
①变量x与y正相关,u与v正相关;
②变量x与y正相关,u与v负相关;
③变量x与y负相关,u与v正相关;
④变量x与y负相关,u与v负相关.
【解析】由图(1)知,x与y是负相关,由图(2)知,u与v是正相关,故③正确.
【答案】③
2.已知对一组观测值(x i,y i)(i=1,2,…,n)作出散点图后,确定具有线性^=a^+b^x,求得b^=0.51,x=61.75,y=38.14,则线性回归相关关系,若对于y
方程为________.
^=y-b^x=38.14-0.51×61.75=6.647 5≈6.65.
【解析】∵a
^=0.51x+6.65.
∴y
^=0.51x+6.65
【答案】y
3.某产品的广告费用x与销售额y的统计数据如下表:
根据上表可得回归方程y ^=b ^x +a ^中的b ^
为9.4,据此模型,预报广告费用为6万元时销售额为______万元.
【解析】 样本中心点是(3.5,42),则a ^=y --b ^x -
=42-9.4×3.5=9.1,所以回归直线方程是y ^=9.4x +9.1,把x =6代入得y ^=65.5.
【答案】 65.5
4.对两个具有线性相关关系的变量进行回归分析时,得到一个回归方程y ^=1.5x +45,x ∈{1,5,7,13,14},则y -=________.
【解析】 由x -=8,得y -=1.5×8+45=57. 【答案】 57
5.已知x ,y 的取值如下表:
画出散点图,从所得的散点图分析,y 与x 线性相关,且y =0.95x +a ^,则a ^=________. 【导学号:29440070】
【解析】 因为回归方程必过样本点的中心(x -,y -),解得x -=2,y -=4.5,将(2,4.5)代入y ^=0.95x +a
^,可得a ^=2.6. 【答案】 2.6
6.一轮又一轮的寒潮席卷全国.某商场为了了解某品牌羽绒服的月销售量y (件)与月平均气温x (℃)之间的关系,随机统计了某4个月的月销售量与当月平均气温,数据如下表:
由表中数据算出线性回归方程y =b x +a 中的b ≈-2.气象部门预测下个月的
平均气温约为 6 ℃,据此估计,该商场下个月羽绒服的销售量的件数约为________.
【解析】 ∵样本点的中心为(10,38), ∴38=-2×10+a
^.
∴a ^=58,即y ^
=-2x +58. ∴当x =6时,y =46. 【答案】 46
7.对具有线性相关关系的变量x ,y 有观测数据(x i ,y i )(i =1,2,…,10),它们之间的线性回归方程是y =3x +20,若∑i =1
10
x i =18,则∑i =1
10
y i =________.
【解析】 由于∑i =1
10
x i =18,
则x -=1.8,∵(x -,y -)在回归方程上, ∴y -=3×1.8+20=25.4, ∴∑i =110
y i =10y -=254.
【答案】 254
8.已知回归直线的斜率的估计值为1.23,样本点的中心为(4,5),则回归直线方程是________.
【解析】 由斜率的估计值为1.23,且回归直线一定经过样本点的中心(4,5),可得y ^-5=1.23(x -4),即y ^=1.23x +0.08.
【答案】 y ^=1.23x +0.08 二、解答题 9.对于数据组:
(1)(2)求线性回归方程.
【解】 (1)作图略.x ,y 具有很好的线性相关性. (2)设y ^=a
^+b ^x , 因为x -=2.5,y -=5,∑4
i =1
x i y i =60,
∑4
i =1
x 2i =30, 故b
^=60-4×2.5×5
30-4×2.52
=2,
a ^=y --
b ^x -=5-2×2.5=0, 故所求的回归直线方程为y ^=2x .
10.下表为某地近几年机动车辆数与交通事故的统计资料,求出y 关于x 的线性回归方程.
【解】 ∑i =1
x i =1 031,∑i =1y i =71.6,∑i =1x 2
i
=137 835,∑i =1
x i y i =9 611.7,x -
=128.875,y -=8.95,将它们代入⎩⎨⎧
b
^=∑n
i =1
x i y i -n x - y -∑n
i =1x 2
i -n (x -)2
,
a ^=y --
b ^x -,
计算得b
^≈0.077 4.a ^=-1.025,
所以,所求线性回归方程为y ^=0.077 4x -1.025.
[能力提升]
1.对具有线性相关关系的变量x ,y 有观测数据(x i ,y i )(i =1,2,…,10),它
们之间的线性回归方程是y ^
=3x +20,若∑10i =1x i =18,则∑10
i =1y i
=________. 【解析】 由∑10
i =1
x i =18,得x =1.8. 因为点(x ,y )在直线y ^=3x +20上,则y =25.4. 所以∑10
i =1y i =25.4×10=254. 【答案】 254
2.已知对一组观测值(x i ,y i )(i =1,2,…,n )作出散点图后,确定具有线性
相关关系,若对于y ^=a ^+b ^x ,求得b ^=0.51,x -=61.75,y -
=38.14,则线性回归方程为________.
【解析】 ∵a ^=y --b ^x -
=38.14-0.51×61.75 =6.647 5≈6.65.∴y ^=0.51x +6.65. 【答案】 y =0.51x +6.65
3.若线性回归方程中的回归系数b
^=0,则相关系数r =________. 【解析】 b
^=
∑i =1
n
(x i -x -)(y i -y -)∑i =1
n (x i -x -
)2,
r =
∑i =1
n
(x i -x -
)(y i -y -)∑i =1
n
(x i -x -)2
∑i =1
n (y i -y -
)2.
由计算公式知,若b =0,则r =0. 【答案】 0
4.某农科所对冬季昼夜温差大小与某反季节大豆新品种发芽多少之间的关系进行分析研究,他们分别记录了12月1日至12月5日的每天昼夜温差与实验室每天每100棵种子中的发芽数,得到如下资料:
程,剩下的2组数据用于回归方程检验.
(1)若选取的是12月1日与12月5日的2组数据,请根据12月2日至12月4日的数据,求出y 关于x 的线性回归方程y ^=b
^x +a ^;
(2)若由线性回归方程得到的估计数据与所选出的检验数据的误差均不超过
2颗,则认为得到的线性回归方程是可靠的,试问(1)中所得的线性回归方程是否可靠?
(3)请预测温差为14 ℃的发芽数.
【解】 (1)由数据求得,x =12,y =27, 由公式求得,b
^=52,a ^=y -b ^x =-3.
所以y 关于x 的线性回归方程为y ^
=52x -3. (2)当x =10时,y ^=5
2×10-3=22,|22-23|<2;
当x =8时,y ^=5
2×8-3=17,|17-16|<2. 所以该研究所得到的线性回归方程是可靠的. (3)当x =14时,有y ^=52×14-3=35-3=32, 所以当温差为14 ℃时的发芽数约为32颗.。