线性回归分析经典例题
多元线性回归例题第章作业(一)
多元线性回归例题第章作业(一)多元线性回归是一种统计学方法,通常用于分析建立多个变量之间的关系模型。
在实际数据分析中,多元线性回归是十分常见且实用的方法。
本文将以一道例题为例,介绍多元线性回归的基本原理及应用方法。
例题:某公司市场销售状况与广告投入的相关性分析。
根据公司过往的销售记录,有如下数据:市场销售(单位:万元):10,20,30,25,35广告投入(单位:万元):5,10,15,12,18解析:1. 确定预测模型在多元线性回归中,首先要确定 Y 与X1,X2,…,Xn 之间的函数关系,一般形式为:Y = β0 + β1X1 + β2X2 + … + βnXn + ε其中,β1, β2,…, βn为自变量系数,β0为常数项,而ε 则表示随机误差。
2. 根据数据集,求解系数通过数据集计算出β0,β1, β2,…, βn的值,从而得到回归方程式,可以通过excel工具中多元线性回归的公式求解得到。
3. 结果解释根据计算结果,对于此例,得到回归方程式:Y = 7.5 + 2.5X1 + 1.5X2其中,X1表示广告投入,X2表示销售额,可以解读得到,每增加1万元广告投入,市场销售量会增加 2.5万元,同时,其拟合优度也很好,在本例中拟合优度高达 0.97。
4. 结论通过多元线性回归,我们可以得到两个变量之间的函数关系式及预测结果,从而为市场策略和决策提供理论依据。
本题中,我们能够得出有利于市场销售的投入策略,即增加广告投入可以带来市场销售量的增长,而这种关系随着投入的增加而呈现出逐渐缓和,也就是得出了“策略的上升边际递减性”这样一个结论。
总结:多元线性回归在实际数据分析中的应用非常广泛,并且能够解决多个自变量与因变量之间的复杂关系。
在研究某种现象或问题时,通过多元线性回归建立适当的模型,可以通过计算得到更加准确的结果,从而更科学更有效地解决问题。
(完整版)数学必修三回归分析经典题型(带答案)
数学必修三回归分析经典题型1.一位母亲记录了儿子3~9岁的身高,由此建立的身高与年龄的回归模型为93.7319.7ˆ+=x y用这个模型预测这个孩子10岁时的身高,则正确的叙述是( ) A.身高一定是145.83cm B.身高在145.83cm 以上 C.身高在145.83cm 以下 D.身高在145.83cm 左右 【答案】D【解析】解:把x=10代入可以得到预测值为145.83,由于回归模型是针对3-9岁的孩子的,因此这个仅仅是估计值,只能说左右,不能说在上或者下,没有标准。
选D2.对有线性相关关系的两个变量建立的线性回归方程$y =$a+b $x ,关于回归系数b $,下面叙述正确的是________.①可以小于0;②大于0;③能等于0;④只能小于0. 【答案】①【解析】由b$和r 的公式可知,当r =0时,这两变量不具有线性相关关系,但b 能大于0也能小于0.3.对具有线性相关关系的变量x 、y 有观测数据(x i ,y i )(i =1,2,…,10),它们之间的线性回归方程是$y =3x +20,若101i i x =∑=18,则101i i y =∑=________.【答案】254【解析】由101i i x =∑=18 1.8.因为点在直线$y =3x +2025.4. 所以101i i y =∑=25.4×10=254.4.下表是某厂1~4由散点图可知,用水量其线性回归直线方程是y =-0.7x +a ,则a 等于________. 【答案】5.252.53.5,∵回归直线方程过定点, ∴3.5=-0.7×2.5+a. ∴a =5.25.5.由一组样本数据(x 1,y 1),(x 2,y 2),…,(x n ,y n )得到线性回归方程$y =b$x +$a ,那么下列说法正确的是________.①直线$y =b$x +$a 必经过点(x ,y ); ②直线$y =b$x +$a 至少经过点(x 1,y 1),(x 2,y 2),…,(x n ,y n )中的一个点; ③直线$y =b$x +$a 的斜率为1221ni ii nii x ynx y xnx==--∑∑;④直线$y =b $x +$a 和各点(x 1,y 1),(x 2,y 2),…,(x n ,y n )的偏差$21()ni i i b a y x =⎡⎤⎣⎦∑$-+是该坐标平面上的直线与这些点的最小偏差.【答案】①③④【解析】回归直线的斜率为b ,故③正确,回归直线不一定经过样本点,但一定经过样本中心,故①正确,②不正确.6.某数学老师身高176 cm ,他爷爷、父亲和儿子的身高分别是173 cm 、170 cm 和182 cm.因儿子的身高与父亲的身高有关,该老师用线性回归分析的方法预测他孙子的身高为________cm. 【答案】185【解析】设父亲身高为173176,b$= $a=-b $ 176-1×173=3, ∴$y =x +3,当x =182时,$y =185.7.下表是关于宿州市服装机械厂某设备的使用年限(年)和所需要的维修费用y (万元)的几组统计数据:)请根据上表提供的数据,用最小二乘法求出y 关于的线性回归方程;(2)估计使用年限为10年时,维修费用为多少?【答案】解:(1)0.08 1.23yx =+线性回归方程为 (2)估计使用年限为10年时,维修费用为12.38万元. 【解析】(1)先求然后利用公可求出回归直线y ax b =+方程.(2)把x=10代入回归直线方程可得y 的值,就可得所求的值.解:(1906543222222512=++++=∑=i ixΘ又x y 23.108.0+=∴线性回归方程为 (2)把10=x 代入回归方程得到:38.121023.108.0=⨯+=y∴估计使用年限为10年时,维修费用为12.38万元.。
线性回归分析练习题
§1回归剖析一.基本过关1.下列变量之间的关系是函数关系的是( )A.已知二次函数y=ax2+bx+c,个中a,c是已知常数,取b为自变量,因变量是这个函数的判别式Δ=b2-4acB.光照时光和果树亩产量C.降雪量和交通变乱产生率D.每亩施用肥料量和食粮产量2.在以下四个散点图中,个中实用于作线性回归的散点图为( )A.①②B.①③C.②③D.③④3.下列变量中,属于负相干的是( )A.收入增长,储蓄额增长B.产量增长,临盆费用增长C.收入增长,支出增长D.价钱降低,花费增长4.已知对一组不雅察值(x i,y i)作出散点图后肯定具有线性相干关系,若对于y =bx+a,求得b=0.51,x=61.75,y=38.14,则线性回归方程为A.yx+6.65 B.yxC.yx+42.30 D.yx5.对于回归剖析,下列说法错误的是( )A.在回归剖析中,变量间的关系若长短肯定关系,那么因变量不克不及由自变量独一肯定B.线性相干系数可所以正的,也可所以负的C.回归剖析中,假如r2=1,解释x与y之间完整相干D.样底细关系数r∈(-1,1)6.下表是x 和y 之间的一组数据,则y 关于x 的回归方程必过( )A.点B .点(1.5,4)C .点D .点(2.5,5)7.若线性回归方程中的回归系数b =0,则相干系数r =________. 二.才能晋升8.若施化肥量x (kg)与小麦产量y (kg)之间的线性回归方程为y =250+4x ,当施化肥量为50 kg 时,估计小麦产量为________ kg.9.某车间为了划定工时定额,需肯定加工零件所花费的时光,为此做了4次实验,得到的数据如下:若加工时光y (1)求加工时光与零件个数的线性回归方程; (2)试预告加工10个零件须要的时光.10.在一段时光内,分5次测得某种商品的价钱x (万元)和需求量y (t)之间的一组数据为:已知∑5i =1x i y i =62,∑i =1x 2i =16.6. (1)画出散点图;(2)求出y 对x 的线性回归方程;(3)假如价钱定为1.9万元,猜测需求量大约是若干?(准确到0.01 t). 11.某运发动练习次数与活动成绩之间的数据关系如下:(1)(2)求出回归方程;(3)盘算相干系数并进行相干性磨练;(4)试猜测该运发动练习47次及55次的成绩.答案1.7.0 8.yx 9.45010.解 (1)由表中数据,应用科学盘算器得x =2+3+4+54=3.5,y =2.5+3+4+4.54=3.5,∑4i =1x i y i =52.5,∑4i =1x 2i =54, b =∑4i =1xiyi -4x y ∑4i =1x2i -4x 2=52.5-4××3.554-4×3.52=0.7,a =y -b x =1.05,是以,所求的线性回归方程为yx +1.05.(2)将x =10代入线性回归方程,得y ×10+1.05=8.05(小时),即加工10个零件的预告时光为8.05小时. 11.解 (1)散点图如下图所示:(2)因为x =15×9=1.8,y =15×37=7.4,∑5i =1x i y i =62,∑5i =1x 2i =16.6,所以b =∑5i =1xiyi -5x y ∑5i =1x2i -5x 2=62-5××7.416.6-5×1.82=-11.5,a =y -b x ×1.8=28.1,故y 对x 的线性回归方程为yx . (3)y ×1.9=6.25(t).所以,假如价钱定为1.9万元,则需求量大约是6.25 t.12.解 (1)作出该运发动练习次数x 与成绩y 之间的散点图,如下图所示,由散点图可知,它们之间具有线性相干关系. (2)列表盘算:由上表可求得x =39.25,y =40.875, ∑8i =1x 2i =12 656,∑8i =1y 2i =13 731,∑8i =1x i y i =13 180, ∴b =∑8i =1xiyi -8x y ∑8i =1x2i -8x 2≈1.041 5,a =y -b x =-0.003 88,∴线性回归方程为y =1.041 5x -0.003 88.(3)盘算相干系数r =0.992 7,是以运发动的成绩和练习次数两个变量有较强的相干关系.(4)由上述剖析可知,我们可用线性回归方程y =1.041 5x -0.003 88作为该运发动成绩的预告值.将x =47和x =55分离代入该方程可得y =49和y =57.故猜测该运发动练习47次和55次的成绩分离为49和57. 13.解 ∵s x =lxyn ,s y =lxyn, ∴lxy n=r lxyn·lyy n ××15.2=57.76.∴β1=lxy n lxy n=57.767.62=1, β0=y -β1x =72-1×172=-100.故由身高估量平均体重的回归方程为y =x -100. 由x ,y 地位的对称性,得b =lxyn lxy n =57.7615.22=0.25,∴a =x -b y ×72=154.故由体重估量平均身高的回归方程为xy +154.可线性化的回归剖析一.基本过关1.某商品发卖量y(件)与发卖价钱x(元/件)负相干,则其线性回归方程可能是()A.y=-10x+200 B.y=10x+200C.y=-10x-200 D.y=10x-200 2.在线性回归方程y=a+bx中,回归系数b暗示()A.当x=0时,y的平均值 B.x变动一个单位时,y 的现实变动量C.y变动一个单位时,x的平均变动量 D.x变动一个单位时,y 的平均变动量3.对于指数曲线y=a e bx,令u=ln y,c=ln a,经由非线性化回归剖析之后,可以转化成的情势为()A.u=c+bx B.u=b+cx C.y=b+cx D.y=c+bx4.下列说法错误的是()A.当变量之间的相干关系不是线性相干关系时,也能直接用线性回归方程描写它们之间的相干关系B.把非线性回归化为线性回归为我们解决问题供给一种办法C.当变量之间的相干关系不是线性相干关系时,也能描写变量之间的相干关系D.当变量之间的相干关系不是线性相干关系时,可以经由过程恰当的变换使其转换为线性关系,将问题化为线性回归剖析问题来解决5.每一吨铸铁成本y c(元)与铸件废品率x%树立的回归方程y c=56+8x,下列说法准确的是 ()A.废品率每增长1%,成本每吨增长64元 B.废品率每增长1%,成本每吨增长8%C.废品率每增长1%,成本每吨增长8元 D.假如废品率增长1%,则每吨成本为56元6.为了考核两个变量x和y之间的线性相干性,甲.乙两个同窗各自自力地做10次和15次实验,并且应用线性回归办法,求得回归直线分离为l1和l2.已知在两小我的实验中发明对变量x的不雅测数据的平均值正好相等,都为s,对变量y的不雅测数据的平均值也正好相等,都为t.那么下列说法准确的是 ()A.直线l1和l2有交点(s,t)B.直线l1和l2订交,但是交点未必是点(s,t) C.直线l1和l2因为斜率相等,所以肯定平行 D.直线l1和l2肯定重合二.才能晋升7.研讨人员对10个家庭的儿童问题行动程度(X)及其母亲的不耐烦程度(Y)进行了评价成果如下,家庭1,2,3,4,5,6,7,8,9,10,儿童得分:72,40,52,87,39,95,12,64,49,46,母亲得分:79,62,53,89,81,90,10,82,78,70.下列哪个方程可以较恰当的拟合()A.y=0.771 1x+.y=36.958ln x-C.y=1.177 8x1.014 5D.y=20.924e0.019 3x8.已知x,y之间的一组数据如下表:则y与x.9.已知线性回归方程为y=x-,则x=25时,y的估量值为________.10.在一次抽样查询拜访中测得样本的5个样本点,数值如下表:(1)树立y与x(211.某地区六年来轻工业产品利润总额y 与年次x 的实验数据如下表所示:由经验知ab xe 0.个中a .b 均为正数,求y 关于x 的回归方程.(保存三位有用数字)三.探讨与拓展12.某市肆各个时代的商品流畅率y (%)和商品零售额x (万元)材料如下:散点图显示出x 都证实,流畅率y 决议于商品的零售额x ,表现着经营范围效益,假定它们之间消失关系式:y =a +bx .试依据上表数据,求出a 与b 的估量值,并估量商品零售额为30万元时的商品流畅率.答案1. 8.10.解 画出散点图如图(1)所示,不雅察可知y 与x 近似是反比例函数关系.设y =k x (k ≠0),令t =1x ,则y =kt .可得到y 关于t 的数据如下表:画出散点图如图(2),是以可应用线性回归模子进行拟合,易得: b =∑5i =1tiyi -5t y ∑5i =1t2i -5t 2≈4.134 4,a =y -b t ≈0.791 7,所以y =4.134 4t +0.791 7,所以y 与x 的回归方程是y =4.134 4x +0.791 7.11.解 对y =ab xe 0双方取对数,得ln y =ln a e 0+x ln b ,令z =ln y , 则z 与x 的数据如下表:由z =ln a e 0+a e 0≈, 即z =+0.047 7x ,所以y =×x.12.解 设u =1x,则y ≈a +bu ,得下表数据:进而可得n =10,u ≈0.060 4,y =, ∑i =110u2i -10u 2≈0.004 557 3, ∑i =110u i y i -10u y ≈0.256 35,b ≈0.256 350.004 557 3≈,a =y -b ·u ≈-0.187 5,所求的回归方程为y =-0.187 5+56.25x.当x =30时,y =1.687 5,即商品零售额为30万元时,商品流畅率为1.687 5%.。
一元线性回归模型典型例题分析
第二章 一元线性回归模型典型例题分析例1、令kids 表示一名妇女生育孩子的数目,educ 表示该妇女接受过教育的年数.生育率对教育年数的简单回归模型为μββ++=educ kids 10(1)随机扰动项μ包含什么样的因素?它们可能与教育水平相关吗?(2)上述简单回归分析能够揭示教育对生育率在其他条件不变下的影响吗?请解释.例2.已知回归模型μβα++=N E ,式中E 为某类公司一名新员工的起始薪金(元),N 为所受教育水平(年).随机扰动项μ的分布未知,其他所有假设都满足。
如果被解释变量新员工起始薪金的计量单位由元改为100元,估计的截距项与斜率项有无变化?如果解释变量所受教育水平的度量单位由年改为月,估计的截距项与斜率项有无变化?例3.对于人均存款与人均收入之间的关系式t t t Y S μβα++=使用美国36年的年度数据得如下估计模型,括号内为标准差:)011.0()105.151(067.0105.384ˆtt Y S +=2R =0.538 023.199ˆ=σ(1)β的经济解释是什么?(2)α和β的符号是什么?为什么?实际的符号与你的直觉一致吗?如果有冲突的话,你可以给出可能的原因吗?(3)对于拟合优度你有什么看法吗? (4)检验统计值?例4.下列方程哪些是正确的?哪些是错误的?为什么?⑴ y x t n t t =+=αβ12,,, ⑵ y x t n t t t =++=αβμ12,,,⑶ y x t n t t t=++= ,,,αβμ12⑷ ,,,y x t n t t t =++=αβμ12 ⑸ y x t n t t =+= ,,,αβ12 ⑹ ,,,y x t n t t =+=αβ12⑺ y x t n t t t =++= ,,,αβμ12 ⑻ ,,,y x t n t tt =++=αβμ12其中带“^”者表示“估计值”.例5.对于过原点回归模型i i i u X Y +=1β ,试证明∑=∧221)(iu XVar σβ例6、对没有截距项的一元回归模型i i i X Y μβ+=1称之为过原点回归(regression through the origin )。
1.6.3 线性回归 典型例题
1.6 线性回归 典型例题 产量与生产费用的线性回归例 某工业部门进行一项研究,分析该部门的产量与生产费用之间的关系,从这个工业部门内随机抽选了10个企业作样本,有如下资料:完成下列要求:(1)计算x 与y 的相关系数;(2)对这两个变量之间是否线性相关进行相关性检验;(3)设回归直线方程为a bx y+=ˆ,求系数b a 、. 分析:(1)使用样本相关系数(即相关系数)计算公式:))((1222121∑∑∑===---=ni i n i i ni ii y n y x n x yx n yx r 即可完成此问:(2)查表行出显著性水平0.05与自由度10-2相应的相关系数临界值05.0r ,通过比较r 与05.0r 的大小,以检验所得结果,来说明y 与x 之间的线性相关是否显著.(3)此问解法与上两题相同.解:(1)制表:;806.0)7.16510277119)(7.771070903(7.1657.771013292922≈⨯-⨯-⨯⨯-=r即x 与y 的相关系数806.0≈r ;(2)查表显著性水平0.05,自由度10-2=8相应的相关系数临界值6319.005.0=r ;因为,05.0r r >,所以,可以认为x 与y 之间具有线性相关关系.(3);397.07.7710709037.1657.77101329292≈⨯-⨯⨯-=b .8.1347.77397.07.165=⨯-=a说明:如果会使用含统计的科学计算器,能简单得到∑∑∑∑∑-====10110110110110122,,,,,i i i i i ii iiiiy x y x y x 这些量,就无需有制表这一步,直接算出结果就行了制表的目的是为了准确无误而快速有效地得到r 和b 的值.顺便值得一提的是:电脑中的许多应用软件,特别是表格类软件是提供统计计算函数的,用起来非常方便.产品产量与单位成本的线性回归分析分析:这是一个实际应用的回归分析问题,其实就是找出回归方程,通过回归直线方程来分析产品产量与单位成本的关系.解:设回归直线方程为,ˆa bx y+=∑∑=======61121481,79,716426,621i ni i i i y x x y x ,所以代入公式,36.77621)8182.1(71,8182.15.51062167971621614812≈⨯--=-≈-=⎪⎭⎫⎝⎛⨯-⨯⨯-=a b ,故回归直线方程为:;82.136.77ˆx y-= 由于回归系数b 为-1.82,由回归系数b 的意义可知:产量每增加1000件,单位成本下降1.82元.说明:回归分析,说明y 与x 它们之间是一元线性回归关系.回归方程中的回归系数b 和a ,刻画了这x 与y 两个量之间的变化趋势,对它们所反映出的信息进行分析,就是回归分析.对求和符号的理解例 下列表达式中错误的是( )A .∑=-+=-+nk n n na d k a 1112)1(])1([ B .∑∑==++-=-n k nk k n n a na k a 11222)1()(C .∑=-=nk nknC112 D .∑=-+=nk n kk n k n b a b a C 1)( 分析:符号“∑” 表示若干个数相加,“∑=nk 1”的下标1=k ,上标n 的含义是:将“∑=nk 1”符号后的表达式中,含k 的部分分别取1,2,3,…,n 后所得式子依次加起来,即∑=++==nk n f f f k f k f 1).()2()1()()(Λ解:分别计算ABCD 知:∑∑==-+=-+++++=-+=-+n k nk d n n na d n n a d k n a d k a 111111.2)1()1210()1(])1([Λ∑∑∑∑∑======+-=+-=-n k nk n k n k nk na k ak a k ak a k a 112211222212)2()(∑∑∑∑====++-=++-=+-nk nk n k nk k n n a na k n n a na k k a 111122222.)1(2)1(22∑=-=-+++++=++++=nk n n n n n n n n n n n n k n C C C C C C C C C C13210321.121)(ΛΛ∑=-----+=+++++=nk nn n n n n k k n k n n n n n k kn k na Cb a b C b a C b a C b a C b aC 1022211.)(ΛΛ故只有D 是错误的。
回归分析练习题
1. 从20的样本中得到的有关回归结果是:SSR=60,SSE=40。
要检验x 与y 之间的线性关系是否显著,即检验假设:01:0H β=。
(1)线性关系检验的统计量F 值是多少? (2)给定显著性水平a =0.05,F a 是多少? (3)是拒绝原假设还是不拒绝原假设?(4)假定x 与y 之间是负相关,计算相关系数r 。
(5)检验x 与y 之间的线性关系是否显著?解:(1)SSR 的自由度为k=1;SSE 的自由度为n-k-1=18;因此:F=1SSR k SSE n k --=6014018=27 (2)()1,18F α=()0.051,18F =4.41 (3)拒绝原假设,线性关系显著。
(4),由于是负相关,因此r=-0.7746(5)从F 检验看线性关系显著。
2. 某汽车生产商欲了解广告费用(x)对销售量(y)的影响,收集了过去12年的有关数据。
通过计算得到下面的有关结果:(1)完成上面的方差分析表。
(2)汽车销售量的变差中有多少是由于广告费用的变动引起的?(3)销售量与广告费用之间的相关系数是多少?(4)写出估计的回归方程并解释回归系数的实际意义。
(5)检验线性关系的显著性(a=0.05)。
(2)R2=0.9756,汽车销售量的变差中有97.56%是由于广告费用的变动引起的。
(3)r=0.9877。
(4)回归系数的意义:广告费用每增加一个单位,汽车销量就增加1.42个单位。
(5)回归系数的检验:p=2.17E—09<α,回归系数不等于0,显著。
回归直线的检验:p=2.17E—09<α,回归直线显著。
3. 根据两个自变量得到的多元回归方程为12ˆ18.4 2.014.74yx x =-++,并且已知n =10,SST =6 724.125,SSR =6 216.375,1ˆ0.0813s β=,2ˆs β=0.056 7。
要求:(1)在a=0.05的显著性水平下,12,x x 与y 的线性关系是否显著? (2)在a =0.05的显著性水平下,1β是否显著?(3)在a =0.05的显著性水平下,2β是否显著?解(1)回归方程的显著性检验:假设:H 0:1β=2β=0 H 1:1β,2β不全等于0 SSE=SST-SSR=6 724.125-6 216.375=507.75 F=1SSR p SSE n p --=6724.1252507.751021--=42.85()2,7F α=4.74,F>()2,7F α,认为线性关系显著。
回归分析例题[整理]
例题:利用我国原煤产量和铁路总货运量,建立一元线性回归预测方程。
解:第一步,准备和整理资料数据、搜集的资料要具有权威性和准确性。
1950~1990年我国煤炭产量与铁路货运量的实际数字见表3—8的X i和Y i两列。
第二步,确定自变量(原煤产量)和因变量(铁路货运量)。
第三步,作散点图。
根据数据资料作出的散点图见图3—10。
从该散点图看出,铁路货运量与煤产量的关系是一种正相关关系,特别在1980年以前,这种关系接近于线性。
第四步,确定预测模型的形式。
根据第三步选择线性回归模型:第五步,计算模型参数b0和b1。
首先把l 950年~1979年的数据代入计算,得到b0=34.499,b1=1.727,于是有回归方程:第六步.计算估计误差和相关系数。
经计算,估计标准误差:相关系数:r=0.9852。
第七步,初步经验检验。
从经验知道,铁路运量一般是应该随煤产量增加而增加的,就是说经验要求回归系数b1为正值,如果计算得到的是负值,就要检查原因。
在这里,b1为正值,说明回归方程并不违反经验常识,这一级检验通过。
第八步,统计检验。
统计检验包括以下几个方面的内容:a.离散系数检验。
要求小于10~15%。
b.相关系数检验。
一般认为相关系数r的绝对值若大于0.7,x和y就具有较高的相关程度。
本例中r=0.9852,两变量高度相关,c.判定系数检验。
r2=0.9726,说明因变量各实际值与估计值离差的97%以上已被回归方程解释,未被解释的只占不到3%。
d.t检验。
本例中t=30.4>t0.025(28)=2.084,模型通过了t检验。
e.D—W检验。
样本期间数n=30,自变量个数K’=1,显著性水平α=0.05的情况下,查D —W分布表得dL=1.35,du=1.49。
因为D—W=0.5492<dL=1.35,由判断标准可知,随机误差u i之间存在正的自相关问题。
也就是说,由于模型的随机误差存在正的自相关问题,用它进行预测可能会导致估计值过高。
线性回归习题答案
线性回归习题答案线性回归是统计学中一种常见的数据分析方法,用于建立自变量与因变量之间的线性关系模型。
在实际应用中,线性回归模型常用于预测、趋势分析和关联度分析等领域。
下面将通过一些典型的线性回归习题来探讨其应用。
习题一:某公司根据过去几年的销售数据,建立了一个线性回归模型来预测未来的销售额。
已知公司的广告费用与销售额之间存在着一定的线性关系。
根据模型,当广告费用为1000元时,预测的销售额为15000元。
求该模型的回归方程。
解答:假设回归方程为y = a + bx,其中y表示销售额,x表示广告费用。
根据已知条件,可以得到一个方程:15000 = a + 1000b。
进一步,如果再给出另外一个广告费用与销售额的数据点,就可以求解出回归方程的具体参数a和b。
习题二:某城市的房价与房屋面积之间存在一定的线性关系。
已知一套房子的面积为120平方米,根据线性回归模型预测其价格为80万元。
求该模型的回归方程。
解答:假设回归方程为y = a + bx,其中y表示房价,x表示房屋面积。
根据已知条件,可以得到一个方程:80 = a + 120b。
同样地,如果再给出另外一个房屋面积与价格的数据点,就可以求解出回归方程的具体参数a和b。
习题三:某公司根据市场调研数据,建立了一个线性回归模型来分析产品销售量与价格之间的关系。
已知当产品价格为10元时,预测的销售量为1000个。
根据该模型,求当产品价格为15元时的预测销售量。
解答:假设回归方程为y = a + bx,其中y表示销售量,x表示产品价格。
根据已知条件,可以得到一个方程:1000 = a + 10b。
根据该方程,可以求解出参数a和b的具体值。
然后,将x取15,代入回归方程中,即可得到当产品价格为15元时的预测销售量。
通过以上习题的解答,我们可以看到线性回归模型在实际问题中的应用。
通过建立合适的回归方程,我们可以通过已知的自变量值来预测因变量的取值。
这对于企业决策、市场分析以及经济预测等方面都具有重要意义。
典型例题:线性回归方程
认识线性回归方程一、线性回归方程设X与y是具有相关关系的两个变量,且相应于n个观测值的n个点大致分布在一条直线的附近,这条直线就叫做回归直线.例1.假设关于某设备的使用年限x (年)和所支出的维修费用y (万元)有如下的统计资料:若由资料知y对x呈线性相关关系,试求:(1)线性回归方程y = a+bxi(2)估计使用年限10年时,维修费用是多少?分析:因为y对x呈线性相关关系,所以可以用线性相关的方法解决问题.解:(1)制表于是有& = • =].23,。
=亍一庚= 5 — 1.23x4 = 0.08.90-5x42・•・线性回归方程为y = 1.23X+0.08 ;(2)当x = 10时,『 = 1.23x10+0.08 = 12.38 (万元),即估计使用10年时1 / 3维修费用约是12.38万元.评注:已知y对x呈线性相关关系,无须进行相关性检验,否则应首先进行相关性检验.二、回归分析通过对有关数据的分析,作出散点图,并利用散点图直观地认识两个变量的 相关关系,也可以用相关系数r 来确定两个变量的线性相关关系.例2. —个车间为了规定工时定额,需要确定加工零件所花费的时间,为此 进行了 10次试验,测得的数据如下:零件数X (个) 10 2030 40 5060708090100加工时间y (分)62 68 75 81 89 95 102 108 115 122(1) y 与X 是否具有线性相关关系?(2) 如果y 与x 具有线性相关关系,求回归直线方程.分析:先求出r 的值,I"的值越接近于1,表明两个变量的线性相关关系越 强.解:(1)列岀下表,并用科学计算器进行计算.■11 2 3 4 5 6 7 8 9 10 xi10 20 30 40 50 60 70 80 90 100 开626875818995102108115122620 1360 2250 3240 4450 5700 71408640 10350 12200 10x = 55, y = 91.7,r-l10= 38500,=87777,/-I10工尤必=55950r-l55950-10x55x91.77(38500 -10 x 552)(87777 -10 x 91.72)•••0.9998>0・632,「.y 与x 具有线性相关关系;(2)设所求的回归直线方程为y 从,« 0.9998 o工心-10厂/-Ia = y-bx = 9\.7-0.668x55 a54.96 ,•••所求的回归直线方程为,y = 0.668x+54.96 •评注:这类问题的解决方法一般分为两步,第一步分析两个变量是否有线性 相关关系,第二步求回归直线方程.那么山上表可知 d55950-10x55x91.738500-I0x552~* 0.668,10D )l-10xy)0 _ jOx /-I。
一元线性回归分析例题
SPSS一元线性回归分析例题(体检数据中的体重和肺活量的分析)某单位对12名女工进行体检,体检项目包括体重(kg)和肺活量(L),数据如下:X(体重:kg) 42.00 42.00 46.00 46.00 46.00 50.0050.00 50.00 52.00 52.00 58.00 58.00Y(肺活量:L) 2.55 2.20 2.75 2.40 2.80 2.813.41 3.10 3.46 2.85 3.50 3.00用x表示体重,y表示肺活量,建立数据文件。
利用一元线性回归分析描述其关系。
基本操作提示:Step 1 建立数据文件,并打开该数据文件。
Step 2 选择菜单Analyz e→Regressio n→Linear,打开主对话框。
在“Dependent”(因变量)列表框中选择变量“肺活量”,作为线性回归分析的被解释变量;在“Independent”(自变量)列表框中选择变量“体重”,作为解释变量。
Step 3 单击“Statistics”按钮,在打开的对话框中,依次选择“Estimates”(显示回归系数的估计值)、“Confidence intervals”、“Model fit”(模型拟合)、“Descriptives”、“Casewise diagnostic”(个案诊断)和“All Cases”选项。
选择完毕后,单击“Continue”按钮,返回主对话框。
Step 4 单击“Plots”(图形)按钮,在打开的主对话框中,选择“DEPENDENT”(因变量)作为y轴变量,“*ZPRED”(标准化预测值)作为x轴变量;并在“Standardized Residual Plots”(标准化残差图)中选择“Histogram”(直方图)和“Normal probabilityplot”(正态概率图,即P-P图)选项。
选择完毕后,单击“Continue”按钮,返回主对话框。
Step 5 单击“Save”(保存)按钮,在打开的主对话框中,在“Predicted Values”(预测值)选项区域中选择“Unstandardized”和“S. E. ofmean predictions”(预测值均数的标准误差)选项;“PredictionIntervals”(预测区间)选项区域中选择“Mean”和“Individual”选项;“Residuals”(残差)选项区域中选择“Unstandardized”选项。
《9.1 线性回归分析》(同步训练)高中数学选择性必修第二册_苏教版_2024-2025学年
《9.1 线性回归分析》同步训练(答案在后面)一、单选题(本大题有8小题,每小题5分,共40分)1、某地区近五年内每年的GDP(单位:亿元)如下表所示:年份 | GDP–|—– 2016 | 300 2017 | 320 2018 | 350 2019 | 370 2020 | 400若要用线性回归分析预测该地区2021年的GDP,以下哪项说法是正确的?A、根据2016年到2020年的数据,拟合直线y=10x+290,则预测2021年GDP为410亿元B、根据2016年到2020年的数据,拟合直线y=10x+280,则预测2021年GDP为420亿元C、根据2016年到2020年的数据,拟合直线y=10x+280,则预测2021年GDP为400亿元D、根据2016年到2020年的数据,拟合直线y=10x+290,则预测2021年GDP为400亿元2、已知一组数据的线性回归方程为(y=1.5x+20),若将(x)的值增加 2,则(y)的值将()。
A、减少 3B、减少 2C、增加 3D、增加 23、(单选题)若线性回归方程为y = 3x + 1,当x增加1个单位时,y大约增加多少个单位?A. 1个单位B. 3个单位C. 4个单位D. 2个单位4、给定一组数据点((x1,y1),(x2,y2),...,(x n,y n)),假设我们已经计算出了线性回归方程(y=ax+b)中的斜率(a)和截距(b)。
如果增加一个新数据点((x n+1,y n+1))到这组数据中,那么新的线性回归方程中的斜率(a′)相对于原来的斜率(a):A. 一定会变大B. 一定会变小C. 可能会变大,可能会变小,也可能会不变D. 一定不会改变5、某校为研究学生身高与体重之间的关系,随机抽取了10名学生的身高和体重数据,并建立了线性回归方程y=50x+35(其中x为身高,y为体重),若某学生的身高为1.75米,则该学生的预测体重约为:A. 70千克B. 75千克C. 80千克D. 85千克6、某研究机构对两种不同品牌的学习卡片销售情况进行了统计,得到了两组数据,为了找到哪种学习卡片的销售趋势更好的线性回归方程,第一组(品牌A)的广告费用与销售额数据如下:广告费用x(元)分别为100、200、300、400、500,对应的销售额y(万元)分别为15、25、35、45、55。
线性回归题目(整理)
(2)、设线性回归方程为
ɵ ɵ y = bx + a
由系数公式可知,
ɵ 66.5 − 4 × 4.5 × 3.5 = 66.5 − 63 = 0.7 x = 4.5, y = 3.5, b = 5 86 − 4 × 4.52
ɵ = 3.5 − 0.7 ×设线性回归方程为由系数公式可知?aybx???26654453586445??665635453507xyb???????????a?923507?035??所以线性回归方程为07035yx??3x100时070357035yx???所以预测生产100吨甲产品的生产能耗比技术改造前降低1965吨标准煤
答案:B
所以线性回归方程为
y = 0.7 x + 0.35
y = 0.7 x + 0.35 = 70.35
所以预测生产100吨甲产品的生产能耗比技术改造前降低19.65吨标准煤.
13.某数学老师身高176cm,他爷爷、父亲和儿子的身高分 别是173cm、170cm和182cm.因儿子的身高与父亲的身 高有关,该老师用线性回归分析的方法预测他孙子的身高 为 cm.
17.下表提供了某厂节能降耗技术改造后生产甲 产品过程中记录的产量x(吨)与相应的生 产能耗y(吨标准煤)的几组对照数据
x y 3 2.5 4 3 5 4 6 4.5
(1)、请画出上表数据的散点图; (2)请根据上表提供的数据,用最小二乘法求
ɵ ɵ 出y关于x的线性回归方程 y = bx + a ; (3)、已知该厂技术改造前100吨甲产品能耗 为90吨标准煤;试根据(2)求出的线性 回归方程,预测生产100吨甲产品的生产 能耗比技术改造前降低多少吨标准煤? (3×2.5+4×3+5×4+6×4.5=66.5)
回归分析典型例题
下图是我国2008年至2014年生活垃圾无害化处理量(单位:亿吨)的折线图.(1)由折线图看出,可用线性回归模型拟合y 与t 的关系,请用相关系数加以说明;(2)建立y 关于t 的回归方程(系数精确到0.01),预测2016年我国生活垃圾无害化处理量. 参考数据:646.27,55.0)(,17.40,32.97127171≈=-==∑∑∑===i ii ii i iy y yt y参考公式:相关系数:.)()())((11221∑∑∑===----=ni ni iini i iy yt ty y t tr回归方程中斜率和截距的最小二乘估计公式:.ˆˆ,)())((ˆ121t b y at ty y t tbni ini i i-=---=∑∑==某互联网公司为了确定下一季的前期广告投入计划,收集了近6个月广告投入量x (单位:万元)和收益y (单位:万元)的数据如下表:月份 1 2 3 4 5 6 广告投入量 2 4 6 8 10 12 收益14.2120.3131.831.1837.8344.67他们分别用两种模型① y =bx +a ,② y =a e bx 分别进行拟合,得到相应回归方程并进行残差分析,得到如图所示的残差图及一些统计量的值。
xy∑=61i ii yx∑=612i ix730 1464.24 364(1)根据残差图,比较模型①,②的拟合效果,应该选择哪个模型?并说明理由; (2)残差绝对值大于2的数据被认为是异常数据,需要剔除: (i )剔除异常数据后求出(1)中所选模型的回归方程; (ii )若广告投入量x =18时,该模型收益的预报值时多少?附:对于一组数据(x 1 , y 1),(x 2 , y 2), … ,(x n , y n ),其回归直线a x b yˆˆˆ+=的斜率和截距的最小二乘估计分别为:.ˆˆ,)())((ˆ1221121x b y a x n xyx n yx x xy y x xbni ini i i ni ini i i-=--=---=∑∑∑∑====某公司为确定下一年度投人某种产品的宣传费,需了解年宣传费x (单位:千元)对年销售量y (单位:t )和年利润z (单位:千元)的影响. 对近8年的年宣传费x i 和年销售量y i (i =1,2,..,8)数据作了初步处理,得到下面的散点图及一些统计量的值.xyw∑=-812)(i ix x∑=-812)(i iw w∑=--81))((i i iy y x x∑=--81))((i iiy yw w46.6 563 6.8289.8 1.61469108.8其中:i i x w =,.8181∑==i iw w(1)根据散点图判断,bx a y +=与x d c y +=哪一个适宜作为年销售量y 关于年宣传费x 的回归方程类型?(给出判断即可,不必说明理由)(2)根据(1)的判断结果及表中数据,建立y 关于x 的回归方程;(3) 已知这种产品的年利润z 与y x ,的关系为x y z -=2.0.根据(2)的结果回答下列问题: (i)年宣传费49=x 时,年销售量及年利润的预报值是多少? (ii)年宣传费x 为何值时,年利润的预报值最大?附:对于一组数据),(,,),(,),(2211n n v u v u v u ,其回归直线u v βα+=的斜率和截距的最小二乘估计分别为.ˆ,)())((ˆ121u v u uv v u uni ini i iβαβ-=---=∑∑==为了预测2018年双十一购物狂欢节成交额,建立了y 与时间变量t 的两个回归模型。
线性回归分析法例题
线性回归分析法例题一、单选题1.相关分析研究的是()A、变量间相互关系的紧密程度B、变量之间因果关系C、变量之间严苛的相依关系D、变量之间的线性关系2.若变量X的值减少时,变量Y的值也减少,那么变量X和变量Y之间存有着()。
A、正相关关系B、负相关关系C、直线有关关系D、曲线有关关系3.若变量X的值增加时,变量Y的值随之下降,那么变量X和变量Y之间存在着()。
A、正有关关系B、负相关关系C、直线相关关系D、曲线相关关系4.相关系数等于零说明两变量()。
A.是严格的函数关系B.不存在相关关系C.不存有线性相关关系D.存在曲线线性相关关系5.有关关系的主要特征就是()。
A、某一现象的标志与另外的标志之间的关系是不确定的B、某一现象的标志与另外的`标志之间存有着一定的依存关系,但它们不是确认的关系C、某一现象的标志与另外的标志之间存在着严格的依存关系D、某一现象的标志与另外的标志之间存有着不确认的直线关系6.时间数列自身相关是指()。
A、两变量在相同时间上的依存关系B、两变量静态的依存关系C、一个变量随其时间相同其前后期变量值之间的依存关系D、一个变量的数值与时间之间的依存关系7.如果变量X和变量Y之间的相关系数为负1,表明两个变量之间()。
A、不存在相关关系B、相关程度很低C、有关程度很高D、全然负相关8.若物价上涨,商品的需求量愈小,则物价与商品需求量之间()。
A、并无有关B、存有正有关C、存在负相关D、无法判断是否相关9.有关分析对资料的建议就是()。
A.两变量均为随机的B.两变量均不是随机的C、自变量就是随机的,因变量不是随机的D、自变量不是随机的,因变量是随机的10.重回分析中直观重回就是指()。
A.时间数列自身回归B.两个变量之间的回归C.变量之间的线性重回D.两个变量之间的线性重回11.已知某工厂甲产品产量和生产成本有直线关系,在这条直线上,当产量为时,其生产成本为元,其中不随产量变化的成本为元,则成本总额对产量的回归方程为()A. y=+24xB. y=6+0.24xC. y=+6xD. y=24+x12.直线回归方程中,若回归系数为负,则()A.表明现象正相关B.表明现象负相关C.说明有关程度较弱D.无法表明有关方向和程度二、多项选择题1.以下属有关关系的存有()。
回归分析练习题(有答案)
回归分析的基本思想及其初步应用一、选择题 1. 某同学由x 与y 之间的一组数据求得两个变量间的线性回归方程为y bx a =+,已知:数据x 的平均值为2,数据y 的平均值为3,则 ( )A .回归直线必过点(2,3)B .回归直线一定不过点(2,3)C .点(2,3)在回归直线上方D .点(2,3)在回归直线下方2. 在一次试验中,测得(x,y)的四组值分别是A(1,2),B(2,3),C(3,4),D(4,5),则Y 与X 之间的回归直线方程为( )A .yx 1=+ B .y x 2=+ C .y 2x 1=+ D.y x 1=-3. 在对两个变量x ,y 进行线性回归分析时,有下列步骤:①对所求出的回归直线方程作出解释; ②收集数据(i x 、i y ),1,2i =,…,n ;③求线性回归方程; ④求未知参数; ⑤根据所搜集的数据绘制散点图如果根据可行性要求能够作出变量,x y 具有线性相关结论,则在下列操作中正确的是( ) A .①②⑤③④ B .③②④⑤① C .②④③①⑤ D .②⑤④③①4. 下列说法中正确的是( )A .任何两个变量都具有相关关系B .人的知识与其年龄具有相关关系C .散点图中的各点是分散的没有规律D .根据散点图求得的回归直线方程都是有意义的5. 给出下列结论:(1)在回归分析中,可用指数系数2R 的值判断模型的拟合效果,2R 越大,模型的拟合效果越好; (2)在回归分析中,可用残差平方和判断模型的拟合效果,残差平方和越大,模型的拟合效果越好; (3)在回归分析中,可用相关系数r 的值判断模型的拟合效果,r 越小,模型的拟合效果越好; (4)在回归分析中,可用残差图判断模型的拟合效果,残差点比较均匀地落在水平的带状区域中,说明这样的模型比较合适.带状区域的宽度越窄,说明模型的拟合精度越高. 以上结论中,正确的有( )个.A .1B .2C .3D .4 6. 已知直线回归方程为2 1.5y x =-,则变量x 增加一个单位时()A.y 平均增加1.5个单位B.y 平均增加2个单位C.y 平均减少1.5个单位D.y 平均减少2个单位7. 下面的各图中,散点图与相关系数r 不符合的是( )8. 一位母亲记录了儿子3~9岁的身高,由此建立的身高与年龄的回归直线方程为ˆ7.1973.93yx =+,据此可以预测这个孩子10岁时的身高,则正确的叙述是( )A .身高一定是145.83cmB .身高超过146.00cmC .身高低于145.00cmD .身高在145.83cm 左右9. 在画两个变量的散点图时,下面哪个叙述是正确的( ) (A)预报变量在x 轴上,解释变量在y 轴上 (B)解释变量在x 轴上,预报变量在y 轴上(C)可以选择两个变量中任意一个变量在x 轴上 (D)可以选择两个变量中任意一个变量在y 轴上10. 两个变量y 与x 的回归模型中,通常用2R 来刻画回归的效果,则正确的叙述是( )A. 2R 越小,残差平方和小B. 2R 越大,残差平方和大C. 2R 于残差平方和无关 D. 2R 越小,残差平方和大 11. 两个变量y 与x 的回归模型中,分别选择了4个不同模型,它们的相关指数2R 如下 ,其中拟合效果最好的模型是( )A.模型1的相关指数2R 为B.模型2的相关指数2R 为C.模型3的相关指数2R 为 D.模型4的相关指数2R 为12. 在回归分析中,代表了数据点和它在回归直线上相应位置的差异的是( ) A.总偏差平方和 B.残差平方和 C.回归平方和 D.相关指数R 213.工人月工资(元)依劳动生产率(千元)变化的回归直线方程为ˆ6090y x =+,下列判断正确的是( ) A.劳动生产率为1000元时,工资为50元 B.劳动生产率提高1000元时,工资提高150元 C.劳动生产率提高1000元时,工资提高90元 D.劳动生产率为1000元时,工资为90元14. 下列结论正确的是( )①函数关系是一种确定性关系;②相关关系是一种非确定性关系;③回归分析是对具有函数关系的两个变量进行统计分析的一种方法;④回归分析是对具有相关关系的两个变量进行统计分析的一种常用方法. A.①② B.①②③ C.①②④ D.①②③④15. 已知回归直线的斜率的估计值为,样本点的中心为(4,5),则回归直线方程为( ) A. 1.234y x =+ B. 1.235y x =+ C. 1.230.08y x =+ D.0.08 1.23y x =+二、填空题16. 在比较两个模型的拟合效果时,甲、乙两个模型的相关指数2R 的值分别约为和,则拟合效果好的模型是 .17. 在回归分析中残差的计算公式为 .18. 线性回归模型y bx a e =++(a 和b 为模型的未知参数)中,e 称为 .19. 若一组观测值(x 1,y 1)(x 2,y 2)…(x n ,y n )之间满足y i =bx i +a+e i (i=1、2.…n)若e i 恒为0,则R 2为_____三、解答题20. 调查某市出租车使用年限x 和该年支出维修费用y (万元),得到数据如下:(2)由(1)中结论预测第10年所支出的维修费用.(121()()()ni i i ni i x x y y b x x a y bx==⎧-⋅-⎪⎪=⎨-⎪⎪=-⎪⎩∑∑)21. 以下是某地搜集到的新房屋的销售价格y和房屋的面积x的数据:(1)画出数据对应的散点图;(2)求线性回归方程,并在散点图中加上回归直线;150m时的销售价格.(3)据(2)的结果估计当房屋面积为2(4)求第2个点的残差。
竞赛班高考数学练习专题(9)--线性回归分析
竞赛班高考数学练习(9)——线性回归分析1.在两个变量的回归分析中,作散点图是为了( )A. 直接求出回归直线方程B. 直接求出回归方程C. 根据经验选定回归方程的类型D. 估计回归方程的参数 2.下列四个结论:①在回归分析模型中,残差平方和越大,说明模型的拟合效果越好;②某学校有男教师60名、女教师40名,为了解教师的体育爱好情况,在全体教师中抽取20名调查,则宜采用的抽样方法是分层抽样;③线性相关系数|r|越大,两个变量的线性相关性越弱;反之,线性相关性越强;④在回归方程0.52y x =+中,当解释变量x 每增加一个单位时,预报变量y 增加0.5个单位. 其中正确的结论是( ) A. ①② B. ①④C. ②③D. ②④3.某同学在只听课不做作业的情况下,数学总不及格.后来他终于下定决心要改变这一切,他以一个月为周5一个月内每天做题数x 5 8 6 4 7 数学月考成绩y8287848186ˆˆ1.6yx a =+题数为( ) A. 8 B. 9 C. 10 D. 11 4.下列关于回归分析的说法中错误的有( )个(1).残差图中残差点所在的水平带状区域越宽,则回归方程的预报精确度越高.(2).回归直线一定过样本中心(),x y 。
(3)两个模型中残差平方和越小的模型拟合的效果越好。
(4) 甲、乙两个模型的2R 分别约为0.88和0.80,则模型乙的拟合效果更好。
A. 4 B. 3 C. 2 D. 15.两个变量y 与x 的回归模型中,分别选择了4个不同模型,它们的相关指数2R 如下,其中拟合效果最好的模型是( )A. 模型3的相关指数2R 为0.50B. 模型2的相关指数2R 为0.80C. 模型1的相关指数2R 为0.98D. 模型4的相关指数2R 为0.256.相关变量x ,y 的散点图如图所示,现对这两个变量进行线性相关分析,方案一:根据图中所有数据,得到线性回归方程11y b x a =+,相关系数为1r ;方案二:剔除点(10,21),根据剩下数据得到线性回归直线方程:22y b x a =+,相关系数为2r .则( ) A. 1201r r <<< B. 2101r r <<< C. 1210r r -<<<D. 2110r r -<<<7(补).2019年是新中国成立七十周年,新中国成立以来,我国文化事业得到了充分发展,尤其是党的十八大以来,文化事业发展更加迅速,下图是从2013 年到 2018 年六年间我国公共图书馆业机构数(个)与对应年份编号的散点图(为便于计算,将 2013 年编号为 1,2014 年编号为 2,…,2018年编号为 6,把每年的公共图书馆业机构个数作为因变量,把年份编号从 1 到 6 作为自变量进行回归分析),得到回归直线ˆ13.7433095.7yx =+,其相关指数2R 0.9817=,给出下列结论,其中正确的个数是( D )①公共图书馆业机构数与年份的正相关性较强 ②公共图书馆业机构数平均每年增加13.743个 ③可预测 2019 年公共图书馆业机构数约为3192个 A. 0 B. 1 C. 2 D. 37.某基地蔬菜大棚采用水培、无土栽培方式种植各类蔬菜.过去50周的资料显示,该地周光照量X(小时)都在30小时以上,其中不足50小时的周数有5周,不低于50小时且不超过70小时的周数有35周,超过70小时的周数有10周.根据统计,该基地的西红柿增加量y(百斤)与使用某种液体肥料x(千克)之间对应数据为如图所示的折线图.(1)依据数据的折线图,是否可用线性回归模型拟合y 与x 的关系?请计算相关系数r 并加以说明(精确到0.01)(若0.75r >,则线性相关程度很高,可用线性回归模型拟合)(2)蔬菜大棚对光照要求较大,某光照控制仪商家为该基地提供了部分光照控制仪,但每周光照控制仪最多可运行台数受周光照量X 限制,并有如表关系:周光照量X (单位:小时) 3050X <<5070X ≤≤70X >光照控制仪最多可运行台数321若某台光照控制仪运行,则该台光照控制仪周利润为元;若某台光照控制仪未运行,则该台光照控制仪周亏损1000元.以过去50周的周光照量的频率作为周光照量发生的概率,商家欲使周总利润的均值达到最大,应安装光照控制仪多少台?附:相关系数12211()()()()niii nniii i x x yy r x x yy ===--=--∑∑∑,参考数据:51()()6i i i x x y y =--=∑,521()25ii x x =-=∑,521()2,0.30.55ij y y =-=≈∑,0.90.95≈8.东莞市公交公司为了方便广大市民出行,科学规划公交车辆的投放,计划在某个人员密集流动地段增设一个起点站,为了研究车辆发车的间隔时间x 与乘客等候人数y 之间的关系,选取一天中的六个不同的调查小组先从这组数据中选取其中的组数据求得线性回归方程,再用剩下的组数据进行检验,检验方法如下:先用求得的线性回归方程计算间隔时间对应的等候人数ˆy,再求ˆy 与实际等候人数y 的差,若两组差值的绝对值均不超过1,则称所求的回归方程是“理想回归方程”.(1)若选取的是前4组数据,求y 关于x 的线性回归方程ˆy bxa =+; (2)判断(1)中的方程是否是“理想回归方程”:(3)为了使等候的乘客不超过38人,试用(1)中方程估计间隔时间最多可以设置为多少分钟? 参考公式:用最小二乘法求线性回归方程˙ˆˆˆy bx a =+的系数公式:()()()1122211ˆˆˆ,n niii ii i nnii i ix x y y x y n x ybay bx x x xnx ====---••===---∑∑∑∑,9.某兴趣小组欲研究昼夜温差大小与患感冒人数多少之间的关系,他们分别到气象局和某医院抄录了1至该兴趣小组确定的研究方案是先从这组数据中选取组,用剩下的组数据求线性回归方程,再用被选出的2组数据进行检验.(1)若选取的是1月和6月的两组数据,请根据2月至5月的数据求出y 关x 于的线性回归方程;(2)若由线性回归方程得到的估计数,与所选出的检验数据的误差均不超过2人,则认为得到的线性回归方程是理想的.试问:该小组所得的线性回归方程是否理想?附;()()()1122211=nni i i ii i nni i i i x x y y x y nxyb x x x nx a y bx====⎧---⎪⎪=⎪⎨--⎪⎪=-⎪⎩∑∑∑∑10.某羽绒服卖场为了解气温对营业额的影响,随机记录了该店3月份上旬中某5天的日营业额y(单元:千元)与该地当日最低气温x(单位:°C)的数据,如表:(1)求y 关于x 的回归直线方程ˆˆˆybx a =+; (2)设该地3月份的日最低气温2~(,)X N μσ,其中μ近似为样本平均数,2σ近似为样本方差,求()0.6 3.8P X <<参考公式:()()()1122211ˆnni iiii i nniii i x ynxyx x yy bxnx x x ====---==--∑∑∑∑,ˆˆay bx =- 计算参考值:22222258911295,2125108898117287++++=⨯+⨯+⨯+⨯+⨯=.3.2,()0.6827,(22)0.9545P X P X μσμσμσμσ≈-<<+=-<<+=.竞赛班高考数学练习(9)——参考答案更正第7题第(2)问答案选择题1--6 CDC CCD解答题7.【详解】(1)由已知数据可得2456855x++++==,3444545y++++==所以相关系数()()0.95ni ix x y yr--===≈∑因为0.75r>,所以可用线性回归模型拟合y与x的关系。
线性回归例题解答
5.32720 1.000 .198
5.18661 1.74765
.000 .052 .22178
.943 1.074 2.28906
.060 .900 .173
1.140 .904 .237
.100
.100
N 10 10 10 10 10 10 10 10 10 10 10 10
.587 37.3722 -2.71472
1.205 52.4988 2.27016
-1.465 -1.544 -3.01680
1.225 1.438 3.50116
-1.724 .001 .005
1.561 2.904 .754
.000
.323
均值 标准 偏差
44.9000 .000 .807
44.6782 .00000
.94
.94
预测值 标准 预测值 预测值的标准误差 调整的预测值 残差 标准 残差 Student 化 残差 已删除的残差 Student 化 已删除的残差 Mahal。 距离 Cook 的距离 居中杠杆值 a. 因变量: VAR00002
残差统计量a
极小值
极大值
38.2298 -1.252
53.9788 1.704
a. 预测变量: (常量), VAR00001。 b. 因变量: VAR00002
Anovab
模型
平方和
df
1
回归
255.412
1
残差
27.488
8
总计
282.900
9
a. 预测变量: (常量), VAR00001。 b. 因变量: VAR00002
均方 255.412
3.436
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
1. “团购”已经渗透到我们每个人的生活,这离不开快递行业的发展,下表是2013-2017年全国快递业务量(x 亿件:精确到0.1)及其增长速度(y %)的数据
(Ⅰ)试计算2012年的快递业务量;
(Ⅱ)分别将2013年,2014年,…,2017年记成年的序号t :1,2,3,4,5;现已知y 与t 具有线
性相关关系,试建立y 关于t 的回归直线方程a x b y
ˆˆˆ+=; (Ⅲ)根据(Ⅱ)问中所建立的回归直线方程,估算2019年的快递业务量
附:回归直线的斜率和截距地最小二乘法估计公式分别为:∑∑==--=n
i i
n
i i
i x n x
y x n y
x b
1
2
2
1
ˆ, x b y a
ˆˆ-=
2.某水果种植户对某种水果进行网上销售,为了合理定价,现将该水果按事先拟定的价格进行试销,得到如下数据:
单价元 7 8 9 11 12 13 销量
120
118
112
110
108
104
已知销量与单价之间存在线性相关关系求y 关于x 的线性回归方程; 若在表格中的6种单价中任选3种单价作进一步分析,求销量恰在区间内的单价种数的
分布列和期望.
附:回归直线的斜率和截距的最小二乘法估计公式分别为:, .
3. (2018年全国二卷)下图是某地区2000年至2016年环境基础设施投资额y (单位:亿元)的折线图.
为了预测该地区2018年的环境基础设施投资额,建立了y 与时间变量t 的两个线性回归模型.根据2000年至2016年的数据(时间变量t 的值依次为1217,
,…,)建立模型①:ˆ30.413.5y t =-+;根据2010年至2016年的数据(时间变量t 的值依次为127,,
…,)建立模型②:ˆ9917.5y t =+. (1)分别利用这两个模型,求该地区2018年的环境基础设施投资额的预测值; (2)你认为用哪个模型得到的预测值更可靠?并说明理由.
4.(2014年全国二卷) 某地区2007年至2013年农村居民家庭纯收入y (单位:千元)的数据如下表:
年份 2007 2008 2009 2010 2011 2012 2013 年份代号t 1 2 3 4 5 6 7 人均纯收入y 2.9
3.3
3.6
4.4
4.8
5.2
5.9
(Ⅰ)求y 关于t 的线性回归方程;
(Ⅱ)利用(Ⅰ)中的回归方程,分析2007年至2013年该地区农村居民家庭人均纯收入的变化情况,并
预测该地区2015年农村居民家庭人均纯收入.
附:回归直线的斜率和截距的最小二乘法估计公式分别为:
()()
()
1
2
1
n
i
i
i n
i i t t y y b t t ∧
==--=
-∑∑,ˆˆa
y bt =-
5(2019 2卷)18.11分制乒乓球比赛,每赢一球得1分,当某局打成10∶10平后,每球交换发球权,
先多得2分的一方获胜,该局比赛结束.甲、乙两位同学进行单打比赛,假设甲发球时甲得分的概率为0.5,乙发球时甲得分的概率为0.4,各球的结果相互独立.在某局双方10∶10平后,甲先发球,两人又打了X 个球该局比赛结束.
(1)求P(X=2);
(2)求事件“X=4且甲获胜”的概率.。