18.4线性回归方程及应用
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
18、统计
18.4 线性回归方程及应用
【知识网络】
1.能通过收集现实问题中两个有关联变量的数据作出散点图,并利用散点图直观认识变量间的相关关系。
2.了解线性回归的方法;了解用最小二乘法研究两个变量的线性相关问题的思想方法;
会根据给出的线性回归方程系数公式建立线性回归方程(不要求记忆系数公式)。
【典型例题】
[例1](1)为了考查两个变量x和y之间的线性关系,甲、乙两位同学各自独立作了10次和15次试验,并且利用线性回归方法,求得回归直线分别为l1、l2,已知两人得的试验数据中,变量x和y的数据的平均值都分别相等,且值为s与t,那么下列说法正确的是
()A.直线l1和l2一定有公共点(s,t) B.直线l1和l2相交,但交点不一定是(s,t) C.必有直线l1∥l2D.直线l1和l2必定重合
(2)工人工资(元)依劳动生产率(千元)变化的回归方程为ˆy=50+80x,下列判断正确
的是()A.劳动生产率为1000元时,工资为130元
B.劳动生产率提高1000元时,工资提高80元
C.劳动生产率提高1000元时,工资提高130元
D.当月工资250元时,劳动生产率为2000元
(3)下列命题:
①任何两个变量都具有相关关系;
②圆的周长与该圆的半径具有相关关系;
③某商品的需求与该商品的价格是一种非确定性关系;
④根据散点图求得的回归直线方程可能是没有意义的;
⑤两个变量间的相关关系可以通过回归直线,把非确定性问题转化为确定性问题进行研
究。
其中正确的命题为()A.①③④B。
②④⑤C。
③④⑤D。
②③⑤
(4)一家保险公司调查其总公司营业部的加班程度,收集了10周中每周加班工作时间y (小时)与签发新保单数目x的数据如下表,则用最小二乘法估计求出的线性回归方程是___________。
(5)上题中,若该公司预计下周签发新保单1000张,则需要加班的时间是。
[例2]
其中x(血球体积,mm),y(血红球数,百万).
①画出上表的散点图;
②求出回归直线并且画出图形。
[例3]要分析学生初中升学的数学成绩对高一年级数学学习有什么影响,在高一年级学生
(1)计算入学成绩(x)与高一期末考试成绩(y)的相关关系;
(2)若某学生入学数学成绩80分,试估计他高一期末数学考试成绩.
[例
出散点图;
(2)商品零售额与商品流通费率具有线性相关关系吗?如果商品零售额是20万元,那么能否预测此时流通费率是多少呢?
【课内练习】
1. 下列两个变量之间的关系哪个不是函数关系 ( )
A .角度和它的余弦值
B 。
正方形边长和面积
C .正n边形的边数和它的内角和
D 。
人的年龄和身高 2. 下列变量之间的关系是函数关系的是 ( )
A .已知二次函数c bx ax y ++=2,其中a ,c 是已知常数,取b 为自变量,因变量
是这个函数的判别式ac b 42
-=∆
B .光照时间和果树的亩产量
C .降雪量和交通事故发生率
D .每亩用肥料量和粮食亩产量 3. 下列命题叙述正确的是 ( )
A .任何两个变量都可以用一元线性回归关系进行合理的描述
B .只能采用最小二乘法对一元线性回归模型进行参数估计
C .对于一个样本,用最小二乘法估计得到的一元线性回归方程参数估计值是唯一的
D .任何两个相关关系的变量经过变换后都可以化为一元线性回归关系
4. 设线性回归直线方程ˆˆy
a bx =+,现将y 的单位由cm 变为m ,x 的单位由ms 变为s ,则在新的线性回归直线方程y a
b x **
=+中,
( )
A .0.1b b *
= B .b b *
= C .10b b *
=
D .100b b *
=
5. 若施肥量x 与水稻产量y 的线性回归直线方程ˆˆ2505y
x =+,当施肥量为80Kg 时,预计水稻产量为___________.
6. 某保险公司收集了10周中工作的加班时间y 与签订新保单数目x ,用最小二乘法求出
线性回归方程为ˆˆ0.120.0036y
x =+.若公司预签订新保单1000张,估计需加班 _________小时.
7. 如果你想作一个反对抽烟的电视公益广告的播放次数与看电视的中学生戒烟率的数据散点图,作为x 轴的变量应为。
8.
试求出回归直线方程
9.在某种产品表面进行腐蚀刻线试验,得到腐蚀深度y 与腐蚀时间x 之间相应的一组观
求腐蚀深度y 对腐蚀时间x 的回归直线方程,并解释回归系数的意义. 10.
年底的四年里,该地区这种病的新发病人数总共多少?
18、统计
18.4 线性回归方程及应用
A 组
1. 设有一个直线回归方程为ˆˆ32y
x =-,则变量x 增加一个单位时 (
)
A .y 平均增加2个单位
B 。
y 平均增加3个单位
C .y 平均减少2个单位
D 。
y 平均减少3个单位
2. 回归直线方程的系数a ,b 的最小二乘法估计使函数Q (a ,b )最小,Q 函数指 ( )
A .
2
1
()
n
i
i
i y a bx =--∑ B 。
1
n
i i
i y a bx
=--∑
C .i i y a bx --
D 。
2
()i i y a bx --
3. 对于给定的两个变量的统计数据,下列说法正确的是
(
)
A .都可以分析出两个变量的关系
C .都可以作出散点图
D .都可以用确定的表达式表示两者的关系
4. 某种机器购置后运营年限x 与当年增加利润y 的统计分析知具备线性相关关系,回归
方种为ˆˆ10.47 1.3y
x =-,估计这种机器使用年最合算。
5. 给出下列关系:
①正方体的体积与棱长 ②角的度数和它的正弦值
③单产为常数时,土地面积和总产量 ④日照时间与棉花亩产量 ⑤体重与身高 其中属于函数关系的有。
6.
问题物件的多寡,随机器运转的速度而变化,左面表格中的数据是几次试验的结果.那么当速度为10(转/秒)时,是否可以预知每小时生产有问题物件数呢?若实际生产中所允许的每小时最大问题物件数为10,那么机器的速度不得超过多少转/秒?
7. 假设儿子身长与父亲身长适合一元线性回归模型,观察了10对英国父子身长(英寸)
8. 我们知道营业税税收总额y 与社会消费品零售总额x 有关.为能从社会消费品零售总额去预测营业税税收总额,需要了解两者的关系.现收集如下11组全国相关数据(单位:亿元)
(1)画出营业税税收总额y 与社会消费品零售总额x 间散点图;
(2用最小二乘法求营业税税收总额y 与社会消费品零售总额x 之间线性回归直线方程. (3)试估计2005年社会消费品零售总额增长在12%~14%,营业税税收总额y 大致会增长多少?
18、统计
18.4 线性回归方程及应用
B 组
1. 回归直线方程的系数a ,b 的最小二乘法估计使函数Q (a ,b )最小,则下列正确答案是 ( )
A .1
2
2
1
n
i i
i n
i
i x y nx y
b x
nx
==-=
-∑∑
B 。
1
n
i
i
i Q y a bx
==
--∑
C .a y bx =+
D 。
12
21n
i i i n
i i n x y x y b n x x
==-=
-∑∑
2. 两个变量成负相关关系时,散点图的特征是 ( )
B .点散布在某带形区域内
C .点散布在某圆形区域内
D .点散布特征为从左上角到右下角区域内
3. 某考察团对全国10大声调进行职工人均平均工资x 与居民人均消费y 进行统计调查,
y 与x 具有相关关系,回归方程为ˆˆ0.66 1.562y x =+(单位:千元)。
若某城市居民消
费水平为7.675,估计该城市消费额占人均工资收入的百分比为 ( )
A .66%
B 。
72.3%
C 。
67.3%
D 。
83% 4. 下列关系中: ①吸烟有害健康 ②粮食产量与施肥量 ③乌鸦叫,没好兆 ④名师出高徒 不具有相关关系的是。
5. 现有一个身高预测体重的回归方程;体重预测值=4(磅/英寸) 身高-130磅.期中体
重和身高分别以磅和英寸为单位。
如果将它们分别以kg 、cm 的单位(1英寸≈2.5cm ,1磅≈0.45kg ) .回归方程应该是____________________________________.
6.
(1)画出散点图;
(2)最小二乘法求月产品的总成本y (万元)与该月产量x (万件)之间线性回归直线方程.
7. 试证明:①2
2
21
1
()n
n
i i i i x x x nx ==-=-∑∑;
②1
1
()()n n
i i i i i i x x y y x y nx y ==--=-∑∑。
8. 下栏的表格是某省20个县城2007年的一份统计资料,其中i x 表示第i 个县城在200732y i
若此县城在2008年预计新建成的住宅面积为350×103m 2,则可以大体估计出此县城当年可销售家具多少万元?
参考答案
18.4 线性回归方程及应用
【典型例题】
[例1](1)A .提示:线性回归直线方程为ˆy
=a +bx ,而a =y bx -,即a =t -bs ,t =a +bs .∴(s ,t )在回归直线上,即直线l 1和l 2必有公共点(s ,t )。
(2)B .提示:回归直线斜率为80,所以x 每增加1,ˆy
增加80,即劳动生产率提高1千元时,工资提高80元。
(3)C .
(4)x y
003585.01181.0ˆ+=。
提示:10
10
211
1762,()129786010i i i i x x x x ====-=∑∑,4653))((,85.210
1
=--=∑=i
i i y y x x y 。
(5)3.7小时。
提示:将x=1000代入上面公式即可。
[例2]①
②50.45)50394058354248464245(10
1
=+++++++++=
x , 37.7)72.855.620.649.990.599.650.752.930.653.6(10
1
=+++++++++=
y 12
2
1
0.13n
i i
i n
i
i x y nxy
b x
nx ==-=
=-∑∑, 1.29a y bx =-=,所以所求回归直线的方程为
ˆ0.13 1.29y
x =+ .图形如下
[例3](1)从入学成绩(x )与高一期末考试成绩(y )两组变量的散点图看,这两组变量尚具有线性关系.
通过计算知76,70==y x ,
∑∑===-=--101
2
10
1
,2474)(,1894))((i i i i
x x y y x x
∑==-10
1
22056)(i y y ,所以
x b y a b -==,76556.041067.22=,因此所求的线性回归方程是y
ˆ=22.410 67+0.765 56x ;
(2)若某学生入学数学成绩为80分,代入上式可求得,84≈y 分,即这个学生高一
期末数学成绩预测值为84分.
[例4](1)散点图如图所示. (2)散点图显示出商品流通费率和商品零售额的变化关系并不是直线型,而是一条递减的双曲线型.两者之间不具有线性相关关系.
但经济理论和实际经验都可说明,流通费率决定于商品零售额,体现着经营的规模效益,因此可以拟合一个以商品销售额为自变量(X ),流通费率为因变量(Y )的双曲线回归
模型:X
b a Y
1ˆ⨯+=,为了求模型中的a
x
和b 两个参数,令
1X X
'=,是上述模型转换为线性模型:ˆY a bX '=+,这样我们就可以运用线性回归的知识加以解决了.
将转化后的有关数据列表如下:
代入公式得:4.60,4377.0=-=b a ,从而线性回归方程为0.437760.4Y X '=-+.将
1X X '=回代得60.4ˆ0.4377Y
X
=-+. 于是当X =20(万元)时,5823.2ˆ=Y (%).
【课内练习】 1. D 。
2. A 。
提示:依据函数的定义即可。
3. C 。
提示:只要样本数据确定,那么所求的参数就是唯一的。
4. D 。
5. 5. 650Kg . 6. 3.73.
7. 播放次数。
8
故可得到
257
3075.43.399,75.430
770002≈⨯-=≈⨯-=
a b
从而得回归直线方程是25775.4ˆ+=x y
. 9.由表中数据经计算可得510214,1111
x y ==,由线性回归公式得:0.304, 5.36b a ==,故y 对x 的回归直线方程为ˆ0.304 5.36y
x =+。
回归系数b=0.304的意义是:腐蚀时间x 每增加一个单位,深度y 平均增加0.304个单位.
10.思路一、从新发病的增长率入手
1996年到1997年新发病的增长率为 (2491-2400)/2400≈3.792%;
1997年到1998年新发病的增长率为 (2586-2491)/2491≈3.814%;
1998年到1999年新发病的增长率为 (2684-2586)/2586≈3.790%.
由此可见,新发病的增长率基本一致,取其平均数为3.799%,以此作为以后新发病增长率的预测,即2684(1+3.799%)+2684(1+3.799%)2+2684(1+3.799%)3+2684(1+3.799%)4,不难算得约等于11795(人).
思路二、从数据处理来考察
因为2491/2400≈1.038、2586/2491≈1.038、2684/2586≈1.038,可见连续两年新发病人数的比值近似于一个常数1.038,以此作为以后的预测,即
2684(1+3.799%)+2684(1+3.799%)2+2684(1+3.799%)3+2684(1+3.799%)4≈11795(人). 思路三、利用回归分析
x 轴上表示年份,y 轴上表示新发病的人数,将表格中的四组数据描点(图略).观察这些点的位置,它们的分布大致在一条直线附近,所以尝试用直线进行拟合.
设回归直线方程为bx a y +=ˆ,则由相关数据计算得:5.199711
==∑=n i i x n x ,25.254011==∑=n
i i y n y ,7.94)(12
21=--=∑∑==n i i n i i i x n x
y x n y x b ,186623-=-=x b y a , 所以回归直线方程为x y
7.94186623ˆ+-=,从而 ⨯+⨯-=7.944186623总y 11676)2003
200220012000(≈+++(人),即为所求.
18、统计
18.4 线性回归方程及应用
A 组
1. C 。
2. A 。
3. C 。
4. 8。
5. ①②③。
6. 用x 表示机器速度,y 表示每小时生产有问题物件数,那么4个样本数据为:(8,5)、(12,8)、(14,9)、(16,11),则25.8,5.12==y x .于是回归直线的斜率为7286.035
5.251221
==---=∑∑==n
i i n i i i
x x y x n y x a ,8571.0-=-=x a y b ,所以所求的回归直线方程为8571.07286.0-=x y 。
根据公式8571.07286.0ˆ-=x y
,要使10≤y ,则就需要108571.07286.0≤-x ,9031.14≤x ,即机器的旋转速度不能超过9013.14转/秒.
7. 98.354646.0ˆ+=x y。
8. 营业税税收总额y 与社会消费品零售总额x 间散点图
(2) 利用计算器可以计算算出: 11
210111133142.9,1883.03, 1.3390610,
768406464
i i i
i i x y x x y =====⨯=∑∑
于是111
11221110.07658,705.0111i i
i i i x y x y b a y bx x
x ==-==---∑∑.
所以所求的线性回归直线方程是ˆˆ705.010.07658y
x =-+。
(3)社会消费品零售总额增长在12%~14%,即社会消费品零售总额在60424~61503,估计2005年营业税税收总额大致在3992~4005亿元,增长9.5%~11.8%。
B 组
1. A 。
2. D 。
3. D 。
4. ③
5. 体重预测值=0.72(kg/cm ) 身高-58.5kg 。
6. 画出散点图:
利用计算器,可以计算得:
1212
2
111.5417, 2.8475,29.808,54.243.i i i i i x y x x y ======∑∑ 于是121
1222112 1.215,0.97412i i
i i i x y x y b a y bx x
x ==-==--∑∑。
所以所求的线性回归直线方程是ˆˆ0.974 1.215y
x =+。
7. ①222
22
2211111()22()n n n n n i i i i
i i i i i i x x x x x nx x x nx nx x nx =====-=-+=-+=-∑∑∑∑∑。
②1111()()n n n n
i i i i i i i i i i x x y y x y x y y x nx y ====--=--+∑∑∑∑
11()()n n
i i i i i i x y x n y y nx nx y x y nx y ===--+=-∑∑。
8. 首先以横坐标表示新建成的住宅面积,纵坐标表示对应县城的家具销售量,作散点图。
散点图如下:
由于家具销售量与新住宅落成的面积间呈现出明显的线性趋势,所以我们可以用回归直线去描述它 .由已知数据可以算出:
8.160918)(12112=-∑∑==n i i n
i i x n x ,8.173976))((1111=-∑∑∑===n i i n i i i n i i y x n y x , 所以0811.1=b ,4147.218=-=x b y a ,因此4147.2180811.1ˆ+=x y
即为所求回归直线。
故当此县城在2008年预计新建成的住宅面积为350×103m 2,则可以大体估计出此县
城当年可销售家具8.5964147.2183500811.1ˆ=+⨯=y
万元。
本资料来源于《七彩教育网》。