课时作业8:3.2 回归分析(二)
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
一、基础过关
1.下列说法正确的是( )
①线性回归方程适用于一切样本和总体; ②线性回归方程一般都有时间性;
③样本的取值范围会影响线性回归方程的适用范围; ④根据线性回归方程得到的预测值是预测变量的精确值. A .①③④ B .②③ C .①② D .③④ 答案 B
2.每一吨铸铁成本y c (元)与铸件废品率x %建立的回归方程y c =56+8x ,下列说法正确的是( )
A .废品率每增加1%,成本每吨增加64元
B .废品率每增加1%,成本每吨增加8%
C .废品率每增加1%,成本每吨增加8元
D .如果废品率增加1%,则每吨成本为56元 答案 C
3.在一组样本数据(x 1,y 1),(x 2,y 2),…,(x n ,y n )(n ≥2,x 1,x 2,…,x n 不全相等)的散点图中,若所有样本点(x i ,y i )(i =1,2,…,n )都在直线y =1
2x +1上,则这组样本数据的样本相关
系数为( )
A .-1
B .0 C.1
2 D .1
答案 D
4.某学校开展研究性学习活动,某同学获得一组实验数据如下表:
x 1.99 3 4 5.1 6.12 y
1.5
4.04
7.5
12
18.01
对于表中数据,现给出下列拟合曲线,其中拟合程度最好的是( ) A .y =2x -2 B .y =(1
2)x
C .y =log 2x
D .y =1
2
(x 2-1)
答案 D
解析 可以代入检验,当x 取相应的值时,所求y 与已知y 相差最小的便是拟合程度最高的. 5.已知x ,y 之间的一组数据如下表:
则y 与x 之间的回归直线方程y =b x +a 必过点______________________________. 答案 (1.16,2.4)
解析 回归直线方程y ^
=b ^
x +a ^
必过样本点中心(x ,y ), ∵x =1.08+1.12+1.19+1.25
4=1.16,
y =
2.25+2.37+2.43+2.55
4
=2.4,
∴样本点中心为(1.16,2.4).
6.在研究两个变量的相关关系时,观察散点图发现样本点集中于某一条指数曲线y =e bx
+a
的周围,令z =ln y ,求得线性回归方程为z ^
=0.25x -2.58,则该模型的回归方程为________. 答案 y ^
=e 0.25x
-2.58
解析 ∵z ^ =0.25x -2.58,z =ln y , ∴y ^
=e 0.25x
-2.58
.
7.某电脑公司有6名产品推销员,其工作年限与年推销金额数据如下表:
(1)求年推销金额y (2)若第6名推销员的工作年限为11年,试估计他的年推销金额. 解 (1)设所求的线性回归方程为y ^
=b ^
x +a ^
,
则b ^
=
∑i =1
5
(x i -x )(y i -y )
∑i =1
5
(x i -x )2
=10
20
=0.5, a ^
=y -b ^
x =0.4.
∴年推销金额y 关于工作年限x 的回归直线方程为y ^
=0.5x +0.4. (2)当x =11时,y ^
=0.5x +0.4=0.5×11+0.4=5.9(万元). ∴可以估计第6名推销员的年推销金额为5.9万元. 二、能力提升
8.下列说法中正确的有:①若r >0,则x 增大时,y 也相应增大;②若r <0,则x 增大时,y 也相应增大;③若r =1,或r =-1,则x 与y 的关系完全对应(有函数关系),在散点图上各个散点均在一条直线上.( )
A .①②
B .②③
C .①③
D .①②③ 答案 C
9.为了考察两个变量x 和y 之间的线性相关性,甲、乙两个同学各自独立地做10次和15次试验,并且利用线性回归方法,求得回归直线分别为l 1和l 2.已知在两个人的试验中发现对变量x 的观测数据的平均值恰好相等,都为s ,对变量y 的观测数据的平均值也恰好相等,都为t .那么下列说法正确的是( ) A .直线l 1和l 2有交点(s ,t )
B .直线l 1和l 2相交,但是交点未必是点(s ,t )
C .直线l 1和l 2由于斜率相等,所以必定平行
D .直线l 1和l 2必定重合 答案 A
解析 由于回归直线一定过(x ,y ), ∴直线l 1和l 2都过(s ,t )点.
10.某化工厂为预测某产品的回收率y ,需要研究它和原料有效成分含量之间的相关关系,现取了8
对观测值,计算得:∑8
i =1x i =52,∑8
i =1y i =228,∑8
i =1x 2i =478,∑8
i =1
x i y i =1 849,则y 与x 的
回归直线方程是________. 答案 y ^
=11.47+2.62x
11.某种图书每册的成本费y (元)与印刷册数x (千册)有关,经统计得到数据如下:
已知每册书的成本费y 与印刷册数的倒数1
x 之间有线性相关关系,求出y 关于x 的回归方程.
解 令u =1
x ,则题目所给数据变成如下表所示的数据:
u 1 0.5 0.33 0.2 0.1 0.05 0.03 0.02 0.01 0.005 y
10.15
5.52
4.08
2.85
2.11
1.62
1.41
1.30
1.21
1.15
由题意可知,每册书的成本费y 与印刷册数的倒数1
x 之间有线性相关关系,故由最小二乘法得:
b ^
≈8.973,a ^
≈1.125,所以y =8.973u +1.125.
回代u =1x 可得y ^ =8.973
x +1.125.
因此y 关于x 的回归方程为y ^
=8.973
x
+1.125.
12.为了研究某种细菌随时间x 变化时,繁殖个数y 的变化,收集数据如下:
天数x /天 1 2 3 4 5 6 繁殖个数y /个
6
12
25
49
95
190
(1)用天数x 作解释变量,繁殖个数y 作预报变量,作出这些数据的散点图; (2)描述解释变量x 与预报变量y 之间的关系. 解 (1)所作散点图如图所示.
(2)由散点图看出样本点分布在一条指数型函数y =c 1e c 2x 的周围,于是令z =ln y ,则
x 1 2 3 4 5 6 z
1.79
2.48
3.22
3.89
4.55
5.25
由计算器得:z ^
=0.69x +1.115,则有y ^
=e 0.69x +1.115
.
三、探究与拓展
13.下表给出了我国从1949年至1999年人口数据资料,试根据表中数据估计我国2004年的人口数,并作出相关性检验. 年份 1949
1954
1959
1964
1969
1974
1979
1984
1989
1994
1999
人口数/百万
542
603
672
705
807
909
975
1 035 1 107 1 177 1 246
x 0 5 10 15 20 25 30 35 40 45 50 y
542
603
672
705
807
909
975
1 035
1 107
1 177
1 246
作出散点图如图,根据公式可得回归直线方程为 y ^
=527.591+14.453x .
由于2004对应的x =55,代入回归直线方程可得y ^
=1 322.506(百万),即2004年的人口总数估计为13.23亿.
下面对其进行线性相关性检验:
(1)作统计假设H 0∶x 与y 不具有线性相关; (2)由0.01与n -2=9的附表中查得r 0.01=0.735; (3)根据公式得相关系数r =0.998; (4)因为|r |=0.998>0.735,即|r |>r 0.01,
所以有99%的把握认为x 与y 之间具有线性相关关系,回归直线方程为y ^
=527.591+14.453x ,用这个方程去估计我国2004年的人口数是有意义的.。