【人教A版高中数学精练及答案解析】选修1-2第一章1.1 回归分析的基本思想及其初步应用 复习练习
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
选修1-2第一章1.1 回归分析的基本思想及其初步应用
复习练习
[A 基础达标]
1.在画两个变量的散点图时,下列叙述正确的是( ) A .预报变量在x 轴上,解释变量在y 轴上 B .解释变量在x 轴上,预报变量在y 轴上 C .可以选择两个变量中任意一个变量在x 轴上 D .可以选择两个变量中任意一个变量在y 轴上
2.四名同学根据各自的样本数据研究变量x ,y 之间的相关关系,求得回归直线方程,并分别得到以下四个结论:
①y 与x 负相关且y ^
=2.347x -6.423; ②y 与x 负相关且y ^
=-3.476x +5.648; ③y 与x 正相关且y ^
=5.437x +8.493; ④y 与x 正相关且y ^
=-4.326x -4.578. 其中一定不正确的结论的序号是( ) A .①② B .②③ C .③④
D .①④
3.对两个变量y 和x 进行回归分析,得到一组样本数据:(x 1,y 1),(x 2,y 2),…,(x n ,y n ),则下列说法中不正确的是( )
A .由样本数据得到的线性回归方程y ^=b ^x +a ^必过样本点的中心(x -,y -
) B .残差平方和越小的模型,拟合的效果越好
C .用相关指数R 2来刻画回归效果,R 2的值越小,说明模型的拟合效果越好
D .若变量y 和x 之间的相关系数r =-0.936 2,则变量y 与x 之间具有线性相关关系
4.如图所示的是一组观测值的四个线性回归模型对应的残差图,则对应的线性回归模型的拟合效果最好的残差图是( )
5.某产品的广告费用x 与销售额y 的统计数据如表:
根据上表可得线性回归方程y =b x +a 中的b 为9.4,据此模型预测广告费用为6万元时销售额为( )
A .63.6万元
B .65.5万元
C .67.7万元
D .72.0万元
6.如果散点图中的所有的点都在一条斜率不为0的直线上,则残差为________,相关指数R 2=________.
7.已知回归直线的斜率的估计值为1.23,样本点的中心为(4,5),则回归直线方程是________. 8.若对于变量y 与x 的10组统计数据的回归模型,R 2
=0.95,又知残差平方和为120.53,那么 i =1
10
(y i -y -
)2的值为________.
9.某工厂为了对新研发的一种产品进行合理定价,将该产品按事先拟定的价格进行试销,得到如表数据:
(1)求线性回归直线方程y =b x +a ,其中b =-20,a =y -b x ;
(2)预计在今后的销售中,销售与单价仍然服从(1)中的关系,且该产品的成本是4元/件,为使工厂获得最大利润,该产品的单价应定为多少元?(利润=销售收入-成本)
[B 能力提升]
10.为了解某社区居民的家庭年收入与年支出的关系,随机调查了该社区5户家庭,得到如下统计数据表:
根据上表可得回归直线方程y =b x +a ,其中b =0.76,a =y -b x .据此估计,该社区一户年收入为15万元家庭的年支出为( )
A .11.4万元
B .11.8万元
C .12.0万元
D .12.2万元
11.关于x 与y 有如下数据:
为了对x ,y 两个变量进行统计分析,现有以下两种线性模型:甲:y =6.5x +17.5,乙:y ^
=7x +17,则________(填“甲”或“乙”)模型拟合的效果更好.
12.假定小麦基本苗数x 与成熟期有效穗数y 之间存在相关关系,今测得5组数据如下:
(1)以x 为解释变量,y (2)求y 与x 之间的回归方程,对于基本苗数56.7预报有效穗数; (3)计算各组残差,并计算残差平方和;
(4)求相关指数R 2,并说明残差变量对有效穗数的影响占百分之几.
13.(选做题)为了研究某种细菌随时间x变化时,繁殖个数y的变化,收集数据如下:
(1)用时间x
(2)描述解释变量x与预报变量y之间的关系;
(3)计算R2.
选修1-2第一章1.1 回归分析的基本思想及其初步应用
复习练习
[A 基础达标]
1.在画两个变量的散点图时,下列叙述正确的是( ) A .预报变量在x 轴上,解释变量在y 轴上 B .解释变量在x 轴上,预报变量在y 轴上 C .可以选择两个变量中任意一个变量在x 轴上 D .可以选择两个变量中任意一个变量在y 轴上
解析:选B.结合线性回归模型y =bx +a +e 可知,解释变量在x 轴上,预报变量在y 轴上. 2.四名同学根据各自的样本数据研究变量x ,y 之间的相关关系,求得回归直线方程,并分别得到以下四个结论:
①y 与x 负相关且y ^
=2.347x -6.423; ②y 与x 负相关且y ^
=-3.476x +5.648; ③y 与x 正相关且y ^
=5.437x +8.493; ④y 与x 正相关且y ^
=-4.326x -4.578. 其中一定不正确的结论的序号是( ) A .①② B .②③ C .③④
D .①④
解析:选D.x 的系数符号决定变量x ,y 之间的正、负相关关系,x 的系数大于0为正相关,小于0为负相关,易知①④不正确.
3.对两个变量y 和x 进行回归分析,得到一组样本数据:(x 1,y 1),(x 2,y 2),…,(x n ,y n ),则下列说法中不正确的是( )
A .由样本数据得到的线性回归方程y ^=b ^x +a ^必过样本点的中心(x -,y -
) B .残差平方和越小的模型,拟合的效果越好
C .用相关指数R 2来刻画回归效果,R 2的值越小,说明模型的拟合效果越好
D .若变量y 和x 之间的相关系数r =-0.936 2,则变量y 与x 之间具有线性相关关系 解析:选C.R 2的值越接近1,说明残差平方和越小,也就是说模型的拟合效果越好.
4.如图所示的是一组观测值的四个线性回归模型对应的残差图,则对应的线性回归模型的拟合效果最好的残差图是( )
解析:选A.残差点比较均匀地落在水平的带状区域中,说明选用的模型比较合适,所以选A. 5.某产品的广告费用x 与销售额y 的统计数据如表:
根据上表可得线性回归方程y =b x +a 中的b 为9.4,据此模型预测广告费用为6万元时销售额为( )
A .63.6万元
B .65.5万元
C .67.7万元
D .72.0万元
解析:选B.由表可计算x -=4+2+3+54=72,y -=49+26+39+54
4=42,因为点⎝⎛⎭⎫72,42在回归直线y ^=b ^x +a ^上,且b ^为9.4,所以42=9.4×72+a ^,解得a ^=9.1,故线性回归方程为y ^
=9.4x +9.1,令x =6,
得y ^
=65.5.
6.如果散点图中的所有的点都在一条斜率不为0的直线上,则残差为________,相关指数R 2=________.
解析:由题意知,y i =y ^i ,所以相应的残差e ^i =y i -y ^
i =0. 相关指数R 2=1-
∑n
i =
1 (y i -y ^i )2
∑n
i =
1
(y i -y -)2
=1. 答案:0 1
7.已知回归直线的斜率的估计值为1.23,样本点的中心为(4,5),则回归直线方程是________. 解析:斜率的估计值为1.23,且回归直线一定经过样本点的中心(4,5),可得y ^
-5=1.23(x -4),即y ^
=1.23x +0.08.
答案:y ^
=1.23x +0.08
8.若对于变量y 与x 的10组统计数据的回归模型,R 2
=0.95,又知残差平方和为120.53,那么∑i =1
10
(y i -y -
)2的值为________.
解析:由R 2=1-∑10
i =
1 (y i -y ^i )2∑10i =1
(y i -y -)2得1-(120.53∑10i =
1
(y i -y -)2
=0.95,得 i =110 (y i -y -
)2=2 410.6.
答案:2 410.6
9.某工厂为了对新研发的一种产品进行合理定价,将该产品按事先拟定的价格进行试销,得到如表数据:
(1)求线性回归直线方程y =b x +a ,其中b =-20,a =y -b x ;
(2)预计在今后的销售中,销售与单价仍然服从(1)中的关系,且该产品的成本是4元/件,为使工厂获得最大利润,该产品的单价应定为多少元?(利润=销售收入-成本)
解:(1)由于x -=1
6(8+8.2+8.4+8.6+8.8+9)=8.5,
y -=1
6(90+84+83+80+75+68)=80,
又b ^
=-20,
所以a ^=y --b ^x -
=80+20×8.5=250, 从而线性回归直线方程为y ^
=-20x +250. (2)设工厂获得的利润为L 元,依题意得 L =x(-20x +250)-4(-20x +250) =-20x 2+330x -1 000 =-20(x -8.25)2+361.25.
当且仅当x =8.25时,L 取得最大值.
故当单价定为8.25元时,工厂可获得最大利润.
[B 能力提升]
10.为了解某社区居民的家庭年收入与年支出的关系,随机调查了该社区5户家庭,得到如下统计数据表:
根据上表可得回归直线方程y =b x +a ,其中b =0.76,a =y -b x .据此估计,该社区一户年收入为15万元家庭的年支出为( )
A .11.4万元
B .11.8万元
C .12.0万元
D .12.2万元
解析:选B.先求a ^
,再利用回归直线方程预测. 由题意知,
x -=8.2+8.6+10.0+11.3+11.95=10,
y -=6.2+7.5+8.0+8.5+9.85=8,
所以a ^
=8-0.76×10=0.4,
所以当x =15时,y ^
=0.76×15+0.4=11.8(万元). 11.关于x 与y 有如下数据:
为了对x ,y 两个变量进行统计分析,现有以下两种线性模型:甲:y =6.5x +17.5,乙:y ^
=7x +17,则________(填“甲”或“乙”)模型拟合的效果更好.
解析:设甲模型的相关指数为R 21,则R 2
1=1-
∑5
i =
1
(y i -y ^i )2
∑5
i =
1
(y i -y -
)2
=1-155
1 000=0.845;
设乙模型的相关指数为R 2
2,
则R 22=1-180
1 000
=0.82. 因为0.845>0.82,即R 21>R 22,所以甲模型拟合效果更好.
答案:甲
12.假定小麦基本苗数x 与成熟期有效穗数y 之间存在相关关系,今测得5组数据如下:
(1)以x 为解释变量,y (2)求y 与x 之间的回归方程,对于基本苗数56.7预报有效穗数; (3)计算各组残差,并计算残差平方和;
(4)求相关指数R 2,并说明残差变量对有效穗数的影响占百分之几. 解:(1)散点图如下.
(2)由图看出,样本点呈条状分布,有比较好的线性相关关系,因此可以用线性回归方程刻画它们之间的关系.
设回归方程为y ^=b ^x +a ^,x -=30.36,y -
=43.5,
∑i =1
5
x 2i =5 101.56
x -y -=1 320.66, y -2=1 892.25,x -
2=921.729 6, ∑i =1
5 x i y i =
6 746.76.
由b ^=∑5
i =1x i y i -5x -y
-
∑5i =1
x 2i -5x -
2
≈0.29,a ^=y --b ^x -≈34.70.
故所求的回归直线方程为y ^
=34.70+0.29x. 当x =56.7时,y ^
=34.70+0.29×56.7=51.143. 因此估计成熟期的有效穗数为51.143.
(3)由e i =y i -y ^
i ,可分别求得e 1=0.35,e 2=0.718,e 3=-0.50,e 4=-2.214,e 5=1.624, 残差平方和:∑i =15
(y i -y ^
i )2=8.427 196.
(4)可得:∑i =1
5
(y i -y -
)2=50.18,
所以R 2=1-8.427 196
50.18
≈0.832.
所以解释变量(小麦基本苗数)对预报变量(成熟期有效穗数)约贡献了83.2%, 残差变量贡献了约1-83.2%=16.8%.
13.(选做题)为了研究某种细菌随时间x 变化时,繁殖个数y 的变化,收集数据如下:
(1)用时间x (2)描述解释变量x 与预报变量y 之间的关系; (3)计算R 2.
解:(1)所作散点图如图所示.
(2)由散点图看出样本点分布在一条指数函数y =c 1e c 2x 的周围,于是令z =ln y ,则
故z ^=0.69x +1.115,则有y =e 0.69x +
1.115. (3)
∑i =1
n
e ^2i =∑i =1
n ( y i -y ^i )2=4.816 1
∑i =1
n (y i -y -
)2=24 642.8,R 2=1-4.816 124 642.8
≈0.999 8,
即解释变量时间对预报变量繁殖个数解释了99.98%.。