人教A版高中数学选修23:3.1+回归分析的基本思想及其初步应用(配套课件+同步检测试题,2份)3.1
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
课时训练14回归分析的基本思想及其初步应用
一、选择题
1.为了考察两个变量x和y之间的线性相关性,甲、乙两位同学各自独立地做了100次和150次试验,并且利用线性回归方法,求得回归直线分别为l1和l
2.已知两个人在试验中发现对变量x的观测数据的平均值都是s,对变量y的观测数据的平均值都是t,那么下列说法正确的是().
A.l1和l2有交点(s,t)
B.l1与l2相交,但交点不一定是(s,t)
C.l1与l2必定平行
D.l1与l2必定重合
答案:A
解析:都过样本中心点(s,t),但斜率不确定.
2.下列四个命题中正确的是().
①在线性回归模型中,e是bx+a预报真实值y的随机误差,它是一个观测的量;②残差平方和越小的模型,拟合的效果越好;③用R2来刻画回归方程,R2越小,拟合的效果越好;④在残差图中,残差点比较均匀地落在水平的带状区域中,说明选用的模型比较合适,若带状区域宽度越窄,说明拟合精度越高,回归方程的预报精度越高.
A.①③
B.②④
C.①④
D.②③
答案:B
解析:e是预报变量y的随机误差,故①不正确;R2越接近1,拟合的效果越好,故③不正确;故选B. 3.(2014湖北高考)根据如下样本数据:
得到的回归方程为=bx+a,则().
A.a>0,b>0
B.a>0,b<0
C.a<0,b>0
D.a<0,b<0
答案:B
解析:由样本数据可知y值总体上是随x值的增大而减少的.故b<0,又回归直线过第一象限,故纵
截距a>0.故选B.
4.某学校开展研究性学习活动,某同学获得一组实验数据如下表:
对于表中数据,现给出下列拟合曲线,其中拟合程度最好的是().
A.y=2x-2
B.y=
C.y=log2x
D.y=(x2-1)
答案:D
解析:可以代入检验,残差平方和最小的拟合程度最高.
5.若某地财政收入x与支出y满足线性回归方程y=bx+a+e(单位:亿元),其中b=0.8,a=2,|e|≤0.5.如果今年该地区财政收入10亿元,年支出预计不会超过().
A.10亿
B.9亿
C.10.5亿
D.9.5亿
答案:C
解析:代入数据y=10+e,因为|e|≤0.5,所以|y|≤10.5,故不会超过10.5亿.
6.某产品的广告费用x与销售额y的统计数据如下表:
根据上表可得回归方程x+中的为9.4,据此模型预报广告费用为6万元时销售额为().
A.63.6万元
B.65.5万元
C.67.7万元
D.72.0万元
答案:B
解析:∵-9.4×=9.1,
∴回归方程为=9.4x+9.1.
令x=6,得=9.4×6+9.1=65.5(万元).
二、填空题
7.在研究身高和体重的关系时,求得R2≈,可以叙述为“身高解释了64%的体重变化,而随机误差贡献了剩余的36%”,所以身高对体重的效应比随机误差的效应大得多.
答案:0.64
解析:结合相关指数的计算公式R2=1-可知,当R2≈0.64时,身高解释了64%的体重变化.
8.为了解篮球爱好者小李的投篮命中率与打篮球时间之间的关系,下表记录了小李某月1号到5号每天打篮球时间x(单位:h)与当天投篮命中率y之间的关系:
小李这5天的平均投篮命中率为,用线性回归分析的方法,预测小李该月6号打6小时篮球的投篮命中率为.
答案:0.50.53
解析:这5天的平均投篮命中率为
=0.5.
因为=3,
(x i-)(y i-)=(1-3)×(0.4-0.5)+(2-3)×(0.5-0.5)+(3-3)×(0.6-0.5)+(4-3)×(0.6-0.5)+(5-3)×(0.4-0.5)=0. 1,
(x i-)2=(1-3)2+(2-3)2+(3-3)2+(4-3)2+(5-3)2=10,
所以=0.01,=0.5-0.03=0.47.
所以回归直线方程为=0.01x+0.47.
当x=6时,=0.01×6+0.47=0.53.
9.已知y与x之间具有很强的线性相关关系,现观测得到(x,y)的四组观测值并制作了下边的对照表,由表中数据粗略地得到线性回归直线方程为x+60,其中的值没有写上.当x不小于-5时,预测y最大为.
答案:70
解析:由已知,得=10,=40,
所以40=10+60,=-2,从而=-2x+60.因为当x≥-5时,≤70,故预测y最大为70.
三、解答题
10.恩格尔系数=×100%.
在我国,据恩格尔系数判定生活发展阶段的标准为:
贫困:>60%,温饱:50%~60%,
小康:40%~50%,富裕:<40%.
据国家统计局统计显示,随着中国经济的不断发展,城镇居民家庭恩格尔系数不断下降,居民消费已从温饱型向享受型、发展型转变.如下表:
求:(1)根据年份预报恩格尔系数的线性回归方程;
(2)预报2013年的恩格尔系数;
(3)求R2;
(4)作出残差图.
解:由于问题中要求根据年份预报恩格尔系数,因此选取年份为自变量x,恩格尔系数为因变量y,作散点图:
(1)由最小二乘法得线性回归方程为
=-0.9018x+1845.9.
(2)由回归方程可知,2013年恩格尔系数为
=-0.9018×2013+1845.9≈30.6.
(3)R2=1-≈1-≈0.82.
(4)
残差图如下:
11.关于x与y有以下数据:
已知x与y线性相关,由最小二乘法得=6.5,
(1)求y关于x的线性回归方程;
(2)现有第二个线性模型:=7x+17,且R2=0.82.
若与(1)的线性模型比较,哪一个线性模型拟合效果比较好,请说明理由.解:(1)依题意设y关于x的线性回归方程为=6.5x+.
=5,
=50.
∵=6.5x+经过(),
∴50=6.5×5+.
∴=17.5.
∴y关于x的线性回归方程为=6.5x+17.5.
(2)由(1)的线性模型得y i-与y i-的关系如下表:
所以(y i-)2=(-0.5)2+(-3.5)2+(-10)2+(-6.5)2+0.52=155.
(y i-)2=(-20)2+(-10)2+102+02+202=1000.
所以=1-=1-=0.845.
由于=0.845,R2=0.82知>R2,
所以(1)的线性模型拟合效果比较好.
12.某兴趣小组欲研究昼夜温差大小与患感冒人数多少之间的关系,他们分别到气象局与某医院抄录了1至6月份每月10号的昼夜温差情况与因患感冒而就诊的人数,得到如下资料:
该兴趣小组确定的研究方案是:先从这六组数据中选取2组,用剩下的4组数据求线性回归方程,再用被选取的2组数据进行检验.
(1)求选取的2组数据恰好是相邻两个月的概率;
(2)若选取的是1月与6月的两组数据,请根据2至5月份的数据,求出y关于x的线性回归方程x+;
(3)若由线性回归方程得到的估计数据与所选出的检验数据的误差均不超过2人,则认为得到的线性回归方程是理想的,试问该小组所得线性回归方程是否理想?
解:(1)设“抽到相邻两个月的数据”为事件A,因为从6组数据中选取2组数据共有=15种情况,每种情况都是等可能出现的,其中,抽到相邻两个月的数据的情况有5种,
所以P(A)=.
(2)由数据求得=11,=24,
由公式,求得=-,
所以y关于x的线性回归方程为x-.
(3)当x=10时,y=<2,
同样,当x=6时,y=<2,
所以,该小组所得线性回归方程是理想的.。