北师大高中数学选择性必修第一册第七章 统计案例 单元测试卷【含答案】
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
北师大高中数学选择性必修第一册
第七章统计案例单元测试卷(原卷版)
一、单项选择题:本题共8小题,每小题5分,共40分.在每小题给出的四个选项中,只有一项是符合题目要求的.
1.对于线性回归方程Y=,下列说法不正确的是()
A.直线必经过点()
B.X增加1个单位时,Y平均增加个单位
C.样本数据中X=0时,可能有Y=
D.样本数据中X=0时,一定有Y=
2.已知变量X,Y之间有线性相关关系,其线性回归方程为Y=-3+X,若x i=17,y i=4,则的值为()
A.1
B.2
C.-1
D.-2
3.小明在做物理实验时,测量一根弹簧的劲度系数,得到了如下的结果:
所挂重量X/N123579
弹簧长度Y/cm111212131416
若弹簧长度Y与所挂重量X之间具有线性相关关系,则Y关于X的线性回归方程为()
A.Y=0.6X-10.3
B.Y=0.6X+10.3
C.Y=10.3X+0.6
D.Y=10.3X-0.6
4.对两个变量x,y进行线性相关检验,得线性相关系数r1=0.7859,对两个变量u,v进行线性相关检验,得线性相关系数r2=-0.9568,则下列判断正确的是()
A.变量x与y正相关,变量u与v负相关,变量x与y的线性相关性
较强
B.变量x与y负相关,变量u与v正相关,变量x与y的线性相关性较强
C.变量x与y正相关,变量u与v负相关,变量u与v的线性相关性较强
D.变量x与y负相关,变量u与v正相关,变量u与v的线性相关性较强
5.对四组数据进行统计,获得以下散点图,关于其相关系数的比较,正确的是()
A.r2<r4<0<r3<r1
B.r4<r2<0<r1<r3
C.r4<r2<0<r3<r1
D.r2<r4<0<r1<r3
6.根据表中所示的样本数据得到的回归方程为Y=.若=
7. 9,则x每增加1个单位,y就()
X34567
Y 4.0 2.5-0.50.5-2.0 A.增加1.4个单位 B.减少1.4个单位
C.增加1.2个单位
D.减少1.2个单位
7.某考察团对全国十大城市职工人均工资X与居民人均消费Y进行统计调查,Y与X具有相关关系,回归方程为Y=0.66X+1.562(单位:千元),若某城市居民消费水平为7.675,估计该城市消费额占
人均工资收入的百分比为()
A.66%
B.72.3%
C.67.3%
D.83%
8.变量y与x的回归模型中,它们对应的相关系数r的值如下,其中拟合效果最好的模型是()
模型1234
r0.480.150.960.30 A.模型1 B.模型2
C.模型3
D.模型4
二、多项选择题:本题共4小题,每小题5分,共20分.在每小题给出的选项中,有多项符合题目要求.全部选对的得5分,部分选对的得2分,有选错的得0分.
9.某电子商务平台每年都会举行“年货节”商业促销狂欢活动,现统计了该平台从2012年到2020年共9年,“年货节”期间的销售额(单位:亿元)并作出散点图,将销售额y看成以年份序号x(2012年作为第1年)的函数.运用excel软件,分别选择回归直线和三次函数回归曲线进行拟合,效果如下图,则下列说法正确的是()
A.销售额y与年份序号x呈正相关关系
B.销售额y与年份序号x线性相关不显著
C.三次函数回归曲线的拟合效果好于回归直线的拟合效果
D.根据三次函数回归曲线可以预测2021年“年货节”期间的销售额约为8454亿元
10.已知x与y之间的几组数据如下表:
x123456
y021334
假设根据上表数据所得线性回归方程为y=,若某同学根据上
表中的前两组数据(1,0)和(2,2)求得的直线方程为y=b'x+a',则以下结论正确的是()
参考公式.
A.a'=-2
B.b'=2
C.>b'
D.>a'
11.下列说法中正确的是()
A.对于独立性检验,χ2的值越大,说明两事件相关的可信程度越大
B.以模型y=c e kx去拟合一组数据时,为了求出回归方程,设z=ln y,将其变换后得到线性方程z=0.3x+4,则c,k的值分别是e4和0.3
C.在具有线性相关关系的两个变量的统计数据所得的线性回归方程Y =X中,=2,=1,=3,则=1
D.通过回归直线Y=及回归系数,可以精确反映变量的取值和变化趋势
12.在统计中,由一组样本数据(x1,y1),(x2,y2),…,(x n,y n)利用最小二乘法得到两个变量的线性回归方程为Y=,那么下面说法正确的是()
A.直线Y=至少经过点(x1,y1),(x2,y2),…,(x n,y n)中的一个点
B.直线Y=必经过点()
C.直线Y=表示最接近Y与X之间真实关系的一条直线
D.|r|≤1,且|r|越接近于1,相关程度越大;|r|越接近于0,相关程度越小
三、填空题:本题共4小题,每小题5分,共20分.
13.已知一系列样本点(x i,y i)(i=1,2,3,…,n)的回归方程为Y =2X+,若样本点(r,1)和(2,s)的偏差相同,则r和s的关系为s 2r=5.
14.已知线性相关的变量X与Y的部分数据如表所示:
X24568
Y3 4.5m7.59
若其线性回归方程是Y=1.05X+0.85,则m=6.5.
15.某部门通过随机调查89名工作人员的休闲方式是读书还是健身,得到的数据如下表:
读书健身总计女243155
男82634
总计325789
在犯错误的概率不超过0.10的前提下认为性别与休闲方式有关系. 16.某研究机构对儿童记忆能力X和识图能力Y进行统计分析,得到如下数据:
记忆能力X46810
识图能力Y3568
由表中数据,求得线性回归方程为Y=,则=9.5,若某儿童的记忆能力为12时,预测他的识图能力为9.5.
四、解答题:本题共6小题,共70分.解答应写出文字说明、证明过程或演算步骤.
17.(10分)某单位为了了解用电量Y千瓦·时与气温X℃之间的关系,随机统计了某4天的用电量与当天的气温,并制作了对照表.
气温/℃181310-1用电量/(千瓦·时)24343864
由表中数据得线性回归方程Y=中≈-2,预测当气温为-4℃时的用电量.
18.(12分)西瓜是夏日消暑的好水果,西瓜的销售价格Y(单位:千元/吨)与西瓜的年产量X(单位:吨)有关,下表数据为某地区连续6年来西瓜的年产量及对应的西瓜销售价格.
X123456
Y9.58.98.17.5 6.8 5.2 (1)若Y与X有较强的线性相关关系,根据上表提供的数据,用最小二乘法求出Y与X的线性回归直线方程;(系数精确到0.01)
(2)若每吨西瓜的成本为4810元,假设所有西瓜可以全部卖出,预测当年产量为多少吨时年利润最大?
参考公式及数据:
对于一组数据(x1,y1),(x2,y2),…,(x n,y n),其回归直线Y=
的斜率和截距的最小二乘估计分别为,其中=3.5,=91,x i y i=146.8.
19.(12分)第24届冬奥会于2022年2月4日至2月20日在北京市和河北省张家口市联合举行,这是中国历史上第一次举办冬季奥运会,为了宣传冬奥会,让更多的人了解、喜爱冰雪项目,某校高三年
级举办了冬奥会知识竞赛(总分100分),并随机抽取了n名中学生的成绩,绘制成如图所示的频率分布直方图.已知前三组的频率分别为f1,f2,f3,2f2=f1+f3,第一组和第五组的频率相同.
(1)求实数a,b的值,并估计这n名中学生的成绩平均值;(同一组中的数据用该组区间的中点值作代表)
(2)已知抽取的n名中学生中,男女生人数相等,男生喜欢花样滑冰
的人数占男生人数的,女生喜欢花样滑冰项的人数占女生人数的,且有95%的把握认为中学生喜欢花样滑冰与性别有关,求n的最小值.
20.(12分)我国北方广大农村地区、一些城镇以及部分大中城市的周边区域,还在大量采用分散燃煤和散烧煤取暖,既影响了居民基本生活的改善,也加重了北方地区冬季的雾霾天气.推进北方地区冬季清洁取暖,是重大民生工程、民心工程,关系北方地区广大群众温暖过冬,关系雾霾天能不能减少,是能源生产和消费革命、农村生活方式革命的重要内容.2017年9月国家发改委制定了煤改气、煤改电价格扶植新政策,从而使得煤改气、煤改电用户大幅度增加,下面条形图反映了某省2018年1~7月份煤改气、煤改电的用户数量.
(1)在给定坐标系中作出煤改气、煤改电用户数量y随月份t变化的散点图,并用散点图和相关系数说明y与t之间具有线性相关性;
(2)建立y关于t的回归方程(系数精确到0.01),预测11月份该省煤改气、煤改电的用户数量.
参考数据:y i=9.24,t i y i=39.75,≈0.53,≈2.646.
参考公式:相关系数
r=(t i-)(y i-)=y i.
回归方程t中斜率和截距的最小二乘估计公式分别为
.
21.(12分)某报社为了解大学生对国产电影的关注情况,就“是否关注国产电影”这一问题,随机调查了某大学的60名男生和60名女生,得到如下列联表:
男生女生总计关注国产电影504090
不关注国产电影102030
总计6060120
(1)从这60名女生中按“是否关注国产电影”进行分层抽样,抽取一个容量为6的样本,再从中随机选取2名进行深度采访,求“选到关注国产电影的女生与不关注国产电影的女生各1名”的概率;
(2)根据以上列联表,问有多大把握认为“大学生关注国产电影与性别有关”.
22.(12分)我国全面二孩政策已于2016年1月1日起正式实施.国家统计局发布的数据显示,从2012年到2017年,中国的人口自然增长率变化始终不大,在5‰上下波动(如图).
为了了解年龄介于24岁至50岁之间的适孕夫妻对生育二孩的态度如何,统计部门按年龄分为9组,每组选取150对夫妻进行调查统计有生育二孩意愿的夫妻数,得到下表:
年龄区间[24,
26]
[27,
29]
[30,
32]
[33,
35]
[36,
38]
[39,
41]
[42,
44]
[45,
47]
[48,
50]
有意
愿数
808187868483837066
(1)设每个年龄区间的中间值为x,有意愿数为y,求样本数据的线性回归方程,并求该模型的相关系数r;(结果保留两位小数)
(2)从[24,26],[33,35],[39,41],[45,47],[48,50]这五个年龄段中各选出一对夫妻(能代表该年龄段超过半数夫妻的意愿)进一步调研,再从这5对夫妻中任选2对夫妻.求其中恰有一对不愿意生育二孩的夫妻的概率.
(参考数据和公式:
r=,(x i-)(y i -)=y i,x i y i=26340,≈473.96)
北师大高中数学选择性必修第一册
第七章统计案例单元测试卷(解析版)
一、单项选择题:本题共8小题,每小题5分,共40分.在每小题给出的四个选项中,只有一项是符合题目要求的.
1.对于线性回归方程Y=,下列说法不正确的是(D)
A.直线必经过点()
B.X增加1个单位时,Y平均增加个单位
C.样本数据中X=0时,可能有Y=
D.样本数据中X=0时,一定有Y=
解析:线性回归方程是对样本数据的一个近似描述,故由它得到的值也是一个近似值.故选D.
2.已知变量X,Y之间有线性相关关系,其线性回归方程为Y=-3+X,若x i=17,y i=4,则的值为(B)
A.1
B.2
C.-1
D.-2
解析:x i=1.7,y i=0.4,∴0.4=-3+1.7,∴=2,故选B.
3.小明在做物理实验时,测量一根弹簧的劲度系数,得到了如下的结果:
所挂重量X/N123579
弹簧长度Y/cm111212131416
若弹簧长度Y与所挂重量X之间具有线性相关关系,则Y关于X的线性回归方程为(B)
A.Y=0.6X-10.3
B.Y=0.6X+10.3
C.Y=10.3X+0.6
D.Y=10.3X-0.6
解析:∵×(1+2+3+5+7+9)=4.5,×(11+12+12+13+14+16)=13,
∴两个变量间的回归直线必过点(4.5,13),排除A,C,D,故选B.
4.对两个变量x,y进行线性相关检验,得线性相关系数r1=0.7859,对两个变量u,v进行线性相关检验,得线性相关系数r2=-0.9568,则下列判断正确的是(C)
A.变量x与y正相关,变量u与v负相关,变量x与y的线性相关性较强
B.变量x与y负相关,变量u与v正相关,变量x与y的线性相关性较强
C.变量x与y正相关,变量u与v负相关,变量u与v的线性相关性较强
D.变量x与y负相关,变量u与v正相关,变量u与v的线性相关性较强
解析:由线性相关系数r1=0.7859>0知x与y正相关,由线性相关系数r2=-0.9568<0知u与v负相关,又|r1|<|r2|,所以,变量u与v的线性相关性比x与y的线性相关性强,故选C.
5.对四组数据进行统计,获得以下散点图,关于其相关系数的比较,正确的是(A)
A.r2<r4<0<r3<r1
B.r4<r2<0<r1<r3
C.r4<r2<0<r3<r1
D.r2<r4<0<r1<r3
解析:由给出的四组数据的散点图可以看出,图1和图3是正相关,相关系数大于0,图2和图4是负相关,相关系数小于0,图1和图2的点相对更加集中,所以相关性更强,所以r1接近于1,r2接近于-1,由此可得r2<r4<0<r3<r1.故选A.
6.根据表中所示的样本数据得到的回归方程为Y=.若=
7. 9,则x每增加1个单位,y就(B)
X34567
Y 4.0 2.5-0.50.5-2.0 A.增加1.4个单位 B.减少1.4个单位
C.增加1.2个单位
D.减少1.2个单位
解析:设变量X,Y的平均值为,所以×(3+4+5+6+7)=5,×(4+2.5-0.5+0.5-2)=0.9,所以0.9=5×+7.9,
所以=-1.4,所以x每增加1个单位,y就减少1.4个单位.故选B.
7.某考察团对全国十大城市职工人均工资X与居民人均消费Y进行统计调查,Y与X具有相关关系,回归方程为Y=0.66X+1.562(单位:千元),若某城市居民消费水平为7.675,估计该城市消费额占人均工资收入的百分比为(D)
A.66%
B.72.3%
C.67.3%
D.83%
解析:7.675=0.66X+1.562⇒X≈9.26,故估计该城市消费额占人
均工资收入的百分比为×100%≈83%.故选D.
8.变量y与x的回归模型中,它们对应的相关系数r的值如下,其中拟合效果最好的模型是(C)
模型1234
r0.480.150.960.30 A.模型1 B.模型2
C.模型3
D.模型4
解析:线性回归分析中,相关系数为r,|r|越接近于1,相关程度越大;|r|越小,相关程度越小,∵模型3的相关系数r最大,∴模拟效果最好,故选C.
二、多项选择题:本题共4小题,每小题5分,共20分.在每小题给出的选项中,有多项符合题目要求.全部选对的得5分,部分选对的得2分,有选错的得0分.
9.某电子商务平台每年都会举行“年货节”商业促销狂欢活动,现统计了该平台从2012年到2020年共9年,“年货节”期间的销售额(单位:亿元)并作出散点图,将销售额y看成以年份序号x(2012年作为第1年)的函数.运用excel软件,分别选择回归直线和三次函数回归曲线进行拟合,效果如下图,则下列说法正确的是(AC)
A.销售额y与年份序号x呈正相关关系
B.销售额y与年份序号x线性相关不显著
C.三次函数回归曲线的拟合效果好于回归直线的拟合效果
D.根据三次函数回归曲线可以预测2021年“年货节”期间的销售额约为8454亿元
解析:根据图象可知,散点从左下到右上分布,销售额y与年份序号x呈正相关关系,故A正确;
因为相关系数0.936>0.75,靠近1,销售额y与年份序号x线性相关显著,B错误;
根据三次函数回归曲线的相关指数0.999>0.936,相关指数越大,拟合效果越好,所以三次多项式回归曲线的拟合效果好于回归直线的拟合效果,C正确;
由三次多项式函数y=0.168x3+28.141x2-29.027x+6.889,
当x=10时,y≈2698.72亿元,D错误.
10.已知x与y之间的几组数据如下表:
x123456
y021334
假设根据上表数据所得线性回归方程为y=,若某同学根据上表中的前两组数据(1,0)和(2,2)求得的直线方程为y=b'x+a',则以下结论正确的是(ABD)
参考公式.
A.a'=-2
B.b'=2
C.>b'
D.>a'
解析:因为某同学根据上表中的前两组数据(1,0)和(2,2)求得的直线方程为y=b'x+a',所以b'=2,a'=-2,
根据题意,得=3.5,,
x i y i=0+4+3+12+15+24=58,
=1+4+9+16+25+36=91,
所以,
,
所以<b',>a'.故选ABD.
11.下列说法中正确的是(ABC)
A.对于独立性检验,χ2的值越大,说明两事件相关的可信程度越大
B.以模型y=c e kx去拟合一组数据时,为了求出回归方程,设z=ln y,将其变换后得到线性方程z=0.3x+4,则c,k的值分别是e4和0.3
C.在具有线性相关关系的两个变量的统计数据所得的线性回归方程Y =X中,=2,=1,=3,则=1
D.通过回归直线Y=及回归系数,可以精确反映变量的取值和变化趋势
解析:对于A,根据独立性检验的性质知,χ2的值越大,说明两个事件相关的可信程度越大,故A正确;对于B,由y=c e kx,两边取自然对数,可得ln y=ln c+kx,z=ln y,则z=kx+ln c,因为z=0.
3x+4,所以则故B正确;对于C,由于回归直线过点(),=3-2×1=1,故C正确;对于D,通过
回归直线Y=及回归系数,可预测变量的取值和变化趋势,故D错误.故选ABC.
12.在统计中,由一组样本数据(x1,y1),(x2,y2),…,(x n,y n)利用最小二乘法得到两个变量的线性回归方程为Y=,那么下面说法正确的是(BCD)
A.直线Y=至少经过点(x1,y1),(x2,y2),…,(x n,y n)中的一个点
B.直线Y=必经过点()
C.直线Y=表示最接近Y与X之间真实关系的一条直线
D.|r|≤1,且|r|越接近于1,相关程度越大;|r|越接近于0,
相关程度越小
解析:对于A,直线Y=由点拟合而成,可以不经过任何样本
点,故A错;对于B,直线Y=必过样本点中心即点(),故B正确;对于C,直线Y=是采用最小二乘法求解出的直线方程,接近真实关系,故C正确;对于D,相关系数r的绝对值越接近于1,表示相关程度越大,越接近于0,相关程度越小,故D正确.故选BCD.
三、填空题:本题共4小题,每小题5分,共20分.
13.已知一系列样本点(x i,y i)(i=1,2,3,…,n)的回归方程为Y =2X+,若样本点(r,1)和(2,s)的偏差相同,则r和s的关系为s +2r=5.
解析:根据偏差的定义,可得1-(2r+)=s-(2×2+),整理,得s+2r=5.
14.已知线性相关的变量X与Y的部分数据如表所示:
X24568
Y3 4.5m7.59
若其线性回归方程是Y=1.05X+0.85,则m=6.5.
解析:由题意可得
=5,,
则=1.05×5+0.85,解得m=6.5.
15.某部门通过随机调查89名工作人员的休闲方式是读书还是健身,得到的数据如下表:
读书健身总计女243155
男82634
总计325789
在犯错误的概率不超过0.10的前提下认为性别与休闲方式有关系.
解析:由列联表中的数据,得
χ2=≈3.689>2.706,因此,在犯错误的概率不超过0.10的前提下认为性别与休闲方式有关系.
16.某研究机构对儿童记忆能力X和识图能力Y进行统计分析,得到如下数据:
记忆能力X46810
识图能力Y3568
由表中数据,求得线性回归方程为Y=,则=,若某儿童的记忆能力为12时,预测他的识图能力为9.5.
解析:由表中数据得
=7,
=5.5,
由()在直线Y=,即5.5=×7+得,即线性回
归方程为Y=.所以当X=12时,Y=×12-=9.5,即他的识图能力为9.5.
四、解答题:本题共6小题,共70分.解答应写出文字说明、证明过程或演算步骤.
17.(10分)某单位为了了解用电量Y千瓦·时与气温X℃之间的关系,随机统计了某4天的用电量与当天的气温,并制作了对照表.
气温/℃181310-1用电量/(千瓦·时)24343864
由表中数据得线性回归方程Y=中≈-2,预测当气温为-4℃时的用电量.
解:=10,=40,回归直线过点(),
所以40=-2×10+,所以=60,所以Y=-2X+60.
令X=-4,得Y=(-2)×(-4)+60=68.
故当气温为-4℃时,用电量预计为68千瓦·时.
18.(12分)西瓜是夏日消暑的好水果,西瓜的销售价格Y(单位:千元/吨)与西瓜的年产量X(单位:吨)有关,下表数据为某地区连续6年来西瓜的年产量及对应的西瓜销售价格.
X123456
Y9.58.98.17.5 6.8 5.2 (1)若Y与X有较强的线性相关关系,根据上表提供的数据,用最小二乘法求出Y与X的线性回归直线方程;(系数精确到0.01)
(2)若每吨西瓜的成本为4810元,假设所有西瓜可以全部卖出,预测当年产量为多少吨时年利润最大?
参考公式及数据:
对于一组数据(x1,y1),(x2,y2),…,(x n,y n),其回归直线Y=
的斜率和截距的最小二乘估计分别为,其中=3.5,=91,x i y i=146.8.
解:(1)设Y与X的回归直线方程为Y==
≈-0.81,
×3.5≈10.51,
所以Y=-0.81X+10.51.
(2)设年利润为Z千元,则Z=(-0.81X+10.51)×X-×X=-0.81X2+5.7X,
当X=-≈3.52时,Z取最大值,所以当年产量为3.52吨
时,年利润最大.
19.(12分)第24届冬奥会于2022年2月4日至2月20日在北京市和河北省张家口市联合举行,这是中国历史上第一次举办冬季奥运会,为了宣传冬奥会,让更多的人了解、喜爱冰雪项目,某校高三年级举办了冬奥会知识竞赛(总分100分),并随机抽取了n名中学生的成绩,绘制成如图所示的频率分布直方图.已知前三组的频率分别为f1,f2,f3,2f2=f1+f3,第一组和第五组的频率相同.
(1)求实数a,b的值,并估计这n名中学生的成绩平均值;(同一组中的数据用该组区间的中点值作代表)
(2)已知抽取的n名中学生中,男女生人数相等,男生喜欢花样滑冰
的人数占男生人数的,女生喜欢花样滑冰项的人数占女生人数的,且有95%的把握认为中学生喜欢花样滑冰与性别有关,求n的最小值.
解:(1)由题意可知,解得
各组频率依次为0.05,0.25,0.45,0.2,0.05,
∴=0.05×50+0.25×60+0.45×70+0.2×80+0.05×90=69. 5(分).
(2)设男生人数为x,依题意可得列联表如下:
喜欢花样滑冰不喜欢花样滑冰合计男生x x x
女生x x x
合计x x2x
χ2=x>3.841,∴x≥29.
,且各组的频数为正整数,故x min=40,n min=80.又x=4k,k∈N
+
20.(12分)我国北方广大农村地区、一些城镇以及部分大中城市的周边区域,还在大量采用分散燃煤和散烧煤取暖,既影响了居民基本生活的改善,也加重了北方地区冬季的雾霾天气.推进北方地区冬季清洁取暖,是重大民生工程、民心工程,关系北方地区广大群众温暖过冬,关系雾霾天能不能减少,是能源生产和消费革命、农村生活方式革命的重要内容.2017年9月国家发改委制定了煤改气、煤改电价格扶植新政策,从而使得煤改气、煤改电用户大幅度增加,下面条形图反映了某省2018年1~7月份煤改气、煤改电的用户数量.
(1)在给定坐标系中作出煤改气、煤改电用户数量y随月份t变化的散点图,并用散点图和相关系数说明y与t之间具有线性相关性;
(2)建立y关于t的回归方程(系数精确到0.01),预测11月份该省煤改气、煤改电的用户数量.
参考数据:y i=9.24,t i y i=39.75,≈0.53,≈2.646.
参考公式:相关系数
r=(t i-)(y i-)=y i.
回归方程t中斜率和截距的最小二乘估计公式分别为
.
解:(1)作出散点图如图所示:
由条形图数据和参考数据得
=4,(t i-)2=28,≈0.53,
(t i-)(y i-)=y i=39.75-4×9.24=2.79,
r≈≈0.99.
因为y与t的相关系数近似为0.99,说明y与t的线性相关性相当高,从而可以用线性回归模型拟合y与t的关系.
(2)由=1.32及(1)得
≈0.10,
≈1.32-0.10×4=0.92,
所以,y关于t的回归方程为y=0.92+0.10t.
将t=11代入回归方程得y=0.92+0.10×11=2.02,
所以预测11月份该省煤改气、煤改电的用户数量达到2.02万户. 21.(12分)某报社为了解大学生对国产电影的关注情况,就“是否关注国产电影”这一问题,随机调查了某大学的60名男生和60名女生,得到如下列联表:
男生女生总计关注国产电影504090
不关注国产电影102030
总计6060120
(1)从这60名女生中按“是否关注国产电影”进行分层抽样,抽取一个容量为6的样本,再从中随机选取2名进行深度采访,求“选到关注国产电影的女生与不关注国产电影的女生各1名”的概率;
(2)根据以上列联表,问有多大把握认为“大学生关注国产电影与性别有关”.
解:(1)根据分层抽样,可得抽取的容量为6的样本中,关注国产电
影的女生有×40=4(名),不关注国产电影的女生有×20=2(名).所以“选到关注国产电影的女生与不关注国产电影的女生各1名”的
概率为P=.
(2)根据题中的列联表,得χ2=≈4.444.
由4.444>3.841,可知有95%的把握认为“大学生关注国产电影与性别有关”.
22.(12分)我国全面二孩政策已于2016年1月1日起正式实施.国家统计局发布的数据显示,从2012年到2017年,中国的人口自然增长率变化始终不大,在5‰上下波动(如图).
为了了解年龄介于24岁至50岁之间的适孕夫妻对生育二孩的态度如何,统计部门按年龄分为9组,每组选取150对夫妻进行调查统计有生育二孩意愿的夫妻数,得到下表:
年龄区间[24,
26]
[27,
29]
[30,
32]
[33,
35]
[36,
38]
[39,
41]
[42,
44]
[45,
47]
[48,
50]
有意
愿数
808187868483837066
(1)设每个年龄区间的中间值为x,有意愿数为y,求样本数据的线性回归方程,并求该模型的相关系数r;(结果保留两位小数)
(2)从[24,26],[33,35],[39,41],[45,47],[48,50]这五个年龄段中各选出一对夫妻(能代表该年龄段超过半数夫妻的意愿)进一步调研,再从这5对夫妻中任选2对夫妻.求其中恰有一对不愿意生育二孩的夫妻的概率.
(参考数据和公式:
r=,(x i-)(y i -)=y i,x i y i=26340,≈473.96)
解:(1)由题意可求得=37,y i=720,=80,y i=26640,
x i y i=26340,
∴(x i-)(y i-)=y i=26340-26640=-300.
又∵(x i-)2=122+92+62+32+32+62+92+122=540,(y i-)2=0+1+49+36+16+9+9+100+196=416,
∴(x i-)2·(y i-)2=540×416=224640.
∴≈-0.56.
∴≈100.72.
∴线性回归方程为Y=-0.56X+100.72.
∴r==
≈-0.63.
(2)由题意可知,在[24,26],[33,35],[39,41]年龄段中,超过半数的夫妻有生育二孩意愿,在[45,47],[48,50]年龄段中,超过半数的夫妻没有生育二孩意愿.
设从[24,26],[33,35],[39,41]年龄段中选出的夫妻分别为A1,A2,A3,
从[45,47],[48,50]年龄段中选出的夫妻分别为B1,B2.
则从中选出2对夫妻的所有可能结果为(A1,A2),(A1,A3),(A1,B1),(A1,B2),(A2,A3),(A2,B1),(A2,B2),(A3,B1),(A3,B2),(B1,B2),共10种情况.
其中恰有一对不愿意生育二孩的夫妻的情况有(A1,B1),(A1,B2),(A2,B1),(A2,B2),(A3,B1),(A3,B2),共6种.
∴恰有一对不愿意生育二孩的夫妻的概率P=.。