深圳市南山区桃源中学选修三第三单元《成对数据的统计分析》检测卷(答案解析)

合集下载
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

一、选择题
1.某校对学生进行心理障碍测试,得到的数据如下表:
根据以上数据可判断在这三种心理障碍中,与性别关系最大的是( ) A .焦虑
B .说谎
C .懒惰
D .以上都不对
2.给出下列结论:在回归分析中
(1)可用相关指数2R 的值判断模型的拟合效果,2R 越大,模型的拟合效果越好; (2)可用残差平方和判断模型的拟合效果,残差平方和越大,模型的拟合效果越好; (3)可用相关系数r 的值判断模型的拟合效果,r 越大,模型的拟合效果越好; (4)可用残差图判断模型的拟合效果,残差点比较均匀地落在水平的带状区域中,说明这样的模型比较合适.带状区域的宽度越窄,说明模型的拟合精度越高. 以上结论中,不.正确的是( ) A .(1)(3) B .(2)(3) C .(1)(4)
D .(3)(4)
3.已知变量,x y 之间满足线性相关关系ˆ 1.31y
x =-,且,x y 之间的相关数据如下表所示:
则实数m =( ) A .0.8
B .0.6
C .1.6
D .1.8
4.已知()()()()()2
2n ad bc K a b c d a c b d -=++++,n a b c d =+++.
在“数学文化大讲堂”活动中,某老师对“学生性别和喜欢数学文化是否有关”作了一次调
查,其中被调查的女生人数是男生人数的1
2,男生喜欢数学文化的人数占男生人数的16
,女生喜欢数学文化的人数占女生人数2
3
,若有99%的把握认为是否喜欢数学文化和性别有关,则男生至少有( ) A .24人 B .22人
C .20人
D .18人
5.某公司在2014~2018年的收入与支出情况如下表所示:
根据表中数据可得回归直线方程为0.7y x a =+,依此估计如果2019年该公司收入为8亿元时的支出为( ) A .4.502亿元 B .4.404亿元 C .4.358亿元
D .4.856亿元
6.已知具有线性相关的两个变量,x y 之间的一组数据如下表所示:
若,x y 满足回归方程 1.5ˆˆy
x a =+,则以下为真命题的是( ) A .x 每增加1个单位长度,则y 一定增加1.5个单位长度 B .x 每增加1个单位长度,y 就减少1.5个单位长度 C .所有样本点的中心为(1,4.5) D .当8x =时,y 的预测值为13.5
7.下列说法中正确的是 ( )
①相关系数r 用来衡量两个变量之间线性关系的强弱, r 越接近于1,相关性越弱; ②回归直线y bx a =+一定经过样本点的中心(),x y ;
③随机误差e 满足()0E e =,其方差()D e 的大小用来衡量预报的精确度; ④相关指数2R 用来刻画回归的效果, 2R 越小,说明模型的拟合效果越好. A .①②
B .③④
C .①④
D .②③
8.在吸烟与患肺病这两个分类变量的计算中,下列说法正确的是( )
A .若从统计量中求出有95%的把握认为吸烟与患肺病有关系,是指有5%的可能性使得推断出现错误
B .从独立性检验可知,有99%的把握认为吸烟与患肺病有关系时,我们说某人吸烟,那么
他有99%的可能患有肺病
C .若2K 的观测值为 6.635k =,我们有99%的把握认为吸烟与患肺病有关系,那么在100个吸烟的人中必有99人患有肺病
D .以上三种说法均不正确
9.为了研究某班学生的数学成绩x (分)和物理成绩y (分)的关系,从该班随机抽取10名学生,根据测量数据的散点图可以看出y 与x 之间有线性相关关系,设其回归直线方
程为ˆˆˆy
bx a =+.已知10
1
750i i x ==∑,10
1
800i i y ==∑,ˆ 1.2b =,该班某学生的物理成绩为86,据此估计其数学成绩约为( ) A .81
B .80
C .93
D .94
10.某研究员为研究某两个变量的相关性,随机抽取这两个变量样本数据如下表:
若依据表中数据画出散点图,则样本点(,)(1,2,3,4,5)i i x y i =都在曲线1y =附近波
动.但由于某种原因表中一个x 值被污损,将方程1y =作为回归方程,则根据回归方
程1y =
和表中数据可求得被污损数据为( )
A . 4.32-
B .1.69
C .1.96
D .4.32
11.为考察某种药物预防疾病的效果,进行动物试验,得到如下药物效果与动物试验列联
表:
由上述数据给出下列结论,其中正确结论的个数是( )
附:2
2
()()()()()
n ad bc K a b c d a c b d -=++++;
0k
3.841 5.024 6.635 7.879
①能在犯错误的概率不超过0.05的前提下认为药物有效 ②不能在犯错误的概率不超过0.025的前提下认为药物有效 ③能在犯错误的概率不超过0.010的前提下认为药物有效 ④不能在犯错误的概率不超过0.005的前提下认为药物有效 A .1
B .2
C .3
D .4
第II 卷(非选择题)
请点击修改第II 卷的文字说明
参考答案 12.有下列说法:
①若某商品的销售量y (件)关于销售价格x (元/件)的线性回归方程为
5350y x =-+,当销售价格为10元时,销售量一定为300件;
②线性回归直线y bx a =+一定过样本点中心(,)x y ;
③若两个随机变量的线性相关性越强,则相关系数r 的值越接近于1;
④在残差图中,残差点比较均匀落在水平的带状区域中即可说明选用的模型比较合适,与带状区域的宽度无关;
⑤在线性回归模型中,相关指数2R 表示解释变量对于预报变量变化的贡献率,2R 越接近于1,表示回归的效果越好; 其中正确的结论有几个( ) A .1
B .2
C .3
D .4
13.有一散点图如图所示,在5个(,)x y 数据中去掉(3,10)D 后,下列说法正确的是( )
A .残差平方和变小
B .相关系数r 变小
C .相关指数2R 变小
D .解释变量x 与预报变量y 的相关性变弱
二、解答题
14.某研究机构对高三学生的记忆力x 和判断力y 进行统计分析,得下表数据.
x
6 8 10 12
(1)请根据表中提供的数据,求出关于的线性回归方程ˆˆy
bx a =+; (2)预测记忆力为19的同学的判断力.
(附参考公式:1
2
21
ˆn
i i
i n
i i x y nx y
b
x nx
==-=-∑∑,ˆa y bx
=-) 15.利用简单随机抽样的方法,从某校高一年级男生体验表格中抽取20名同学的胸围
()cm x 与肺活量()ml y 的样本,计算平均值80.5x =,4030y =,并求出线性回归方程
为ˆ32.26y
x a =+. 高一男生胸围与肺活量样本统计表
(2)求样本y 与x 的相关系数r ,并根据相关性检验的临界值表,判断有无99%把握认为肺活量与胸围线性关系是有意义的(精确到0.001);
(3)将肺活量不低于4500ml 视为大肺活量,用样本大肺活量的频率作为全校高一男生大肺活量的概率,求从本校高一年级任意抽取4名男同学,恰有两名是大肺活量的概率.
(参考公式及数据:()()
()
1
2
1
ˆn
i
i
i n
i
i x x y y b
x x ==--=-∑∑,()()
n
i
i
x x y y r --=
∑38≈2040≈.)
附:相关性检验的临界值表
16.某校从高二年级随机抽取了20名学生的数学总评成绩和物理总评成绩,记第i 位学生的成绩为(i i x y ,) (i =1,2,3...20),其中i i x y ,分别为第i 位学生的数学总评成绩和物理总评成绩.抽取的数据列表如下( 按数学成绩降序整理):
(1)根据统计学知识,当相关系数|r |≥0.8时,可视为两个变量之间高度相关.根据抽取的数据,能否说明数学总评成绩与物理总评成绩高度相关?请通过计算加以说明. 参考数据:
20
20
20
2
21
1
1
()()485.()
678.()476i
i
i
i i i i x x y y x x y y ===--=-=-=∑∑∑
参考公式:相关系数1
2
2
1
1
()()
.()()
n
i
i
i n n
i
i
i i x x y y r x x x y ===--=
--∑∑∑
(2)规定:总评成绩大于等于85分者为优秀,小于85分者为不优秀,对优秀赋分1,对不优秀赋分0,从这20名学生中随机抽取2名学生,若用X 表示这2名学生两科赋分的和,求X 的分布列和数学期望.
17.某企业为确定下一年投入某种产品的研发费用,需了解年研发费用x (单位:千万元)对年销售量y (单位:千万件)的影响,统计了近10年投入的年研发费用i x 与年销售
量()1
210i y i =⋯,,的数据,得到散点图如图所示.
(1)利用散点图判断y a bx =+和·d y c x =(其中c d ,均为大于0的常数)哪一个更适合作为年销售量y 和年研发费用x 的回归方程类型(只要给出判断即可,不必说明理由) (2)对数据作出如下处理,令,i i i i u lnx v lny ==,得到相关统计量的值如下表:根据第(1)问的判断结果及表中数据,求y 关于x 的回归方程;
10
1
i i v =∑
10
1
i i u =∑
(
)()
10
1
i i i u u v v =--∑
()10
2
1
i i u u =-∑
15 15 28.25 56.5
(3)已知企业年利润z (单位:千万元)与x y ,的关系为3
4
9
182
z e
y x =-
-(其中271828e ≈.),根据第(2)问的结果判断,要使得该企业下一年的年利润最大,预计下一年应投入多少研发费用?
附:对于一组数据()()()1122,,,n n u v u v u v ⋯,,,,其回归直线ˆˆˆv
u αβ=+的斜率和截距的最小二乘估计分别为()()
()
1
2
1
n
i
i
i n
i
i u u v v u u β==--=
-∑∑,ˆa
v u β=- 18.双十一购物狂欢节,是指每年11月11日的网络促销日,源于淘宝商城(天猫)2009年11月11日举办的网络促销活动,已成为中国电子商务行业的年度盛事.某生产商为了了解其生产的产品在不同电商平台的销售情况,统计了A B 、两个电商平台各十个网络销售店铺的销售数据:
A 电商平台 64
71 81 70 79 69 82 73 75 60 B 电商平台
60
80
97
77
96
87
76
83
94
96
(1)作出A B 、两个电商平台销售数据的茎叶图,根据茎叶图判断哪个电商平台的销售更好,并说明理由;
(2)填写下面关于店铺个数的22⨯列联表,并根据列联表判断是否有95%的把握认为销售量与电商平台有关;
(3)生产商要从这20个网络销售店铺销售量前五名的店铺中,随机抽取三个店铺进行销售返利,则其中恰好有两个店铺的销售量在95以上的概率是多少?
附:2
2
()(
)()()()
n ad bc K a b c d a c b d -=++++,n a b c d =+++.
19.某连锁经营公司所属5个零售店某月的销售额和利润额如下表:
(2)用最小二乘法计算利润额y 对销售额x 的线性回归方程; (3)当销售额为4千万元时,估计利润额的大小.
(参考公式:1
2
2
1
ˆn
i i
i n
i
i x y nxy
b
x
nx ==-=-∑∑,ˆˆa
y bx =-) 20.为保护农民种粮收益,促进粮食生产,确保国家粮食安全,调动广大农民生产粮食的积极性,从2014年开始,国家实施了对种粮农民直接补贴的政策通过对2014~2018年的数据进行调查,发现某地区发放粮食补贴额x (单位:亿元)与该地区粮食产量y (单位:万亿吨)之间存在着线性相关关系,统计数据如下表:
(1)请根据上表所给的数据,求出y 关于x 的线性回归直线方程ˆˆy
bx a =+; (2)通过对该地区粮食产量的分析研究,计划2019年在该地区发放粮食补贴7亿元,请根据(1)中所得到的线性回归直线方程,预测2019年该地区的粮食产量.
参考公式:()()
(
)
1
2
1
ˆn
i
i
i n
i i x x y y b
x x
==--=-∑∑,ˆˆa
y bx =-. 21.某市春节期间7家超市的广告费支出i x (万元)和销售额i y (万元)数据如下:
参数数据及公式:8x =,42y =,
7
12794i i i x y ==∑,7
12
708i i x ==∑,1
2
2
1
ˆn
i i n
i i i y n x y b nx
x x ==-⋅=-∑∑
,ˆˆa
y bx =-,ln 20.7≈. (1)若用线性回归模型拟合y 与x 的关系,求y 关于
x 的线性回归方程;
(2)用对数回归模型拟合y 与x 的关系,可得回归方程:ˆ12ln 22y
x =+,经计算得出线性回归模型和对数模型的2R 分别约为0.75和0.97,请用2R 说明选择哪个回归模型更合适,并用此模型预测A 超市广告费支出为8万元时的销售额.
22.为调查喜欢冲浪运动与性别是否相关,随机对100名大学生进行调查并制成下表:
(1)当20a =,50c =,10d =时,判断能否有99.9%的把握认为喜欢冲浪运动与性别有关?
(2)当50c =,10d =时,已知a 的值越大则2K 的值越小,若有99.9%的把握认为喜欢冲浪运动与性别有关,求a 的最大值.
参考公式及数据:2
2
()()()()()
n ad bc K a b c d a c b d -=++++,n a b c d =+++.
225741167129⨯>⨯⨯,2
25681067228
⨯<⨯⨯.
23.根据教育部高考改革指导意见,广东省从2021年正式实施“312++”新的高考考试方案.为尽快了解学生的选科需求,及时调整学校人力资源配备.某校从高一学生中抽样调查了100名同学,在模拟分科选择中,一半同学(其中男生38人)选择了物理,另一半(其中男生14人)选择了历史.请完成以下22⨯列联表,并判断能否有99.9%的把握说选科与性别有关?
参考公式:22
()()()()()
n ad bc K a b c d a c b d -=++++,其中n a b c d =+++为样本容量.
24.某景区的各景点从2009年取消门票实行免费开放后,旅游的人数不断地增加,不仅带动了该市淡季的旅游,而且优化了旅游产业的结构,促进了该市旅游向“观光、休闲、会展”三轮驱动的理想结构快速转变.下表是从2009年至2018年,该景点的旅游人数y (万人)与年份x 的数据:
第x 年 1 2 3 4 5 6 7 8 9 10
旅游人数y (万人)
300 283 321 345 372 435 486 527 622 800
该景点为了预测2021年的旅游人数,建立了y 与x 的两个回归模型: 模型①:由最小二乘法公式求得y 与x 的线性回归方程50.8169.7y x =+;
模型②:由散点图的样本点分布,可以认为样本点集中在曲线e bx
y a =的附近.
(1)根据表中数据,求模型②的回归方程ˆe bx y
a =.(a 精确到个位,
b 精确到0.01).
(2)根据下列表中的数据,比较两种模型的相关指数2R ,并选择拟合精度更高、更可靠的模型,预测2021年该景区的旅游人数(单位:万人,精确到个位). 回归方程
①50.8169.7y x =+
②ˆe bx y
a = 10
2
1
()
i
i
i y y =-∑ 30407
14607
参考公式、参考数据及说明: ①对于一组数据()()()1122,,,,
,,n n v w v w v w ,其回归直线w v αβ=+的斜率和截距的最
小二乘法估计分别为1
2
1
()()
,()
n
i
i
i n
i
i w w v v w v v v βαβ==--=
=--∑∑.②刻画回归效果的相关指数
2212
1
()1()n
i
i i n i
i y
y R y
y ==-=-
-∑∑;③参考数据: 5.46e 235≈, 1.43e 4.2≈.
表中10
1
1ln ,10i i i i u y u u ===∑.
25.某地实施乡村振兴战略,对农副产品进行深加工以提高产品附加值,已知某农产品成本为每件3元,加工后的试营销期间,对该产品的价格与销售量统计得到如下数据: (1)求销量y (件)关于单价x (元)的线性回归方程ˆˆˆy
bx a =+; (2)根据销量y 关于单价x 的线性回归方程,要使加工后收益P 最大,应将单价定为多少元?(产品收益=销售收入-成本).
参考公式:ˆb
=()12
1
()(
)
n
i i i n i i x x y y x x ==---∑∑
=
122
1n
i i i n i
i x y nxy x nx
==--∑∑
,ˆˆa
y bx =- 26.据不完全统计,某厂的生产原料耗费x (单位:百万元)与销售额y (单位:百万元)如下:
变量x 、y 为线性相关关系.
(1)求线性回归方程必过的点; (2)求线性回归方程;
(3)若实际销售额要求不少于54百万元,则原材料耗费至少要多少百万元.
1
1
2
2
2
1
1
()()()
ˆn
n
i
i
i i
i i n
n
i i
i i x x y y x y nxy
b
x x x
nx ====---==
--∑∑∑∑,ˆˆa
y bx =-
【参考答案】***试卷处理标记,请不要删除
一、选择题 1.B 解析:B 【分析】
分别求出三种关系的观测值,比较后可得结论. 【详解】
解:对于焦虑,说谎,懒惰三种心理障碍,设它们观测值分别为123,,K K K , 由表中数据可得:
()
2
111056025200.86330802585K ⨯⨯-⨯=≈⨯⨯⨯,
()2
211010702010 6.36630802090K ⨯⨯-⨯=≈⨯⨯⨯,
()2311015301550 1.41030806545
K ⨯⨯-⨯=≈⨯⨯⨯,
因为2K 的值最大,所以说谎与性别关系最大. 故选:B. 【点睛】
本题考查独立性检验的应用,考查理解能力和计算能力.
2.B
解析:B 【分析】
由2R 越大,模型的拟合效果越好,2R 越大,模型的拟合效果越好,相关系数r 越大,模型的拟合效果越好,带状区域的宽度越窄,说明模型的拟合精度越高,作出判断即可. 【详解】
用相关指数2R 的值判断模型的拟合效果,2R 越大,模型的拟合效果越好,故(1)正确;
用残差平方和判断模型的拟合效果,残差平方和越小,模型的拟合效果越好,故(2)不正确;
可用相关系数r 的值判断模型的拟合效果,r 越大,模型的拟合效果越好,故(3)不正确;
用残差图判断模型的拟合效果,残差点比较均匀地落在水平的带状区域中,说明这样的模型比较合适.带状区域的宽度越窄,说明模型的拟合精度越高,故(4)正确; 故选:B 【点睛】
本题主要考查了相关系数和相关指数的性质,属于中档题.
3.D
解析:D 【解析】
分析:由题意结合线性回归方程的性质整理计算即可求得最终结果. 详解:由题意可得:12345 2.542x +++=
==,0.1 3.14 1.844
m m
y +++==+, 线性回归方程过样本中心点,则:1.8 1.3 2.514
m
+=⨯-, 解得: 1.8m =. 本题选择D 选项.
点睛:本题主要考查线性回归方程的性质及其应用等知识,意在考查学生的转化能力和计算求解能力.
4.D
解析:D 【分析】
设男生至少有x 人,根据条件,列出22⨯联表,计算出2K ,令2K 6.635,即可求出.
【详解】
设男生至少有x 人,根据题意,可列出如下22⨯联表:
则2
2
3111532
6636118
22
x x x x x K x x x x x , 若有99%的把握认为是否喜欢数学文化和性别有关, 则2 6.635K >,即3
6.6358
x , 解得17.693x ,
由于表中人数都为整数,所以18x =, 即男生至少有18人. 故选:D. 【点睛】
本题考查独立性检验,属于基础题.
5.D
解析:D 【分析】
先求 3.92x =,2y =,根据0.7a y x =-,求解0.744a =-,将8x =代入回归直线方程为0.7y x a =+,求解即可. 【详解】 2.2 2.4 3.8 5.2 6.0
3.925x ++++=
=,0.2 1.5 2.0 2.5 3.825
y ++++==
0.720.7 3.920.744a y x =-=-⨯=-即0.70.744y x =-
令8x =,则0.780.744 4.856y =⨯-= 故选:D 【点睛】
本题考查回归分析,样本中心点()
,x y 满足回归直线方程,是解决本题的关键.属于中档题.
6.D
解析:D 【分析】
利用回归直线过样本点中心可求回归方程,根据该方程可得正确的选项. 【详解】
由 1.5y x a =+,得x 每增一个单位长度,y 不一定增加1.5,而是大约增加1.5个单位长度,故选项,A B 错误; 由已知表格中的数据,可知01234
25
x ++++=
=,
2.2 4.3 4.5 4.8 6.7
4.55
y ++++=
=,回归直线必过样本的中心点()2,4.5,故C 错
误;
又4.5 1.52 1.5ˆˆa
a =⨯+⇒=,∴回归方程为 1.5 1.5y x =+, 当8x =时,y 的预测值为1.58 1.513.5⨯+=,故D 正确, 故选:D. 【点睛】
本题考查线性回归方程的性质及应用,注意回归直线过()
,x y ,本题属于基础题.
7.D
解析:D 【分析】
运用相关系数、回归直线方程等知识对各个选项逐一进行分析即可 【详解】
①相关系数r 用来衡量两个变量之间线性关系的强弱,r 越接近于1,相关性越强,故错误
②回归直线y bx a =+一定经过样本点的中心()x y ,,故正确
③随机误差e 满足()0E e =,其方差()D e 的大小用来衡量预报的精确度,故正确 ④相关指数2R 用来刻画回归的效果,2R 越大,说明模型的拟合效果越好,故错误 综上,说法正确的是②③ 故选D 【点睛】
本题主要考查的是命题真假的判断,运用相关知识来进行判断,属于基础题
8.A
解析:A 【解析】
要正确认识观测值的意义,观测值同临界值进行比较得到一个概率,这个概率是推断出错误的概率,若从统计量中求出有95%的把握认为吸烟与患肺病有关系,是指有5%的可能性使得推断出现错误 故选A
9.B
解析:B 【分析】
计算75x =,80y =,故ˆ10a y bx =-=-,代入数据计算得到答案. 【详解】
10
1
7510i
i x x
==
=∑,
10
1
80
10
i
i y
y ===∑,故ˆ10a y bx =-=-,即ˆ 1.210y
x =-, 当86y =时,86 1.210x =-,解得80x =.
故选:B . 【点睛】
本题考查了线性回归方程,意在考查学生的计算能力和应用能力.
10.C
解析:C 【分析】
令i m =
,根据线性回归中心点在回归直线上,求出y ,得出m ,即可求解.
【详解】
设缺失的数据为),1,2,3,4,5i x m i =
=,则样本(),i i m y 数据如下表所示:
其回归直线方程为1
1.1
2.1 2.3
3.3
4.2 2.65
y =++++=(),
由线性回归方程ˆ1y
m =+得, 1.6m =,
即1
0.21 2.2 3.2 1.65
++=(),解得 1.96x =.
故选:C . 【点睛】
本题考查线性回归方程的应用,换元是解题的关键,掌握回归中心点在线性回归直线上,考查计算求解能力,属于中档题.
11.B
解析:B 【分析】
计算出2K 的值,由此判断出正确结论的个数. 【详解】
依题意()2
210510302045 6.10930755055
K ⨯⨯-⨯=≈⨯⨯⨯,故能在犯错误的概率不超过0.05的前提下认为药物有效, 不能在犯错误的概率不超过0.005的前提下认为药物有效,即①④结论正确,本小题选B. 【点睛】
本小题主要考查22⨯列联表独立性检验,考查运算求解能力,属于基础题.
12.B
解析:B 【分析】
由最小二乘法求解回归直线和回归直线的性质可知①错误,②正确;随机变量为负相关
时,线性相关性越强,相关系数r 越接近1-,③错误;残差图中带状区域越窄,拟合度越高,④错误;2R 越接近1,模型拟合度越高,⑤正确;由此可得结果. 【详解】
①当销售价格为10时,销售量的预估值为300件,但预估值与实际值未必相同,①错误;
②由最小二乘法可知,回归直线必过(),x y ,②正确;
③若两个随机变量为负相关,若线性相关性越强,相关系数r 越接近1-,③错误; ④残差图中,带状区域越窄,模型拟合度越高,④错误;
⑤相关指数2R 越接近1,拟合度越高,则在线性回归模型中,回归效果越好,⑤正确. 可知正确的结论为:②⑤,共2个 本题正确选项:B 【点睛】
本题考查统计案例部分命题的判断,涉及到回归直线、最小二乘法、相关系数、相关指数、残差图的相关知识.
13.A
解析:A 【分析】
由散点图可知,去掉(3,10)D 后,y 与x 的线性相关性加强,由相关系数r ,相关指数2R 及残差平方和与相关性的关系得出选项. 【详解】
∵从散点图可分析得出:
只有D 点偏离直线远,去掉D 点,变量x 与变量y 的线性相关性变强, ∴相关系数变大,相关指数变大,残差的平方和变小,故选A. 【点睛】
该题考查的是有关三点图的问题,涉及到的知识点有利用散点图分析数据,判断相关系数,相关指数,残差的平方和的变化情况,属于简单题目.
二、解答题
14.(1)ˆ0.7 2.3y
x =-;(2)记忆力为19的同学的判断力约为11. 【分析】
(1)根据题意及公式1
2
21
ˆn
i i
i n
i i x y nx y
b
x nx
==-=-∑∑算出ˆb
,根据公式ˆa y bx =-算出a 即可得出答案;
(2)将19x =代入(1)中的回归方程计算即可. 【详解】 解:(1)由题意
4
1
6283105126158i i
i x y
==⨯+⨯+⨯+⨯=∑,
68101294x +++==,235644y +++==,4
222221
681012344i i x ==+++=∑,
所以2158494140.73444920
ˆb
-⨯⨯===-⨯,ˆˆ40.79 2.3a y bx =-=-⨯=-, 故线性回归方程为ˆ0.7 2.3y x =- (2)当19x =时,解得ˆ11y
= 所以由回归直线方程预测,记忆力为19的同学的判断力约为11. 【点睛】
线性回归分析问题的类型及解题方法: (1)求线性回归方程:
公式法:利用公式,求出回归系数ˆ,b
a . 待定系数法:利用回归直线过样本点中心求系数. (2)利用回归方程进行预测:
把回归直线方程看作一次函数,求函数值.
(3)利用回归直线判断正、负相关:决定正相关还是负相关的是系数ˆb
. 15.(1)1433.07;( 2)有99%的把握认为肺活量的大小与胸围具有线性相关关系;
(3)
27
128. 【分析】
(1)把均值代入公式可得答案;
(2)假设H 0:变量x ,y 不具有线性相关关系,计算出r 值与参考临界值表可得答案;
(3)计算出全校高一男生大肺活量的概率,然后利用24C 2
14⎛⎫ ⎪⎝⎭2
34⎛⎫ ⎪⎝⎭
计算可得答案 【详解】
( 1)由于回归直线:ˆy
=32.26x +a 过点(80.5,4030), 所以a =4030-32.26x 80.5=1433.07.
( 2)假设H 0:变量x ,y 不具有线性相关关系, 所以r =
38
2040
⨯32.26≈0.601,
由相关性检验临界值表知:r 001=0.561,r =0.601>0.561,所以有99%的把握认为肺活量的大小与胸围具有线性相关关系.
( 3)从统计表中可知,20个样本中不低于4500m /有5个, 所以全校高一男生大肺活量的概率为
520=14
设从高一年级任取4名男同学,恰有两名男生是大肺活量的概率为ρ,
则p =24C 214⎛⎫ ⎪⎝⎭2
247128
3⎛⎫ ⎪=
⎝⎭. 所以从高一年级任取4名男同学,恰有两名男生是大肺活量的概率为27128
. 【点睛】
小概率原理:我们做这样一个假设,假设H 0是真实的,那么处于H 0对立面的H 1假设就是不真实的、不可能发生的小概率事件,要是在一次试验中这么小概率的事件H 1竟然发生了,那么我们就有充足的理由怀疑H 0的真实性,我们会拒绝H 0假设,这是一种类似于反证法的思想.
16.(1)“数学学期综合成绩”与“物理学期综合成绩”高度相关;答案见解析;(2)分布列见解析,95
. 【分析】
(1)代入公式计算,解得0.8r >即可得解;
(2)由超几何分布概率公式计算出(0)P X =、(1)P X =、(2)P X =、(3)P X =、
(4)P X =,进而可得分布列,再由数学期望的公式即可得数学期望.
【详解】
(1
)由题意,20
()()
i
i x
x y y r --=
=

62
60.87.515
>
=
=
>
=⨯=, 所以“数学学期综合成绩”与“物理学期综合成绩”高度相关; (2) 由题意得:X 的可能取值为0,1,2,3,4.,
根据赋分规则可知,7人赋分为2,4人赋分为1,9个人赋分为0,
所以9222036
(0)190C P X C ===,49112203619(1)0C C P X C ===,211
2
204791609(29)C C C P X C +===,11
4722023810(9)C C P X C ===,27220(4)21
190
C P X C ===,
所以X 的分布列为:
所以190190190()012341901901905
E X =⨯+⨯+⨯+⨯+⨯==. 【点睛】
关键点点睛:解决本题的关键是对r 的值合理放缩及超几何分布的应用. 17.(1) 选择d
y c x =⋅更合适;(2)
y =. (3) 要使年利润取最大值,预计下一年应投
入4千万元的研发费用 【分析】
(1)根据散点图分布,可知更符合指数型模型,可得结果;(2)对d
y c x =⋅两边取倒
数,得到ln v c du =+,采用最小二乘法可求得d 和ln c ,从而得到结果;(3)由(2)
可得()9
2
z x x =,利用导数可判断出()z x 单调性,可知当4x =时,()z x 取最大值,从而得到结果. 【详解】
(1)由散点图知,选择d
y c x =⋅更合适
(2)对d
y c x =⋅两边取对数,得ln ln ln y c d x =+,即:ln v c du =+
由表中数据得32u v ==
28.251
56.52
d ∴=
= 令ln c m =,则3133
2224
m v du =-=
-⨯=,即34c e = ∴年销售y 和年研发费用x 的回归方程为:
y =
(3)由(2)知,()9
2
z x x =,则()92z x =
' 令()0z x '=,得4x =
当()0,4x ∈时,()0z x '>;当()4,x ∈+∞时,()0z x '<
()z x ∴在()0,4上单调递增;在()4,+∞上单调递减
∴当4x =千万元时,年利润z 取得最大值,且最大值为:()418z =千万元 1.8=亿元
∴要使年利润取最大值,预计下一年应投入4千万元的研发费用
【点睛】
本题考查统计中的数据的相关性的问题,涉及到非线性回归模型方程的求解、利用导数求解函数的最值的问题;解题关键是能够将非线性回归模型转化为线性回归模型,从而利用最小二乘法求得回归模型.
18.(1)茎叶图见解析,B 电商平台的销售更好,理由见解析(2)22⨯列联表答案见解析,没有95%的把握认为销售量与电商平台有关. (3)0.6
【分析】
(1)由已知数据作出茎叶图,由茎叶图可知,A 电商、B 电商平台销售量的中位数及平均数,可得B 电商平台的销售更好;
(2)由题中数据,可将22⨯列联表补充完整,数据代入公式可得2 3.333 3.841K ≈<,故没有95%的把握认为销售量与电商平台有关;
(3)由已知数据,从销售量前五名的店铺选取三个店铺共有10种情况,其中恰好有两个店铺的销售量在95以上的情况有6种,由古典概型求概率可得. 【详解】
(1)由已知数据作出茎叶图如下:
①由茎叶图可知,A 电商平台销售量的中位数为72,B 电商平台销售量的中位数为85,因此B 电商平台的销售更好.
②由茎叶图可求得A 电商平台销售量的平均数为72.4,B 电商平台销售量的平均数为84.6,因此B 电商平台的销售更好. (2)由题中数据,可得22⨯列联表如下:
2
20(848)320
3.333 3.841812101096
K ⨯-∴==≈<⨯⨯⨯,
∴没有95%的把握认为销售量与电商平台有关.
(3)由已知数据,销售量前五名的店铺,销售量分别为97,96,96,94,87. 设对应的店铺分别为12312,,,,a a a b b .
从其中选取三个店铺共有10种情况,如下:()123,,a a a ,()121,,a a b ,()122,,a a b ,
()311,,a a b ,()312,,a a b ,()112,,a b b ,()321,,a a b ,()322,,a a b ,()112,,a b b ()312,,a b b .
其中恰好有两个店铺的销售量在95以上的情况有6种:
()121,,a a b ,()122,,a a b ,()311,,a a b ,()312,,a a b ,()321,,a a b ,()322,,a a b .
∴其中恰好有两个店铺的销售量在95以上的概率6
0.6
10
P==.
【点睛】
本题为统计与概率综合问题,考查茎叶图、列联表、相关性分析、古典概型求概率等知识的应用,考查数据分析能力,属于中等题.
19.(1)图见解析,变量,x y线性相关;(2)0.50.4
y x
=+;(3)2.4百万元
【分析】
(1)根据题中数据在直角坐标系中作出这五个点,即可得到散点图,并由图观察这些点是否在一条直线附近,即可判断;
(2)根据公式分别求出
55
2
11
,,,
i i i
i i
x y x y x
==
∑∑,即可求出;
(3)由(2)中求出的回归方程,将4
x=代入,即可估计利润额的大小.
【详解】
解:(1)散点图如图所示.
由散点图可以看出变量,x y线性相关.
(2)设线性回归方程是ˆˆ
y bx a
=+.
因为
55
2
11
3.4,6,112,200
i i i
i i
y x x y x
==
====
∑∑,所以
5
1
5
22
1
5
ˆ0.5
5
i i
i
i
i
x y xy
b
x x
=
=
-
==
-


,ˆ
ˆ 3.460.50.4
a y bx
=-=-⨯=,
即利润额y对销售额x的线性回归方程为0.50.4
y x
=+.
(3)当销售额为4千万元时,利润额约为0.540.4 2.4
y=⨯+=(百万元).
【点睛】
本题主要考查利用散点图判断两个变量是否存在相关关系,利用最小二乘法求线性回归方程,以及利用回归方程进行预测,属于基础题.
20.(1)ˆ 2.24
y x
=+(2)大约为19.4万亿吨
【分析】
(1)分别求出x和y,根据公式,求出ˆb和ˆa,即可得出线性回归方程;
(2)由(1)得ˆ 2.24
y x
=+,可估计出2019年该地区的粮食产量.
【详解】
解:(1)由表中所给数据可得,。

相关文档
最新文档