上海长青学校选修三第三单元《成对数据的统计分析》检测(包含答案解析)
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
一、选择题
1.一组数据如下表所示:
已知变量y 关于x 的回归方程为+0.5
ˆbx y
e =,若5x =,则预测y 的值可能为( ) A .5e B .
11
2e
C .
132
e
D .7e
2.以下说法:
①将一组数据中的每一个数据都加上或减去同一个常数后,方差不变;
②设有一个回归方程ˆ35y
x =-,变量x 增加1个单位时,y 平均增加5个单位 ③线性回归方程ˆy bx a =+必过(),x y
④设具有相关关系的两个变量,x y 的相关系数为r ,那么||r 越接近于0,,x y 之间的线性相关程度越高;
⑤在一个22⨯列联表中,由计算得2K 的值,那么2K 的值越大,判断两个变量间有关联的把握就越大。
其中错误..
的个数是( ) A .0 B .1
C .2
D .3
3.已知变量y 关于x 的回归方程为0.5ˆbx y
e -=,其一组数据如下表所示:
若5x =,则预测y 的值可能为( ) A .5e
B .
11
2e
C .7e
D .15
2e
4.下列命题中错误的是( )
A .样本数据的方差越小,则数据离散度越小
B .在残差图中,残差点分布的带状区域的宽度越狭窄,其模型拟合的精度越高
C .相关系数r 满足1r ≤且r 越接近1,线性相关程度越强,r 越接近0,线性相关程度越弱
D .相关指数越小,回归直线拟合效果越好. 5.下列说法中正确的是( )
A .“a b >”是“22a b >”成立的充分不必要条件
B .命题:,20x p x R ∀∈>,则00:,20x
p x R ⌝∃∈<
C .为了了解800名学生对学校某项教改试验的意见,用系统抽样的方法从中抽取一个容量为40的样本,则分组的组距为40
D .已知回归直线的斜率的估计值为1.23,样本点的中心为(4,5),则回归直线方程为
^ 1.230.08y x =+.
6.已知()()()()()2
2n ad bc K a b c d a c b d -=++++,n a b c d =+++.
在“数学文化大讲堂”活动中,某老师对“学生性别和喜欢数学文化是否有关”作了一次调查,其中被调查的女生人数是男生人数的1
2,男生喜欢数学文化的人数占男生人数的16
,女生喜欢数学文化的人数占女生人数2
3
,若有99%的把握认为是否喜欢数学文化和性别有关,则男生至少有( ) A .24人
B .22人
C .20人
D .18人
7.下列命题中正确的个数( )①“0x ∀>,2sin x x >”的否定是“00x ∃≤,
002sin x x ≤”;②用相关指数2R 可以刻画回归的拟合效果,2R 值越小说明模型的拟合效
果越好;③命题“若0a b >>0>>”的逆命题为真命题;④若
22(1)mx m x -+30m ++≥的解集为R ,则m 1≥.
A .0
B .1
C .2
D .3
8.为预测某种产品的回收率y ,需要研究它和原料有效成分的含量x 之间的相关关系,现取了8组观察值.计算得8
1
52i
i x
==∑,8
1
228i i y ==∑,8
21
478i
i x ==∑,8
1
1849i i i x y ==∑,则y
对x 的回归方程是( ) A .y =11.47+2.62x B .y =-11.47+2.62x C .y =2.62+11.47x
D .y =11.47-2.62x
9.下列有关统计知识的四个命题正确的是( )
A .衡量两变量之间线性相关关系的相关系数r 越接近1,说明两变量间线性关系越密切
B .在回归分析中,可以用卡方2x 来刻画回归的效果,2x 越大,模型的拟合效果越差
C .线性回归方程对应的直线ˆˆˆy bx a =+至少经过其样本数据点中的一个点
D .线性回归方程0.51y x =+中,变量x 每增加一个单位时,变量y 平均增加1个单位 10.某同学在研究性学习中,收集到某制药厂今年前5个月甲胶囊生产产量(单位:万盒)的数据如下表所示:
x (月份) 1
2 3 4 5 y (万
盒)
5
5
6
6
8
若x ,线性相关,线性回归方程为0.7y x a =+,则以下判断正确的是( ) A .x 增加1个单位长度,则y 一定增加0.7个单位长度 B .x 减少1个单位长度,则y 必减少0.7个单位长 C .当6x =时,y 的预测值为8.1万盒 D .线性回归直线0.7y x a =+,经过点()2,6 11.有下列说法:
①若某商品的销售量y (件)关于销售价格x (元/件)的线性回归方程为
5350y x =-+,当销售价格为10元时,销售量一定为300件;
②线性回归直线y bx a =+一定过样本点中心(,)x y ;
③若两个随机变量的线性相关性越强,则相关系数r 的值越接近于1;
④在残差图中,残差点比较均匀落在水平的带状区域中即可说明选用的模型比较合适,与带状区域的宽度无关;
⑤在线性回归模型中,相关指数2R 表示解释变量对于预报变量变化的贡献率,2R 越接近于1,表示回归的效果越好; 其中正确的结论有几个( ) A .1
B .2
C .3
D .4
12.有一散点图如图所示,在5个(,)x y 数据中去掉(3,10)D 后,下列说法正确的是( )
A .残差平方和变小
B .相关系数r 变小
C .相关指数2R 变小
D .解释变量x 与预报变量y 的相关性变弱
13.下列说法中正确的是()
A .若数列{}n a 为常数列,则{}n a 既是等差数列也是等比数列;
B .若函数()f x 为奇函数,则(0)0f =;
C .在ABC ∆中,A B >是sin sin A B >的充要条件;
D .若两个变量,x y 的相关系数为r ,则r 越大,x 与y 之间的相关性越强.
二、解答题
14.某研究机构对高三学生的记忆力x 和判断力y 进行统计分析,得下表数据.
(1)请根据表中提供的数据,求出关于的线性回归方程ˆˆy
bx a =+; (2)预测记忆力为19的同学的判断力.
(附参考公式:1
2
21
ˆn
i i
i n
i i x y nx y
b
x nx
==-=-∑∑,ˆa y bx
=-) 15.疫苗能够使人体获得对病毒的免疫力,是保护健康人群最有效的手段.新冠肺炎疫情发生以来,军事医学科学院陈薇院土领衔的团队开展应急科研攻关,研制的重组新型冠状病毒疫苗(腺病毒载体),于4月12日开始招募志愿者,进入二期临床试验.根据普遍规律,志愿者接种疫苗后体内会产生抗体,人体中检测到抗体,说明有抵御病毒的能力.科研人员要定期从接种疫苗的志愿者身上采集血液样本,检测人体中抗体含量水平(单位:
miu/mL ,百万国际单位/毫升).
(1)IgM 作为人体中首先快速产生的抗体,是人体抗感染免疫的“先头部队”.经采样分折,志愿者身体中IgM 含量水平()miu/mL y 与接种天数x (接种后每满24小时为一天,
*x N ∈)近似满足函数关系:100.1,10
,10
x
x x y e x -≤⎧=⎨>⎩,经研究表明,IgM 含量水平不低于0.2miu/mL 时是免疫的有效时段,试估计接种一次后IgM 含量水平有效时段可经历的时
间(向下取整).(参考数据: 2.718e ≈)
(2)IgG 虽然是接种后产生比较慢的抗体,却是血清和体液中含量最高的抗体,也是亲和力最强、人体内分布最广泛、具有免疫效应的抗感染“主力军”.科研人员每间隔3天检测一次(检测次数依次记为i t ,1,2,3,4,5,6,7i =)某志愿者人体中IgG 的含量水平,记作
()()miu/mL 1,2,3,4,5,6,7i z i =,得到相关数据如下表:
①请画出散点图,并根据散点图判断线性拟合模型与指数拟合模型·t z c d =哪种更适合拟合z 与t 的关系(不必说明理由);
②研究人员发现,上述数据中存在一组异常数据应当予以剔除.试根据余下的六组数据,利用①中选择的拟合模型计算回归方程,并估计原异常数据对应的i z 值.
附:回归系数与估计值均保留两位小数,由七组数据计算出的参考数据见下表,其中
ln u z =.
z
u
i i
t z ∑ i i
t u ∑
ln0.06 ln1.55 ln2.27 ln4.85
4.91 0.60 20
5.48 39.87
-2.84
0.44
0.82
1.58
参考公式:线性回归直线ˆˆˆy
a bx =+的斜率和截距的最小二乘估计分别为:2
()()ˆ()
i
i i
x x y y b
x x --=-∑∑,a y bx =-
16.近年来,“双11”网购的观念逐渐深入人心.某人统计了近5年某网站“双11”当天的交易额,,统计结果如下表: 年份 2015 2016 2017 2018 2019 年份代码x 1 2 3 4 5 交易额y /百亿元
9
12
17
21
26
r y x 留三位小数.(统计中用相关系数r 来衡量两个变量之间线性关系的强弱.若相应于变量x 的取值i x ,变量y 的观测值为i y (1i n ≤≤),则两个变量的相关系数的计算公式为:.统计学认为,对于变量
,如果[]1,0.75r -∈-,那么负相关很强;如果[]
0.751r ∈,,那么正相关很强;如果(]0.75,0.30r ∈--或[
)0.30,0.75r ∈,那么相关性一般;如果[]0.25,0.25r ∈-,那么相关性较弱);
(2)求出关于x 的线性y 回归方程,并预测2020年该网站“双11”当天的交易额.
参考公式:1
2
1
()()
()
ˆn
i
i
i n
i i x x y y b
x x ==--=-∑∑,ˆˆa
y bx =-186043.1≈. 17.近年来我国电子商务行业迎来蓬勃发展的新机遇,2016年双11期间,某购物平台的销售业绩高达918亿人民币.与此同时,相关管理部门推出了针对电商的商品和服务的评价体系.现从评价系统中选出200次成功交易,并对其评价进行统计,对商品的好评率为0.6,对服务的好评率为0.75,其中对商品和服务都做出好评的交易为80次.
(1)完成下面22⨯列联表,并通过计算说明是否可以在犯错误概率不超0.1%的前提下,认为商品好评与服务好评有关?
对商品好评 对商品非好评 合计
对服务好评 对服务非好评
2.072(2
()()()()()
n ad bc k a b c d a c b d -=++++,其中n a b c d =+++)
(2)若将频率视为概率,某人在该购物平台上进行的5次购物中,设对商品和服务全好评的次数为随机变量X :
①
求对商品和服务全好评的次数X 的分布列(概率用组合数算式表示); ②求X 的数学期望和方差.
18.每年10月中上旬是小麦的最佳种植时间,但小麦的发芽会受到土壤、气候等多方面因素的影响.某科技小组为了解昼夜温差的大小与小麦发芽的多少之间的关系,在不同的温差下统计了100颗小麦种子的发芽数,得到了如下数据: (1)请根据统计的最后三组数据,求出y 关于x 的线性回归方程y bx a =+; (2)若由(1)中的线性回归方程得到的估计值与前两组数据的实际值误差均不超过两颗,则认为线性回归方程是可靠的,试判断(1)中得到的线性回归方程是否可靠; (3)若100颗小麦种子的发芽率为n 颗,则记为%n 的发芽率,当发芽率为%n 时,平均每亩地的收益为10n 元,某农场有土地10万亩,小麦种植期间昼夜温差大约为9C ︒,根据(1)中得到的线性回归方程估计该农场种植小麦所获得的收益.
附:在线性回归方程y bx a =+中,12
2
1
n
i i
i n
i
i x y nx y
b x
nx
==-=
-∑∑.
19.忽如一夜春风来,翘首以盼的5G 时代,已然在全球“多点开花”,一个万物互联的新时代,即将呈现在我们的面前.为更好的满足消费者对流量的需求,中国电信在某地区推出六款不同价位的流量套餐,每款套餐的月资费x (单位:元)与购买人数y (单位:万人)的数据如表:
对数据作初步的处理,相关统计量的值如表:
其中ln i i v x =,ln i i y ω=,且绘图发现,散点(),i i v ω(6l i ≤≤)集中在一条直线附近. (1)根据所给数据,求y 关于x 的回归方程;
(2)按照某项指标测定,当购买人数y 与月资费x 的比在区间,97e e ⎛⎫
⎪⎝⎭
内,该流量套餐受大
众的欢迎程度更高,被指定为“主打套餐”,现有一家三口从这六款套餐中,购买不同的三款各自使用.记三人中使用“主打套餐”的人数为X ,求随机变量X 的分布列和期望. 附:对于一组数据()11,v ω,()22,v ω,…,()33,v ω,其回归直线bv a ω=+的斜率和截
距的最小二乘估计值分别为12
21
n
i i
i n
i
i v nv b v
nv
ωω
==-=
-∑∑,a bv ω=-.
20.艾滋病是一种危害性极大的传染病,由感染艾滋病病毒(HIV 病毒)引起,它把人体免疫系统中最重要的CD 4T 淋巴细胞作为主要攻击目标,使人体丧失免疫功能.下表是近八年来我国艾滋病病毒感染人数统计表:
()1请根据该统计表,画出这八年我国艾滋病病毒感染人数的折线图;
()2请用相关系数说明:能用线性回归模型拟合y 与x 的关系;
()3建立y 关于x 的回归方程(系数精确到0.01),预测2019年我国艾滋病病毒感染人
数.
参考数据:42 6.48≈;
8
1
449.6i
i y
==∑,8
1
2319.5i i i x y ==∑,
8
2
1
()
46.2i
i y y =-=∑,
参考公式:相关系数)12
2
1
1
()()()
n
i n
n
i
i
i i x x y y r x x y y ===--=
--∑∑∑,
回归方程y bx a =+中,b
()
1
2
1
()()
n
i i i n i i x x y y x x ==--=
-∑∑
,a y bx =-.
21.某网店销售某种商品,为了解该商品的月销量y (单位:千件)与月售价x (单位:元/件)之间的关系,对近几年的月销售量i y 和月销售价()1,2,3,,10i x i =⋅⋅⋅数据进行了统计分析,得到了下面的散点图.
(1)根据散点图判断,ln y c d x =+与y bx a =+哪一个更适宜作为月销量y 关于月销售价x 的回归方程类型?(给出判断即可,不需说明理由),并根据判断结果及表中数据,建立y 关于x 的回归方程;
(2)利用(1)中的结果回答问题:已知该商品的月销售额为Z (单位:千元),当月销售量为何值时,商品的月销售额预报值最大?(月销售额=月销售量×当月售价) 参考公式、参考数据及说明:
①对一组数据()11,v w ,()22,v w ,…,(),n n v w ,其回归直线w v αβ=+的斜率和截距的
最小二乘法估计分别为()()
()
1
2
1n
i
i
i n
i
i w w v v v v β==--=
-∑∑,w v αβ=-.
②参考数据:
表中ln i i u x =,10
1
110i i u u ==∑.
③计算时,所有的小数都精确到0.01,如ln 4.06 1.40≈.
22.为了解某地区足球特色学校的发展状况,某调查机构得到如下统计数据:
(1)根据上表数据,计算y 与x 的相关系数r ,并说明y 与x 的线性相关性强弱(已知:
0.751r ≤≤,则认为y 与x 线性相关性很强;0.30.75x ≤≤,则认为y 与x 线性相关性
一般,0.25r ≤,则认为y 与x 线性相关性较弱)
(2)求y 与x 的线性回归方程,并预测该地区2019年足球特色学校的个数(精确到个位) 参考公式:
()()
n
i
i
x x y y r --=
∑()()2
2
1
1
,10, 3.6056n
n
i i i i x x y y ==-=-=≈∑∑;
()()
()
1
2
1
,n
i
i
i n
i
i x x y
y b a y bx x x ==--=
=--∑∑
23.为保护农民种粮收益,促进粮食生产,确保国家粮食安全,调动广大农民生产粮食的积极性,从2014年开始,国家实施了对种粮农民直接补贴的政策通过对2014~2018年的数据进行调查,发现某地区发放粮食补贴额x (单位:亿元)与该地区粮食产量y (单位:万亿吨)之间存在着线性相关关系,统计数据如下表:
年份 2014 2015
2016 2017 2018 补贴额x /亿元 9 10 12 11 8 粮食产量y /万亿
25
26
31
37
21
(1)请根据上表所给的数据,求出y 关于x 的线性回归直线方程ˆˆy
bx a =+; (2)通过对该地区粮食产量的分析研究,计划2019年在该地区发放粮食补贴7亿元,请根据(1)中所得到的线性回归直线方程,预测2019年该地区的粮食产量.
参考公式:()()
(
)
1
2
1
ˆn
i
i
i n
i i x x y y b
x x
==--=-∑∑,ˆˆa
y bx =-. 24.某品牌汽车4S 店为对厂家研发的一种辅助产品进行合理定价,对该产品进行试销售,如图1.在试销售期间对100名顾客进行回访,由客户对该产品性能作出“满意”或“不满意”评价,如图2.
(1)判断能否有99%的把握认为“客户购买产品对产品性能满意之间有关”? (2)请结合数据:
()()66
34580i
i
i x x y y =--=∑,()()
6
6
175.5i
i
i x x z
z =--=-∑,
(
)()
6
6
3465.2i i i y y z z =--=∑,()
6
2
6
776840i i y y
=-=∑,求y 与x 的回归方程(精确到
0.1)
25.这次新冠肺炎疫情,是新中国成立以来在我国发生的传播速度最快、感染范围最广、防控难度最大的一次重大突发公共卫生事件.中华民族历史上经历过很多磨难,但从来没有被压垮过,而是愈挫愈勇,不断在磨难中成长,从磨难中奋起.在这次疫情中,全国人民展现出既有责任担当之勇、又有科学防控之智.某校高三学生也展开了对这次疫情的研究,一名同学在数据统计中发现,从2020年2月1日至2月7日期间,日期x 和全国累计报告确诊病例数量y (单位:万人)之间的关系如下表: 日期x
1 2 3 4 5 6 7 全国累计报告确诊病例数量y (万人)
1.4
1.7
2.0
2.4
2.8
3.1
3.5
(1)根据表中的数据,运用相关系数进行分析说明,是否可以用线性回归模型拟合y 与x 的关系?
(2)求出y 关于x 的线性回归方程y bx a =+(系数精确到0.01).并预测2月10日全国
累计报告确诊病例数. 参考数据:
7
1
16.9i
i y
==∑,7
1
77.5i i i x y ==∑
1.88
= 2.65≈.
参考公式:相关系数()()
n
i
i
x x y y r --=
∑
回归方程y a bt =+中斜率和截距的最小二乘估计公式分别为:
()()
1
n
i
i
i n
x x y y b =--=
∑,a y bx =-.
26.假设关于某设备的使用年限x 和所支出的维修费用y (万元)有如下的统计资料:
若由资料知y 对x 呈线性相关关系. (1)请画出上表数据的散点图;
(2)请根据最小二乘法求出线性回归方程ˆy
bx a =+的回归系数a ,b ; (3)估计使用年限为10年时,维修费用是多少?
【参考答案】***试卷处理标记,请不要删除
一、选择题 1.C 解析:C 【分析】
令ln z y ,求得
,x z 之间的数据对照表,结合样本中心点的坐标满足回归直线方程,即
可求得b ;再令5x =,即可求得预测值y .
【详解】
将式子两边取对数,得到ln 0.5y bx =+,令ln z
y ,得到0.5z bx =+,
根据已知表格数据,得到,x z 的取值对照表如下:
1234
2.54x +++=
=,1346 3.54
z +++==, 利用回归直线过样本中心点,即可得3.5 2.50.5b =+, 求得 1.2b =,则 1.20.5z x =+, 进而得到 1.2+0.5x y e =,将5x =代入, 解得13
6.5
2
y e e ==.
故选:C. 【点睛】
本题考查利用样本中心点坐标满足回归直线方程求参数值,以及由回归方程进行预测值得求解,属中档题.
2.C
解析:C 【分析】
根据用样本估计总体、线性回归方程、独立性检验的基本概念和基本性质,逐项判断,即可得到本题答案. 【详解】
方差反映一组数据的波动大小,将一组数据中的每个数据都加上或减去同一个常数后,方
差不变,故①正确;一个回归方程ˆ35y
x =-,变量x 增加1个单位时,y 平均减少5个单位,故②不正确;线性回归方程ˆy bx a =+必过样本中心点,故③正确;根据线性回归分析中相关系数的定义:在线性回归分析中,相关系数为r ,||r 越接近于1,相关程度越大,故④不正确;对于观察值2K 来说,2K 越大,“x 与y 有关系”的可信程度越大,故⑤正确. 故选:C 【点睛】
本题主要考查用样本估计总体、线性回归方程、独立性检验的基本思想.
3.D
解析:D 【分析】
将式子两边取对数,得到ln 0.5y bx =-,令ln z
y ,得到0.5z bx =-,根据题中所给
的表格,列出,x z 的取值对应的表格,求得,x z ,利用回归直线过样本中心点,列出等量关系式,求得 1.6b =,得到 1.60.5z x =-,进而得到 1.60.5x y e -=,将5x =代入,求得结果. 【详解】
由0.5bx y e -=,得ln 0.5y bx =-,令ln z y ,则0.5z bx =-.
2.54x =
=, 3.54
z ==, ∵(,)x z 满足0.5z bx =-,∴3.5 2.50.5b =⨯-, 解得 1.6b =,∴ 1.60.5z x =-,∴ 1.60.5
x y e -=,
当5x =时,15
1.650.5
2
y e e ⨯-==,
故选D. 【点睛】
该题考查的是有关回归分析的问题,涉及到的知识点将对数型回归关系转化为线性回归关系,根据回归直线过样本中心点求参数,属于简单题目.
4.D
解析:D 【分析】
运用相关系数、变量间的相关关系来进行判定 【详解】
对于A ,样本数据的方差越小,则数据离散度越小正确
对于B ,在残差图中,残差点分布的带状区域的宽度越狭窄,其模型拟合的精度越高正确 对于C ,相关系数r 满足1r ≤且r 越接近1,线性相关程度越强,r 越接近0,线性相关程度越弱正确
对于D ,相关指数越小说明残差平方和越大,则拟合效果越差,故D 错误 故选D 【点睛】
本题考查对变量间的相关关系进行判定,结合残差图、相关系数来进行分析即可得到结果,较为基础
5.D
解析:D 【解析】
对于A ,取1a =-,2b =时,不能推出22a b >,故错误;对于B ,命题
:,20x p x R ∀∈>的否定为00,20x
x R ∃∈≤,故错误;对于C ,为了了解800名学生对学
校某项教改试验的意见,用系统抽样的方法从中抽取一个容量为40的样本,则分组的组距为8004020÷=,故错误;对于D ,因为回归直线的斜率的估计值为1.23,所以回归直线方程可写成 1.23y x a =+,根据回归直线方程过样本点的中心()4,5,则0.08a =,所以
回归直线方程为 1.2308ˆ.0y
x =+,故正确. 故选D.
6.D
解析:D 【分析】
设男生至少有x 人,根据条件,列出22⨯联表,计算出2K ,令2K 6.635,即可求出.
【详解】
设男生至少有x 人,根据题意,可列出如下22⨯联表:
则2
3111532
6636118
22
x x x x x K x x x x x , 若有99%的把握认为是否喜欢数学文化和性别有关, 则2 6.635K >,即3
6.6358
x , 解得17.693x ,
由于表中人数都为整数,所以18x =, 即男生至少有18人. 故选:D. 【点睛】
本题考查独立性检验,属于基础题.
7.C
解析:C 【分析】
根据含量词命题的否定可知①错误;根据相关指数的特点可知2R 越接近0,模型拟合度越低,可知②错误;根据四种命题的关系首先得到逆命题,利用不等式性质可知③正确;分别在0m =和0m ≠的情况下,根据解集为R 确定不等关系,从而解得m 范围,可知④正确. 【详解】
①根据全称量词的否定可知“0x ∀>,2sin x x >”的否定是“00x ∃>,002sin x x ≤”,则①错误;
②相关指数2R 越接近1,模型拟合度越高,即拟合效果越好;2R 越接近0,模型拟合度越低,即拟合效果越差,则②错误;
③若“0a b >>
0>>”的逆命题为:若“
0>>,则0a b >>”,根据不等式性质可知其为真命题,则③正确;
④当0m =时,()2
213230mx m x m x -+++=-+≥,此时解集不为R ,不合题意;
当0m ≠时,若()2
2130mx m x m -+++≥解集为R ,只需:
()()2
41430m m m m >⎧⎪⎨+-+≤⎪⎩
解得:m 1≥,则④正确.
∴正确的命题为:③④
本题正确选项:C 【点睛】
本题考查命题真假性的判断,涉及到含量词命题的否定、四种命题的关系及真假性的判断、相关指数的应用、根据一元二次不等式解集为R 求解参数范围的知识.
8.A
解析:A 【解析】
分析:根据公式计算ˆb
≈2.62,ˆa ≈11.47,即得结果. 详解:由1
2
2
1
,()ˆˆˆn
i i
i n
i
i x y nxy
b
a y bx x
n x ==-==--∑∑,直接计算得ˆb ≈2.62,ˆa ≈11.47,所以ˆy
=2.62x +11.47.选A.
点睛:函数关系是一种确定的关系,相关关系是一种非确定的关系.事实上,函数关系是两个非随机变量的关系,而相关关系是非随机变量与随机变量的关系.如果线性相关,则直接根据用公式求,a b ,写出回归方程,回归直线方程恒过点(,)x y .
9.A
解析:A 【解析】
分析:利用“卡方”的意义、相关指数的意义及回归分析的适用范围,逐一分析四个答案的真假,可得答案.
详解:A. 衡量两变量之间线性相关关系的相关系数r 越接近1,说明两变量间线性关系越密切,正确;
B. 在回归分析中,可以用卡方2x 来刻画回归的效果,2x 越大,模型的拟合效果越差,错
误
对分类变量X 与Y 的随机变量的2x 观测值来说, 2x 越大,“X 与Y 有关系”可信程度越大; 故B 错误;
C. 线性回归方程对应的直线y bx a =+至少经过其样本数据点中的一个点,错误,回归直线y bx a =+可能不经过其样本数据点中的任何一个点;
D. 线性回归方程0.51y x =+中,变量x 每增加一个单位时,变量y 平均增加1个单位,错误,由回归方程可知变量x 每增加一个单位时,变量y 平均增加0.5个单位. 故选A.
点睛:本题考查回归分析的意义以及注意的问题.是对回归分析的思想、方法小结.要结合实例进行掌握.
10.C
解析:C 【分析】
通过线性回归方程可以进行预测而不能做出确定的判断,排除A ,B 选项;线性回归方程一定过样本中心点(,)x y ,排除D 选项;令6x =,代入方程求y ,可得C 正确. 【详解】
由ˆˆ0.7y
x a =+,得x 每增(减)一个单位长度,y 不一定增加(减少)0.7,而是大约增加(减少)0.7个单位长度,故选项A,B 错误;由已知表中的数据,可知
1234555668
3,655x y +++=++++=
===,则回归直线必过点(3,6),故D 错误;
代入回归直线ˆˆ0.7y x a =+,解得ˆ 3.9a =,即ˆ0.7 3.9y x =+,令6x =,解得ˆy
=0.76 3.98.1⨯+=万盒, 故选:C 【点睛】
本题考查了线性回归方程的性质,正确掌握线性回归方程的性质是解题的关键.
11.B
解析:B 【分析】
由最小二乘法求解回归直线和回归直线的性质可知①错误,②正确;随机变量为负相关时,线性相关性越强,相关系数r 越接近1-,③错误;残差图中带状区域越窄,拟合度越高,④错误;2R 越接近1,模型拟合度越高,⑤正确;由此可得结果. 【详解】
①当销售价格为10时,销售量的预估值为300件,但预估值与实际值未必相同,①错误;
②由最小二乘法可知,回归直线必过(),x y ,②正确;
③若两个随机变量为负相关,若线性相关性越强,相关系数r 越接近1-,③错误; ④残差图中,带状区域越窄,模型拟合度越高,④错误;
⑤相关指数2R 越接近1,拟合度越高,则在线性回归模型中,回归效果越好,⑤正确. 可知正确的结论为:②⑤,共2个 本题正确选项:B 【点睛】
本题考查统计案例部分命题的判断,涉及到回归直线、最小二乘法、相关系数、相关指数、残差图的相关知识.
12.A
解析:A 【分析】
由散点图可知,去掉(3,10)D 后,y 与x 的线性相关性加强,由相关系数r ,相关指数2R 及残差平方和与相关性的关系得出选项. 【详解】
∵从散点图可分析得出:
只有D 点偏离直线远,去掉D 点,变量x 与变量y 的线性相关性变强, ∴相关系数变大,相关指数变大,残差的平方和变小,故选A. 【点睛】
该题考查的是有关三点图的问题,涉及到的知识点有利用散点图分析数据,判断相关系数,相关指数,残差的平方和的变化情况,属于简单题目.
13.C
解析:C 【分析】
对于选项A ,B 给出反例可说明命题错误,C 由正弦定理可知命题正确,D 由相关系数的定义确定其真伪即可. 【详解】
逐一考查所给的说法:
A . 若0n a =,则数列{}n a 为常数列,则{}n a 是等差数列但不是等比数列,该说法错误;
B . 函数()f x 1
x
=
为奇函数,但是不满足()00f =,该说法错误; C . 由正弦定理可得在ABC ∆中,A B >是sinA sinB >的充要条件,该说法正确; D . 两个随机变量相关性越强,则相关系数r 的绝对值越接近于1,题中说法错误. 本题选择C 选项. 【点睛】
本题主要考查奇函数的性质,正弦定理的应用,相关系数的含义,常数列与等差数列、等比数列的关系等知识,意在考查学生的转化能力和计算求解能力.
二、解答题
14.(1)ˆ0.7 2.3y
x =-;(2)记忆力为19的同学的判断力约为11. 【分析】
(1)根据题意及公式1
2
21
ˆn
i i
i n
i i x y nx y
b
x nx
==-=-∑∑算出ˆb
,根据公式ˆa y bx =-算出a 即可得出答案;
(2)将19x =代入(1)中的回归方程计算即可. 【详解】 解:(1)由题意
4
1
6283105126158i i
i x y
==⨯+⨯+⨯+⨯=∑,
68101294x +++==,235644y +++==,4
222221
681012344i i x ==+++=∑,
所以2158494140.73444920
ˆb
-⨯⨯===-⨯,ˆˆ40.79 2.3a y bx =-=-⨯=-, 故线性回归方程为ˆ0.7 2.3y x =- (2)当19x =时,解得ˆ11y
= 所以由回归直线方程预测,记忆力为19的同学的判断力约为11. 【点睛】
线性回归分析问题的类型及解题方法: (1)求线性回归方程:
公式法:利用公式,求出回归系数ˆ,b
a . 待定系数法:利用回归直线过样本点中心求系数. (2)利用回归方程进行预测:
把回归直线方程看作一次函数,求函数值.
(3)利用回归直线判断正、负相关:决定正相关还是负相关的是系数ˆb
. 15.(1)11天;(2)①见解析,指数拟合模型·t z c d =适合拟合z 与t 的关系;②1.55 【分析】
(1)由函数的单调性可知10x ≤时,0.1y x =单调递增,10x >时,10-=x
y e 单调递减,
得到10x =时,y 达到峰值,再由100.2-<x e 求解不等式得答案; (2)①画出散点图,根据图像可得答案;
②求出对于的ˆb
与ˆa 的值,可得z 关于t 的回归方程,通过回归方程估计异常数据.。