2017-2018学年高中数学 第一章 统计案例阶段质量检测B卷(含解析)新人教A版选修1-2

合集下载
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

第一章 统计案例
(时间90分钟,满分120分)
一、选择题(本大题共10小题,每小题5分,共50分) 1.在画两个变量的散点图时,下面叙述正确的是( ) A .预报变量在x 轴上,解释变量在y 轴上 B .解释变量在x 轴上,预报变量在y 轴上 C .可以选择两个变量中任意一个变量在x 轴上 D .可以选择两个变量中任意一个变量在y 轴上
解析:选B 在散点图中,预报变量在y 轴上,解释变量在x 轴上. 2.在回归分析中,残差图中的纵坐标为( ) A .残差 B .样本编号 C.x - D.e ^(n )
解析:选A 残差是真实值与预报值的差,残差分析就是对这些残差画出残差图进行分析,在残差图中,横坐标代表编号,纵坐标代表残差.
3.下表显示出样本中变量y 随变量x 变化的一组数据,由此判断它最可能是( )
A.C .指数函数模型
D .对数函数模型
解析:选A 画出散点图(图略)可以得到这些样本点在某一条直线上或该直线附近,故最可能是线性函数模型.
4.利用独立性检验来考虑两个分类变量X 与Y 是否有关系时,通过查阅下表来确定“X 和Y 有关系”的可信度.如果k >5.024,那么就有把握认为“X 和Y 有关系”的百分比为( )
C .5%
D .97.5%
解析:选D ∵k >5.024,而在观测值表中对应于5.024的是0.025,∴有1-0.025=97.5%的把握认为“X 和Y 有关系”,故选D.
5.如图所示,图中有5组数据,去掉________(填字母代号)组数据后,剩下的4组数据的线性相关性最大 ( )
A .E
B .C
(B 卷 能力素养提升)
C .
D D .A
解析:选A ∵A ,B ,C ,D 四点分布在一条直线附近且贴近某一直线,E 点离得远,∴去掉E 点剩下的4组数据的线性相关性最大.故答案为A.
6.在一次实验中,测得(x ,y )的四组值分别是A (1,2),B (2,3),C (3,4),D (4,5),则
y 与x 之间的回归直线方程为( )
A.y ^=2x +1
B.y ^
=x +2 C.y ^=x +1 D.y ^
=x -1 解析:选C ∵x =
1+2+3+44=2.5,y =2+3+4+5
4
=3.5,∴这组数据的样本中心点是(2.5,3.5),把样本中心点代入四个选项中,只有y ^
=x +1成立,故选C.
7.为判定喜欢黑色的人是否易患抑郁症,对91名大学生进行调查,得到如下2×2列联表:
附表:
A .在犯错误的概率不超过0.01的前提下认为喜欢黑色与患抑郁症有关系
B .在犯错误的概率不超过0.05的前提下认为喜欢黑色与患抑郁症有关系
C .在犯错误的概率不超过0.1的前提下认为喜欢黑色与患抑郁症有关系
D .不能认为喜欢黑色与患抑郁症有关系
解析:选D 经计算K 2
≈9.8×10-5
≤3.841,故没有理由认为喜欢黑色与患抑郁症有关. 8.为了评价某个电视栏目改革效果,在改革前后分别从居民点抽取了100位居民进行调查,经过计算得K 2
≈0.99.根据这一数据分析,下列说法正确的是 ( )
A .有99%的人认为该栏目优秀
B .有99%的人认为该栏目是否优秀与改革无关
C .有99%的把握认为该栏目是否优秀与改革有关系
D .没有充分理由认为该栏目是否优秀与改革有关系
解析:选D 只有K 2
>6.635才能有99%的把握认为该栏目是否优秀与改革有关系,而即使K 2
>6.635也只是对“该栏目是否优秀与改革有关系”这个论断成立的可能性大小的结
论.故选D.
9.若残差平方和是325,总偏差平方和是923,则随机误差对预报变量变化的贡献率为( )
A .64.8%
B .60%
C .35.2%
D .40%
解析:选C 相关指数R 2
表示解释变量对预报变量变化的贡献率,故随机误差对预报变量变化的贡献率为
残差平方和总偏差平方和×100%=325
923
×100%≈35.2%.
10.下面是调查某地区男、女中学生喜欢理科的等高条形图,阴影部分表示喜欢理科的百分比,从图可以看出( )
A .性别与喜欢理科无关
B .女生中喜欢理科的百分比为80%
C .男生比女生喜欢理科的可能性大些
D .男生不喜欢理科的百分比为60%
解析:选C 由等高条形图可知,女生中喜欢理科的百分比约为1-0.8=0.2=20%, 男生中喜欢理科的百分比约为1-0.4=0.6=60%, 因此男生比女生喜欢理科的可能性大些.
二、填空题(本大题共4小题,每小题5分,共20分)
11.调查了某地若干户家庭的年收入x (单位:万元)和年饮食支出y (单位:万元),调查显示年收入x 与年饮食支出y 具有线性相关关系,并由调查数据得到y 对x 的回归直线方程:y ^
=0.254x +0.321.由回归直线方程可知,家庭年收入每增加1万元,年饮食支出平均增加________万元.
解析:以x +1代x ,得y ^
=0.254(x +1)+0.321, 与y ^
=0.254x +0.321相减可得, 年饮食支出平均增加0.254万元. 答案:0.254
12.在线性回归方程y =a +bx 中,b 为回归系数,下列关于b 的说法中正确的是________(填序号).
①b 为回归直线的斜率;
②b >0,表示随x 增加,y 值增加,b <0,表示随x 增加,y 值减少; ③b 是唯一确定的值;
④回归系数b 的统计意义是当x 每增加(或减少)一个单位,y 平均改变b 个单位. 解析:b 是由总体的一个样本,利用一定的方法得到的,选择不同的样本或不同的计算方法得到的b 是不同的,故③错.
答案:①②④
13.独立性检验显示:有90%的把握认为性别与是否喜爱喝酒有关.下列说法中正确的是________(填序号).
①在100个男性中约有90个人爱喝酒;
②如果某人爱喝酒,那么此人为男性的可能性为90%; ③认为性别与是否喜爱喝酒有关判断出错的可能性为10%; ④有90%的把握认为10个男性中有9个人爱喝酒.
解析:根据独立性检验的概念可知③正确,其他说法均错误. 答案:③ 14.下列说法:
①将一组数据中的每个数据都加上或减去同一个常数后,方差恒不变; ②设有一个回归方程y ^
=3-5x ,变量x 增加1个单位时,y 平均增加5个单位; ③线性回归方程y ^=b ^x +a ^
必过(x ,y );
④在一个2×2列联表中,由计算得K 2
=13.079,则在犯错误的概率不超过0.001的前提下认为这两个变量间有关系.
其中错误的个数是________. 本题可以参考独立性检验临界值表:
其稳定性不变,所以方差恒不变;②设有一个回归方程y ^
=3-5x ,变量x 增加1个单位时,
y 平均减少5个单位,而不是增加5个单位;③线性回归方程y ^=b ^x +a ^
必过(x ,y );④
在一个2×2列联表中,由计算得K 2
=13.079,13.079>10.828,且P (K 2
>10.828)=0.001,所以在犯错误的概率不超过0.001的前提下认为这两个变量间有关系.因此,①③④正确,②错误,故只有1个错误的说法.
答案:1
三、解答题(本大题共4小题,共50分.解答时应写出文字说明、证明过程或演算步骤) 15. (本小题满分12分)在对人们的休闲方式的一次调查中,共调查了124人,其中女性70人,男性54人,女性中有43人主要的休闲方式是看电视,另外的27人主要的休闲方式是运动;男性中有21人主要的休闲方式是看电视,另外的33人主要的休闲方式是运动.
(1)根据以上数据建立一个2×2列联表;
(2)能否在犯错误的概率不超过0.025的前提下认为性别与休闲方式有关系? 解:(1)2×2列联表为:
(2)k =

2
70×54×64×60
≈6.201.
因为
6.201>5.024,因此在犯错误的概率不超过0.025的前提下认为性别与休闲方式有关系.
16.(本小题满分12分)某种产品的广告费用支出x 万元与销售额y 万元之间有如下的对应数据:
(1)(2)据此估计广告费用为10万元时所得的销售收入.(∑i =1
5
x 2
i =145,∑i =1
5
x i y i =1 270)
解:(1)x -=2+4+5+6+8
5=5,
y -=20+30+50+50+705
=44,
b ^=5
i =1
x i y i -5x - y -
5i =1x 2
i -5x -2=1 270-5×5×44145-5×25=8.5,
a ^=y --
b ^x -
=44-8.5×5=1.5, ∴回归直线方程为y ^
=8.5x +1.5.
(2)当x =10时,预报y 的值为y ^
=8.5×10+1.5=86.5(万元).所以所得的销售收入约
为86.5万元.
17.(本小题满分12分)某高校共有学生15 000人,其中男生10 500人,女生4 500人.为调查该校学生每周平均体育运动时间的情况,采用分层抽样的方法,收集300位学生每周平均体育运动时间的样本数据(单位:时).
(1)应收集多少位女生的样本数据?
(2)根据这300个样本数据,得到学生每周平均体育运动时间的频率分布直方图(如图所示),其中样本数据的分组区间为:[0,2],(2,4],(4,6],(6,8],(8,10],(10,12].估计该校学生每周平均体育运动时间超过4小时的概率.
(3)在样本数据中,有60位女生的每周平均体育运动时间超过4小时,请完成每周平均体育运动时间与性别的列联表,并判断能否在犯错误的概率不超过0.05的前提下认为“该校学生的每周平均体育运动时间与性别有关”.
附: K 2


2

+++
解:(1)300×15 000=90,
所以应收集90位女生的样本数据.
(2)由频率分布直方图得1-2×(0.100+0.025)=0.75,所以估计该校学生每周平均体育运动时间超过4小时的概率为0.75.
(3)由(2)知,300位学生中有300×0.75=225人的每周平均体育运动时间超过4小时,75人的每周平均体育运动时间不超过4小时.又因为样本数据中有210份是关于男生的,90份是关于女生的.所以每周平均体育运动时间与性别的列联表如下:
每周平均体育运动时间与性别的列联表
k =

2
75×225×210×90

100
21
≈4.762>3.841. 所以在犯错误的概率不超过0.05的前提下认为“该校学生的每周平均体育运动时间与性别有关”.
18.(本小题满分14分)以下资料是一位销售经理收集到的年销售额y(千元)和销售经验x (年)的关系:
(1)根据这些数据画出散点图并作直线y ^=78+4.2x ,计算∑i =1
10
(y i -y ^i )2

(2)依据这些数据求回归直线方程并据此计算
∑i =1
10
(y i -y ^
i )2;
(3)比较(1)(2)中的残差平方和∑i =1
10
(y i -y ^i )2
的大小.
解:(1)散点图与直线y ^
=78+4.2x 的图形如图, 对x =1,3,…,13,有 y ^
i =82.2,90.6,94.8,94.8,103.2,111.6,120,120,124.2,132.6,
∑i =1
10
(y i -y ^
i )2=179.28.
(2)x =110∑i =1
10
x i =7,
∑i =110
x i y i =8 128,
∑i =1
10
x 2i =632,
y =110∑i =1
10
y i =108,
∴b ^=4,a ^=y -b ^
x =108-4×7=80, 故y ^
=80+4x ,对x =1,3,…,13,有 y ^
i =84,92,96,96,104,112,120,120,124,132,
∑i =1
10
(y i -y ^
i )2=170.
(3)比较可知,(2)中求出的∑i =1
10
(y i -y ^i )2
较小.。

相关文档
最新文档