高中数学 阶段质量检测(五)统计案例 苏教版选修2-3-苏教版高二选修2-3数学试题
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
阶段质量检测(五)统计案例
(时间120分钟,满分150分)
一、选择题(本大题共12小题,每小题5分,共60分.在每小题给出的四个选项中,只有一项是符合题目要求的)
1.已知回归方程y ^=b ^x +a ^,其中a ^
=3,且样本点的中心为(1,2),则回归直线方程为( )
A.y ^=x +3
B.y ^
=-2x +3 C.y ^=-x +3 D.y ^
=x -3
解析:选C 因为回归方程一定经过样本点的中心,所以只需将样本点的中心坐标代入方程,用待定系数法求出即可.
2.每一吨铸铁成本y (元)与铸件废品率x %建立的回归方程y ^
=56+8x ,下列说法正确的是( )
A .废品率每增加1%,成本每吨增加64元
B .废品率每增加1%,成本每吨增加8%
C .废品率每增加1%,成本每吨增加8元
D .如果废品率增加1%,则每吨成本为56元
解析:选C 根据回归方程知y 是关于x 的单调增函数,并且由系数知x 每增加一个单位,y 平均增加8个单位.
3.下表是某厂1~4月份用水量(单位:百吨)的一组数据:
月份x 1 2 3 4 用水量y
4.5
4
3
2.5
由散点图可知,用水量y 与月份x 之间有较好的线性相关关系,其线性回归方程是y ^=-0.7x +a ^,则a ^
等于( )
A .10.5
B .5.15
C .5.2
D .5.25
解析:选D 样本点的中心为(2.5,3.5),将其代入线性回归方程可解得a ^
=5.25. 4.下表显示出样本中变量y 随变量x 变化的一组数据,由此判断它最可能是( )
x 4 5 6 7 8 9 10 y
14
18
19
20
23
25
28
A
C .指数函数模型
D .对数函数模型
解析:选A 画出散点图(图略)可以得到这些样本点在某一条直线上或该直线附近,故最可能是线性函数模型.
5.试验测得四组(x ,y )的值为(1,2),(2,3),(3,4),(4,5),则y 与x 之间的回归直线方程为( )
A.y ^=x +1
B. y ^
=x +2 C.y ^=2x +1 D.y ^
=x -1
解析:选A 由题意发现,(x ,y )的四组值均满足y ^=x +1,故y ^
=x +1为回归直线方程. 6.下列说法中,错误说法的个数是( )
①将一组数据中的每个数据都加上或减去同一个常数后,方差恒不变; ②回归方程y ^=3-5x ,变量x 增加1个单位时,y ^
平均增加5个单位; ③线性回归方程y ^=b ^x +a ^
必过样本点的中心(x ,y );
④在一个2×2列联表中,若χ2
的观测值k =13.079,则有99.9%以上的把握认为这两个变量之间有关系.
A .0
B .1
C .2
D .3
解析:选B 数据的方差与加了什么样的常数无关,故①正确;对于回归方程y ^
=3-5x ,变量x 增加1个单位时,y ^平均减少5个单位,故②错误;易知③正确;若k =13.079>10.828,则有99.9%以上的把握认为这两个变量之间有关系,故④正确.
7.根据一组样本数据(x 1,y 1),(x 2,y 2),…,(x n ,y n )的散点图分析存在线性相关关系,求得其回归方程y ^
=0.85x -85.7,则在样本点(165,57)处的残差为( )
A .54.55
B .2.45
C .3.45
D .111.55
解析:选B 把x =165代入y ^
=0.85x -85.7,得y =0.85×165-85.7=54.55,故残差为57-54.55=2.45.
8.某高校《统计》课程的教师随机给出了选修该课程的一些情况,具体数据如下:
χ2
>3.841,所以可以判断选修该课程与性别有关.那么这种判断出错的可能性不超过( )
A .5%
B .95%
C .1%
D .99%
解析:选A 若χ2
>3.841,说明在犯错误的概率不超过0.05的前提下认为选修该课程与性别有关,也就是选修该课程与性别有关出错的可能性不超过5%.
9.为考察数学成绩与物理成绩的关系,某老师在高二随机抽取了300名学生,得到下面的列联表:
A .0.5%
B .1%
C .2%
D .5%
解析:选D 由表中数据代入公式得χ2
的观测值 χ2
=300×(37×143-85×35)2
122×178×72×228
≈4.514>3.841,
所以有95%以上的把握认为数学成绩与物理成绩有关,因此,判断的出错率不超过5%. 10.已知x 与y 之间的几组数据如下表所示.
假设根据上表数据所得回归方程为y =b x +a ,若某同学根据上表中的前两组数据(1,0)和(2,2)求得的直线方程为y =b ′x +a ′,则以下结论正确的是( )
A.b ^>b ′,a ^>a ′
B.b ^>b ′,a ^
<a ′ C.b ^<b ′,a ^>a ′ D.b ^<b ′,a ^
<a ′
解析:选C 由题意可得,b ′=2,a ′=-2,x =72,y =136
.由公式b ^
=
∑i =1
6
(x i -x )(y i -y
)
∑i =1
6
(x i -x
)
2
求得b ^=57,a ^=y -b ^x =136-57×72=-13
,∴b ^<b ′,a ^
>a ′.
11.假设有两个分类变量X 和Y ,它们的可能取值分别为{x 1,x 2}和{y 1,y 2},其2×2
列联表如下:
( ) A .a =9,b =8,c =7,d =6 B .a =9,b =7,c =6,d =8 C .a =8,b =6,c =9,d =7 D .a =6,b =7,c =8,d =9
解析:选B 对于同一样本,|ad -bc |越大,说明X 与Y 之间的关系越强,故检验知选B.
12.两个分类变量X 和Y, 值域分别为{x 1,x 2}和{y 1,y 2}, 其样本频数分别是a =10, b =21, c +d =35. 若X 与Y 有关系的可信程度不小于97.5%, 则c 等于( )
A .3
B .4
C .5
D .6
解析:选A 列2×2列联表如下:
故K 2
的观测值k =31×35×(10+c )(56-c )≥5.024. 把选项A, B, C, D 代入验证可知
选A.
二、填空题(本大题共4小题,每小题5分,共20分.请把正确答案填在题中的横线上) 13.已知高三某学生的高考成绩y (分)与高三期间有效复习时间x (天)正相关,且回归方程是y ^
=3x +50,若期望他高考达到500分,则他的有效复习时间应不低于________天.
解析:本题主要考查运用线性回归方程来预测变量的取值.当y ^
=500时,易得x =500-50
3
=150. 答案:150
14.若一组观测值(x 1,y 1),(x 2,y 2),…,(x n ,y n )之间满足y i =bx i +a +e i (i =1,2,…,
n ),若e i 恒为0,则r 2为________.
解析:e i 恒为0,说明随机误差总为0,于是y i =y ^,故r 2
=1. 答案:1
15.欲知作者的性别是否与读者的性别有关,某出版公司派工作人员到各书店随机调查了500位买书的顾客,结果如下表所示.
________.(填“有关”或“无关”)
解析:由公式得χ2
=500×(142×133-122×103)2
264×236×245×255
≈5.131>5.024,所以在犯错误的概
率不超过0.025的前提下作者的性别与读者的性别有关.
答案:有关
16.已知x ,y 之间的一组数据如下表,对于表中数据,甲、乙两同学给出的拟合直线分别为l 1:y =13x +1与l 2:y =12x +1
2,利用最小二乘法判断拟合程度更好的直线是
______________.
解析:用y =1
3
x +1作为拟合直线时,所得y 的实际值与y 的估计值的差的平方和为:
S 1=⎝
⎛⎭
⎪⎫
1-432+(2-2)2+(3-3)2+⎝
⎛⎭
⎪⎫
4-1032+⎝
⎛⎭
⎪⎫
5-113
2=73.用y =12x +12
作为拟合直线时,所得
y 的实际值与y 的估计值的差的平方和为:S 2=(1-1)2+(2-2)2+⎝
⎛
⎭
⎪⎫
3-722+(4-4)2+⎝
⎛⎭
⎪⎫
5-92
2
=12
. 因为S 2<S 1,故用直线l 2:y =12x +1
2,拟合程度更好.
答案:y =12x +1
2
三、解答题(本大题共6小题,共70分,解答时写出必要的文字说明、证明过程或演算
步骤)
17.(本小题满分10分)对某校小学生进行心理障碍测试得如下列联表:(其中焦虑、说
谎、懒惰都是心理障碍)
解:对于上述三种心理障碍分别构造三个随机变量χ2
1,χ2
2,χ2
3, 由表中数据可得
χ21
=110×(5×60-25×20)2
30×80×25×85
≈0.863,
χ22
=110×(10×70-20×10)2
30×80×20×90
≈6.366,
χ23
=110×(15×30-15×50)2
30×80×65×45
≈1.410.
因为χ2
2的值最大,所以说谎与性别关系最大.
18.(本小题满分12分)某房地产公司有6名产品推销员,其中5名推销员的工作年限与年推销金额的数据如表:
(1)求这5 (2)若第6名推销员的工作年限为11年,试估计他的推销金额.
解:(1)设所求的线性回归方程为y ^=b ^x +a ^,由题表数据得x =6,y =3.4,则b ^
=
∑i =1
5
(x i -x )(y i -y
)∑i =1
5
(x i -x
)
2
=
10
20
=0.5,a ^=y -b ^
x =0.4. 所以这5名推销员的年推销金额y 关于工作年限x 的线性回归方程为y ^
=0.5x +0.4. (2)当x =11时,y ^
=0.5×11+0.4=5.9.
所以估计第6名推销员的年推销金额为5.9百万元.
19.(本小题满分12分)淘宝网卖家在某商品的所有买家中,随机选择男女买家各50位进行调查,他们的评分等级如下:
(2)规定:评分等级在[0,3]为不满意该商品,在(3,5]为满意该商品.完成下列2×2列联表,并帮助卖家判断能否95%的把握的认为是否满意该商品与性别有关系.
解:(1)20种选法,其中恰有1人为男性的共有C 1
12C 1
8=96种选法,
所以所求概率P =96190=48
95.
(2)2×2列联表如下:
假设H 0由公式得χ2
=100×(32×30-20×18)
2
50×50×52×48
≈5.769>3.841,
所以能95%的把握认为是否满意该商品与性别有关.
20.(本小题满分12分)某工厂用甲、乙两种不同工艺生产一大批同一种零件,零件尺寸均在[21.7,22.3](单位:cm)之间,把零件尺寸在[21.9,22.1)的记为一等品,尺寸在[21.8,21.9)∪[22.1,22.2)的记为二等品,尺寸在[21.7,21.8)∪[22.2,22.3]的记为三等品,现从甲、乙工艺生产的零件中各随机抽取100件产品,所得零件尺寸的频率分布直方图如图所示:
(1)根据上述数据完成下列2×2列联表,根据此数据你认为选择不同的工艺与生产出一等品是否有关?
甲工艺乙工艺总计
一等品
非一等品
总计
附:
P(χ2≥k0)0.100.050.01
k0 2.706 3.841 6.635
χ2=n(ad2
(a+b)(c+d)(a+c)(b+d)
(2)以上述各种产品的频率作为各种产品发生的概率,若一等品、二等品、三等品的单件利润分别为30元、20元、15元,你认为以后该工厂应该选择哪种工艺生产该种零件?请说明理由.
解:(1)2×2列联表如下:
甲工艺乙工艺总计
一等品5060110
非一等品504090
总计100100200
K2=200×(
110×90×100×100
≈2.02<2.706,所以没有理由认为选择不同的工艺与生产
出一等品有关.
(2)由题知运用甲工艺生产单件产品的利润X的分布列为
X的数学期望为E(X)24,X的方差为V(X)=(30-24)2×0.5+(20-24)2×0.3+(15-24)2×0.2=39.
乙工艺生产单件产品的利润Y的分布列为
Y的数学期望为E(Y),
Y的方差为V(Y)=(30-24.5)2×0.6+(20-24.5)2×0.1+(15-24.5)2×0.3=47.25.
由上述结果可以看出V(X)<V(Y),即甲工艺波动小,虽然E(X)<E(Y),但相差不大,所以以后应选择甲工艺.
21.(本小题满分12分)某区卫生部门成立了调查小组,调查常吃零食与患龋齿的关系,对该区六年级的800名学生进行检查,按患龋齿和不患龋齿分类,得汇总数据:不常吃零食且不患龋齿的学生有60名,常吃零食但不患龋齿的学生有100名,不常吃零食但患龋齿的学生有140名.
(1)完成下列2×2列联表,并分析能否在犯错概率不超过0.001的前提下,认为该区的学生常吃零食与患龋齿有关系?
(2)4
负责数据处理.求工作人员甲分到负责收集数据组,工作人员乙分到负责数据处理组的概率.解:(1)由题意可得列联表如下所示.
因为K2的观测值k=
≈16.667>10.828,
160×640×200×600
所以能在犯错概率不超过0.001的前提下,认为该区的学生常吃零食与患龋齿有关系.
(2)设其他工作人员为丙和丁,4人分组的所有情况有:
收集数据组:甲乙;甲丙;甲丁;乙丙;乙丁;丙丁;
相应的处理数据组:丙丁;乙丁;乙丙;甲丁;甲丙;甲乙.共有6种情况. 记事件A 为“工作人员甲分到负责收集数据组,工作人员乙分到负责数据处理组”, 则满足条件的情况有:甲丙收集数据,乙丁处理数据或 甲丁收集数据,乙丙处理数据,共2种情况. 所以P (A )=26=1
3
.
22.(本小题满分12分)某市为了对学生的数理(数学与物理)学习能力进行分析,从10 000名学生中随机抽出100位学生的数理综合学习能力等级分数(6分制)作为样本,分数频数分布如下表: 等级得分 (0,1] (1,2] (2,3] (3,4] (4,5] (5,6] 人数 3
17
30
30
17
3
(1)如果以能力等级分数大于4分作为良好的标准,从样本中任意抽取2名学生,求恰有1名学生为良好的概率.
(2)统计方法中,同一组数据常用该组区间的中点值(例如区间(1,2]的中点值为1.5)作为代表:
①据此,计算这100名学生数理学习能力等级分数的期望μ及标准差σ(精确到0.1); ②若总体服从正态分布,以样本估计总体,估计该市这10 000名学生中数理学习能力等级在(1.9,4.1)X 围内的人数.
(3)从这10 000名学生中任意抽取5名同学,他们数学与物理单科学习能力等级分数如下表:
x (数学学习能力) 2 3 4 5 6 y (物理学习能力)
1.5
3
4.5
5
6
①请画出上表数据的散点图;
②请根据上表提供的数据,用最小二乘法求出y 关于x 的线性回归方程y ^=b ^x +a ^
(附参考数据:129≈11.4).
解:(1)样本中学生为良好的人数为20人.故从样本中任意抽取2名学生,则仅有1名学生为良好的概率为C 1
20×C 1
80C 2100=32
99
.
word 11 / 11 (2)①总体数据的期望约为:μ=0.5×0.03+1.5×0.17+2.5×0.30+3.5×0.30+
4.5×0.17+
5.5×0.03=3.0,
标准差σ=[(0.5-3)2×0.03+(1.5-3)2×0.17+(2.5-3)2×0.3+(3.5-3)2
×0.3
+(4.5-3)2×0.17+(5.5-3)2×0.03]12
= 1.29≈1.1, ②由于μ=3,σ=1.1
当x ∈(1.9,4.1)时,即x ∈(μ-σ,μ+σ),
故数理学习能力等级分数在(1.9,4.1)X 围中的概率约为0.682 7.
数理习能力等级分数在(1.9,4.1)X 围中的学生的人数约为10 000×0.682 7=6 827人.
(3)①数据的散点图如图:
②设线性回归方程为y ^=b ^x +a ^,则x =4,y =4.
b ^=
∑i =15
(x i -x )(y i -y
)∑i =15
(x i -x
)2
=1.1,a ^=y -b ^x =-0.4. 故回归直线方程为y ^=1.1x -0.4.。