(好题)高中数学必修三第一章《统计》测试卷(答案解析)(4)
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
一、选择题
1.我校高中生共有2700人,其中高一年级900人,高二年级1200人,高三年级600人,现采取分层抽样法抽取容量为135的样本,那么高一、高二、高三各年级抽取的人数分别为 ( ) A.45,75,15 B.45,45,45 C.45,60,30 D.30,90,15
2.某人研究中学生的性别与成绩、视力、智商、阅读量这4个变量之间的关系,随机抽查52名中学生,得到统计数据如表1至表4,这与性别有关联的可能性最大的变量是()
A.成绩B.视力C.智商D.阅读量
3.某中学有学生300人,其中一年级120人,二,三年级各90人,现要利用抽样方法取10人参加某项调查,考虑选用简单随机抽样、分层抽样和系统抽样三种方案,使用简单随机抽样和分层抽样时,将学生按一,二,三年级依次统一编号为1,2,…,300;使用系统抽样时,将学生统一编号为1,2,…,300,并将整个编号依次分为10段.如果抽得的号码有下列四种情况:
①7,37,67,97,127,157,187,217,247,277;
②5,9,100,107,121,180,195,221,265,299;
③11,41,71,101,131,161,191,221,251,281;
④31,61,91,121,151,181,211,241,271,299.
关于上述样本的下列结论中,正确的是()
A.②④都不能为分层抽样B.①③都可能为分层抽样
C .①④都可能为系统抽样
D .②③都不能为系统抽样
4.在2018年1月15日那天,某市物价部门对本市的5家商场的某商品的一天销售量及其价格进行调查,5家商场的售价元和销售量件之间的一组数据如下表所示: 价格
9
9.5
10.5 11
销售量 11
8
6 5
由散点图可知,销售量与价格之间有较强的线性相关关系,其线性回归方程是
,且
,则其中的
( ) A .10
B .11
C .12
D .10.5
5.在一次53.5公里的自行车个人赛中,25名参赛选手的成绩(单位:分钟)的茎叶图如图所示,现将参赛选手按成绩由好到差编为125-号,再用系统抽样方法从中选取5人,已知选手甲的成绩为85分钟,若甲被选取,则被选取的其余4名选手的成绩的平均数为(
)
A .95
B .96
C .97
D .98
6.网上大型汽车销售某品牌A 型汽车,在2017年“双十一”期间,进行了降价促销,该型汽车的价格与月销量之间有如下关系 价格(万元) 25 23.5 22 20.5 销售量(辆)
30
33
36
39
已知A 型汽车的购买量y 与价格x 符合如下线性回归方程:8ˆ0ˆy
bx =+,若A 型汽车价格降到19万元,预测月销量大约是( ) A .39
B .42
C .45
D .50
7.将1000名学生的编号如下:0001,0002,0003,…,1000,若从中抽取50个学生,用系统抽样的方法从第一部分0001,0002,…,0020中抽取的号码为0015时,抽取的第40个号码为( ) A .0795
B .0780
C .0810
D .0815
8.已知某8个数的平均数为3,方差为2,现加入一个新数据3,此时这9个数的平均数为x ,方差为2s ,则( ) A .3x =,22s < B .3x =,22s > C .3x >,22s <
D .3x >,22s >
9.某校为了提高学生身体素质,决定组建学校足球队,学校为了解报名学生的身体素质,
对他们的体重进行了测量,将所得的数据整理后,画出了频率分布直方图(如右图),已知图中从左到右3个小组的频率之比为1:2:3,其中第2小组的频数为12,则该校报名学生总人数( )
A .40
B .45
C .48
D .50
10.已知某企业上半年前5个月产品广告投入与利润额统计如下: 月份
1 2 3 4 5 广告投入(x 万元) 9.5 9.3 9.1 8.9 9.7 利润(y 万元)
92
89
89
87
93
由此所得回归方程为7.5ˆy
x a =+,若6月份广告投入10(万元)估计所获利润为( ) A .97万元
B .96.5万元
C .95.25万元
D .97.25万元
11.在学校组织的考试中,45名学生的数学成绩的茎叶图如图所示,若将学生按成绩由低到高编为1-45号,再用系统抽样方法从中抽取9人,则其中成绩在区间[120,135]上的学生人数是( )
A .4
B .5
C .6
D .7
12.从存放号码分别为1,2,⋯,10的卡片的盒子中,有放回地取100次,每次取一张卡片并记下号码,统计结果如下:
则取到号码为奇数的频率是( ) A .0.53
B .0.5
C .0.47
D .0.37
二、填空题
13.下列说法正确的是__________(填序号)
(1)已知相关变量(),x y 满足回归方程ˆ24y
x =-,若变量x 增加一个单位,则y 平均增加4个单位
(2)若,p q 为两个命题,则“p q ∨”为假命题是“p q ∧”为假命题的充分不必要条件
(3)若命题0:p x R ∃∈,2
0010x x -+<,则:p x R ⌝∀∉,210x x -+≥
(4)已知随机变量(
)2
2X N σ~,,若()0.32P X a <=,则()40.68P X a >-=
14.已知一组样本数据1210,x x x ,且22
212102020x x x ++
+=,平均数9=x ,则该组
数据的标准差为__________.
15.某地区共有4所普通高中,这4所普通高中参加2018年高考的考生人数如下表所示: 学校 A 高中
B 高中
C 高中
D 高中
参考人数
800
1200
1000
600
现用分层抽样的方法在这4所普通高中抽取144人,则应在D 高中中抽取的学生人数为_______.
16.已知某8个数据的平均数为5,方差为3,现又加入一个新数据5,此时这9个数据的方差为______.
17.某高中有高一学生320人,高二学生400人,高三学生360人.现采用分层抽样调查学生的视力情况.已知从高一学生中抽取了8人,则三个年级一共抽取了__________人。
18.某超市统计了一个月内每天光顾的顾客人数,得到如图所示的频率分布直方图,根据该图估计该组数据的中位数为__________.
19.一组样本数据按从小到大的顺序排列为:1-,0,4,x ,y ,14,已知这组数据的平均数与中位数均为5,则其方差为__________.
20.某校对全校1200名男女学生进行健康调查,采用分层抽样法抽取一个容量为200的样本,已知女生抽了95人,则该校的男生数是__________.
三、解答题
21.某公司为了制定下一季度的投入计划,收集了今年前6个月投入量x (单位:万元)和产量y (单位:吨)的数据,用两种模型①y bx a =+,
②y a =+分别进行拟合,得到相应的回归方程111.2 2.0y x =+
,29.8y =,进行残差分析得到如图所示的
残差值及一些统计量的值:
(1)求上表中空格内的值;
(2)残差值的绝对值之和越小说明模型拟合效果越好,根据残差比较模型①,②的拟合效果,应选择哪一个模型?并说明理由;
(3)残差绝对值大于3的数据认为是异常数据,需要剔除,剔除异常数据后,重新求出(2)中所选模型的回归方程.
(参考公式:i i i
e y bx a =--,1
2
21
n
i i
i n
i
i x y nx y
b x
nx
==-=
-∑∑,a y bx =-)
22.现有某高新技术企业年研发费用投入x (百万元)与企业年利润y (百万元)之间具有线性相关关系,近5年的年科研费用和年利润具体数据如下表: (1)画出散点图;
(2)求y 对x 的回归直线方程;
(3)如果该企业某年研发费用投入8百万元,预测该企业获得年利润为多少?
参考公式:用最小二乘法求回归方程ˆˆˆy
bx a =+的系数ˆˆ,a b 计算公式:
1
22
1
ˆˆ
ˆ
·
,
n
i i
i
n
i
i
x y nx y
b a y bx
x nx
=
=
-
==-
-
∑
∑
23.从某小区抽取100个家庭进行月用电量调查,发现其月用电量都在50度至350度之
间,频率分布直方图如图所示.
(1)根据直方图求x的值,并估计该小区100个家庭的月均用电量(同一组中的数据用该组区间的中点值作代表);
(2)从该小区已抽取的100个家庭中, 随机抽取月用电量超过300度的2个家庭,参加电视台举办的环保互动活动,求家庭甲(月用电量超过300度)被选中的概率.
24.某工厂为提高生产效率,开展技术创新活动,提出了完成某项生产任务的两种新的生产方式.为比较两种生产方式的效率,选取40名工人,将他们随机分成两组,每组20人.第一组工人用第一种生产方式,第二组工人用第二种生产方式。
根据工人完成生产任务的工作时间(单位:min)绘制了如下茎叶图:
(1)分别指出两种生产方式完成任务时间的最大值、最小值、极差.
(2)求40名工人完成生产任务所需时间的中位数m.
(3)分别求出两种生产方式完成任务的平均时间.
(4)哪种生产方式的效率更高?并说明理由.
25.2018年中秋节到来之际,某超市为了解中秋节期间月饼的销售量,对其所在销售范围内的1000名消费者在中秋节期间的月饼购买量(单位:g)进行了问卷调查,得到如下频率分布直方图:
()1求频率分布直方图中a的值;
()2以频率作为概率,试求消费者月饼购买量在600g1400g
~的概率;
()3已知该超市所在销售范围内有20万人,并且该超市每年的销售份额约占该市场总量的
5%,请根据这1000名消费者的人均月饼购买量估计该超市应准备多少吨月饼恰好能满足
市场需求(频率分布直方图中同一组的数据用该组区间的中点值作代表)?
26.某校为了了解甲、乙两班的数学学习情况,从两班各抽出10名学生进行数学水平测试,成绩如下(单位:分):
甲班:82 84 85 89 79 80 91 89 79 74 乙班:90 76 86 81 84 87 86 82 85 83 (1)求两个样本的平均数; (2)求两个样本的方差和标准差; (3)试分析比较两个班的学习情况.
【参考答案】***试卷处理标记,请不要删除
一、选择题 1.C 解析:C 【解析】
因为共有学生2700,抽取135,所以抽样比为
135
2700
,故各年级分别应抽取135900452700⨯
=,1351200602700⨯=,135
600302700
⨯=,故选C. 2.D
解析:D 【解析】
试题分析:由表中数据可得 表1:()25262210140.00916362032K ⨯⨯-⨯=≈⨯⨯⨯;表2: ()2524201216 1.76916362032
K ⨯⨯-⨯=
≈⨯⨯⨯;
表3: ()252824128 1.316362032
K ⨯⨯-⨯=
≈⨯⨯⨯;表4: ()25214302623.4816362032
K ⨯⨯-⨯=
≈⨯⨯⨯.
其中23.48最大,所以阅读量与性别有关联的可能性最大.故D 正确. 考点:独立性检验.
3.B
解析:B
【分析】
根据系统抽样和分层抽样的定义分别进行判断即可.
【详解】
若采用简单随机抽样,根据简单随机抽样的特点,1~300之间任意一个号码都有可能出现;
若采用分层抽样,则1~120号为一年级,121~210为二年级,211~300为三年级.且根据分层抽样的概念,需要在1~120之间抽取4个,121~210与211~300之间各抽取3个;
若采用系统抽样,根据系统抽样的概念,需要在1~30,31~60,61~90,91~ 120,
121~150,151~180,181~210,211~240,241~270,271~300之间各抽一个.
①项,1~120之间有 4个,121~210之间有 3个,211~300之间有 3个,并且满足系统抽样的条件,所以①项为系统抽样或分层抽样;
②项,1~120之间有 4个,121~210之间有 3个,211~300之间有 3个,可能为分层抽样;
③项,1~120之间有 4个,121~210之间有 3个,211~300之间有 3个,并且满足系统抽样的条件,所以③项为系统抽样或分层抽样;
④项,第一个数据大于30,所以④项不可能为系统抽样,并且④项不满足分层抽样的条件.
综上所述,B选项正确.
故选:B.
【点睛】
本题主要考查系统抽样和分层抽样,掌握系统抽样和分层抽样的定义是解题的关键,属于基础题.
(1)系统抽样适用于总体容量较大的情况.将总体平均分成若干部分,按事先确定的规则在各部分中抽取,在起始部分抽样时采用简单随机抽样;
(2)分层抽样适用于已知总体是由差异明显的几部分组成的.将总体分成互不交叉的层,然后分层进行抽取,各层抽样时采用简单随机抽样或系统抽样.
4.A
解析:A
【解析】
【分析】
由表求得,,代入回归直线方程,联立方程组,即可求解,得到答案.【详解】
由题意,5家商场的售价元和销售量件之间的一组数据,
可得,,
又由回归直线的方程,则,即
,
又因为,解得,故选A.
【点睛】
本题主要考查了回归直线方程的特征及其应用,其中解答中熟记回归直线方程的特征,准确计算是解答的关键,着重考查了推理与运算能力,属于基础题.
5.C
解析:C
【分析】
结合系统抽样法的方法,得出其他四名选手的成绩,然后计算平均数,即可.
【详解】
结合系统抽样法,可知间隔5个人抽取一次,甲为85,则其他人分别是88,94,99,107,故平均数
为88+94+99+107
=97
4
,故选C.
【点睛】
考查了系统抽样法,关键该抽取方法每间隔相同人数中抽取一人,计算平均数,即可,难度中等. 6.B
解析:B
【解析】
分析:先求均值,确定ˆb,再求自变量为19对应函数值得结果.
详解:因为
2523.52220.53303336391
22,34
4442
x y
++++++
====,
所以
1
3480
22,
3
22
4
ˆb
-
==-
所以19(2)8042
y=⨯-+=
选B.
点睛:函数关系是一种确定的关系,相关关系是一种非确定的关系.事实上,函数关系是两个非随机变量的关系,而相关关系是非随机变量与随机变量的关系.如果线性相关,则直接根据用公式求,a b,写出回归方程,回归直线方程恒过点(,)
x y.
7.A
解析:A
【解析】
分析:先确定间距,再根据等差数列通项公式求结果.
详解:因为系统抽样的方法抽签,所以间距为1000
20 50
=
所以抽取的第40个数为1520(401)795
+⨯-=
选A.
点睛:本题考查系统抽样概念,考查基本求解能力.
8.A
解析:A 【分析】
由题意计算出加入新数据后的平均数,然后比较方差 【详解】
()181
38x x +⋯+=, ()181
339
x x +⋯++=, 3x ∴=,
由方差的定义可知加入新数据3,样本数据会变得更加稳定 故22s < 故选A 【点睛】
本题主要考查了加入数据后平均数和方差的变化,代入公式计算出结果,较为基础
9.C
解析:C 【分析】
根据频数关系,求出前三段每段的频数,由直方图求出四五组的频率,进而求出前三组的频率和,从而可求该校报名学生的总人数. 【详解】
从左到右3个小组的频率之比为1:2:3,其中第2小组的频数为12,
∴从左到右3个小组的频数分别为6,12,18,共有36人,
第4,5小组的频率之和为()0.03750.012550.25+⨯=, 则前3小组的频率之和为10.250.75-=, 则该校报名学生的总人数为360.7548÷=,故选C. 【点睛】
本题主要考查频率分布直方图的应用,属于中档题. 直方图的主要性质有:(1)直方图中各矩形的面积之和为1;(2)组距与直方图纵坐标的乘积为该组数据的频率;(3)每个矩形的中点横坐标与该矩形的纵坐标相乘后求和可得平均值;(4)直观图左右两边面积相等处横坐标表示中位数.
10.C
解析:C 【解析】 【分析】
首先求出x y ,的平均数,将样本中心点代入回归方程中求出a 的值,然后写出回归方程,然后将10x =代入求解即可
【详解】
()1
9.59.39.18.99.79.35x =⨯++++=
()1
9289898793905
y =⨯++++=
代入到回归方程为7.5ˆy x a =+,解得20.25a = 7.25ˆ50.2y
x ∴=+ 将10x =代入7.50.5ˆ22y
x =+,解得ˆ95.25y = 故选C 【点睛】
本题是一道关于线性回归方程的题目,解答本题的关键是求出线性回归方程,属于基础题。
11.B
解析:B 【解析】
分析:首先写出所有学生的乘积,然后结合系统抽样的方法整理计算即可求得最终结果. 详解:由题意可知,学生的成绩如下:
111,111,112,113,113; 116,117,117,118,118; 120,120,121,122,122; 123,124,124,126127;
128,128,129,129,129; 131,131,131,132,132; 132,133,134,134,135; 137,138,138,138,139; 140,142,142,143,144.
用系统抽样方法从中抽取9人,则每5人中抽取一人,即上述分组中每组抽取一人, 则所抽取的学生的成绩在区间[]
120,135上的学生人数为5. 本题选择B 选项.
点睛:本题主要考查系统抽样的概念及其应用,茎叶图的识别等知识,意在考查学生的转化能力和计算求解能力.
12.A
解析:A 【解析】
分析:由题意结合统计表确定频数,然后确定频率即可.
详解:由题意可知,取到卡片为奇数的频数为:1356181153++++=, 取卡片的次数为100次,则取到号码为奇数的频率是53
0.53100
=. 本题选择A 选项.
点睛:本题主要考查频率的定义及其应用等知识,意在考查学生的转化能力和计算求解能力.
二、填空题
13.【分析】(1)由回归方程知相关变量与成负相关(2)为假命题则同时为假命题为假命题则中至少有一假命题(3)全称命题与特称命题转换条件不变结论变相反(4)由正态曲线的对称性可解【详解】(1)由回归方程知 解析:(2)
【分析】
(1)由回归方程ˆ24y
x =-知相关变量y 与x 成负相关,(2) “p q ∨”为假命题则,p q 同时为假命题,“p q ∧”为假命题则,p q 中至少有一假命题(3)全称命题与特称命题转换条件不变,结论变相反 (4)由正态曲线的对称性可解. 【详解】
(1)由回归方程ˆ24y
x =-知相关变量y 与x 成负相关,若变量x 增加一个单位,则y 平均增加4-个单位,故(1)错误
(2) “p q ∨”为假命题则,p q 同时为假命题,“p q ∧”为假命题则,p q 中至少有一假命题,所以“p q ∨”为假命题是“p q ∧”为假命题的充分不必要条件是正确的.故(2)正确 (3)全称命题与特称命题转换条件不变,结论变相反,故(3)错误 (4)由正态曲线的对称性知,随机变量(
)2
2X N σ~,,若()0.32P X a <=,对称轴
是2x = ,则()40.32P X a >-=,故(4)错误. 故答案为; (2) 【点睛】
利用正态曲线的对称性求概率是常见的正态分布应用问题.解题的关键是利用对称轴=x μ确定所求概率对应的随机变量的区间与已知概率对应的随机变量的区间的关系,必要时可借助图形判断.
对于正态分布2
()N μσ,,由=x μ是正态曲线的对称轴知:
(1)对任意的a ,有()()P X a P X a μμ<->+=; (2)()001;()P X x P X x -≥=<;
(3)()()=()P a X b P X b P X a <<<≤-.
14.11【分析】根据题意利用方差公式计算可得数据的方差进而利用标准差公式可得答案【详解】根据题意一组样本数据且平均数则其方差则其标准差故答案为:11【点睛】本题主要考查平均数方差与标准差属于基础题样本方
解析:11 【分析】
根据题意,利用方差公式计算可得数据的方差,进而利用标准差公式可得答案. 【详解】
根据题意,一组样本数据1210,,...,x x x ,且222
12102020x x x ++⋯+=,
平均数9x =,
则其方差(
)()(
)()222
2
12101
10
S x x x x x x =-+-+⋯+-
()
2222
121011012110
x x x x =
++⋯+-=,
则其标准差11S ==, 故答案为:11. 【点睛】
本题主要考查平均数、方差与标准差,属于基础题. 样本方差
2222121
[()()...()]n s x x x x x x n
=-+-++-,标准差
s =
15.24【分析】计算出高中人数占总人数的比例乘以得到在高中抽取的学生人数【详解】应在高中抽取的学生人数为【点睛】本小题主要考查分层抽样考查频率的计算属于基础题
解析:24 【分析】
计算出D 高中人数占总人数的比例,乘以144得到在D 高中抽取的学生人数. 【详解】
应在D 高中抽取的学生人数为600
1442480012001000600
⨯=+++.
【点睛】
本小题主要考查分层抽样,考查频率的计算,属于基础题.
16.【解析】【分析】先求出这个数据的平均数为此时这个数据的方差为由此求出结果【详解】某个数据的平均数为方差为现又加入一个新数据则这个数据的平均数为此时这个数据的方差为故答案为【点睛】本题主要考查了平均数
解析:8
3
【解析】 【分析】
先求出这9个数据的平均数为5,此时这9个数据的方差为()2
2
183559S ⎡⎤=⨯+-⎣
⎦,由此
求出结果 【详解】
某8个数据的平均数为5,方差为3,现又加入一个新数据5, 则这9个数据的平均数为
855
59
⨯+=
∴此时这9个数据的方差为()2
218835593S ⎡⎤=
⨯+-=⎣
⎦
故答案为
8
3
【点睛】
本题主要考查了平均数和方差的计算公式,属于基础题。
17.27【解析】分析:根据分层抽样的概念得按比例抽样:详解:因为分层抽样所以三个年级一共抽取点睛:在分层抽样的过程中为了保证每个个体被抽到的可能性是相同的这就要求各层所抽取的个体数与该层所包含的个体数之
解析:27 【解析】
分析:根据分层抽样的概念得按比例抽样:
320320400360
=8n
++. 详解:因为分层抽样,所以三个年级一共抽取320400360
827320
++⨯
=.
点睛:在分层抽样的过程中,为了保证每个个体被抽到的可能性是相同的,这就要求各层所抽取的个体数与该层所包含的个体数之比等于样本容量与总体的个体数之比,即n i ∶N i =n ∶N .
18.75【解析】分析:由频率分布直方图算出各频率然后计算中位数详解:由图可知的频率为的频率为的频率为的频率为的频率为前两组频率前三组频率中位数在第三组设中位数为则解得故该组数据的中位数为点睛:本题考查了
解析:75. 【解析】
分析:由频率分布直方图算出各频率,然后计算中位数 详解:由图可知,10~20的频率为0.14
20~30的频率为0.24 30~40的频率为0.32 40~50的频率为0.2 50~60的频率为0.1
前两组频率0.140.240.380.5=+=<
前三组频率0.140.240.320.70.5=++=> ∴中位数在第三组
设中位数为x ,则()300.380.320.510
x -+⨯=
解得33.75x =
故该组数据的中位数为33.75
点睛:本题考查了在频率分布直方图中求中位数,此类题目需要先确定中位数所在的组,然后根据公式计算求得结果,较为基础.
19.【解析】分析:根据中位数为求出是代入平均数公式可求出从而可得出平均数代入方差公式得到方差详解中位数为这组数据的平均数是可得这组数据的方差是故答案为点睛:本题主要考查平均数与方差属于中档题样本数据的算 解析:
743
【解析】
分析:根据1,0,4,,,14x y -中位数为5,,求出x 是6 ,代入平均数公式,可求出7y =,从而可得出平均数,代入方差公式,得到方差. 详解
1,0,4,,7,14x -中位数为45,52
x
+∴
=,6x ∴=,∴这组数据的平均数是104614
56y -+++++=,7y =可得这组数据的方差是
()17436251148163+++++=,故答案为743
. 点睛:本题主要考查平均数与方差,属于中档题.样本数据的算术平均数公式为
12n 1
(x +x +...+x )x n
=
.样本方差2222121[()()...()]n s x x x x x x n =-+-++-,
标准差s =
20.630【解析】每层的抽样比为女生抽了95人所以男生抽取105人因此共有男生人故填630
解析:630 【解析】 每层的抽样比为
2001
12006
=,女生抽了95人,所以男生抽取105人,因此共有男生1056630⨯=人,故填630. 三、解答题
21.(1)7.4;(2)选模型①,理由见解析;(3)111y x =+. 【分析】
(1)根据i i i
e y bx a =--,结合表中所给数据,即可求得空格内的值;
(2)分别计算出模型①和模型②的残差值绝对值之和,比较其大小,即可求得应选择哪一个模型;
(3)根据所给数据计算出x ,y ,
5
1
i i
i x y =∑,5
2
1
i
i x
=∑,带入12
21
n
i i
i n
i
i x y nx y
b x
nx
==-=
-∑∑,即可求得
答案. 【详解】
(1)根据i i i
e y bx a =--
∴空格处的值为()43311.2 2.07.4-⨯+=
(2)应选择模型①
模型①的残差值的绝对值之和为0.2 2.47.4 1.83 1.216+++++= 模型②的残差值的绝对值之和为5.48.0 4.0 1.6 1.69.029.6+++++=
1629.6<
∴模型①的拟合效果好,应该选模型①.
(3)剔除异常数据,即剔除3月份的数据后, 得()13.563 3.65x =
⨯-=,()14164340.65
y =⨯-=, 5
1
1049343920i i
i x y
==-⨯=∑,5
221
91382i i x ==-=∑.
∴5
15
2
21
59205 3.640.6189.2
11825 3.6 3.617.2
5i i
i i i x y x y
b x x
==--⨯⨯=
=
==-⨯⨯-∑∑,
40.611 3.61a y bx =-=-⨯=.
所以y 关于x 的回归方程为111y x =+. 【点睛】
本题解题关键是掌握残差的定义和回归直线方程的求解步骤,考查了分析能力和计算能力,属于中档题.
22.(1)见解析(2) 1.1.7ˆ0y
x =+(3)9.5百万元 【解析】
试题分析:(1)根据表格中的数据,在坐标系中描出点,将点连起来,就画出了散点图;
(2)根据题目中的数据计算出 1.1,0.ˆˆ7b
a ==,代入平均值3,4x y ==,即可得到回归方程;(3)将8x =,代入回归方程即可得到预测值. (1)散点图
(2)由题意可知,1234523447
3,455
x y ++++++++=
===,
5
1
122334445771i i
i x y
==⨯+⨯+⨯+⨯+⨯=∑,52222221
1234555i i x ==++++=∑,
根据公式,可求得2
71534
1.1,4 1.130.ˆˆ75553
b
a -⨯⨯===-⨯=-⨯, 故所求回归直线的方程为 1.1.7ˆ0y x =+; (3)令8x =,得到预测值 1.1809.5ˆ.7y
=⨯+=(百万元) 答:如果该企业某年研发费用投入8百万元,预测该企业获得年利润为9.5百万元. 23.(1)x=0.0044, 月均用电量约为186度;(2).
【详解】 (1)由题意得,
.
设该小区100个家庭的月均用电量为S 则
9+22.5+52.5+49.5+33+19.5=186.
(2)
,所以用电量超过300度的家庭共有6个.
分别令为甲、A 、B 、C 、D 、E ,则从中任取两个,有(甲,A )、(甲,B )、(甲,C )、(甲,D )、(甲,E )、(A,B )、(A,C )、(A,D )、(A,E )、(B,C )、(B,D )、(B,E )、(C,D )、(C,E )、(D,E )15种等可能的基本事件,其中甲被选中的基本事件有(甲,A )、(甲,B )、(甲,C )、(甲,D )、(甲,E )5种. 家庭甲被选中的概率
.
24.(1)第一种生产方式的最大值为92,最小值为68,极差为24;第二种生产方式的最大值为90,最小值为65,极差为25;
(2)80;(3)84,74.7;(4)第二种生产方式的效率更高.
【分析】
(1)结合茎叶图中的数据,即可分别求出最大值、最小值、极差; (2)根据中位数的定义和求法,即可求得实数m 的值;
(3)结合茎叶图的数据,即可分别求出两种生产方式完成任务的平均时间; (4)结合茎叶图的数据,利用平均数的计算公式,即可求解. 【详解】
(1)根据茎叶图中的数据,
可得第一种生产方式的最大值为92,最小值为68,极差为926824-=, 第二种生产方式的最大值为90,最小值为65,极差为906525-=. (2)结合茎叶图中的数据,可得这40名工人完成任务所需时间的中位数为
7981
802
+=, 即这40名工人完成生产任务所需时间的中位数80m =. (3)第一种生产方式的工人完成生产任务平均所需要的时间:
1
(6872767779828383848586878788899020
x =
+++++++++++++++ 90919192)84++++= 第二种生产方式的工人完成生产任务平均所需要的时间:
1
(6565666869707172727374757676788120
y =
+++++++++++++++ 84848590)74.7++++= 即两种生产方式完成任务的平均时间分别为84和74.7. (4)由于x y >,显然第二种生产方式的效率更高. 【点睛】
本题主要考查了统计知识的综合应用,其中解答中熟记茎叶图的极差、中位数和平均数的计算方法是解答的关键,注重考查分析问题和解答问题的能力,属于基础题. 25.(1)a 0.001=;(2)0.62;(3)12.08吨 【分析】
(1)由频率分布直方图列出方程能求出a .
(2)由频率分布直方图先求出满足题意的频率,即得概率.
(3)由频率分布直方图先求出人均月饼购买量,由此能求出该超市应准备12.08吨月饼恰好能满足市场需求. 【详解】
()1由()0.00020.00055a 0.00050.000254001++++⨯=,解得a 0.001=. ()2消费者月饼购买量在600g 1400g ~的频率为: ()0.000550.0014000.62+⨯=,
∴消费者月饼购买量在600g 1400g ~的概率为0.62.
()3由频率分布直方图得人均月饼购买量为:
()4000.00028000.0005512000.00116000.000520000.000254001208g
⨯+⨯+⨯+⨯+⨯⨯=,
∴2012085%1208⨯⨯=万克12.08?=吨, ∴该超市应准备12.08吨月饼恰好能满足市场需求. 【点睛】
本题考查用样本的频率分布估计总体分布及识图的能力,求解的重点是对题设条件及直方图的理解,了解直方图中每个小矩形的面积的意义,是中档题.
26.(1)=83.2x 甲,=84x 乙;(2)2
2
=26.36=13.2S S 甲乙,,=5.13S 甲,=3.63S 乙;(3)乙班的总体学习情况比甲班好 【解析】
试题分析:每组样本数据有10个,求样本的平均数利用平均数公式,10个数的平均数等于这10个数的和除以10;比较平均分的大小可以看出两个班学生平均水平的高低,求样本的方差只需使用方差公式,求这10个数与平均数的差的平方方和再除以10;比较两组数据方差的大小就可得出两组数据的标准差的大小,标准差较小者成绩较稳定 . 试题 (1)x 甲=
1
10
×(82+84+85+89+79+80+91+89+79+74)=83. 2, x 乙=
1
10
×(90+76+86+81+84+87+86+82+85+83)=84. (2)2
S 甲=
1
10
×[(82-83. 2)2+(84-83. 2)2+(85-83. 2)2+(89-83. 2)2+(79-83. 2)2+(80-83. 2)2+(91-83. 2)2+(89-83. 2)2+(79-83. 2)2+(74-83. 2)2]=26. 36,
2S 甲=
1
10
[(90-84)2+(76-84)2+(86-84)2+(81-84)2+(84-84)2+(87-84)2+(86-84)2+(82-84)2+(85-84)2+(83-84)2]=13. 2,
则s 甲,s 乙≈3. 63.
(3)由于x x <甲乙,则甲班比乙班平均水平低.由于S S >甲乙,则甲班没有乙班稳定. 所以乙班的总体学习情况比甲班好
【点睛】怎样求样本的平均数,n 个数的平均数等于这n 个数的和除以n ;比较平均数的大小可以看出两个样本平均水平的高低,怎样求样本的方差,就是求这n 个数与平均数的差的平方方和再除以n ;比较两组数据方差的大小就可得出两组数据的标准差的大小,标准差较小者成绩较稳定 .。