2016届高考数学理命题猜想专题18统计与统计案例(解析版)
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
【命题热点突破一】抽样方法
某工厂生产的甲、乙、丙、丁四种不同型号的产品分别有150件、120件、180件、150件.为了调查产品的情况,需从这600件产品中抽取一个容量为100的样本,若采用分层抽样法,设甲产品中应抽取的产品件数为x ,某件产品A 被抽到的概率为y ,则x ,y 的值分别为( )
A .25,14
B .20,1
6 C .25,1600 D .25,1
6 【【答案】】D
【特别提醒】 三种抽样方法均是等概率抽样,当总体是由差异明显的几个部分组成时,往往选用分层抽样的方法.【变式探究】
从编号分别为0,1,2,…,79的80件产品中,采用系统抽样的方法抽取容量为10的样本,若编号为58的产品在样本中,则该样本中产品的最大编号为________.
【【答案】】74
【【解析】】每8件产品抽取一件,编号为58的产品在样本中,则样本中产品的最大编号为58+16=74.
【命题热点突破二】用样本估计总体
(1)将某市8所中学参加中学生合唱比赛的得分用茎叶图表示(如图18-3所示),其中茎为十位数,叶为个位数,则这组数据的中位数和平均数分别是( )
图18-3
A .91,91.5
B .91,92
C .91.5,91.5
D .91.5,92
(2)2014年6月,一篇关于“键盘侠”(“键盘侠”一词描述了部分网民在现实生活中胆小怕事自私自利,却习惯在网络上大放厥词的一种现象)的时评引发了大家对“键盘侠”的热议.某地区新闻栏目对该地区群众对“键盘侠”的认可度做出调查:在随机抽取的50人中,有14人持认可态度,其余持反对态度.若该地区有9600人,则估计该地区对“键盘侠”持反对态度的有
________人.
【【答案】】(1)C(2)6912
【特别提醒】统计的基本思想之一就是以样本估计总体.以样本的频率估计总体的概率、以样本的特征数估计总体的特征数.
【变式探究】
(1)某学校随机抽查了本校20个同学,调查他们平均每天在课外进行体育锻炼的时间(分钟),根据所得数据的茎叶图,以5为组距将数据分为八组,分别是[0,5),[5,10),…,[35,40],作出的频率分布直方图如图18-4所示,则原始的茎叶图可能是()
图18-5
(2)高三年级上学期期末考试中,某班级数学成绩的频率分布直方图如图18-6所示,数据分组依次如下:
[70,90),[90,110),[110,130),[130,150].
估计该班数学成绩的平均分数为()
图18-6
A.112
B.114
C.116
D.120
【【答案】】(1)B(2)B
【命题热点突破三】统计案例
例3、某高校共有15 000人,其中男生10 500人,女生4500人,为调查该校学生每周平均参加体育运动时间情况,采用分层抽样的方法,收集了300名学生每周平均参加体育运动时间的样本数据(单位:小时).
(1)应收集多少名女生的样本数据?
(2)根据这300个样本数据,得到学生每周平均参加体育运动时间的频率分布直方图(如图18-7所示),其中样本数据分组区间为[0,2],(2,4],(4,6],(6,8],(8,10],(10,12],估计该校学生每周平均参加体育运动时间超过4个小时的概率.
(3)在样本数据中,有60名女生每周平均参加体育运动的时间超过4个小时,请画出每周平均参加体育运动时间与性别的列联表,并判断是否有95%的把握认为“该校学生每周平均参加体育运动的时间与性别有关”.
附:K2=
n(ad-bc)
(a+b)(c+d)(a+c)(b+d)
结合列联表可得K 2
的观测值k =300×(165×30-45×60)75×225×210×90=100
21≈4.762>3.841. 所以有95%的把握认为“该校学生每周平均参加体育运动的时间与性别有关”.
【特别提醒】 在计算K 2时要注意公式中各个字母的含义,分子上是总量乘2×2列联表中对角线数字乘积之差的平方,分母上是四个分和量的乘积.
【变式探究】
为了解篮球爱好者小李的投篮命中率与打篮球时间之间的关系,下表记录了小李某月1号到5号每天打篮球的时间x(单位:小时)与当天投篮命中率y 之间的关系.
(1)求小李这5天的平均投篮命中率;
(2)用线性回归分析的方法,预测小李该月6号打6小时篮球的投篮命中率. 解:(1)小李这5天的平均投篮命中率y -= 0.4+0.5+0.6+0.6+0.4
5
=0.5.
(2)易知x -=1+2+3+4+5
5
=3, 设线性回归方程为y ^=b ^x +a ^,则由公式可得b ^=
=
(-2)×(-0.1)+(-1)×0+0×0.1+1×0.1+2×(-0.1)
(-2)2+(-1)2+02+12+22=0.01,
所以a ^=y --b ^x -
=0.5-0.01×3=0.47, 所以y ^=b ^x +a ^
=0.01x +0.47.
当x =6时,y ^
=0.53,故小李该月6号打6小时篮球的投篮命中率约为0.53.
【特别提醒】 回归直线一定过样本点的中心(x ,y),当已知回归直线方程两个系数中的一个时,可以直接代入样本点中心的坐标求得另一个系数.正相关和负相关是根据回归直线方程的斜率判断的:正相关时回归直线方程的斜率为正值;负相关时回归直线方程的斜率为负值.回归直线方程斜率的符号与相关系数的符号是一致的.
【高考真题解读】
1.(2015·陕西,2)某中学初中部共有110名教师,高中部共有150名教师,其性别比例如图所示,则该校女教师的人数为( )
A .167
B .137
C .123
D .93
【答案】 B
2.(2015·安徽,6)若样本数据x 1,x 2,…,x 10的标准差为8,则数据2x 1-1,2x 2-1,…,2x 10-1的标准差为( )
A .8
B .15
C .16
D .32 【答案】 C
【解析】 法一 由题意知,x 1+x 2+…+x 10=10x ,
s 1
则y =1
n [(2x 1-1)+(2x 2-1)+…+(2x 10-1)] =1
n
[2(x 1+x 2+…+x 10)-n]=2x -1,
所以S 2
==2s 1,故选C.
3.(2015·重庆,3)重庆市2013年各月的平均气温(℃)数据的茎叶图如下: 则这组数据的中位数是( )
0122
8 9 2 5 8
0 0 0
3 3 8 1 2
A .19
B .20
C .21.5
D .23
【答案】 B
4
.(2015·新课标全国Ⅱ,31)根据下面给出的2004年至2013年我国二氧化硫排放量(单位:万吨)柱形图.以下结论不正确的是( )
A .逐年比较,2008年减少二氧化硫排放量的效果最显著
B .2007年我国治理二氧化硫排放显现成效
C .2006年以来我国二氧化硫年排放量呈减少趋势
D .2006年以来我国二氧化硫年排放量与年份正相关 【答案】 D
【解析】从2006年,将每年的二氧化硫排放量与前一年作差比较,得到2008年二氧化硫排放量与2007年排放量的差最大,A选项正确;
2007年二氧化硫排放量较2006年降低了很多,B选项正确;
虽然2011年二氧化硫排放量较2010年多一些,但自2006年以来,整体呈递减趋势,即C选项正确;自2006年以来我国二氧化硫年排放量与年份负相关,D选项错误,故选D.
5.(2015·福建,4)为了解某社区居民的家庭年收入与年支出的关系,随机调查了该社区5户家庭,得到如下统计数据表:
根据上表可得回归直线方程y
∧
=b
∧
x+a
∧
,其中b
∧
=0.76,a
∧
=y-b
∧
x.据此估计,该社
区一户年收入为15万元家庭的年支出为()
A.11.4万元B.11.8万元
C.12.0万元D.12.2万元
【答案】B
6.(2014·山东,7)为了研究某药品的疗效,选取若干名志愿者进行临床试验.所有志愿者的舒张压数据(单位:kPa)的分组区间为[12,13),[13,14),[14,15),[15,16),[16,17],将其按从左到右的顺序分别编号为第一组,第二组,……,第五组.如图是根据试验数据制成的频率分布直方图.已知第一组与第二组共有20人,第三组中没有疗效的有6人,则第三组中有疗效的人数为()
A .6
B .8
C .12
D .18 【答案】 C
【解析】 由题图可知,第一组和第二组的频率之和为(0.24+0.16)×1=0.40,故该试验共选取的志愿者有20
0.40=50人.所以第三组共有50×0.36=18人,其中有疗效的人数为18-6=12.
7.(2014·陕西,9)设样本数据x 1,x 2,…,x 10的均值和方差分别为1和4,若y i =x i +a(a 为非零常数,i =1,2,…,10),则y 1,y 2,…,y 10的均值和方差分别为( )
A .1+a ,4
B .1+a ,4+a
C .1,4
D .1,4+a
【答案】 A
8
.(2014·湖南,2)对一个容量为N 的总体抽取容量为n 的样本,当选取简单随机抽样、系统抽样和分层抽样三种不同方法抽取样本时,总体中每个个体被抽中的概率分别为p 1,p 2,p 3,则( )
A .p 1=p 2<p 3
B .p 2=p 3<p 1
C .p 1=p 3<p 2
D .p 1=p 2=p 3
【答案】 D
【解析】 因为采取简单随机抽样、系统抽样和分层抽取样本时,总体中每个个体被抽中的概率相等,故选D.
9.(2014·广东,6)已知某地区中小学生人数和近视情况分别如图1和图2所示.为了解该
地区中小学生的近视形成原因,用分层抽样的方法抽取2%的学生进行调查,则样本容量和抽取的高中生近视人数分别为(
)
A .200,20
B .100,20
C .200,10
D .100,10
【答案】
A
1
0.(2014·天津,9)某大学为了解在校本科生对参加某项社会实践活动的意向,拟采用分层抽样的方法,从该校四个年级的本科生中抽取一个容量为300的样本进行调查.已知该校一年级、二年级、三年级、四年级的本科生人数之比为4∶5∶5∶6,则应从一年级本科生中抽取________名学生.
【答案】 60
【解析】 4
20×300=60(名).
11.(2015·江苏,2)已知一组数据4,6,5,8,7,6,那么这组数据的平均数为________. 【答案】 6
【解析】 这组数据的平均数为1
6(4+6+5+8+7+6)=6.
12.(2015·湖南,12)在一次马拉松比赛中,35名运动员的成绩(单位:分钟)的茎叶图如图所示:
13
14
15
0 0 3 4 5 6 6 8 8 9
1 1 1
2 2 2
3 3
4 4
5 5 5
6 6
7
8 0 1 2 2 3 3 3
若将运动员按成绩由好到差编为1~35号,再用系统抽样方法从中抽取7人,则其中成
绩在区间[139,151]上的运动员人数是________.
【答案】 4
1 3.(2015·新课标全国Ⅱ,18)某公司为了解用户对其产品的满意度,从A,B两地区分别随机调查了20个用户,得到用户对产品的满意度评分如下:
A地区:62738192958574645376
78869566977888827689
B地区:73836251914653736482
93486581745654766579
(1)根据两组数据完成两地区用户满意度评分的茎叶图,并通过茎叶图比较两地区满意度评分的平均值及分散程度(不要求计算出具体值,给出结论即可);
(2)根据用户满意度评分,将用户的满意度从低到高分为三个等级:
记事件C:“A地区用户的满意度等级高于B地区用户的满意度等级”.假设两地区用户的评价结果相互独立.根据所给数据,以事件发生的频率作为相应事件发生的概率,求C的概率.
解(1)两地区用户满意度评分的茎叶图如下
通过茎叶图可以看出,A 地区用户满意度评分的平均值高于B 地区用户满意度评分的平均值;A 地区用户满意度评分比较集中,B 地区用户满意度评分比较分散.
由所给数据得C A1,C A2,C B1,C B2发生的频率分别为1620,420,1020,820,故P(C A1)=1620,P(C A2)
=420,P(C B1)=1020,
P(C B2)=820,P(C)=1020×1620+820×420=0.48.。