【3份】2017高考数学(理)人教A版一轮复习第11章 统计与统计案例(基础知识+题型剖析+练出高分)
高考数学一轮复习 第十一章 统计 11.4 统计案例课件 文
(2)下列三个命题: ①残差平方和越小的模型,拟合的效果越好; ②用相关指数 R2 来刻画回归效果,R2 越小,说明模型拟合的 效果越好;
③散点图中所有点都在回归直线附近.
其中正确命题的个数是( ) A.1 B.2 C.3 D.0
解:②中 R2 越大,拟合效果越好;③中回归直线同样可以远
5.024
6.635
7.879
10.82 8
如果 K2≥5.024,那么有把握认为“X 与 Y 有关系”的百分数为( )
A.25% B.75% C.2.5% D.97.5%
解:∵K2≥5.024,而在观测值表中对应于 5.024 的是 0.025,∴有 1-0.025=97.5%的把握认为“X 和 Y 有关
方和
,即模型的拟合效果
;R2 越小,
残差平方和
,即模型的拟合效果
.
在线性回归模型中,R2 表示解释变量对于预报变量变化
的
,R2 越接近于 1,表示回归的效果
.
2. 独立性检验
(1)变量的不同“值”表示个体所属的不同类别,像
这样的变量称为___________.
(2)像下表所示列出两个分类变量的频数表,称为___________.
判断为“两个分类变量之间有关系”的概率不超过 P(K2≥k0).上面 这种利用随机变量 K2 来判断“两个分类变量有关系”的方法称为
___________.
自查自纠:
1.(2)随机误差 (3)( x , y )
n
(4) yi yˆi
( yi yˆi )2
i 1
n
( yi yˆi )2
(5)1-
i 1 n
高考数学一轮复习 第十一章 统计 11.2 用样本估计总体 理
【步步高】(江苏专用)2017版高考数学一轮复习第十一章统计11.2 用样本估计总体理1.作频率分布直方图的步骤(1)求极差(即一组数据中最大值与最小值的差).(2)决定组距与组数.(3)将数据分组.(4)列频率分布表.(5)画频率分布直方图.2.频率分布折线图和总体分布的密度曲线(1)频率分布折线图:将频率分布直方图中各个相邻的矩形的上底边的中点顺次连结起来,就得到频率分布折线图.(2)总体分布的密度曲线:将样本容量取得足够大,分组的组距取得足够小,那么相应的频率折线图趋于一条光滑曲线,称这条光滑曲线为总体分布的密度曲线. 3.茎叶图统计中还有一种被用来表示数据的图叫做茎叶图,茎是指中间的一列数,叶是从茎的旁边生长出来的数. 4.标准差和方差(1)标准差是样本数据到平均数的一种平均距离. (2)标准差:s =1n[x 1-x2+x 2-x2+…+x n -x2].(3)方差:s 2=1n[(x 1-x )2+(x 2-x )2+…+(x n -x )2](x n 是样本数据,n 是样本容量,x是样本平均数). 【知识拓展】1.频率分布直方图的特点(1)频率分布直方图中相邻两横坐标之差表示组距,纵坐标表示频率组距,频率=组距×频率组距.(2)频率分布直方图中各小长方形的面积之和为1,因为在频率分布直方图中组距是一个固定值,所以各小长方形高的比也就是频率比.(3)频率分布表和频率分布直方图是一组数据频率分布的两种形式,前者准确,后者直观. 2.平均数、方差的公式推广(1)若数据x 1,x 2,…,x n 的平均数为x ,那么mx 1+a ,mx 2+a ,mx 3+a ,…,mx n +a 的平均数是m x +a .(2)数据x 1,x 2,…,x n 的方差为s 2.①数据x 1+a ,x 2+a ,…,x n +a 的方差也为s 2; ②数据ax 1,ax 2,…,ax n 的方差为a 2s 2. 【思考辨析】判断下面结论是否正确(请在括号中打“√”或“×”)(1)平均数、众数与中位数从不同的角度描述了一组数据的集中趋势.( √ ) (2)一组数据的众数可以是一个或几个,那么中位数也具有相同的结论.( × ) (3)从频率分布直方图得不出原始的数据内容,把数据表示成直方图后,原有的具体数据信息就被抹掉了.( √ )(4)茎叶图一般左侧的叶按从大到小的顺序写,右侧的叶按从小到大的顺序写,相同的数据可以只记一次.( × )(5)在频率分布直方图中,最高的小长方形底边中点的横坐标是众数.( √)(6)在频率分布直方图中,众数左边和右边的小长方形的面积和是相等的.( ×)1.(2015·陕西改编)某中学初中部共有110名教师,高中部共有150名教师,其性别比例如图所示,则该校女教师的人数为________.答案137解析由题干扇形统计图可得该校女教师人数为:110×70%+150×(1-60%)=137.2.若某校高一年级8个班参加合唱比赛的得分茎叶图如图所示,则这组数据的中位数和平均数分别是__________.答案91.5和91.5解析∵这组数据由小到大排列为87,89,90,91,92,93,94,96,∴中位数为12×(91+92)=91.5.平均数为18×(87+89+90+91+92+93+94+96)=91.5.3.在“世界读书日”前夕,为了了解某地 5 000名居民某天的阅读时间,从中抽取了200名居民的阅读时间进行统计分析.在这个问题中,5 000名居民的阅读时间的全体是________. 答案 总体解析 调查的目的是“了解某地5 000名居民某天的阅读时间”,所以“5 000名居民的阅读时间的全体”是调查的总体.4.(教材改编)某赛季,甲、乙两名篮球运动员都参加了11场比赛,他们每场比赛得分的情况用如图所示的茎叶图表示,则甲、乙两名运动员得分的中位数分别为________.答案 19,135.(教材改编)甲、乙两人在相同条件下各射靶10次,每次命中环数如下: 甲 4 7 10 9 5 6 8 6 8 8 乙 7 8 6 8 6 7 8 7 5 9 试问10次射靶的情况较稳定的是________. 答案 乙解析 x 甲=4+7+10+9+5+6+8+6+8+810=7.1,x 乙=7+8+6+8+6+7+8+7+5+910=7.1.s 2甲=110[(4-7.1)2+(7-7.1)2+…+(8-7.1)2]=3.09, s 2乙=110[(7-7.1)2+(8-7.1)2+…+(9-7.1)2]=1.29. s 2甲>s 2乙,∴乙较稳定.题型一频率分布直方图的绘制与应用例1 (2015·课标全国Ⅱ)某公司为了解用户对其产品的满意度,从A,B两地区分别随机调查了40个用户,根据用户对产品的满意度评分,得到A地区用户满意度评分的频率分布直方图和B地区用户满意度评分的频数分布表.A地区用户满意度评分的频率分布直方图图①B地区用户满意度评分的频数分布表(1)评分的平均值及分散程度(不要求计算出具体值,给出结论即可).B地区用户满意度评分的频率分布直方图图②(2)根据用户满意度评分,将用户的满意度分为三个等级:解(1)如图所示.通过两地区用户满意度评分的频率分布直方图可以看出,B地区用户满意度评分的平均值高于A地区用户满意度评分的平均值;B地区用户满意度评分比较集中,而A地区用户满意度评分比较分散.(2)A地区用户的满意度等级为不满意的概率大.记C A表示事件:“A地区用户的满意度等级为不满意”;C B表示事件:“B地区用户的满意度等级为不满意”.由直方图得P(C A)的估计值为(0.01+0.02+0.03)×10=0.6,P(C B)的估计值为(0.005+0.02)×10=0.25.所以A地区用户的满意度等级为不满意的概率大.思维升华(1)明确频率分布直方图的意义,即图中的每一个小矩形的面积是数据落在该区间上的频率,所有小矩形的面积和为1.(2)对于统计图表类题目,最重要的是认真观察图表,从中提炼有用的信息和数据.(1)(2014·山东改编)为了研究某药品的疗效,选取若干名志愿者进行临床试验,所有志愿者的舒张压数据(单位:kPa)的分组区间为[12,13),[13,14),[14,15),[15,16),[16,17],将其按从左到右的顺序分别编号为第一组,第二组,…,第五组,如图是根据试验数据制成的频率分布直方图.已知第一组与第二组共有20人,第三组中没有疗效的有6人,则第三组中有疗效的人数为________.答案12解析志愿者的总人数为200.16+0.24×1=50,所以第三组人数为50×0.36=18,有疗效的人数为18-6=12.(2)某校从参加高一年级期中考试的学生中随机抽出60名学生,将其物理成绩(均为整数)分成六段[40,50),[50,60),…,[90,100]后得到如图所示的频率分布直方图,观察图形的信息,回答下列问题:①求分数在[70,80)内的频率,并补全这个频率分布直方图;②统计方法中,同一组数据常用该组区间的中点值作为代表,据此估计本次考试中的平均分.解①设分数在[70,80)内的频率为x,根据频率分布直方图,有(0.010+0.015×2+0.025+0.005)×10+x=1,可得x=0.3,所以频率分布直方图如图所示.②平均分:45×0.1+55×0.15+65×0.15+75×0.3+85×0.25+95×0.05=71(分). 题型二 茎叶图的应用例2 (1)(2015·山东)为比较甲、乙两地某月14时的气温情况,随机选取该月中的5天,将这5天中14时的气温数据(单位:℃)制成如图所示的茎叶图.考虑以下结论:①甲地该月14时的平均气温低于乙地该月14时的平均气温; ②甲地该月14时的平均气温高于乙地该月14时的平均气温; ③甲地该月14时的气温的标准差小于乙地该月14时的气温的标准差; ④甲地该月14时的气温的标准差大于乙地该月14时的气温的标准差. 其中根据茎叶图能得到的统计结论的编号为________.(2)以下茎叶图记录了甲、乙两组各五名学生在一次英语听力测试中的成绩(单位:分).已知甲组数据的中位数为15,乙组数据的平均数为16.8,则x ,y 的值分别为__________. 答案 (1)①④ (2)5,8解析 (1)甲地5天的气温为:26,28,29,31,31, 其平均数为x 甲=26+28+29+31+315=29;方差为s 2甲=15[(26-29)2+(28-29)2+(29-29)2+(31-29)2+(31-29)2]=3.6;标准差为s 甲= 3.6.乙地5天的气温为:28,29,30,31,32,其平均数为x 乙=28+29+30+31+325=30;方差为s 2乙=15[(28-30)2+(29-30)2+(30-30)2+(31-30)2+(32-30)2]=2;标准差为s 乙= 2. ∴x 甲<x 乙,s 甲>s 乙.(2)由茎叶图及已知得x =5,又乙组数据的平均数为16.8,即9+15+10+y +18+245=16.8,解得y =8. 引申探究1.本例(2)中条件不变,试比较甲、乙两组哪组成绩较好. 解 由原题可知x =5,则甲组平均分为9+12+15+24+275=17.4.而乙组平均分为16.8,所以甲组成绩较好.2.在本例(2)条件下:①求乙组数据的中位数、众数;②求乙组数据的方差. 解 ①由茎叶图知,乙组中五名学生的成绩为9,15,18,18,24. 故中位数为18,众数为18.②s 2=15[(9-16.8)2+(15-16.8)2+(18-16.8)2×2+(24-16.8)2]=23.76.思维升华 茎叶图的优缺点由茎叶图可以清晰地看到数据的分布情况,这一点同频率分布直方图类似.它优于频率分布直方图的第一点是从茎叶图中能看到原始数据,没有任何信息损失,第二点是茎叶图便于记录和表示.其缺点是当样本容量较大时,作图较烦琐.(2014·课标全国Ⅱ)某市为了考核甲,乙两部门的工作情况,随机访问了50位市民.根据这50位市民对这两部门的评分(评分越高表明市民的评价越高),绘制茎叶图如下:(1)分别估计该市的市民对甲,乙两部门评分的中位数; (2)分别估计该市的市民对甲,乙两部门的评分高于90的概率; (3)根据茎叶图分析该市的市民对甲,乙两部门的评价.解 (1)由所给茎叶图知,50位市民对甲部门的评分由小到大排序,排在第25,26位的是75,75,故样本中位数为75,所以该市的市民对甲部门评分的中位数的估计值是75. 50位市民对乙部门的评分由小到大排序,排在第25,26位的是66,68,故样本中位数为66+682=67,所以该市的市民对乙部门评分的中位数的估计值是67.(2)由所给茎叶图知,50位市民对甲,乙部门的评分高于90的比率分别为550=0.1,850=0.16,故该市的市民对甲,乙部门的评分高于90的概率的估计值分别为0.1,0.16.(3)由所给茎叶图知,市民对甲部门的评分的中位数高于对乙部门的评分的中位数,而且由茎叶图可以大致看出对甲部门的评分的标准差要小于对乙部门的评分的标准差,说明该市市民对甲部门的评价较高、评价较为一致,对乙部门的评价较低、评价差异较大.(注:考生利用其他统计量进行分析,结论合理的同样给分.) 题型三 用样本的数字特征估计总体的数字特征例3 甲、乙二人参加某体育项目训练,近期的五次测试成绩得分情况如图.(1)分别求出两人得分的平均数与方差;(2)根据图和上面算得的结果,对两人的训练成绩作出评价. 解 (1)由题图象可得甲、乙两人五次测试的成绩分别为 甲:10分,13分,12分,14分,16分; 乙:13分,14分,12分,12分,14分.x 甲=10+13+12+14+165=13;x 乙=13+14+12+12+145=13,s 2甲=15[(10-13)2+(13-13)2+(12-13)2+(14-13)2+(16-13)2]=4;s 2乙=15[(13-13)2+(14-13)2+(12-13)2+(12-13)2+(14-13)2]=0.8.(2)由s 2甲>s 2乙可知乙的成绩较稳定.从折线图看,甲的成绩基本呈上升状态,而乙的成绩上下波动,可知甲的成绩在不断提高,而乙的成绩则无明显提高.思维升华 平均数与方差都是重要的数字特征,是对总体的一种简明的描述,它们所反映的情况有着重要的实际意义,平均数、中位数、众数描述其集中趋势,方差和标准差描述其波动大小.(2015·广东)某工厂36名工人的年龄数据如下表.(1)年龄数据为44,列出样本的年龄数据; (2)计算(1)中样本的均值x 和方差s 2;(3)36名工人中年龄在x -s 与x +s 之间的有多少人?所占的百分比是多少(精确到0.01%)?解 (1)44,40,36,43,36,37,44,43,37.(2)x =44+40+36+43+36+37+44+43+379=40.s 2=19[(44-40)2+(40-40)2+(36-40)2+(43-40)2+(36-40)2+(37-40)2+(44-40)2+(43-40)2+(37-40)2]=1009.(3)40-103=1103,40+103=1303在⎝ ⎛⎭⎪⎫1103,1303的有23个,占63.89%.9.高考中频率分布直方图的应用典例 (14分)(2015·广东)某城市100户居民的月平均用电量(单位:度),以[160,180),[180,200),[200,220),[220,240),[240,260),[260,280),[280,300]分组的频率分布直方图如图.(1)求直方图中x 的值;(2)求月平均用电量的众数和中位数;(3)在月平均用电量为[220,240),[240,260),[260,280),[280,300]的四组用户中,用分层抽样的方法抽取11户居民,则月平均用电量在[220,240)的用户中应抽取多少户? 规范解答解 (1)由(0.002+0.009 5+0.011+0.012 5+x +0.005+0.002 5)×20=1得:x =0.007 5, 所以直方图中x 的值是0.007 5.[3分](2)月平均用电量的众数是220+2402=230.[4分]因为(0.002+0.009 5+0.011)×20=0.45<0.5,所以月平均用电量的中位数在[220,240)内,设中位数为a ,由(0.002+0.009 5+0.011)×20+0.012 5×(a -220)=0.5得:a =224,所以月平均用电量的中位数是224.[8分](3)月平均用电量为[220,240)的用户有0.012 5×20×100=25(户),月平均用电量为[240,260)的用户有0.007 5×20×100=15(户),月平均用电量为[260,280)的用户有0.005×20×100=10(户),月平均用电量为[280,300]的用户有0.002 5×20×100=5(户),抽取比例=1125+15+10+5=15,所以月平均用电量在[220,240)的用户中应抽取25×15=5(户).[14分]温馨提醒本题的难点是对频率分布直方图意义的理解以及利用这个图提供的数据对所提问题的计算,频率分布直方图中纵轴上的数据是频率除以组距,组距越大该数据越小,在解答这类问题时要特别注意.[方法与技巧]1.用样本频率分布来估计总体分布的重点是频率分布表和频率分布直方图的绘制及用样本频率分布估计总体分布;难点是频率分布表和频率分布直方图的理解及应用.在计数和计算时一定要准确,在绘制小矩形时,宽窄要一致.通过频率分布表和频率分布直方图可以对总体作出估计.2.茎叶图、频率分布表和频率分布直方图都是用来描述样本数据的分布情况的.茎叶图由所有样本数据构成,没有损失任何样本信息,可以随时记录;而频率分布表和频率分布直方图则损失了样本的一些信息,必须在完成抽样后才能制作.3.若取值x1,x2,…,x n的频率分别为p1,p2,…,p n,则其平均值为x1p1+x2p2+…+x n p n;若x1,x2,…,x n的平均数为x,方差为s2,则ax1+b,ax2+b,…,ax n+b的平均数为a x +b,方差为a2s2.[失误与防范]频率分布直方图的纵坐标为频率/组距,每一个小长方形的面积表示样本个体落在该区间内的频率;条形图的纵坐标为频数或频率,把直方图视为条形图是常见的错误.A组专项基础训练(时间:40分钟)1.下图是某公司10个销售店某月销售某产品数量(单位:台)的茎叶图,则数据落在区间[22,30)内的频率为________.答案0.4解析10个数据落在区间[22,30)内的数据有22,22,27,29,共4个,因此,所求的频率为410=0.4.2.(2014·陕西改编)某公司10位员工的月工资(单位:元)为x1,x2,…,x10,其均值和方差分别为x和s2,若从下月起每位员工的月工资增加100元,则这10位员工下月工资的均值和方差分别为____________.答案x+100,s2解析x1+x2+…+x1010=x,y i=x i+100,所以y1,y2,…,y10的均值为x+100,方差不变.3.某班的全体学生参加英语测试,成绩的频率分布直方图如图,数据的分组依次为[20,40),[40,60),[60,80),[80,100].若低于60分的人数是15,则该班的学生人数是________.答案50解析由频率分布直方图,知低于60分的频率为(0.01+0.005)×20=0.3.∴该班学生人数n=150.3=50.4.在某次测量中得到的A样本数据如下:42,43,46,52,42,50,若B样本数据恰好是A样本数据每个都减5后所得数据,则A,B两样本的数字特征对应相同的是__________.答案标准差解析利用平均数、标准差、众数、中位数等统计特征数的概念求解.由B样本数据恰好是A样本数据每个都减5后所得数据,可得平均数、众数、中位数分别是原来结果减去5,即与A样本不相同,标准差不变.5.如图是某青年歌手大奖赛上七位评委为甲、乙两名选手打出的分数的茎叶图(其中m为数字0~9中的一个),去掉一个最高分和一个最低分后,甲、乙两名选手得分的平均数分别为a1、a2,则一定有________.①a1>a2②a2>a1③a1=a2④a1,a2的大小与m的值有关答案②解析去掉一个最高分和一个最低分后,甲选手叶上的数字之和是20,乙选手叶上的数字之和是25,故a2>a1.6.样本中共有五个个体,其值分别为a,0,1,2,3.若该样本的平均值为1,则样本方差为___________. 答案 2解析 由题意可知样本的平均值为1,所以a +0+1+2+35=1,解得a =-1,所以样本的方差为15[(-1-1)2+(0-1)2+(1-1)2+(2-1)2+(3-1)2]=2.7.将某选手的9个得分去掉1个最高分,去掉1个最低分,7个剩余分数的平均分为91.现场作的9个分数的茎叶图后来有1个数据模糊,无法辨认,在图中以x 表示:则7个剩余分数的方差为________. 答案367解析 由题意知87+94+90+91+90+90+x +917=91,解得x =4.所以s 2=17[(87-91)2+(94-91)2+(90-91)2+(91-91)2+(90-91)2+(94-91)2+(91-91)2] =17(16+9+1+0+1+9+0)=367. 8.从某小学随机抽取100名学生,将他们的身高(单位:厘米)数据绘制成频率分布直方图(如图).由图中数据可知a =____________.若要从身高在[120,130),[130,140),[140,150]三组内的学生中,用分层抽样的方法选取18人参加一项活动,则从身高在[140,150]内的学生中选取的人数应为________.答案 0.030 3解析 ∵小矩形的面积等于频率,∴除[120,130)外的频率和为0.700,∴a =1-0.70010=0.030.由题意知,身高在[120,130),[130,140),[140,150]内的学生分别为30人,20人,10人,∴由分层抽样可知抽样比为1860=310,∴在[140,150]中选取的学生应为3人.9.某校高一某班的某次数学测试成绩(满分为100分)的茎叶图和频率分布直方图都受了不同程度的破坏,但可见部分如图,据此解答下列问题:(1)求分数在[50,60]的频率及全班人数;(2)求分数在[80,90]之间的频数,并计算频率分布直方图中[80,90]间的矩形的高. 解 (1)分数在[50,60]的频率为0.008×10=0.08. 由茎叶图知,分数在[50,60]之间的频数为2, 所以全班人数为20.08=25.(2)分数在[80,90]之间的频数为25-2-7-10-2=4,频率分布直方图中[80,90]间的矩形的高为425÷10=0.016.10.某工厂对一批产品进行了抽样检测.如图是根据抽样检测后的产品净重(单位:克)数据绘制的频率分布直方图,其中产品净重的范围是[96,106],样本数据分组为[96,98),[98,100),[100,102),[102,104),[104,106],已知样本中产品净重小于100克的个数是36.(1)求样本容量及样本中净重大于或等于98克并且小于104克的产品的个数;(2)已知这批产品中每个产品的利润y (单位:元)与产品净重x (单位:克)的关系式为y =⎩⎪⎨⎪⎧3,96≤x <98,5,98≤x <104,4,104≤x ≤106,求这批产品平均每个的利润.解 (1)产品净重小于100克的频率为(0.050+0.100)×2=0.300.设样本容量为n . ∵样本中产品净重小于100克的个数是36, ∴36n=0.300,∴n =120.∵样本中净重大于或等于98克并且小于104克的产品的频率为(0.100+0.150+0.125)×2=0.750,∴样本中净重大于或等于98克并且小于104克的产品的个数是120×0.750=90.(2)产品净重在[96,98),[98,104),[104,106]内的频率分别为0.050×2=0.100,(0.100+0.150+0.125)×2=0.750,0.075×2=0.150,∴其相应的频数分别为120×0.100=12,120×0.750=90,120×0.150=18, ∴这批产品平均每个的利润为1120×(3×12+5×90+4×18)=4.65(元). B 组 专项能力提升 (时间:30分钟)11.某学校随机抽取20个班,调查各班中有网上购物经历的人数,所得数据的茎叶图如图所示,以组距为5将数据分组成[0,5),[5,10),…,[30,35),[35,40]时,所作的频率分布直方图是________.答案①解析由于频率分布直方图的组距为5,排除③、④,又[0,5),[5,10)两组各一人,排除②,①符合条件,故①正确.12.(2014·江苏)为了了解一片经济林的生长情况,随机抽测了其中60株树木的底部周长(单位:cm),所得数据均在区间[80,130]上,其频率分布直方图如图所示,则在抽测的60株树木中,有________株树木的底部周长小于100 cm.答案24解析底部周长在[80,90)的频率为0.015×10=0.15,底部周长在[90,100)的频率为0.025×10=0.25,样本容量为60,所以树木的底部周长小于100 cm的株数为(0.15+0.25)×60=24. 13.(2015·湖北)某电子商务公司对10 000名网络购物者2014年度的消费情况进行统计,发现消费金额(单位:万元)都在区间[0.3,0.9]内,其频率分布直方图如图所示.(1)直方图中的a=________;(2)在这些购物者中,消费金额在区间[0.5,0.9]内的购物者的人数为________.答案(1)3 (2)6 000解析由频率分布直方图及频率和等于1可得0.2×0.1+0.8×0.1+1.5×0.1+2×0.1+2.5×0.1+a×0.1=1,解得a=3.于是消费金额在区间[0.5,0.9]内频率为0.2×0.1+0.8×0.1+2×0.1+3×0.1=0.6,所以消费金额在区间[0.5,0.9]内的购物者的人数为:0.6×10 000=6 000,故应填3,6 000.14.若某产品的直径长与标准值的差的绝对值不超过1 mm时,则视为合格品,否则视为不合格品.在近期一次产品抽样检查中,从某厂生产的此种产品中,随机抽取5 000件进行检测,结果发现有50件不合格品.计算这50件不合格品的直径长与标准值的差(单位:mm),将所得数据分组,得到如下频率分布表:(1)(2)估计该厂生产的此种产品中,不合格品的直径长与标准值的差落在区间(1,3]内的概率;(3)现对该厂这种产品的某个批次进行检查,结果发现有20件不合格品.据此估算这批产品中的合格品的件数.解(1)如下表所示频率分布表.(2)由频率分布表知,(1,3]内的概率约为0.50+0.20=0.70.(3)设这批产品中的合格品数为x件,依题意505 000=20x+20,解得x=5 000×2050-20=1 980.所以该批产品的合格品件数是1 980. 15.(2014·广东)某车间20名工人年龄数据如下表:(1)求这20(2)以十位数为茎,个位数为叶,作出这20名工人年龄的茎叶图;(3)求这20名工人年龄的方差.解(1)这20名工人年龄的众数为:30;这20名工人年龄的极差为:40-19=21.(2)以十位数为茎,个位数为叶,作出这20名工人年龄的茎叶图如下:(3)这20名工人年龄的平均数为:(19+28×3+29×3+30×5+31×4+32×3+40)÷20=30;所以这20名工人年龄的方差为:1 20(30-19)2+320(30-28)2+320(30-29)2+520(30-30)2+420(30-31)2+320(30-32)2+120(30-40)2=12.6.。
高考数学一轮复习 第十一章 统计与统计案例 第2讲 用样本估计总体练习 理 新人教A版
【创新设计】(全国通用)2017版高考数学一轮复习 第十一章 统计与统计案例 第2讲 用样本估计总体练习 理 新人教A 版x 基础巩固题组(建议用时:30分钟)一、选择题1.(2015·重庆卷)重庆市2013年各月的平均气温(°C)数据的茎叶图如下:则这组数据的中位数是( ) A.19B.20C.21.5D.23解析 从茎叶图知所有数据为8,9,12,15,18,20,20,23,23,28,31,32,中间两个数为20,20,故中位数为20,选B. 答案 B2.如图是一容量为100的样本的质量的频率分布直方图,样本质量均在[5,20]内,其分组为[5,10),[10,15),[15,20],则样本质量落在[15,20]内的频数为( ) A.10 B.20C.30D.40解析 由题意得组距为5,故样本质量在[5,10),[10,15)内的频率分别为0.3和0.5,所以样本质量在[15,20]内的频率为1-0.3-0.5=0.2,频数为100×0.2=20,故选B. 答案 B3.某公司10位员工的月工资(单位:元)为x 1,x 2,…,x 10,其均值和方差分别为x 和s 2,若从下月起每位员工的月工资增加100元,则这10位员工下月工资的均值和方差分别为( )A. x ,s 2+1002B. x +100,s 2+1002C. x ,s 2D. x +100,s 2解析 x =x 1+x 2+…+x 1010,s 2=110[(x 1-x )2+(x 2-x )2+…+(x 10-x )2],月工资增加100元后:x ′=(x 1+100)+(x 2+100)+…+(x 10+100)10=x 1+x 2+…+x 1010+100=x +100,s ′2=110[(x ′+100-x ′)2+(x 2+100-x ′)2+…+(x 10+100-x ′)2]=s 2.故选D.答案 D4.(2016·郑州质量检测)已知甲、乙两组数据如茎叶图所示,若它们的中位数相同,平均数也相同,则m n=( )A.1B.13C.29D.38解析 由题中茎叶图可知甲的数据为27、30+m 、39,乙的数据为20+n 、32、34、38.由此可知乙的中位数是33,所以甲的中位数也是33,所以m =3.由此可以得出甲的平均数为33,所以乙的平均数也为33,所以有20+n +32+34+384=33,所以n =8,所以mn =38,所以选D. 答案 D5.为了普及环保知识,增强环保意识,某大学随机抽取30名学生参加环保知识测试,得分(十分制)如图所示,假设得分值的中位数为m e ,众数为m o ,平均值为x ,则( )A.m e =m o =xB.m e =m o <xC.m e <m o <xD.m o <m e <x解析 30个数中第15个数是5,第16个数是6,所以中位数m e =5+62=5.5,众数m o =5,平均值x =3×2+4×3+5×10+6×6+7×3+8×2+9×2+10×230=17930.∴m o <m e <x .答案 D 二、填空题6.(2016·南昌模拟)若1,2,3,4,m 这五个数的平均数为3,则这五个数的方差为________. 解析 ∵这5个数的平均数为3,∴1+2+3+4+m5=3,∴m =5.故方差为2.答案 27.在样本频率分布直方图中,共有5个小长方形,已知中间一个小长方形的面积是其余4个小长方形面积之和的13,且中间一组的频数为10,则这个样本的容量是________.解析 设中间小长方形的面积为S ,则S =13(1-S ),解得S =14,即中间一组的频率为14.又中间一组的频数为10,所以样本容量=频数频率=1014=40.答案 408.某企业3个分厂同时生产同一种电子产品,第一、二、三分厂的产量之比为1∶2∶1,用分层抽样方法(每个分厂的产品为一层)从3个分厂生产的电子产品中共取100件作使用寿命的测试,由所得的测试结果算得从第一、二、三分厂取出的产品的使用寿命的平均值分别为980 h ,1 020 h ,1 032 h ,则抽取的100件产品的使用寿命的平均值为________h. 解析 依题意,抽取的100件产品来自于第一、二、三分厂分别有25,50,25件,因此抽取的100件产品的使用寿命的平均值为1100(980×25+1 032×25+1 020×50)=1 013(h). 答案 1 013 三、解答题9.某校高一某班的某次数学测试成绩(满分为100分)的茎叶图和频率分布直方图都受了不同程度的破坏,但可见部分如图,据此解答下列问题:(1)求分数在[50,60]的频率及全班人数;(2)求分数在[80,90]之间的频数,并计算频率分布直方图中[80,90]间的矩形的高. 解 (1)分数在[50,60]的频率为0.008×10=0.08.由茎叶图知,分数在[50,60]之间的频数为2,所以全班人数为20.08=25.(2)分数在[80,90]之间的频数为25-2-7-10-2=4,频率分布直方图中[80,90]间的矩形的高为425÷10=0.016.10.某城市100户居民的月平均用电量(单位:度),以[160,180),[180,200),[200,220),[220,240),[240,260),[260,280),[280,300]分组的频率分布直方图如图.(1)求直方图中x 的值;(2)求月平均用电量的众数和中位数;(3)在月平均用电量为[220,240),[240,260),[260,280),[280,300]的四组用户中,用分层抽样的方法抽取11户居民,则月平均用电量在[220,240)的用户中应抽取多少户? 解 (1)依题意,20×(0.002+0.009 5+0.011+0.012 5+x +0.005+0.002 5)=1,解得x =0.007 5.(2)由图可知,最高矩形的数据组为[220,240), ∴众数为220+2402=230.∵[160,220)的频率之和为(0.002+0.009 5+0.011)×20=0.45,∴依题意,设中位数为y ,∴0.45+(y -220)×0.012 5=0.5.解得y =224, ∴中位数为224.(3)月平均用电量在[220,240)的用户在四组用户中所占比例为 0.012 50.012 5+0.007 5+0.005+0.002 5=511,∴月平均用电量在[220,240)的用户中应抽取11×511=5(户).能力提升题组(建议用时:20分钟)11.某高校进行自主招生,先从报名者中筛选出400人参加笔试,再按笔试成绩择优选出100人参加面试.现随机调查了24名笔试者的成绩,如下表所示: 分数段 [60,65)[65,70)[70,75)[75,80)[80,85)[85,90]人数234951A.75B.80C.85D.90解析 因为参加笔试的400人中择优选出100人,故每个人被择优选出的概率P =100400=14,因为随机调查24名笔试者,则估计能够参加面试的人数为24×14=6,观察表格可知,分数在[80,85)有5人,分数在[85,90)的有1人,故面试的分数线大约为80分,故选B. 答案 B12.为了了解某校九年级1 600名学生的体能情况,随机抽查了部分学生,测试1分钟仰卧起坐的成绩(次数),将数据整理后绘制成如图所示的频率分布直方图,根据统计图的数据,下列结论错误的是( )A.该校九年级学生1分钟仰卧起坐的次数的中位数为26.25次B.该校九年级学生1分钟仰卧起坐的次数的众数为27.5次C.该校九年级学生1分钟仰卧起坐的次数超过30次的人数约有320人D.该校九年级学生1分钟仰卧起坐的次数少于20次的人数约有32人解析 由题图可知中位数是26.25次,众数是27.5次,1分钟仰卧起坐的次数超过30次的频率为0.2,所以估计该校九年级学生1分钟仰卧起坐的次数超过30次的人数约有320人;1分钟仰卧起坐的次数少于20次的频率为0.1,所以该校九年级学生1分钟仰卧起坐的次数少于20次的人数约有160人.故D 是错误的,选D. 答案 D13.在样本的频率分布直方图中,共有4个小长方形,这4个小长方形的面积由小到大构成等比数列{a n },已知a 2=2a 1,且样本容量为300,则小长方形面积最大的一组的频数为________.解析 ∵小长方形的面积由小到大构成等比数列{a n },且a 2=2a 1,∴样本的频率构成一个等比数列,且公比为2,∴a1+2a1+4a1+8a1=15a1=1,∴a1=1 15,∴小长方形面积最大的一组的频数为300×8a1=160.答案16014.从某企业生产的某种产品中抽取100件,测量这些产品的一项质量指标值,由测量结果得如下频数分布表:质量指标值分组[75,85) [85,95) [95,105) [105,115) [115,125) 频数62638228(2)估计这种产品质量指标值的平均数及方差(同一组中的数据用该组区间的中点值作代表);(3)根据以上抽样调查数据,能否认为该企业生产的这种产品符合“质量指标值不低于95的产品至少要占全部产品80%”的规定?解(1)(2)质量指标值的样本平均数为x=80×0.06+90×0.26+100×0.38+110×0.22+120×0.08=100.质量指标值的样本方差为s2=(-20)2×0.06+(-10)2×0.26+0×0.38+102×0.22+202×0.08=104.所以这种产品质量指标值的平均数的估计值为100,方差的估计值为104.(3)质量指标值不低于95的产品所占比例的估计值为0.38+0.22+0.08=0.68.由于该估计值小于0.8,故不能认为该企业生产的这种产品符合“质量指标值不低于95的产品至少要占全部产品80%”的规定.。
高考数学一轮复习 第十一章 统计与统计案例、算法 113 变量间的相关关系、统计案例课件 文
12/13/2021
第十一页,共八十一页。
2×2 列联表
x1 x2 总计
y1 a c a+c
y2 b d b+d
总计 a+b c+d a+b+c+d
K2=a+ban+adc-bb+cd2 c+d(其中 n= a+b+c+d
为
样本容量),则利用独立性检验判断表来判断“X 与 Y 的关系”.
12/13/2021
[答案] C
12/13/2021
第十四页,共八十一页。
2.已知变量 x 与 y 正相关,且由观测数据算得样本平均数-x =3,-y =3.5,则由该观测数据算得的线性回归方程可能是( )
A.^y=0.4x+2.3 B.^y=2x-2.4 C.^y=-2x+9.5 D.^y=-0.3x+4.4
12/13/2021
12/13/2021
第十七页,共八十一页。
A.线性相关关系较强,b^的值为 3.25 B.线性相关关系较强,b^的值为 0.83 C.线性相关关系较强,b^的值为-0.87 D.线性相关关系太弱,无研究价值 [解析] 依题意,注意到题中相关的点均集中在某条直线的 附近,且该直线的斜率小于 1,结合各选项知,故选 B.
12/13/2021
第五页,共八十一页。
2.两个变量线性相关 (1)从散点图上看,如果这些点从整体上看大致分布在一条直 线附近,则称这两个变量之间具有线性相关关系,这条直线叫
回归直线.
(2)回归方程 ①最小二乘法:使得样本数据的点到回归直线的 距离的平方和 最小的方法叫最小二乘法.
12/13/2021
12/13/2021
第三页,共八十一页。
吃透教材 夯双基
填一填 页,共八十一页。
高三数学一轮复习第十一章统计统计案例第二节用样本估计总体课件理
A.30辆 B.40辆
C.60辆 D.80辆
答案 B 从频率分布直方图可知,车速大于或等于70 km/h的频率为
0.02×10=0.2,而样本容量为200,所以被处罚的汽车约有200×0.2=40辆.
4.如图是某班8位学生诗词比赛得分的茎叶图,那么这8位学生得分的众
数和中位数分别为
答案 93,92
.
866 9013336
解析 依题意,结合茎叶图,将题中的数由小到大依次排列得到:86,86,
90,91,93,93,93,96,因此这8位学生得分的众数是93,中位数是 9 1 = 9923 .
2
5.某学员在一次射击测试中射靶10次,命中环数如下:7,8,7,9,5,4,9,10,7,4.
(1)平均命中环数为
频 率
横轴表示样本数据,纵轴表示④ 组 距 ,每个小矩形的面积表示样本
落在该组内的⑤ 频率 . (3)茎叶图的画法: 第一步:将每个数据分为茎(高位)和叶(低位)两部分; 第二步:将各个数据的茎按⑥ 大小 次序排成一列; 第三步:将各个数据的叶依次写在其茎的右(左)侧.
2.样本的数字特征 (1)众数、中位数、平均数
理数
课标版
第二节 用样本估计总体
教材研读
1.常用统计图表 (1)频率分布表的画法:
极 差
第一步:求① 值所在区间取左闭右开区间,最后一 组取闭区间; 第三步:登记频数,计算频率,列出频率分布表.
(2)频率分布直方图:反映样本频率分布的直方图.
s=⑩
1 n[(x1 . x)2(x2x)2 (xnx)2]
(ii)方差:标准差的平方s2叫做方差.
1
s2= n [(xx1- )2+(xx2- )2+…+x(xn- )2] ,其中xi(i=1,2,3,…,n)是 样本数
人教A版高考总复习一轮数学精品课件 第十一章 解答题专项 概率与统计中的综合问题
条件的矩形比较多,也可以用对立事件的概率公式求解;
(3)分别计算“任选1人年龄位于区间[40,50)的概率”和“任选1人年龄位于区
间[40,50)且患这种疾病的概率”,根据条件概率公式计算.
规律方法 频率分布直方图、条形图等是考查数据收集和整理的常用依据,
掌握图中常见数据的提取方法,将频率看作概率是解决这类问题的关键.
=(5×0.001+15×0.002+25×0.012+35×0.017+45×0.023+55×0.020+65×0.017
+75×0.006+85×0.002)×10=47.9(岁). .............................................................3 分
2
∑ ( -)
=1
^
^
= − .
6
6
=1
=1
参考数据: ∑ xiyi=4 066, ∑ 2 =434.2.
∑ -
= =1
∑ 2 -
=1
2
,
解 (1)(ⅰ) =
8+8.2+8.4+8.6+8.8+9
=8.5,
6
=
90+84+83+80+75+68
=
C 38
0,1,2,3,P(ξ=0)=C 3
11
=
56
C 28 C 13
,P(ξ=1)=
165
C 311
=
故 ξ 的分布列为
故
ξ
0
1
2
高考数学一轮复习第十一章统计与统计案例2用样本估计总体课件新人教A版2
;b.决定组距与
组数;c. 将数据分组
;d.列频率分布表;e.画频率分布直方
图.
-3知识梳理
双基自测
(3)总体密度曲线
①频率分布折线图:连接频率分布直方图中各小长方形上端的中
点,就得到频率分布折线图.
②总体密度曲线:随着样本容量的增加,作图时所分的组数增加,
底部周长(单位:cm),所得数据均在区间[80,130]上,其频率分布直方
24
图如图所示,则在抽测的60株树木中,有
株树木的底部
周长小于100 cm.
解析 由题意知,在抽测的60株树木中,底部周长小于100 cm的株
数为(0.015+0.025)×10×60=24.
-11考点1
考点2
考点3
考点 1
组距减小,相应的频率分布折线图会越来越接近于一条光滑曲线,
统计中称这条光滑曲线为总体密度曲线.总体密度曲线反映了总体
在各个范围内取值的百分比,它能提供更加精细的信息.
(4)茎叶图:茎叶图中茎是指 中间 的一列数,叶是从茎的 旁边
生长出来的数.当样本数据较少时,用茎叶图表示数据的效果较好,
它不但可以保留所有信息,而且可以随时记录,给数据的记录和表
月平均用电量在[260,280)的用户有0.005×20×100=10(户),
月平均用电量在[280,300]的用户有0.002 5×20×100=5(户),抽
11
1
= ,
取比例为
25+15+10+5
5
所以月平均用电量在[220,240)的用户中应抽取25×
1
5 =5(户).
-14考点1
高考数学一轮复习第11章统计统计案例第3节变量间的相关关系统计案例课件文新人教A版
3.某公司在 2019 年上半年的收入 x(单位:万元)与月支出 y(单位:万元)的统计资料 如下表所示:
月份 1 月份 2 月份 3 月份 4 月份 5 月份 6 月份 收入 x 12.3 14.5 15.0 17.0 19.8 20.6 支出 y 5.63 5.75 5.82 5.89 6.11 6.18 根据统计资料,则( ) A.月收入的中位数是 15,x 与 y 有正线性相关关系 B.月收入的中位数是 17,x 与 y 有负线性相关关系 C.月收入的中位数是 16,x 与 y 有正线性相关关系 D.月收入的中位数是 16,x 与 y 有负线性相关关系
4.(选修 2-3P81 例 1 改编)某车间为了规定工时定额,需要确定加工零件所花费的时
间,为此进行了 5 次试验.根据收集到的数据(如下表),由最小二乘法求得回归方程^y=
0.67x+54.9.
零件数 x(个) 10 20 30 40 50
加工时间 y(min) 62
75 81 89
现发现表中有一个数据看不清,请你推断出该数据的值为________.
归方程进行预测,独立性 2.数学运算 3.了解回归分析的基本思想、方法及简单应用.
检验的应用等.此节必考 4.了解独立性检验的基本思想、方法及其初步
一个解答题,选择题、填 应用.
空题中也会出现.
1
课 前 ·基 础 巩 固
‖知识梳理‖ 1.相关关系与回归分析 回归分析是对具有相关关系的两个变量进行统计分析的一种常用方法;判断相关性 的常用统计图是: 1 _散__点__图____;统计量有相关系数与相关指数. (1)在散点图中,点散布在从 2 __左__下__角___到 3 _右__上__角____的区域,对于两个变量的这 种相关关系,我们将它称为正相关. (2)在散点图中,点散布在从 4 _左__上__角____到 5 _右__下__角____的区域,两个变量的这种相 关关系称为负相关.
【3份】2017高考数学北师大版(理)一轮复习第11章 统计与统计案例
【3份】2017高考数学北师大版(理)一轮复习第11章统计与统计案例目录1.抽样调查(1)抽样调查通常情况下,从调查对象中按照一定的方法抽取一部分,进行调查或观测,获取数据,并以此对调查对象的某项指标作出推断,这就是抽样调查.(2)总体和样本调查对象的全体称为总体,被抽取的一部分称为样本.(3)抽样调查与普查相比有很多优点,最突出的有两点:①迅速、及时;②节约人力、物力和财力.2.简单随机抽样(1)简单随机抽样时,要保证每个个体被抽到的概率相同.(2)通常采用的简单随机抽样的方法:抽签法和随机数法.3.分层抽样(1)定义:将总体按其属性特征分成若干类型(有时称作层),然后在每个类型中按照所占比例随机抽取一定的样本.这种抽样方法通常叫作分层抽样,有时也称为类型抽样.(2)分层抽样的应用范围:当总体是由差异明显的几个部分组成时,往往选用分层抽样.4.系统抽样系统抽样是将总体中的个体进行编号,等距分组,在第一组中按照简单随机抽样抽取第一个样本,然后按分组的间隔(称为抽样距)抽取其他样本.这种抽样方法有时也叫等距抽样或机械抽样.【思考辨析】判断下面结论是否正确(请在括号中打“√”或“×”)(1)简单随机抽样是一种不放回抽样.(√)(2)简单随机抽样每个个体被抽到的机会不一样,与先后有关.(×)(3)系统抽样在起始部分抽样时采用简单随机抽样.(√)(4)要从1002个学生中用系统抽样的方法选取一个容量为20的样本,需要剔除2个学生,这样对被剔除者不公平.(×)(5)分层抽样中,每个个体被抽到的可能性与层数及分层有关.(×)1.(教材改编)某公司有员工500人,其中不到35岁的有125人,35~49岁的有280人,50岁以上的有95人,为了调查员工的身体健康状况,从中抽取100名员工,则应在这三个年龄段分别抽取人数为()A.33人,34人,33人B.25人,56人,19人C.20人,40人,30人D.30人,50人,20人答案 B【详细分析】因为125∶280∶95=25∶56∶19,所以抽取人数分别为25人,56人,19人.2.(2015·四川)某学校为了了解三年级、六年级、九年级这三个年级之间的学生视力是否存在显著差异,拟从这三个年级中按人数比例抽取部分学生进行调查,则最合理的抽样方法是()A.抽签法B.系统抽样法C.分层抽样法D.随机数法答案 C【详细分析】根据年级不同产生差异及按人数比例抽取易知应为分层抽样法.3.将参加英语口语测试的1000名学生编号为000,001,002,…,999,从中抽取一个容量为50的样本,按系统抽样的方法分为50组,如果第一组编号为000,001,002,…,019,且第一组随机抽取的编号为015,则抽取的第35个编号为( ) A .700 B .669 C .695 D .676答案 C【详细分析】由题意可知,第一组随机抽取的编号l =15,分段间隔数k =N n =100050=20,则抽取的第35个编号为a 35=15+(35-1)×20=695.4.(教材改编)某公司共有1000名员工,下设若干部门,现采用分层抽样方法,从全体员工中抽取一个样本容量为80的样本,已告知广告部门被抽取了4个员工,则广告部门的员工人数为________. 答案 50【详细分析】100080=x4,x =50.5.某高中共有1200人,其中高一、高二、高三年级的人数依次成等差数列.现用分层抽样的方法从中抽取48人,那么高二年级被抽取的人数为________. 答案 16【详细分析】设高一、高二、高三年级的人数分别为a -d ,a ,a +d ,则有3a =1200,所以a =400,则高二年级被抽取的人数为48×4001200=16.题型一 简单随机抽样例1 (1)总体由编号为01,02,…,19,20的20个个体组成.利用下面的随机数表选取5个个体,选取方法是从随机数表第1行的第5列和第6列数字开始由左到右依次选取两个数字,则选出来的第5个个体的编号为( )A.08B .(2)下列抽取样本的方式不属于简单随机抽样的有________. ①从无限多个个体中抽取100个个体作为样本;②盒子里共有80个零件,从中选出5个零件进行质量检验.在抽样操作时,从中任意拿出一个零件进行质量检验后再把它放回盒子里; ③从20件玩具中一次性抽取3件进行质量检验;④某班有56名同学,指定个子最高的5名同学参加学校组织的篮球赛.答案(1)D(2)①②③④【详细分析】(1)由题意知前5个个体的编号为08,02,14,07,01.(2)①不是简单随机抽样.②不是简单随机抽样.由于它是放回抽样.③不是简单随机抽样.因为这是“一次性”抽取,而不是“逐个”抽取.④不是简单随机抽样.因为指定个子最高的5名同学是56名中特指的,不存在随机性,不是等可能抽样.思维升华应用简单随机抽样应注意的问题(1)一个抽样试验能否用抽签法,关键看两点:一是抽签是否方便;二是号签是否易搅匀.一般地,当总体容量和样本容量都较小时可用抽签法.(2)在使用随机数法时,如遇到三位数或四位数,可从选择的随机数表中的某行某列的数字计起,每三个或四个作为一个单位,自左向右选取,有超过总体号码或出现重复号码的数字舍去.下列抽样试验中,适合用抽签法的有()A.从某厂生产的5000件产品中抽取600件进行质量检验B.从某厂生产的两箱(每箱18件)产品中抽取6件进行质量检验C.从甲、乙两厂生产的两箱(每箱18件)产品中抽取6件进行质量检验D.从某厂生产的5000件产品中抽取10件进行质量检验答案 B【详细分析】A,D中的总体中个体数较多,不适宜抽签法,C中甲、乙两厂的产品质量有区别,也不适宜抽签法,故选B.题型二系统抽样例2(1)(2015·湖南)在一次马拉松比赛中,35名运动员的成绩(单位:分钟)的茎叶图如图所示若将运动员按成绩由好到差编为1~35号,再用系统抽样方法从中抽取7人,则其中成绩在区间[139,151]上的运动员人数是()A.3B.4C.5D.6(2)某单位有840名职工,现采用系统抽样方法抽取42人做问卷调查,将840人按1,2,…,840随机编号,则抽取的42人中,编号落入区间[481,720]的人数为()A .11B .12C .13D .14 答案 (1)B (2)B【详细分析】(1)由题意知,将1~35号分成7组,每组5名运动员,成绩落在区间[139,151]的运动员共有4组,故由系统抽样法知,共抽取4名.选B. (2)由84042=20,即每20人抽取1人,所以抽取编号落入区间[481,720]的人数为720-48020=24020=12. 引申探究1.本例(2)中条件不变,若第三组抽得的号码为44,则在第八组中抽得的号码是________. 答案 144【详细分析】在第八组中抽得的号码为(8-3)×20+44=144.2.本例(2)中条件不变,若在编号为[481,720]中抽取8人,则样本容量为________. 答案 28【详细分析】因为在编号[481,720]中共有720-480=240人,又在[481,720]中抽取8人, 所以抽样比应为240∶8=30∶1,又因为单位职工共有840人,所以应抽取的样本容量为84030=28.思维升华 (1)系统抽样适用的条件是总体容量较大,样本容量也较大.(2)使用系统抽样时,若总体容量不能被样本容量整除,可以先从总体中随机地剔除几个个体,从而确定分段间隔.(3)起始编号的确定应用简单随机抽样的方法,一旦起始编号确定,其他编号便随之确定.将参加夏令营的600名学生编号为001,002,…,600.采用系统抽样方法抽取一个容量为50的样本,且随机抽得的号码为003.这600名学生分住在三个营区,从001到300在第Ⅰ营区,从301到495在第Ⅱ营区,从496到600在第Ⅲ营区,三个营区被抽中的人数依次为( ) A .26,16,8 B .25,17,8 C .25,16,9 D .24,17,9答案 B【详细分析】由题意及系统抽样的定义可知,将这600名学生按编号依次分成50组,每一组各有12名学生,第k (k ∈N +)组抽中的号码是3+12(k -1). 令3+12(k -1)≤300得k ≤1034,因此第Ⅰ营区被抽中的人数是25; 令300<3+12(k -1)≤495得1034<k ≤42,因此第Ⅱ营区被抽中的人数是42-25=17.结合各选项知,选B. 题型三 分层抽样命题点1 求总体或样本容量例3 某工厂甲、乙、丙三个车间生产了同一种产品,数量分别为120件,80件,60件.为了解它们的产品质量是否存在显著差异,用分层抽样方法抽取了一个容量为n 的样本进行调查,其中从丙车间的产品中抽取了3件,则n 等于( ) A .9 B .10 C .12 D .13答案 D【详细分析】∵360=n 120+80+60,∴n =13.命题点2 求某层入样的个体数例4 (2015·福建)某校高一年级有900名学生,其中女生400名.按男女比例用分层抽样的方法,从该年级学生中抽取一个容量为45的样本,则应抽取的男生人数为________. 答案 25【详细分析】由题意知,男生共有500名,根据分层抽样的特点,在容量为45的样本中男生应抽取人数:45×500900=25.思维升华 分层抽样问题类型及解题思路(1)求某层应抽个体数量:按该层所占总体的比例计算.(2)已知某层个体数量,求总体容量或反之:根据分层抽样就是按比例抽样,列比例式进行计算.(3)确定是否应用分层抽样:分层抽样适用于总体中个体差异较大的情况.(1)(2014·广东)已知某地区中小学生人数和近视情况分别如图①和图②所示.为了解该地区中小学生的近视形成原因,用分层抽样的方法抽取2%的学生进行调查,则样本容量和抽取的高中生近视人数分别为( )A .200,20B .100,20C .200,10D .100,10(2)(2014·湖北)甲、乙两套设备生产的同类型产品共4800件,采用分层抽样的方法从中抽取一个容量为80的样本进行质量检测.若样本中有50件产品由甲设备生产,则乙设备生产的产品总数为________件. 答案 (1)A (2)1800【详细分析】(1)该地区中小学生总人数为 3500+2000+4500=10000,则样本容量为10000×2%=200,其中抽取的高中生近视人数为2000×2%×50%=20,故选A.(2)设乙设备生产的产品总数为x 件,则甲设备生产的产品总数为(4800-x )件.由分层抽样特点,结合题意可得5080=4800-x 4800,解得x =1800.五审图表找规律典例 (12分)某单位有2000名职工,老年、中年、青年分布在管理、技术开发、营销、生产各部门中,如下表所示:(1)若要抽取40(2)若要开一个25人的讨论单位发展与薪金调整方面的座谈会,则应怎样抽选出席人? (3)若要抽20人调查对广州亚运会举办情况的了解,则应怎样抽样?抽取40人调查身体状况↓(观察图表中的人数分类统计情况) 样本人群应受年龄影响↓(表中老、中、青分类清楚,人数确定) 要以老、中、青分层,用分层抽样 ↓要开一个25人的座谈会 ↓(讨论单位发展与薪金调整)样本人群应受管理、技术开发、营销、生产方面的影响 ↓(表中管理、技术开发、营销、生产分类清楚,人数确定) 要以管理、技术开发、营销、生产人员分层,用分层抽样 ↓要抽20人调查对广州亚运会举办情况的了解可认为亚运会是大众体育盛会,一个单位人员对情,况了解相当将单位人员看作一个整体↓(从表中数据看总人数为2000人)人员较多,可采用系统抽样规范解答解(1)按老年、中年、青年分层,用分层抽样法抽取,[1分]抽取比例为402000=150.[2分]故老年人、中年人、青年人各抽取4人、12人、24人.[4分] (2)按管理、技术开发、营销、生产分层,用分层抽样法抽取,[5分]抽取比例为252000=180,[6分]故管理、技术开发、营销、生产各部门抽取2人、4人、6人、13人.[8分](3)用系统抽样,对全部2000人随机编号,号码从0001~2000,每100号分为一组,从第一组中用简单随机抽样抽取一个号码,然后将这个号码分别加100,200,…,1900,共20人组成一个样本.[12分]温馨提醒(1)本题审题的关键有两点,一是对图表中的人员分类情况和数据要审视清楚;二是对样本的功能要审视准确.(2)本题易错点是,对于第(2)问,由于对样本功能审视不准确,按老、中、青三层分层抽样.[方法与技巧]1.简单随机抽样的特点:总体中的个体性质相似,无明显层次;总体容量较小,尤其是样本容量较小;用简单随机抽样法抽取的个体带有随机性;个体间无固定间距.2.系统抽样的特点:适用于元素个数很多且均衡的总体;各个个体被抽到的机会均等;总体分组后,在起始部分抽样时,采用简单随机抽样.3.分层抽样的特点:适用于总体由差异明显的几部分组成的情况;分层后,在每一层抽样时可采用简单随机抽样或系统抽样.[失误与防范]进行分层抽样时应注意以下几点:(1)分层抽样中分多少层、如何分层要视具体情况而定,总的原则是层内样本的差异要小,两层之间的样本差异要大,且互不重叠.(2)为了保证每个个体等可能入样,所有层中每个个体被抽到的可能性相同.\A 组 专项基础训练 (时间:30分钟)1.为了了解某地区的中小学生视力情况,拟从该地区的中小学生中抽取部分学生进行调查,事先已了解到该地区小学、初中、高中三个学段学生的视力情况有较大差异,而男女生视力情况差异不大,在下面的抽样方法中,最合理的抽样方法是( ) A .简单随机抽样 B .按性别分层抽样 C .按学段分层抽样 D .系统抽样 答案 C【详细分析】不同的学段在视力状况上有所差异,所以应该按照学段分层抽样.2.某校选修乒乓球课程的学生中,高一年级有30名,高二年级有40名.现用分层抽样的方法在这70名学生中抽取一个样本,已知在高一年级的学生中抽取了6名,则在高二年级的学生中应抽取的人数为( ) A .6 B .8 C .10 D .12答案 B【详细分析】设样本容量为N ,则N ×3070=6,∴N =14,∴高二年级所抽学生人数为14×4070=8.3.某初级中学有学生270人,其中一年级108人,二、三年级各81人,现要利用抽样方法抽取10人参加某项调查,考虑选用简单随机抽样、分层抽样和系统抽样三种方案,使用简单随机抽样和分层抽样时,将学生按一、二、三年级依次统一编号为1,2,…,270,使用系统抽样时,将学生统一随机编号为1,2,…,270,并将整个编号依次分为10段,如果抽得号码有下列四种情况:①7,34,61,88,115,142,169,196,223,250 ②5,9,100,107,111,121,180,195,200,265 ③11,38,65,92,119,146,173,200,227,254 ④30,57,84,111,138,165,192,219,246,270 关于上述样本的下列结论中,正确的是( ) A .②、③都不能为系统抽样B .②、④都不能为分层抽样C.①、④都可能为系统抽样D.①、③都可能为分层抽样答案 D【详细分析】因为③为系统抽样,所以选项A不对;因为②为分层抽样,所以选项B不对;因为④不为系统抽样,所以选项C不对,故选D.4.从编号为1~50的50枚最新研制的某种型号的导弹中随机抽取5枚来进行发射实验,若采用每部分选取的号码间隔一样的系统抽样方法,则所选取5枚导弹的编号可能是() A.5,10,15,20,25 B.3,13,23,33,43C.1,2,3,4,5 D.2,4,6,16,32答案 B【详细分析】间隔距离为10,故可能的编号是3,13,23,33,43.5.(2015·北京)某校老年、中年和青年教师的人数见下表,采用分层抽样的方法调查教师的身体状况,在抽取的样本中,青年教师有320人,则该样本中的老年教师人数为()A.90C.180 D.300答案 C【详细分析】由题意得,抽样比为3201600=15,∴该样本的老年教师人数为900×15=180(人).6.某学校高一、高二、高三年级的学生人数之比为3∶3∶4,现用分层抽样的方法从该校高中三个年级的学生中抽取容量为50的样本,则应从高二年级抽取________名学生.答案15【详细分析】抽取比例与学生比例一致.设应从高二年级抽取x名学生,则x∶50=3∶10.解得x=15.7.某校共有学生2000名,各年级男、女学生人数如下表.已知在全校学生中随机抽取1名,抽到二年级女生的概率是0.19.现用分层抽样的方法在全校抽取64名学生,则应在三年级抽取的学生人数为________.答案16【详细分析】依题意可知二年级的女生有380人,那么三年级的学生人数应该是2000-373-377-380-370=500,即总体中各个年级的人数比为3∶3∶2,故在分层抽样中应在三年级抽取的学生人数为64×28=16.8.用系统抽样法从160名学生中抽取容量为20的样本,将160名学生从1~160编号,按编号顺序平均分成20组(1~8号,9~16号,…,153~160号),若第16组抽出的号码为123,则第2组中应抽出个体的号码是________. 答案 11【详细分析】由题意可知,系统抽样的组数为20,间隔为8,设第1组抽出的号码为x ,则由系统抽样的法则可知,第n 组抽出个体的号码应该为x +(n -1)×8,所以第16组应抽出的号码为x +(16-1)×8=123,解得x =3,所以第2组中应抽出个体的号码为3+(2-1)×8=11.9.将某班的60名学生编号为01,02,…,60,采用系统抽样方法抽取一个容量为5的样本,且随机抽得的一个号码为04,则剩下的四个号码依次是______________. 答案 16,28,40,52【详细分析】编号组数为5,间隔为605=12,因为在第一组抽得04号:4+12=16,16+12=28,28+12=40,40+12=52, 所以其余4个号码为16,28,40,52.10.某政府机关有在编人员100人,其中副处级以上干部10人,一般干部70人,工人20人.上级机关为了了解政府机构改革意见,要从中抽取一个容量为20的样本,试确定用何种方法抽取,请具体实施抽取. 解 用分层抽样方法抽取. 具体实施抽取如下:(1)∵20∶100=1∶5,∴105=2,705=14,205=4,∴从副处级以上干部中抽取2人,从一般干部中抽取14人,从工人中抽取4人. (2)副处级以上干部与工人的人数较少,他们分别按1~10编号与1~20编号,然后采用抽签法分别抽取2人和4人;对一般干部70人采用00,01,02,…,69编号,然后用随机数法抽取14人.(3)将2人,4人,14人的编号汇合在一起就取得了容量为20的样本.B 组 专项能力提升 (时间:25分钟)11.某班共有52人,现根据学生的学号,用系统抽样的方法,抽取一个容量为4的样本,已知3号、29号、42号同学在样本中,那么样本中还有一个同学的学号是( ) A .15B .16 C .20D .55 答案 B【详细分析】因为29号、42号的号码差为13,所以3+13=16,即另外一个同学的学号是16.12.采用系统抽样方法从960人中抽取32人做问卷调查,为此将他们随机编号为1,2,…,960,分组后在第一组采用简单随机抽样的方法抽到的号码为9.抽到的32人中,编号落入区间[1,450]的人做问卷A ,编号落入区间[451,750]的人做问卷B ,其余的人做问卷C .则抽到的人中,做问卷B 的人数为( ) A .7 B .9 C .10 D .15答案 C【详细分析】由系统抽样的特点知:抽取号码的间隔为96032=30,抽取的号码依次为9,39,69,…,939.落入区间[451,750]的有459,489,…,729,这些数构成首项为459,公差为30的等差数列,设有n 项,显然有729=459+(n -1)×30,解得n =10.所以做问卷B 的有10人.13.200名职工年龄分布如图所示,从中随机抽取40名职工作样本,采用系统抽样方法,按1~200编号,分为40组,分别为1~5,6~10,…,196~200,第5组抽取号码为22,第8组抽取号码为________.若采用分层抽样,40岁以下年龄段应抽取________人.答案 37 20【详细分析】将1~200编号分为40组,则每组的间隔为5,其中第5组抽取号码为22,则第8组抽取的号码应为22+3×5=37;由已知条件200名职工中40岁以下的职工人数为200×50%=100,设在40岁以下年龄段中应抽取x 人,则40200=x100,解得x =20.14.一个总体中有90个个体,随机编号0,1,2,…,89,依从小到大的编号顺序平均分成9个小组,组号依次为1,2,3,…,9.现用系统抽样方法抽取一个容量为9的样本,规定如果在第1组随机抽取的号码为m ,那么在第k 组中抽取的号码个位数字与m +k 的个位数字相同,若m =8,求在第8组中抽取的号码是________. 答案 76解 由题意知:m =8,k =8,则m +k =16,也就是第8组抽取的号码个位数字为6,十位数字为8-1=7,故抽取的号码为76.15.某公路设计院有工程师6人,技术员12人,技工18人,要从这些人中抽取n 个人参加市里召开的科学技术大会.如果采用系统抽样和分层抽样的方法抽取,不用剔除个体,如果参会人数增加1个,则在采用系统抽样时,需要在总体中先剔除1个个体,求n . 解 总体容量为6+12+18=36.当样本容量是n 时,由题意知,系统抽样的间隔为36n ,分层抽样的比例是n36,抽取的工程师人数为n 36×6=n 6,技术员人数为n 36×12=n 3,技工人数为n 36×18=n2,所以n 应是6的倍数,36的约数,即n =6,12,18.当样本容量为(n +1)时,总体容量是35人,系统抽样的间隔为35n +1,因为35n +1必须是整数,所以n 只能取6.即样本容量n =6.1.统计图表统计图表是表达和分析数据的重要工具,常用的统计图表有条形统计图、扇形统计图、折线统计图、茎叶图等. 2.数据的数字特征 (1)众数、中位数、平均数众数:在一组数据中,出现次数最多的数据叫作这组数据的众数.中位数:将一组数据按大小依次排列,把处在最中间位置的一个数据(或最中间两个数据的平均数)叫作这组数据的中位数.平均数:样本数据的算术平均数,即x =1n (x 1+x 2+…+x n ).在频率分布直方图中,中位数左边和右边的直方图的面积应该相等. (2)样本方差、标准差 标准差s =1n[(x 1-x )2+(x 2-x )2+…+(x n -x )2], 其中x n 是样本数据的第n 项,n 是样本容量,x 是平均数.标准差是刻画数据的离散程度的特征数,样本方差是标准差的平方.通常用样本方差估计总体方差,当样本容量接近总体容量时,样本方差很接近总体方差. 3.用样本估计总体(1)通常我们对总体作出的估计一般分成两种,一种是用样本的频率分布估计总体的频率分布,另一种是用样本的数字特征估计总体的数字特征. (2)在频率分布直方图中,纵轴表示频率组距,数据落在各小组内的频率用各小长方形的面积表示,各小长方形的面积总和等于1.(3)在频率分布直方图中,按照分组原则,再在左边和右边各加一个区间.从所加的左边区间的中点开始,用线段依次连接各个矩形的顶端中点,直至右边所加区间的中点,就可以得到一条折线,称之为频率折线图.(4)当样本数据较少时,用茎叶图表示数据的效果较好,它没有信息的缺失,而且可以随时记录,方便表示与比较. 【思考辨析】判断下面结论是否正确(请在括号中打“√”或“×”)(1)平均数、众数与中位数从不同的角度描述了一组数据的集中趋势.( √ ) (2)一组数据的众数可以是一个或几个,那么中位数也具有相同的结论.( × )(3)从频率分布直方图得不出原始的数据内容,把数据表示成直方图后,原有的具体数据信息就被抹掉了.( √ )(4)茎叶图一般左侧的叶按从大到小的顺序写,右侧的叶按从小到大的顺序写,相同的数据可以只记一次.( × )(5)在频率分布直方图中,最高的小长方形底边中点的横坐标是众数.( √ ) (6)在频率分布直方图中,众数左边和右边的小长方形的面积和是相等的.( × )1.(2015·陕西)某中学初中部共有110名教师,高中部共有150名教师,其性别比例如图所示,则该校女教师的人数为( )A .93B .123C .137D .167答案 C【详细分析】由题干扇形统计图可得该校女教师人数为:110×70%+150×(1-60%)=137.故选C.2.若某校高一年级8个班参加合唱比赛的得分茎叶图如图所示,则这组数据的中位数和平均数分别是( )A .91.5和91.5B .91.5和92C .91和91.5D .92和92答案 A【详细分析】∵这组数据由小到大排列为87,89,90,91,92,93,94,96,∴中位数为12×(91+92)=91.5.平均数为18×(87+89+90+91+92+93+94+96)=91.5.3.一个容量为66的样本,数据的分组及各组的频数如下: [11.5,15.5) 2 [15.5,19.5) 4 [19.5,23.5) 9 [23.5,27.5) 18 [27.5,31.5) 11 [31.5,35.5) 12 [35.5,39.5) 7 [39.5,43.5) 3根据样本的频率分布估计,数据落在[31.5,43.5)的概率约是( ) A.16B.13C.12D.23 答案 B【详细分析】由已知,样本容量为66,而落在[31.5,43.5)内的样本数为12+7+3=22,故所求概率为2266=13.4.(教材改编)某赛季,甲、乙两名篮球运动员都参加了11场比赛,他们每场比赛得分的情况用如图所示的茎叶图表示,则甲、乙两名运动员得分的中位数分别为________.答案19,135.某中学为了了解学生数学课程的学习情况,在3000名学生中随机抽取200名,并统计这200名学生的某次数学考试成绩,得到了样本的频率分布直方图(如图).根据频率分布直方图推测,这3000名学生在该次数学考试中成绩小于60分的学生数是________.答案600【详细分析】由频率分布直方图易得数学考试中成绩小于60分的频率为(0.002+0.006+0.012)×10=0.2,所以所求分数小于60分的学生数为3000×0.2=600.题型一频率分布直方图的绘制与应用例1(2015·课标全国Ⅱ)某公司为了解用户对其产品的满意度,从A,B两地区分别随机调查了40个用户,根据用户对产品的满意度评分,得到A地区用户满意度评分的频率分布直方图和B地区用户满意度评分的频数分布表.A地区用户满意度评分的频率分布直方图图①B地区用户满意度评分的频数分布表度评分的平均值及分散程度(不要求计算出具体值,给出结论即可).B地区用户满意度评分的频率分布直方图图②(2)根据用户满意度评分,将用户的满意度分为三个等级:解(1)如图所示.通过两地区用户满意度评分的频率分布直方图可以看出,B地区用户满意度评分的平均值高于A地区用户满意度评分的平均值;B地区用户满意度评分比较集中,而A地区用户满意度评分比较分散.(2)A地区用户的满意度等级为不满意的概率大.记C A表示事件:“A地区用户的满意度等级为不满意”;C B表示事件:“B地区用户的满意度等级为不满意”.由直方图得P(C A)的估计值为(0.01+0.02+0.03)×10=0.6,P(C B)的估计值为(0.005+0.02)×10=0.25.所以A地区用户的满意度等级为不满意的概率大.思维升华(1)明确频率分布直方图的意义,即图中的每一个小矩形的面积是数据落在该区间上的频率,所有小矩形的面积和为1.(2)对于统计图表类题目,最重要的是认真观察图表,从中提炼有用的信息和数据.。
高考数学一轮复习第11章统计统计案例第2节用样本估计总体课件文新人教A版
●命题角度二 样本数字特征的应用 【例 2】 甲、乙两人在相同条件下各射击 10 次,每次中靶环数情况如图所示:
(1)请填写下表(写出计算过程): 平均数 方差 命中 9 环及 9 环以上的次数
甲 乙 (2)从下列三个不同的角度对这次测试结果进行分析: ①从平均数和方差相结合看(分析谁的成绩更稳定); ②从平均数和命中 9 环及 9 环以上的次数相结合看(分析谁的成绩好些); ③从折线图上两人射击命中环数的走势看(分析谁更有潜力).
[解] 由题图知 甲射击 10 次中靶环数分别为 9,5,7,8,7,6,8,6,7,7,将它们由小到大排 列为 5,6,6,7,7,7,7,8,8,9. 乙射击 10 次中靶环数分别为 2,4,6,8,7,7,8,9,9,10,将它们由小到大排 列为 2,4,6,7,7,8,8,9,9,10.
‖基础自测‖ 一、疑误辨析 1.判断下列结论的正误(正确的打“√”,错误的打“×”) (1)平均数、众数与中位数从不同的角度描述了一组数据的集中趋势.( ) (2)一组数据的方差越大,说明这组数据越集中.( ) (3)在频率分布直方图中,小矩形的面积越大,表示样本数据落在该区间的频率越 大.( ) (4)茎叶图一般左侧的叶按从大到小的顺序写,右侧的叶按从小到大的顺序写,相同 的数据可以只记一次.( )
2
课 堂 ·考 点 突 破
考点 茎叶图的应用
|题组突破| 1.如图所示的茎叶图记录了甲、乙两组各 5 名工人某日的产量数据(单位:件).若 这两组数据的中位数相等,平均值也相等,则 x 和 y 的值分别为( )
A.3,5 C.3,7
B.5,5 D.5,7
解析:选 A 根据两组数据的中位数相等可得 65=60+y,解得 y=5,又它们的平 均值相等,
2017高考数学人教A版理科一轮复习课件:第11章 统计与统计案例 第2讲
规律方法 解决频率分布直方图的问题,关键在于找 出图中数据之间的联系.这些数据中,直接的有组距、 频率 组距,间接的有频率、小长方形的面积,合理使用这 些数据,再结合两个等量关系:小长方形面积=组距 ×频组率距=频率,小长方形面积之和等于 1,即频率之 和等于 1,就可以解决直方图的有关问题.
A.6
B.8
C.12
D.18
第九页,编辑于星期六:二十一点 三十五分。
解析 全体志愿者共有(0.24+200.16)×1=50(人), 所以第三组有志愿者 0.36×1×50=18(人),∵第三组 中没有疗效的有 6(人),∴有疗效的有 18-6=12(人), 故选 C.
答案 C
第十页,编辑于星期六:二十一点 三十五分。
4.(2015·全国Ⅱ卷)根据下面给出的2004年至2013年我国二氧化硫 排放量(单位:万吨)柱形图.以下结论不正确的是( )
A.逐年比较,2008年减少二氧化硫排放量的效果最显著 B.2007年我国治理二氧化硫排放显现成效
C.2006年以来我国二氧化硫年排放量呈减少趋势
D.2006年以来我国二氧化硫年排放量与年份正相关
标准差 s=____1n___x1___x__2___x_2___x_2_______x_n___x__2 ___.
其中 xn 是样本数据的第 n 项,n 是样本容量, x 是平均数. 标准差是反映总体波动大小的特征数,样本方差是标准差的平 方.通常用样本方差估计总体方差,当样本容量接近总体容量 时,样本方差很接近总体方差.
•第2讲 用样本估计总体
第一页,编辑于星期六:二十一点 三十五分。
最新考纲 1.了解分布的意义和作用,能根据频率分布表画频 率分布直方图、频率折线图、茎叶图,体会它们各自的特点;2. 理解样本数据标准差的意义和作用,会计算数据标准差;3.能从样 本数据中提取基本的数字特征(如平均数、标准差),并作出合 理的解释;4.会用样本的频率分布估计总体分布,会用样本的 基本数字特征估计总体的基本数字特征,理解用样本估计总体 的思想;5.会用随机抽样的基本方法和样本估计总体的思想解决 一些简单的实际问题.
2017高考数学(理)一轮复习配套课件:第十一章统计11.3
解:回归直线方程 yˆ bˆx aˆ 经过样本点的中心( x , y ),可能不经过(x1,y1),(x2,
y2),…,(xn,yn)中的任何一点,这些点都分布在这条直线附近.故选 B.
第十五页,编辑于星期六:二十一点 四十八分。
类型三 散点图
(1)对变量 x,y 有观测数据(xi,yi)(i=1,2,…,10),得散点图 1; 对变量 u,v 有观测数据(ui,vi)(i=1,2,…,10),得散点图 2.由这两个散点图可 以判断( )
【点拨】点分布在从左下角到右上角的区域时,两 个变量的相关关系为正相关;点分布在从左上角到右下 角的区域时,两个变量的相关关系为负相关.
第十七页,编辑于星期六:二十一点 四十八分。
(2)下面是一块田的水稻产量与施化肥量的一组观 测数据(单位:kg):
施化肥量 15 20 25 30 35 40 45 水稻产量 320 330 360 410 460 470 480 (Ⅰ)将上述数据制成散点图; (Ⅱ)你能从散点图中发现施化肥量与水稻产量近似 成什么关系吗?水稻产量会一直随施化肥量的增加而增 长吗?
n
n
(xi x)( yi y)
xi yi nxy
归方程为
yˆ
bˆx
aˆ
,则
bˆ
i 1
n
(xi x)2
i 1 n
,
xi2 nx2
i 1
i 1
aˆ bˆx.
第三页,编辑于星期六:二十一点 四十八分。
自查自纠
1.相关关系 非确定性 2.(1)线性相关关系 回归直线
(2)正相关 负相关 (3)1 0
那么下面说法错.误.的是( )
2017高考数学(理)一轮复习配套课件:第十一章统计11.1
员每 10 分钟从中抽取一件新产品进行某项指标检
测,这样的抽样是( )
A.系统抽样
B.分层抽样
C.简单随机抽样
D.随机数法
解:根据定义易判断这样的抽样为系统抽 样.故选 A.
第八页,编辑于星期六:二十一点 四十八分。
(2014·重庆)某中学有高中生 3500 人,初中生
1500 人.为了解学生的学习情况,用分层抽样的方法从该
第二页,编辑于星期六:二十一点 四十八分。
(5)会用随机抽样的基本方法和样本估计总体的思想解 决一些简单的实际问题.
3.变量的相关性 (1)会做两个有关联变量的数据的散点图,并利用散点图 认识变量间的相关关系. (2)了解最小二乘法的思想,能根据给出的线性回归方程 系数公式建立线性回归方程(线性回归方程系数公式不要求 记忆). 4.了解回归分析的思想、方法及其简单应用. 5.了解独立性检验的思想、方法及其初步应用.
第十一章
统计
考纲链接
§11.1 随机抽样
第一页,编辑于星期六:二十一点 四十八分。
1.随机抽样 (1)理解随机抽样的必要性和重要性. (2)会用简单随机抽样方法从总体中抽取样本;了解分层抽样和系 统抽样方法. 2.用样本估计总体 (1)了解分布的意义和作用,能根据频率分布表画频率分布直方 图、频率折线图、茎叶图,体会它们各自的特点. (2)理解样本数据标准差的意义和作用,会计算数据标准差. (3)能从样本数据中提取基本的数字特征(如平均数、标准差),并 作出合理的解释. (4)会用样本的频率分布估计总体分布,会用样本的基本数字特征 估计总体的基本数字特征,理解用样本估计总体的思想.
2017高考数学人教A版理科一轮复习课件:第11章 统计与统计案例 第3讲
第十三页,编辑于星期六:二十一点 三十六分。
5.(人教A选修1-2P13例1改编)在一项打鼾与患心脏病的调查中,共 调查了1 671人,经过计算K2的观测值k=27.63,根据这一数据分 析,我们有理由认为打鼾与患心脏病是________的(填“有关”或“ 无关”).
答案 有关
第十四页,编辑于星期六:二十一点 三十六分。
第十六页,编辑于星期六:二十一点 三十六分。
解析 (1)所有点均在直线上,则样本相关系数最大即为1, 故选D. (2)由图(1)可知,各点整体呈递减趋势,x与y负相关;由 图(2)可知,各点整体呈递增趋势,u与v正相关. 答案 (1)D (2)C
第十七页,编辑于星期六:二十一点 三十六分。
规律方法 判断变量之间有无相关关系,一种简便可行的方法就 是绘制散点图,根据散点图很容易看出两个变量之间是否具有相 关性,是不是存在线性相关关系,是正相关还是负相关,相关关
第十五页,编辑于星期六:二十一点 三十六分。
(2)对变量 x,y 有观测数据(xi,yi)(i=1,2,…,10),得散 点图(1);对变量 u,v 有观测数据(ui,vi)(i=1,2,…,10), 得散点图(2).由这两个散点图可以判断( )
A.变量x与y正相关,u与v正相关 B.变量x与y正相关,u与v负相关 C.变量x与y负相关,u与v正相关 D.变量x与y负相关,u与v负相关
中 n=a+b+c+d 为样本容量.
(3)独立性检验
利用随机变量 K2 来判断“两个分类变量有关系”的方法称为独
立性检验.
第七页,编辑于星期六:二十一点 三十六分。
诊断自测 1.判断正误(在括号内打“√”或“×”)
(1)相关关系与函数关系都是一种确定性的关系,也是一种因果关 系.( × ) (2)散点图是判断两个变量是否相关的一种重要方法和手段.( √ ) (3) 通 过 回 归 方 程 ^y = b^ x + a^ 可 以 估 计 和 观 测 变 量 的 取 值 和 变 化 趋 势.( √ ) (4)事件 X,Y 关系越密切,则由观测数据计算得到的 K2 的观测值越 大.( √ ) (5)由独立性检验可知,有 99%的把握认为物理成绩优秀与数学成 绩有关,某人数学成绩优秀,则他有 99%的可能物理优秀.( × )
2017高考数学(理)一轮复习配套课件:第十一章统计11.2
(3)虽然 A 轮胎和 B 轮胎的最远行驶里程的平均数相同,但 B 轮胎行驶的
最远里程的极差和标准差相对于 A 轮胎较小,所以 B 轮胎性能更加稳定.
第十四页,编辑于星期六:二十一点 四十八分。
类型二 频率分布表、频率分布直方图及其应用
(2014·全国Ⅰ)从某企业生产的某种产品中抽取 100 件,测量这些产品的一项质量 指标值,由测量结果得如下频数分布表:
第十三页,编辑于星期六:二十一点 四十八分。
解:(1)A 轮胎行驶的最远里程的平均数为: 96+112+97+108+8 100+103+86+98=100,中位数为:1002+98=99;
B 轮胎行驶的最远里程的平均数为: 108+101+94+1058+96+93+97+106=100,中位数为:1012+97=99.
落在区间(30,35]的概率.
第十八页,编辑于星期六:二十一点 四十八分。
解:(1)根据已知数据统计出 n1=7,n2=2, 计算得 f1=0.28,f2=0.08. (2)由于组距为 5,用频 组率 距得各组的纵坐标分别为 0.024,0.040,0.064,0.056,
(2)A 轮胎行驶的最远里程的极差为:112-86=26,
标准差为:s=
221 (-4)2+122+(-3)2+82+02+32+(-14)2+(-2)2 = 2 ≈7.43; 8
B 轮胎行驶的最远里程的极差为:108-93=15,
标准差为:s=
118 82+12+(-6)2+52+(-4)2+(-7)2+(-3)2+62 = 2 ≈5.43. 8
差是样本标准差的__________.通常用样本方差估计总体方差,当样本容量接近
总体容量时,样本方差很接近总体方差.
2017版高考数学人教A版(全国)一轮复习配套课件 第十一章 统计与概率11.1
超过175 cm的概率为( )
B
A.0.2
B.0.3
C.0.7
D.0.8
解析 因为必然事件发生的概率是1,所以该同学的身高超过175 cm的概
率为1-0.2-0.5=0.3,故选B.
1 2345
第十一解页析,编答辑于案星期六:二十点 十七分。
3.(2015·湖北)我国古代数学名著《数书九章》有“米谷粒分”题:粮仓开
4.给出下列三个命题,其中正确的命题有________0个.
①有一大批产品,已知次品率为10%,从中任取100件,必有10件是次品;
②做7次抛硬币的试验,结果3次出现正面,因此正面出现的概率是 ;③ 随机事件3 发生的频率就是这个随机事件发生的概率.
7
解析 ①错,不一定是10件次品;
②错,3 是频率而非概率; 7
100+200=0.3. 1 000
解析答案 第二十六页,编辑于星期六:二十点 十七分。
(3)如果顾客购买了甲,则该顾客同时购买乙、丙、丁中哪种商品的可能性 最大? 解 与(1)同理,可得:
顾客同时购买甲和乙的概率可以估计为1200000=0.2, 100+200+300
顾客同时购买甲和丙的概率可以估计为 1 000 =0.6, 顾客同时购买甲和丁的概率可以估计为1100000=0.1. 所以,如果顾客购买了甲,则该顾客同时购买丙的可能性最大.
P(A).
答案 第四页,编辑于星期六:二十点 十七分。
2.事件的关系与运算
定义
符号表示
包含 如果事件A发生,则事件B一定发生,这时称事 B⊇A
关系 件B 包含 事件A(或称事件A包含于事件B)
(或A⊆B)
相等 关系
若B⊇A且A⊇B
2017版高考数学人教A版(全国)一轮复习配套课件 第十一章 统计与概率11.3
1.(教材改编)在线段[0,3]上任投一点,则此点坐标小于1的概率为( ) B
1
1
1
A.2
B.3
C.4
D.1
解析 坐标小于 1 的区间为[0,1],长度为 1,[0,3]区间长度为 3,故
所求概率为13.
1 2345
第八页解,编析辑答于星案期六:二十点 十七分。
2.(2015·山东)在区间[0,2]上随机地取一个数
(1)使用计算机或者其他方式进行的模拟试验,以便通过这个试验求出随机
事件的概率的近似值的方法就是模拟方法.
第五页,编辑于星期六:二十点 十七答分。案
(2)用计算机或计算器模拟试验的方法为随机模拟方法.这个方法的基本
步骤是①用计算器或计算机产生某个范围内的随机数,并赋予每个随机数
一定的意义;②统计代表某意义的随机数的个数M和总的随机数个数N;③
2.若本例(3)中“在∠BAC内作射线AM交BC于点M”改为“在线段BC上找 一点M”,求BM<1的概率.
解
依题意知 BC=BD+DC=1+
3,P(BM<1)=1+1
3=
3-1 2.
思第十维九升页华,编辑于星期六:二解十点析十答七案分。
跟踪训练1
(1)如图,在直角坐标系内,射线OT落在30°角的终边上, 任作一条射线OA,则射线OA落在∠yOT内的概率为
第四十二页,编辑于星期六:二十点 十七分。
失误与防范
1.准确把握几何概型的“测度”是解题关键;
2.几何概型中,线段的端点、图形的边框是否包含在事件之内不影响所 求结果.
第四十三页,编辑于星期六:二十点返十七回分。
练出高分
第四十四页,编辑于星期六:二十点 十七分。
高考数学一轮复习 第11章 统计与统计案例 2 第2讲 用样本估计总体教案 理-人教版高三全册数学教
第2讲 用样本估计总体1.统计图表(1)频率分布直方图的画法步骤①求极差(即一组数据中最大值与最小值的差); ②决定组距与组数; ③将数据分组; ④列频率分布表; ⑤画频率分布直方图.(2)频率分布折线图和总体密度曲线①频率分布折线图:连接频率分布直方图中各小长方形上端的中点,就得到频率分布折线图.②总体密度曲线:随着样本容量的增加,作图时所分组数增加,组距减小,相应的频率折线图会越来越接近于一条光滑曲线,统计中称这条光滑曲线为总体密度曲线. (3)茎叶图的画法步骤第一步:将每个数据分为茎(高位)和叶(低位)两部分; 第二步:将最小茎与最大茎之间的数按大小次序排成一列; 第三步:将各个数据的叶依次写在其茎的两侧. 2.样本的数字特征(1)众数:一组数据中出现次数最多的那个数据,叫做这组数据的众数.(2)中位数:把n 个数据按大小顺序排列,处于最中间位置的一个数据(或最中间两个数据的平均数)叫做这组数据的中位数. (3)平均数:把a 1+a 2+…+a nn称为a 1,a 2,…,a n 这n 个数的平均数.(4)标准差与方差:设一组数据x 1,x 2,x 3,…,x n 的平均数为x -,那么这组数据的标准差和方差分别是s =1n[〔x 1-x -〕2+〔x 2-x -〕2+…+〔x n -x -〕2] s 2=1n[(x 1-x -)2+(x 2-x -)2+…+(x n -x -)2]3.与平均数和方差有关的结论(1)假设x 1,x 2,…,x n 的平均数为x -,那么mx 1+a ,mx 2+a ,…,mx n +a 的平均数为m x -+a ;(2)数据x 1,x 2,…,x n 与数据x ′1=x 1+a ,x ′2=x 2+a ,…,x ′n =x n +a 的方差相等,即数据经过平移后方差不变;(3)假设x 1,x 2,…,x n 的方差为s 2,那么ax 1+b ,ax 2+b ,…,ax n +b 的方差为a 2s 2;(4)s 2=1n ∑i =1n (x i -x -)2=1n ∑i =1nx 2i -x -2,即各数平方的平均数减去平均数的平方.判断正误(正确的打“√〞,错误的打“×〞)(1)一组数据的方差越大,说明这组数据的波动越大.( )(2)在频率分布直方图中,小矩形的面积越大,表示样本数据落在该区间内的频率越大.( )(3)茎叶图中的数据要按从小到大的顺序写,相同的数据可以只记一次.( )(4)频率分布表和频率分布直方图是一组数据频率分布的两种形式,前者准确,后者直观.( )(5)在频率分布直方图中,最高的小长方形底边中点的横坐标是众数的估计值.( ) 答案:(1)√ (2)√ (3)× (4)√ (5)√(2017·高考全国卷Ⅲ)某城市为了解游客人数的变化规律,提高旅游服务质量,收集并整理了2014年1月至2016年12月期间月接待游客量(单位:万人)的数据,绘制了下面的折线图.根据该折线图,以下结论错误的是( ) A .月接待游客量逐月增加 B .年接待游客量逐年增加C .各年的月接待游客量高峰期大致在7,8月份D .各年1月至6月的月接待游客量相对7月至12月,波动性更小,变化比较平稳解析:选A.根据折线图可知,2014年8月到9月、2014年10月到11月等月接待游客量都是减少,所以A错误.某某市某年各月的平均气温(℃)数据的茎叶图如图,那么这组数据的中位数是( )A.19 B.20C.21.5 D.23解析:选B.由茎叶图可知这组数据由小到大依次为8,9,12,15,18,20,20,23,23,28,31,32,所以中位数为20+202=20.(2018·某某第一次质量预测)我市某校组织学生参加英语测试,成绩的频率分布直方图如图,数据的分组依次为[20,40),[40,60),[60,80),[80,100],假设低于60分的人数是15,那么该班的学生人数是________.解析:依题意得,成绩低于60分的相应的频率等于(,所以该班的学生人数是15÷0.3=50.答案:50甲、乙两人在10天中每天加工零件的个数用茎叶图表示如图,中间一列的数字表示零件个数的十位数,两边的数字表示零件个数的个位数,那么这10天甲、乙两人日加工零件的平均数分别为________和________.解析:由茎叶图可知甲的平均数为19+18+20+21+23+22+20+31+31+3510=24.乙的平均数为19+17+11+21+24+22+24+30+32+3010=23.答案:24 23茎叶图[典例引领](2017·高考某某卷)如下图的茎叶图记录了甲、乙两组各5名工人某日的产量数据(单位:件).假设这两组数据的中位数相等,且平均值也相等,那么x 和y 的值分别为( )A .3,5B .5,5C .3,7D .5,7【解析】 根据两组数据的中位数相等可得65=60+y ,解得y =5,又它们的平均值相等, 所以56+62+65+74+〔70+x 〕5=59+61+67+〔60+y 〕+785,解得xA .【答案】 A茎叶图中的三个关注点(1)“叶〞的位置只有一个数字,而“茎〞的位置的数字位数一般不需要统一. (2)重复出现的数据要重复记录,不能遗漏.(3)给定两组数据的茎叶图,估计数字特征,茎上的数字由小到大排列,一般“重心〞下移者平均数较大,数据集中者方差较小.[通关练习]1.(2018·某某某某航天高中模拟)某学生在一门功课的22次考试中,所得分数茎叶图如下图,那么此学生该门功课考试分数的极差与中位数之和为( )A.117 B.118解析:选次考试中,所得分数最高的为98,最低的为56,所以极差为98-56=42,将分数从小到大排列,中间两数为76,76,所以中位数为76,所以此学生该门功课考试分数的极差与中位数之和为42+76=118.2.为了了解某校教师使用多媒体进行教学的情况,现采用简单随机抽样的方法,从该校400名授课教师中抽取20名,调查了他们上学期使用多媒体进行教学的次数,结果用茎叶图表示,如下图.据此可估计上学期该校400名教师中,使用多媒体进行教学的次数在[16,30)内的人数为( )A.100 B.160C.200 D.280解析:选B.由茎叶图可知在20名教师中,上学期使用多媒体进行教学的次数在[16,30)内的人数为8,据此可以估计400名教师中,使用多媒体进行教学的次数在[16,30)内的人数为400×820=160.频率分布直方图(高频考点)频率分布直方图是高考的热点,选择题、填空题、解答题都有可能出现.难度一般较小.高考对频率分布直方图的考查主要有以下三个命题角度:(1)求样本的频率、频数;(2)求样本的数字特征;(3)与概率结合的问题.[典例引领]角度一求样本的频率、频数(2016·高考某某卷)某高校调查了200名学生每周的自习时间(单位:小时),制成了如下图的频率分布直方图,,30],,20),[20),,25),[25),,30].根据直方图,这200名学生中每周的自习时间不少于22.5小时的人数是( )A .56B .60C .120D .140【解析】 由频率分布直方图可知,这200名学生每周的自习时间不少于22.5小时的频率为(0.16+0.08+,D. 【答案】 D角度二 求样本的数字特征(2018·某某省11校跨区调研)为了解一种植物果实的情况,随机抽取一批该植物果实样本测量重量(单位:克),),),),),]分为5组,其频率分布直方图如下图.(1)求图中a 的值;(2)估计这种植物果实重量的平均数x -和方差s 2(同一组中的数据用该组区间的中点值作代表).【解】 (1)组距d =5,由5×(0.02+0.04+0.075+a +)=1得a =0.05. (2)各组中点值和相应的频率依次为中点值 30 35 40 45 50 频率x -=30×0.1+35×0.2+40×0.375+45×0.25+50×=40,s 2=(-10)2×+(-5)2×+02×+52×+102×=28.75.角度三 与概率结合的问题(2018·东北四市高考模拟)某手机厂商推出一款6寸大屏手机,现对500名该手机使用者(200名女性,300名男性)进行调查,对手机进行打分,打分的频数分布表如下:女性用户分值区间[50,60)[60,70)[70,80)[80,90)频数 20408050男性用户分值区间[50,60)[60,70)[70,80)[80,90)频数45759060(1)完成以下频率分布直方图,并比较女性用户和男性用户评分的波动大小(不计算具体值,给出结论即可);(2)根据评分的不同,运用分层抽样的方法从男性用户中抽取20名用户,再从这20名用户中满足评分不低于80分的用户中任意抽取3名用户,求3名用户中评分小于90分的人数X 的分布列和数学期望.【解】 (1)女性用户和男性用户的频率分布直方图如图.由图可知女性用户评分的波动小,男性用户评分的波动大.(2)运用分层抽样的方法从男性用户中抽取20名用户,评分不低于80分的用户有6人,其中评分小于90分的有4人,从6人中任取3人,那么X 的可能取值为1,2,3, P (X =1)=C 14C 22C 36=420=15,P (X =2)=C 24C 12C 36=1220=35,P (X =3)=C 34C 36=420=15.所以X 的分布列为X 1 2 3P15 35 15E (X )=15+65+35=2.频率、频数、样本容量的计算方法(1)频率组距×组距=频率. (2)频数样本容量=频率,频数频率=样本容量,样本容量×频率=频数. [提醒] 制作好频率分布表后,可以利用各组的频率之和是否为1来检验该表是否正确.[通关练习]1.在样本频率分布直方图中,共有9个小长方形,假设中间一个小长方形的面积等于其他8个长方形的面积和的25,且样本容量为140,那么中间一组的频数为( )A .28B .40C .56D .60解析:选B .设中间一组的频数为x ,因为中间一个小长方形的面积等于其他8个长方形的面积和的25,所以其他8组的频数和为52x ,由x +52x =140,解得x =40.2.(2018·某某市武昌区调研考试)我国是世界上严重缺水的国家,城市缺水问题较为突出.某市政府为了鼓励居民节约用水,计划在本市试行居民生活用水定额管理,即确定一个合理的居民月用水量标准x (吨),月用水量不超过x 的部分按平价收费,超出x 的部分按议价收费.为了了解全市居民用水量的分布情况,通过抽样,获得了100位居民某年的月均用水量(单位:吨),将数据按照[0),,1),…,[4,4.5]分成9组,制成了如下图的频率分布直方图.(1)求频率分布直方图中a 的值;(2)该市有80万居民,估计全市居民中月均用水量不低于3吨的人数,并说明理由; (3)假设该市政府希望使85%的居民每月的用水量不超过标准x (吨),估计x 的值,并说明理由.解:(1)由频率分布直方图,可得(0.08+0.16+a +0.40+0.52+a +0.12+0.08+0.04)×0.5=1, 解得a =0.30.(2)由频率分布直方图知,100位居民每人月均用水量不低于3吨的频率为(0.12+0.08+0.04)×0.5=0.12.由以上样本频率分布,可以估计全市80万居民中月均用水量不低于3吨的人数为800 000×0.12=96 000. ,,所以2.5≤x <3.由0.3×(x ,解得x =2.9.因此,,85%的居民每月的用水量不超过标准.样本数字特征的求解与应用[典例引领](1)在发生某公共卫生事件期间,有专业机构认为该事件在一段时间内没有发生大规模群体感染的标志是“连续10天,每天新增疑似病例不超过7人〞.根据过去10天甲、乙、丙、丁四地新增疑似病例的数据,一定符合该标志的是( ) A .甲地:总体均值为3,中位数为4 B .乙地:总体均值为1,总体方差大于0 C .丙地:中位数为2,众数为3 D .丁地:总体均值为2,总体方差为3(2)(2018·某某模拟)假设1,2,3,4,m 这五个数的平均数为3,那么这五个数的方差为________.(3)(2018·某某市教学质量检测(二))设样本数据x 1,x 2,…,x 2 017的方差是4,假设y i =2x i -1(i =1,2,…,2 017),那么y 1,y 2,…,y 2 017的方差为________.【解析】 (1)根据标志,,无法确定.方差表达数据中个体的波动程度,假设大于0,那么无法确定.假设均值为2,方差为3,假设∃x i ≥8,那么s 2≥〔x i -x -〕210=6210>3,故假设不成立.(2)由1+2+3+4+m 5=3得m =5,所以这五个数的方差为15[(1-3)2+(2-3)2+(3-3)2+(4-3)2+(5-3)2]=2.(3)设样本数据的平均数为x -,那么y i =2x i -1的平均数为2x --1,那么y 1,y 2,…,y 2 017的方差为12 017[(2x 1-1-2x -+1)2+(2x 2-1-2x -+1)2+…+(2x 2 017-1-2x -+1)2]=4×12 017[(x 1-x -)2+(x 2-x -)2+…+(x 2 017-x -)2]=4×4=16. 【答案】 (1)D (2)2 (3)16(1)众数、中位数、平均数及方差的意义①平均数与方差都是重要的数字特征,是对总体的一种简明地描述. ②平均数、中位数、众数描述其集中趋势,方差和标准差描述波动大小. (2)在计算平均数、方差时可利用平均数、方差的有关结论.[通关练习]1.甲、乙两人在一次射击比赛中各射靶5次,两人成绩的条形统计图如下图,那么( )A .甲的成绩的平均数小于乙的成绩的平均数B .甲的成绩的中位数等于乙的成绩的中位数C .甲的成绩的方差小于乙的成绩的方差D .甲的成绩的极差小于乙的成绩的极差 解析:选C.x -甲=15(4+5+6+7+8)=6,x -乙=15(5×3+6+9)=6,甲的成绩的方差为15(22×2+12×2)=2,乙的成绩的方差为15(12×3+32×1)=2.4.2.(2018·某某市第二次教学质量检测)某同学在高三学年的五次阶段性考试中,数学成绩依次为110,114,121,119,126,那么这组数据的方差是________.解析:因为对一组数据同时加上或减去同一个常数,方差不变,所以此题中可以先对这5个数据同时减去110,得到新的数据分别为0,4,11,9,16,其平均数为8,根据方差公式可得s 2=〔0-8〕2+〔4-8〕2+〔11-8〕2+〔9-8〕2+〔16-8〕25=30.8.3.(2018·某某市监测考试)在某校科普知识竞赛前的模拟测试中,得到甲、乙两名学生的6次模拟测试成绩(百分制)的茎叶图(如图).假设从甲、乙两名学生中选择一人参加该知识竞赛,你会选哪位?请运用统计学的知识说明理由.解:学生甲的平均成绩x -甲=68+76+79+86+88+956=82,学生乙的平均成绩x -乙=71+75+82+84+86+946=82,又s 2甲=16×[(68-82)2+(76-82)2+(79-82)2+(86-82)2+(88-82)2+(95-82)2]=77,s 2乙=16×[(71-82)2+(75-82)2+(82-82)2+(84-82)2+(86-82)2+(94-82)2]=1673,那么x -甲=x -乙,s 2甲>s 2乙,说明甲、乙的平均水平一样,但乙的方差小,即乙发挥更稳定,故可选择学生乙参加知识竞赛.众数、中位数和平均数的异同众 数中位数平均数相同点 都是描述一组数据集中趋势的量不同点与这组数据中的部分数据有关,出现在这些不一定在这些数据中出现.奇数个时,在这不一定在这些数据中出现数据中 组数据中出现;偶数个时,为中间两数的平均值标准差和方差的异同相同点:标准差和方差描述了一组数据围绕平均数波动的大小.不同点:方差与原始数据的单位不同,且平方后可能夸大了偏差程度,标准差那么不然. 易错防X(1)易忽视频率分布直方图中纵轴表示的应为频率组距.(2)在绘制茎叶图时,易遗漏重复出现的数据,重复出现的数据要重复记录,同时不要混淆茎叶图中茎与叶的含义.1.把样本容量为20的数据分组,分组区间与频数如下:[10,20),2;[20,30),3;[30,40),4;[40,50),5;[50,60),4;[60,70],2,那么在区间[10,50)上的数据的频率是( ) B .解析:选D.由题知,在区间[10,50)上的数据的频数是2+3+4+5=14,故其频率为1420=0.7.2.(2018·某某三市第一次联考)在如下图一组数据的茎叶图中,有一个数字被污染后模糊不清,但曾计算得该组数据的极差与中位数之和为61,那么被污染的数字为( )A .1B .2C .3D .4解析:选B.由题图可知该组数据的极差为48-20=28,那么该组数据的中位数为61-28=33,易得被污染的数字为2.3.(2018·某某模拟)某商场在国庆黄金周的促销活动中,对10月2日9时到14时的销售额进行统计,其频率分布直方图如下图,9时至,那么11时到12时的销售额为( )A .6万元B .8万元C .10万元D .12万元解析:选C.设11时到12时的销售额为x 万元,依题意有2.5x =0.100.40,解得x =10.4.某学校随机抽取20个班,调查各班中有网上购物经历的人数,所得数据的茎叶图如下图,以组距为5将数据分组成[0,5),[5,10),…,[30,35),[35,40]时,所作的频率分布直方图是( )解析:选A.由分组可知C ,D 一定不对;由茎叶图可知[0,5)有1人,[5,10)有1人,所以第一、二小组频率相同,频率分布直方图中矩形的高应相等,可排除B.5.某人5次上班途中所花的时间(单位:分钟)分别为x ,y ,10,11,9.这组数据的平均数为10,方差为2,那么|x -y |的值为( ) A .1 B .2 C .3D .4解析:选D.由题意这组数据的平均数为10,方差为2,可得:x +y =20,(x -10)2+(y -10)2=8,设x =10+t ,y =10-t ,由(x -10)2+(y -10)2=8,得t 2=4,所以|x -y |=2|t |=4. 6.(2018·某某省五市十校联考)某中学奥数培训班共有14人,分为两个小组,在一次阶段测试中两个小组成绩的茎叶图如下图,其中甲组学生成绩的平均数是88,乙组学生成绩的中位数是89,那么n -m 的值是________.解析:由甲组学生成绩的平均数是88,可得70+80×3+90×3+〔8+4+6+8+2+m +5〕7=88,解得m ,可得n =9,所以n -m =6.答案:67.为了普及环保知识,增强环保意识,某大学有300名员工参加环保知识测试,按年龄分组:第1组[25,30),第2组[30,35),第3组[35,40),第4组[40,45),第5组[45,50],得到的频率分布直方图如下图.现在要从第1,3,4组中用分层抽样的方法抽取16人,那么在第4组中抽取的人数为________.解析:根据频率分布直方图得,第1,3,4组的频率之比为1∶4∶3,所以用分层抽样的方法抽取16人时,在第4组中应抽取的人数为16×31+4+3=6.答案:68.(2018·某某市第二次诊断性检测)在一个容量为5的样本中,数据均为整数,已测出其平均数为10,但墨水污损了两个数据,其中一个数据的十位数字1未被污损,即9,10,11,1,那么这组数据的方差s 2可能的最大值是________.解析:由题意可设两个被污损的数据分别为10+a ,b ,(a ,b ∈Z ,0≤a ≤9),那么10+a +b +9+10+11=50,即a +b =10,b =10-a ,所以s 2=15[(9-10)2+(10-10)2+(11-10)2+(10+a -10)2+(b -10)2]=15[2+a 2+(b -10)2]=25(1+a 2)≤25×(1+92)=32.8.9.某校1 200名高三年级学生参加了一次数学测验(总分值为100分),为了分析这次数学测验的成绩,从这1 200人的数学成绩中随机抽取200人的成绩绘制成如下的统计表,请根据表中提供的信息解决以下问题:成绩分组 频数 频率平均分 [0,20) 316 [20,40) ab [40,60) 2555 [60,80) c74 [80,100]6288(1)求a 、b 、c 的值;(2)如果从这 1 200名学生中随机抽取一人,试估计这名学生该次数学测验及格的概率P (注:60分及60分以上为及格);(3)试估计这次数学测验的年级平均分.解:(1)由题意可得,b ,a =200×0.05=10,c =200×0.5=100.(2)根据,在抽出的200人的数学成绩中,及格的有162人.所以P =162200=81100=0.81.(3)这次数学测验样本的平均分为x -=16×3+32.1×10+55×25+74×100+88×62200=73,所以这次数学测验的年级平均分大约为73分.10.(2017·高考卷)某大学艺术专业400名学生参加某次测评,根据男女学生人数比例,使用分层抽样的方法从中随机抽取了100名学生,记录他们的分数,将数据分成7组:[20,30),[30,40),…,[80,90],并整理得到如下频率分布直方图:(1)从总体的400名学生中随机抽取一人,估计其分数小于70的概率;(2)样本中分数小于40的学生有5人,试估计总体中分数在区间[40,50)内的人数; (3)样本中有一半男生的分数不小于70,且样本中分数不小于70的男女生人数相等.试估计总体中男生和女生人数的比例.解:(1)根据频率分布直方图可知,样本中分数不小于,所以样本中分数小于70的频率为1-0.6=0.4.所以从总体的400名学生中随机抽取一人,其分数小于70的概率估计为0.4. (2)根据题意,样本中分数不小于50的频率为 ,分数在区间[40,50)内的人数为100-100×0.9-5=5. 所以总体中分数在区间[40,50)内的人数估计为400×5100=20. (3)由题意可知,样本中分数不小于70的学生人数为 (0.02+0.04)×10×100=60,所以样本中分数不小于70的男生人数为60×12=30.所以样本中的男生人数为30×2=60,女生人数为100-60=40,男生和女生人数的比例为60∶40=3∶2.所以根据分层抽样原理,总体中男生和女生人数的比例估计为3∶2.1.(2018·某某模拟)某销售公司为了解员工的月工资水平,从 1 000位员工中随机抽取100位员工进行调查,得到如下的频率分布直方图:(1)试由此图估计该公司员工的月平均工资;(2)该公司的工资发放是以员工的营销水平为重要依据来确定的,一般认为,工资低于 4 500元的员工属于学徒阶段,没有营销经验,假设进行营销将会失败;高于4 500元的员工属于成熟员工,进行营销将会成功.现将该样本按照“学徒阶段工资〞“成熟员工工资〞分成两层,进行分层抽样,从中抽出5人,在这5人中任选2人进行营销活动.活动中,每位员工假设营销成功,将为公司赚得3万元,否那么公司将损失1万元.试问在此次比赛中公司收入多少万元的可能性最大?解:(1)估计该公司员工的月平均工资为0.000 1×1 000×2 000+0.000 1×1 000×3 000+0.000 2×1 000×4 000+0.000 3×1 000×5 000+0.000 2×1 000×6 000+0.000 1×1 000×7 000=4 700(元).(2)抽取比为5100=120,从工资在[1 500,4 500)内的员工中抽出100×(0.1+0.1+0.2)×120=2人,设这两位员工分别为1,2;从工资在[4 500,7 500]内的员工中抽出100×(0.3+0.2+0.1)×120=3人,设这三位员工分别为A ,B ,C .从中任选2人,共有以下10种不同的等可能结果:(1,2),(1,A ),(1,B ),(1,C ),(2,A ),(2,B ),(2,C ),(A ,B ),(A ,C ),(B ,C ).两人营销都成功,公司收入6万元,有以下3种不同的等可能结果:(A ,B ),(A ,C ),(B ,C ),概率为310;其中一人营销成功,一人营销失败,公司收入2万元,有以下6种不同的等可能结果:(1,A ),(1,B ),(1,C ),(2,A ),(2,B ),(2,C ),概率为610=35;两人营销都失败,公司收入-2万元,即损失2万元,有1种结果:(1,2),概率为110.因为110<310<35,所以公司收入2万元的可能性最大.2.(2018·某某三市第二次联考)某高三毕业班甲、乙两名同学在连续的8次数学周练中,统计解答题失分的茎叶图如图:(1)比较这两名同学8次周练解答题失分的平均数和方差的大小,并判断哪位同学做解答题相对稳定些;(2)以上述数据统计甲、乙两名同学失分超过15分的频率作为概率,假设甲、乙两名同学在同一次周练中失分多少互不影响,预测在接下来的2次周练中,甲、乙两名同学失分均超过15分的次数X 的分布列和均值.解:(1)x -甲=18(7+9+11+13+13+16+23+28)=15,x -乙=18(7+8+10+15+17+19+21+23)=15,s 2甲=18[(-8)2+(-6)2+(-4)2+(-2)2+(-2)2+12+82+132,s 2乙=18[(-8)2+(-7)2+(-5)2+02+22+42+62+82]=32.25.甲、乙两名同学解答题失分的平均数相等;甲同学解答题失分的方差比乙同学解答题失分的方差大.所以乙同学做解答题相对稳定些.(2)根据统计结果,在一次周练中,甲和乙失分超过15分的概率分别为P 1=38,P 2=12,两人失分均超过15分的概率为P 1P 2=316,X 的所有可能取值为0,1,2.依题意,X ~B (2,316),P (X =k )=C k 2(316)k (1316)2-k,k =0,1,2, 那么X 的分布列为X 的均值E (X )=2×16=8.。
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
【3份】2017高考数学(理)人教A 版 一轮复习第11章 统计与统计案例 (基础知识+题型剖析+练出高分)目录1.简单随机抽样(1)定义:设一个总体含有N 个个体,从中逐个不放回地抽取n 个个体作为样本(n ≤N ),如果每次抽取时总体内的各个个体被抽到的机会都相等,就把这种抽样方法叫做简单随机抽样.(2)最常用的简单随机抽样的方法:抽签法和随机数法. 2.系统抽样的步骤假设要从容量为N 的总体中抽取容量为n 的样本. (1)先将总体的N 个个体编号;(2)确定分段间隔k ,对编号进行分段.当N n (n 是样本容量)是整数时,取k =Nn ;(3)在第1段用简单随机抽样确定第一个个体编号l (l ≤k );(4)按照一定的规则抽取样本.通常是将l 加上间隔k 得到第2个个体编号(l +k ),再加k 得到第3个个体编号(l +2k ),依次进行下去,直到获取整个样本. 3.分层抽样(1)定义:在抽样时,将总体分成互不交叉的层,然后按照一定的比例,从各层独立地抽取一定数量的个体,将各层取出的个体合在一起作为样本,这种抽样方法叫做分层抽样. (2)分层抽样的应用范围:当总体由差异明显的几个部分组成时,往往选用分层抽样.【思考辨析】判断下面结论是否正确(请在括号中打“√”或“×”)(1)简单随机抽样是一种不放回抽样.(√)(2)简单随机抽样每个个体被抽到的机会不一样,与先后有关.(×)(3)系统抽样在起始部分抽样时采用简单随机抽样.(√)(4)要从1002个学生中用系统抽样的方法选取一个容量为20的样本,需要剔除2个学生,这样对被剔除者不公平.(×)(5)分层抽样中,每个个体被抽到的可能性与层数及分层有关.(×)1.(教材改编)某公司有员工500人,其中不到35岁的有125人,35~49岁的有280人,50岁以上的有95人,为了调查员工的身体健康状况,从中抽取100名员工,则应在这三个年龄段分别抽取人数为()A.33人,34人,33人B.25人,56人,19人C.20人,40人,30人D.30人,50人,20人答案 B解析因为125∶280∶95=25∶56∶19,所以抽取人数分别为25人,56人,19人.2.(2015·四川)某学校为了了解三年级、六年级、九年级这三个年级之间的学生视力是否存在显著差异,拟从这三个年级中按人数比例抽取部分学生进行调查,则最合理的抽样方法是()A.抽签法B.系统抽样法C.分层抽样法D.随机数法答案 C解析根据年级不同产生差异及按人数比例抽取易知应为分层抽样法.3.将参加英语口语测试的1000名学生编号为000,001,002,…,999,从中抽取一个容量为50的样本,按系统抽样的方法分为50组,如果第一组编号为000,001,002,…,019,且第一组随机抽取的编号为015,则抽取的第35个编号为()A.700B.669C.695D.676答案 C解析由题意可知,第一组随机抽取的编号l=15,分段间隔数k =N n =100050=20,则抽取的第35个编号为a 35=15+(35-1)×20=695.4.(教材改编)某公司共有1000名员工,下设若干部门,现采用分层抽样方法,从全体员工中抽取一个样本容量为80的样本,已告知广告部门被抽取了4个员工,则广告部门的员工人数为________. 答案 50 解析100080=x4,x =50. 5.(2014·天津)某大学为了了解在校本科生对参加某项社会实践活动的意向,拟采用分层抽样的方法,从该校四个年级的本科生中抽取一个容量为300的样本进行调查,已知该校一年级、二年级、三年级、四年级的本科生人数之比为4∶5∶5∶6,则应从一年级本科生中抽取________名学生. 答案 60解析 根据题意,应从一年级本科生中抽取的人数为44+5+5+6×300=60.题型一 简单随机抽样例1 (1)总体由编号为01,02,…,19,20的20个个体组成.利用下面的随机数表选取5个个体,选取方法是从随机数表第1行的第5列和第6列数字开始由左到右依次选取两个数字,则选出来的第5个个体的编号为( )A.08(2)下列抽取样本的方式不属于简单随机抽样的有________. ①从无限多个个体中抽取100个个体作为样本.②盒子里共有80个零件,从中选出5个零件进行质量检验.在抽样操作时,从中任意拿出一个零件进行质量检验后再把它放回盒子里. ③从20件玩具中一次性抽取3件进行质量检验.④某班有56名同学,指定个子最高的5名同学参加学校组织的篮球赛. 答案 (1)D (2)①②③④解析 (1)由题意知前5个个体的编号为08,02,14,07,01. (2)①不是简单随机抽样.②不是简单随机抽样.由于它是放回抽样.③不是简单随机抽样.因为这是“一次性”抽取,而不是“逐个”抽取.④不是简单随机抽样.因为指定个子最高的5名同学是56名中特指的,不存在随机性,不是等可能抽样.思维升华应用简单随机抽样应注意的问题(1)一个抽样试验能否用抽签法,关键看两点:一是抽签是否方便;二是号签是否易搅匀.一般地,当总体容量和样本容量都较小时可用抽签法.(2)在使用随机数法时,如遇到三位数或四位数,可从选择的随机数表中的某行某列的数字计起,每三个或四个作为一个单位,自左向右选取,有超过总体号码或出现重复号码的数字舍去.下列抽样试验中,适合用抽签法的有()A.从某厂生产的5000件产品中抽取600件进行质量检验B.从某厂生产的两箱(每箱18件)产品中抽取6件进行质量检验C.从甲、乙两厂生产的两箱(每箱18件)产品中抽取6件进行质量检验D.从某厂生产的5000件产品中抽取10件进行质量检验答案 B解析A,D中的总体中个体数较多,不适宜抽签法,C中甲、乙两厂的产品质量有区别,也不适宜抽签法,故选B.题型二系统抽样例2(1)(2015·湖南)在一次马拉松比赛中,35名运动员的成绩(单位:分钟)的茎叶图如图所示13003456688891411122233445556678 15012233 3若将运动员按成绩由好到差编为1~35号,再用系统抽样方法从中抽取7人,则其中成绩在区间[139,151]上的运动员人数是()A.3B.4C.5D.6(2)某单位有840名职工,现采用系统抽样方法抽取42人做问卷调查,将840人按1,2,…,840随机编号,则抽取的42人中,编号落入区间[481,720]的人数为()A.11B.12C.13D.14答案(1)B(2)B解析(1)由题意知,将1~35号分成7组,每组5名运动员,成绩落在区间[139,151]的运动员共有4组,故由系统抽样法知,共抽取4名.选B.(2)由84042=20,即每20人抽取1人,所以抽取编号落入区间[481,720]的人数为720-48020=24020=12.引申探究1.本例(2)中条件不变,若第三组抽得的号码为44,则在第八组中抽得的号码是________. 答案 144解析 在第八组中抽得的号码为(8-3)×20+44=144.2.本例(2)中条件不变,若在编号为[481,720]中抽取8人,则样本容量为________. 答案 28解析 因为在编号[481,720]中共有720-480=240人,又在[481,720]中抽取8人, 所以抽样比应为240∶8=30∶1,又因为单位职工共有840人,所以应抽取的样本容量为84030=28.思维升华 (1)系统抽样适用的条件是总体容量较大,样本容量也较大.(2)使用系统抽样时,若总体容量不能被样本容量整除,可以先从总体中随机地剔除几个个体,从而确定分段间隔.(3)起始编号的确定应用简单随机抽样的方法,一旦起始编号确定,其他编号便随之确定.将参加夏令营的600名学生编号为001,002,…,600.采用系统抽样方法抽取一个容量为50的样本,且随机抽得的号码为003.这600名学生分住在三个营区,从001到300在第Ⅰ营区,从301到495在第Ⅱ营区,从496到600在第Ⅲ营区,三个营区被抽中的人数依次为( ) A.26,16,8 B.25,17,8 C.25,16,9 D.24,17,9答案 B解析 由题意及系统抽样的定义可知,将这600名学生按编号依次分成50组,每一组各有12名学生,第k (k ∈N *)组抽中的号码是3+12(k -1). 令3+12(k -1)≤300得k ≤1034,因此第Ⅰ营区被抽中的人数是25; 令300<3+12(k -1)≤495得1034<k ≤42,因此第Ⅱ营区被抽中的人数是42-25=17.结合各选项知,选B. 题型三 分层抽样命题点1 求总体或样本容量例3 某工厂甲、乙、丙三个车间生产了同一种产品,数量分别为120件,80件,60件.为了解它们的产品质量是否存在显著差异,用分层抽样方法抽取了一个容量为n 的样本进行调查,其中从丙车间的产品中抽取了3件,则n 等于( ) A.9B.10C.12D.13答案 D解析 ∵360=n120+80+60,∴n =13.命题点2 求某层入样的个体数例4 (2015·福建)某校高一年级有900名学生,其中女生400名.按男女比例用分层抽样的方法,从该年级学生中抽取一个容量为45的样本,则应抽取的男生人数为________. 答案 25解析 由题意知,男生共有500名,根据分层抽样的特点,在容量为45的样本中男生应抽取人数:45×500900=25.思维升华 分层抽样问题类型及解题思路(1)求某层应抽个体数量:按该层所占总体的比例计算.(2)已知某层个体数量,求总体容量或反之:根据分层抽样就是按比例抽样,列比例式进行计算.(3)确定是否应用分层抽样:分层抽样适用于总体中个体差异较大的情况.(1)(2014·广东)已知某地区中小学生人数和近视情况分别如图①和图②所示.为了解该地区中小学生的近视形成原因,用分层抽样的方法抽取2%的学生进行调查,则样本容量和抽取的高中生近视人数分别为( )A.200,20B.100,20C.200,10D.100,10(2)(2014·湖北)甲、乙两套设备生产的同类型产品共4800件,采用分层抽样的方法从中抽取一个容量为80的样本进行质量检测.若样本中有50件产品由甲设备生产,则乙设备生产的产品总数为________件. 答案 (1)A (2)1800解析 (1)该地区中小学生总人数为 3500+2000+4500=10000,则样本容量为10000×2%=200,其中抽取的高中生近视人数为2000×2%×50%=20,故选A.(2)设乙设备生产的产品总数为x 件,则甲设备生产的产品总数为(4800-x )件.由分层抽样特点,结合题意可得5080=4800-x4800,解得x =1800.五审图表找规律典例(12分)某单位有2000名职工,老年、中年、青年分布在管理、技术开发、营销、生产各部门中,如下表所示:(1)若要抽取40(2)若要开一个25人的讨论单位发展与薪金调整方面的座谈会,则应怎样抽选出席人?(3)若要抽20人调查对广州亚运会举办情况的了解,则应怎样抽样?抽取40人调查身体状况↓(观察图表中的人数分类统计情况)样本人群应受年龄影响↓(表中老、中、青分类清楚,人数确定)要以老、中、青分层,用分层抽样↓要开一个25人的座谈会↓(讨论单位发展与薪金调整)样本人群应受管理、技术开发、营销、生产方面的影响↓(表中管理、技术开发、营销、生产分类清楚,人数确定)要以管理、技术开发、营销、生产人员分层,用分层抽样↓要抽20人调查对广州亚运会举办情况的了解↓(可认为亚运会是大众体育盛会,一个单位人员对情况了解相当)将单位人员看作一个整体↓(从表中数据看总人数为2000人)人员较多,可采用系统抽样规范解答解(1)按老年、中年、青年分层,用分层抽样法抽取,[1分]抽取比例为402000=150.[2分]故老年人、中年人、青年人各抽取4人、12人、24人.[4分](2)按管理、技术开发、营销、生产分层,用分层抽样法抽取,[5分]抽取比例为252000=180,[6分]故管理、技术开发、营销、生产各部门抽取2人、4人、6人、13人.[8分](3)用系统抽样,对全部2000人随机编号,号码从0001~2000,每100号分为一组,从第一组中用简单随机抽样抽取一个号码,然后将这个号码分别加100,200,…,1900,共20人组成一个样本.[12分]温馨提醒(1)本题审题的关键有两点,一是对图表中的人员分类情况和数据要审视清楚;二是对样本的功能要审视准确.(2)本题易错点是,对于第(2)问,由于对样本功能审视不准确,按老、中、青三层分层抽样.[方法与技巧]1.简单随机抽样的特点:总体中的个体性质相似,无明显层次;总体容量较小,尤其是样本容量较小;用简单随机抽样法抽取的个体带有随机性;个体间无固定间距.2.系统抽样的特点:适用于元素个数很多且均衡的总体;各个个体被抽到的机会均等;总体分组后,在起始部分抽样时,采用简单随机抽样.3.分层抽样的特点:适用于总体由差异明显的几部分组成的情况;分层后,在每一层抽样时可采用简单随机抽样或系统抽样.[失误与防范]进行分层抽样时应注意以下几点:(1)分层抽样中分多少层、如何分层要视具体情况而定,总的原则是层内样本的差异要小,两层之间的样本差异要大,且互不重叠.(2)为了保证每个个体等可能入样,所有层中每个个体被抽到的可能性相同.A 组 专项基础训练 (时间:30分钟)1.为了了解某地区的中小学生视力情况,拟从该地区的中小学生中抽取部分学生进行调查,事先已了解到该地区小学、初中、高中三个学段学生的视力情况有较大差异,而男女生视力情况差异不大,在下面的抽样方法中,最合理的抽样方法是( ) A.简单随机抽样 B.按性别分层抽样 C.按学段分层抽样 D.系统抽样答案 C解析 不同的学段在视力状况上有所差异,所以应该按照学段分层抽样.2.某校选修乒乓球课程的学生中,高一年级有30名,高二年级有40名.现用分层抽样的方法在这70名学生中抽取一个样本,已知在高一年级的学生中抽取了6名,则在高二年级的学生中应抽取的人数为( ) A.6 B.8 C.10 D.12答案 B解析 设样本容量为N ,则N ×3070=6,∴N =14,∴高二年级所抽学生人数为14×4070=8.3.某初级中学有学生270人,其中一年级108人,二、三年级各81人,现要利用抽样方法抽取10人参加某项调查,考虑选用简单随机抽样、分层抽样和系统抽样三种方案,使用简单随机抽样和分层抽样时,将学生按一、二、三年级依次统一编号为1,2,…,270,使用系统抽样时,将学生统一随机编号为1,2,…,270,并将整个编号依次分为10段,如果抽得号码有下列四种情况:①7,34,61,88,115,142,169,196,223,250 ②5,9,100,107,111,121,180,195,200,265 ③11,38,65,92,119,146,173,200,227,254 ④30,57,84,111,138,165,192,219,246,270 关于上述样本的下列结论中,正确的是( ) A.②、③都不能为系统抽样 B.②、④都不能为分层抽样 C.①、④都可能为系统抽样D.①、③都可能为分层抽样答案 D解析因为③为系统抽样,所以选项A不对;因为②为分层抽样,所以选项B不对;因为④不为系统抽样,所以选项C不对,故选D.4.从编号为1~50的50枚最新研制的某种型号的导弹中随机抽取5枚来进行发射实验,若采用每部分选取的号码间隔一样的系统抽样方法,则所选取5枚导弹的编号可能是() A.5,10,15,20,25 B.3,13,23,33,43C.1,2,3,4,5D.2,4,6,16,32答案 B解析间隔距离为10,故可能的编号是3,13,23,33,43.5.(2015·北京)某校老年、中年和青年教师的人数见下表,采用分层抽样的方法调查教师的身体状况,在抽取的样本中,青年教师有320人,则该样本中的老年教师人数为()A.90B.100答案 C解析由题意得,抽样比为3201600=15,∴该样本的老年教师人数为900×15=180(人).6.某学校高一、高二、高三年级的学生人数之比为3∶3∶4,现用分层抽样的方法从该校高中三个年级的学生中抽取容量为50的样本,则应从高二年级抽取________名学生.答案15解析抽取比例与学生比例一致.设应从高二年级抽取x名学生,则x∶50=3∶10.解得x=15.7.某校共有学生2000名,各年级男、女学生人数如下表.已知在全校学生中随机抽取1名,抽到二年级女生的概率是0.19.现用分层抽样的方法在全校抽取64名学生,则应在三年级抽取的学生人数为________.答案16解析依题意可知二年级的女生有380人,那么三年级的学生人数应该是2000-373-377-380-370=500,即总体中各个年级的人数比为3∶3∶2,故在分层抽样中应在三年级抽取的学生人数为64×28=16.8.用系统抽样法从160名学生中抽取容量为20的样本,将160名学生从1~160编号,按编号顺序平均分成20组(1~8号,9~16号,…,153~160号),若第16组抽出的号码为123,则第2组中应抽出个体的号码是________. 答案 11解析 由题意可知,系统抽样的组数为20,间隔为8,设第1组抽出的号码为x ,则由系统抽样的法则可知,第n 组抽出个体的号码应该为x +(n -1)×8,所以第16组应抽出的号码为x +(16-1)×8=123,解得x =3,所以第2组中应抽出个体的号码为3+(2-1)×8=11. 9.将某班的60名学生编号为01,02,…,60,采用系统抽样方法抽取一个容量为5的样本,且随机抽得的一个号码为04,则剩下的四个号码依次是______________. 答案 16,28,40,52解析 编号组数为5,间隔为605=12,因为在第一组抽得04号:4+12=16,16+12=28,28+12=40,40+12=52, 所以其余4个号码为16,28,40,52.10.某政府机关有在编人员100人,其中副处级以上干部10人,一般干部70人,工人20人.上级机关为了了解政府机构改革意见,要从中抽取一个容量为20的样本,试确定用何种方法抽取,请具体实施抽取. 解 用分层抽样方法抽取. 具体实施抽取如下:(1)∵20∶100=1∶5,∴105=2,705=14,205=4,∴从副处级以上干部中抽取2人,从一般干部中抽取14人,从工人中抽取4人.(2)副处级以上干部与工人的人数较少,他们分别按1~10编号与1~20编号,然后采用抽签法分别抽取2人和4人;对一般干部70人采用00,01,02,…,69编号,然后用随机数法抽取14人.(3)将2人,4人,14人的编号汇合在一起就取得了容量为20的样本.B 组 专项能力提升 (时间:25分钟)11.(2014·湖南)对一个容量为N 的总体抽取容量为n 的样本,当选取简单随机抽样、系统抽样和分层抽样三种不同方法抽取样本时,总体中每个个体被抽中的概率分别为p 1,p 2,p 3,则( )A.p 1=p 2<p 3B.p 2=p 3<p 1C.p 1=p 3<p 2D.p 1=p 2=p 3答案 D解析 由于三种抽样过程中,每个个体被抽到的概率都是相等的,因此p 1=p 2=p 3. 12.采用系统抽样方法从960人中抽取32人做问卷调查,为此将他们随机编号为1,2,…,960,分组后在第一组采用简单随机抽样的方法抽到的号码为9.抽到的32人中,编号落入区间[1,450]的人做问卷A ,编号落入区间[451,750]的人做问卷B ,其余的人做问卷C .则抽到的人中,做问卷B 的人数为( ) A.7B.9C.10D.15答案 C解析 由系统抽样的特点知:抽取号码的间隔为96032=30,抽取的号码依次为9,39,69,…,939.落入区间[451,750]的有459,489,…,729,这些数构成首项为459,公差为30的等差数列,设有n 项,显然有729=459+(n -1)×30,解得n =10.所以做问卷B 的有10人. 13.200名职工年龄分布如图所示,从中随机抽取40名职工作样本,采用系统抽样方法,按1~200编号,分为40组,分别为1~5,6~10,…,196~200,第5组抽取号码为22,第8组抽取号码为________.若采用分层抽样,40岁以下年龄段应抽取________人.答案 37 20解析 将1~200编号分为40组,则每组的间隔为5,其中第5组抽取号码为22,则第8组抽取的号码应为22+3×5=37;由已知条件200名职工中40岁以下的职工人数为200×50%=100,设在40岁以下年龄段中应抽取x 人,则40200=x100,解得x =20. 14.一个总体中有90个个体,随机编号0,1,2,…,89,依从小到大的编号顺序平均分成9个小组,组号依次为1,2,3,…,9.现用系统抽样方法抽取一个容量为9的样本,规定如果在第1组随机抽取的号码为m ,那么在第k 组中抽取的号码个位数字与m +k 的个位数字相同,若m =8,则在第8组中抽取的号码是________. 答案 76解析 由题意知:m =8,k =8,则m +k =16,也就是第8组抽取的号码个位数字为6,十位数字为8-1=7,故抽取的号码为76.15.某公路设计院有工程师6人,技术员12人,技工18人,要从这些人中抽取n 个人参加市里召开的科学技术大会.如果采用系统抽样和分层抽样的方法抽取,不用剔除个体,如果参会人数增加1个,则在采用系统抽样时,需要在总体中先剔除1个个体,求n . 解 总体容量为6+12+18=36.当样本容量是n 时,由题意知,系统抽样的间隔为36n ,分层抽样的比例是n36,抽取的工程师人数为n 36×6=n 6,技术员人数为n 36×12=n 3,技工人数为n 36×18=n2,所以n 应是6的倍数,36的约数,即n =6,12,18.当样本容量为(n +1)时,总体容量是35人,系统抽样的间隔为35n +1,因为35n +1必须是整数,所以n 只能取6.即样本容量n =6.1.作频率分布直方图的步骤(1)求极差(即一组数据中最大值与最小值的差). (2)决定组距与组数. (3)将数据分组. (4)列频率分布表. (5)画频率分布直方图.2.频率分布折线图和总体密度曲线(1)频率分布折线图:连接频率分布直方图中各小长方形上端的中点,就得到频率分布折线图.(2)总体密度曲线:随着样本容量的增加,作图时所分的组数增加,组距减小,相应的频率折线图会越来越接近于一条光滑曲线,统计中称这条光滑曲线为总体密度曲线. 3.茎叶图统计中还有一种被用来表示数据的图叫做茎叶图,茎是指中间的一列数,叶是从茎的旁边生长出来的数.4.标准差和方差(1)标准差是样本数据到平均数的一种平均距离. (2)标准差: s =1n[(x 1-x )2+(x 2-x )2+…+(x n -x )2]. (3)方差:s 2=1n [(x 1-x )2+(x 2-x )2+…+(x n -x )2](x n 是样本数据,n 是样本容量,x 是样本平均数).【知识拓展】1.频率分布直方图的特点(1)频率分布直方图中相邻两横坐标之差表示组距,纵坐标表示频率组距,频率=组距×频率组距.(2)频率分布直方图中各小长方形的面积之和为1,因为在频率分布直方图中组距是一个固定值,所以各小长方形高的比也就是频率比.(3)频率分布表和频率分布直方图是一组数据频率分布的两种形式,前者准确,后者直观. 2.平均数、方差的公式推广(1)若数据x 1,x 2,…,x n 的平均数为x ,那么mx 1+a ,mx 2+a ,mx 3+a ,…,mx n +a 的平均数是m x +a .(2)数据x 1,x 2,…,x n 的方差为s 2.①数据x 1+a ,x 2+a ,…,x n +a 的方差也为s 2; ②数据ax 1,ax 2,…,ax n 的方差为a 2s 2.【思考辨析】判断下面结论是否正确(请在括号中打“√”或“×”)(1)平均数、众数与中位数从不同的角度描述了一组数据的集中趋势.( √ ) (2)一组数据的众数可以是一个或几个,那么中位数也具有相同的结论.( × )(3)从频率分布直方图得不出原始的数据内容,把数据表示成直方图后,原有的具体数据信息就被抹掉了.( √ )(4)茎叶图一般左侧的叶按从大到小的顺序写,右侧的叶按从小到大的顺序写,相同的数据可以只记一次.( × )(5)在频率分布直方图中,最高的小长方形底边中点的横坐标是众数.( √ ) (6)在频率分布直方图中,众数左边和右边的小长方形的面积和是相等的.( × )1.(2015·陕西)某中学初中部共有110名教师,高中部共有150名教师,其性别比例如图所示,则该校女教师的人数为( )A.93B.123C.137D.167答案 C【详细分析】由题干扇形统计图可得该校女教师人数为:110×70%+150×(1-60%)=137.故选C.2.若某校高一年级8个班参加合唱比赛的得分茎叶图如图所示,则这组数据的中位数和平均数分别是( )A.91.5和91.5B.91.5和92C.91和91.5D.92和92答案 A【详细分析】∵这组数据由小到大排列为87,89,90,91,92,93,94,96,∴中位数为12×(91+92)=91.5.平均数为18×(87+89+90+91+92+93+94+96)=91.5.3.一个容量为66的样本,数据的分组及各组的频数如下:[11.5,15.5) 2 [15.5,19.5) 4 [19.5,23.5) 9 [23.5,27.5) 18 [27.5,31.5) 11 [31.5,35.5) 12[35.5,39.5) 7 [39.5,43.5) 3根据样本的频率分布估计,数据落在[31.5,43.5)的概率约是( ) A.16 B.13 C.12 D.23答案 B【详细分析】由已知,样本容量为66,而落在[31.5,43.5)内的样本数为12+7+3=22,故所求概率为2266=13.4.(教材改编)某赛季,甲、乙两名篮球运动员都参加了11场比赛,他们每场比赛得分的情况用如图所示的茎叶图表示,则甲、乙两名运动员得分的中位数分别为________.答案 19,135.(教材改编)甲、乙两人在相同条件下各射靶10次,每次命中环数如下: 甲 4 7 10 9 5 6 8 6 8 8 乙 7 8 6 8 6 7 8 7 5 9 试问10次射靶的情况较稳定的是________. 答案 乙【详细分析】x 甲=4+7+10+9+5+6+8+6+8+810=7.1,x 乙=7+8+6+8+6+7+8+7+5+910=7.1.s 2甲=110[(4-7.1)2+(7-7.1)2+…+(8-7.1)2]=3.09, s 2乙=110[(7-7.1)2+(8-7.1)2+…+(9-7.1)2]=1.29. s 2甲>s 2乙,∴乙较稳定.题型一 频率分布直方图的绘制与应用例1 (2015·课标全国Ⅱ)某公司为了解用户对其产品的满意度,从A ,B 两地区分别随机调查了40个用户,根据用户对产品的满意度评分,得到A 地区用户满意度评分的频率分布直方图和B 地区用户满意度评分的频数分布表.A 地区用户满意度评分的频率分布直方图图①B地区用户满意度评分的频数分布表(1)度评分的平均值及分散程度(不要求计算出具体值,给出结论即可).B地区用户满意度评分的频率分布直方图图②(2)根据用户满意度评分,将用户的满意度分为三个等级:解(1)如图所示.通过两地区用户满意度评分的频率分布直方图可以看出,B地区用户满意度评分的平均值高于A地区用户满意度评分的平均值;B地区用户满意度评分比较集中,而A地区用户满意度评分比较分散.(2)A地区用户的满意度等级为不满意的概率大.记C A表示事件:“A地区用户的满意度等级为不满意”;C B表示事件:“B地区用户的满意度等级为不满意”.由直方图得P (C A )的估计值为(0.01+0.02+0.03)×10=0.6,P (C B )的估计值为(0.005+0.02)×10=0.25.所以A 地区用户的满意度等级为不满意的概率大.思维升华 (1)明确频率分布直方图的意义,即图中的每一个小矩形的面积是数据落在该区间上的频率,所有小矩形的面积和为1.(2)对于统计图表类题目,最重要的是认真观察图表,从中提炼有用的信息和数据.(1)(2014·山东)为了研究某药品的疗效,选取若干名志愿者进行临床试验,所有志愿者的舒张压数据(单位:kPa)的分组区间为[12,13),[13,14),[14,15),[15,16),[16,17],将其按从左到右的顺序分别编号为第一组,第二组,…,第五组,如图是根据试验数据制成的频率分布直方图.已知第一组与第二组共有20人,第三组中没有疗效的有6人,则第三组中有疗效的人数为( )A.6B.8C.12D.18答案 C【详细分析】志愿者的总人数为20(0.16+0.24)×1=50,所以第三组人数为50×0.36=18, 有疗效的人数为18-6=12.(2)某校从参加高一年级期中考试的学生中随机抽出60名学生,将其物理成绩(均为整数)分成六段[40,50),[50,60),…,[90,100]后得到如图所示的频率分布直方图,观察图形的信息,回答下列问题:①求分数在[70,80)内的频率,并补全这个频率分布直方图;②统计方法中,同一组数据常用该组区间的中点值作为代表,据此估计本次考试中的平均分. 解 ①设分数在[70,80)内的频率为x ,根据频率分布直方图,有(0.010+0.015×2+0.025+0.005)×10+x =1,可得x =0.3,所以频率分布直方图如图所示.。