(江西版)2013年高考数学总复习 第十章10.6 随机抽样与用样本估计总体 理 北师大版(含详解)

合集下载

2013届高考理科数学一轮复习课件10.4用样本估计总体

2013届高考理科数学一轮复习课件10.4用样本估计总体

【解析】 分组
[39.95,39.97) [39.97,39.99) [39.99,40.01) [40.01,40.03]
合计
频数 频率 频率/组距
10 0.10
5
20 0.20
10
50 0.50
25
20 0.20
10
100 1
频率分布直方图如下:
(2)误差不超过0.3mm,即直径落在[39.97,40.03]范围 内,其概率为0.2+0.5+0.2=0.9.
【解析】 (1)两学生成绩的茎叶图如图所示.
(2)将甲、乙两学生的成绩从小到大排列为: 甲:512 522 528 534 536 538 541 549 554 556 乙:515 521 527 531 532 536 543 548 558 559 从以上排列可知甲学生成绩的中位数为 536+2 538=537.
+62)]=57.25.
品种乙的每公顷产量的样本平均数和样本方差分别
为:
-x
乙=
1 8
×(419+403+412+418+408+423+400+
413)=412,
s2乙=18×[72+(-9)2+02+62+(-4)2+112+(-12)2+
12]=56.
由以上结果可看出,品种乙的样本平均数大于品种
3.标准差和方差 (1)标准差是样本数据到平均数的一种 平均距离 .
(2)s= 1n[x1- x 2+x2- x 2+…+xn- x 2] . (3)方差:s2= 1n[(x1- x )2+(x2- x )2+…+(xn- x )2] (xn是样本数据,n是样本404 388 400 412 406
品种乙 419 403 412 418 408 423 400 413

高考数学一轮复习 第十章 第2讲 用样本估计总体课件 文

高考数学一轮复习 第十章 第2讲 用样本估计总体课件 文

ppt精选
3
2.样本的数字特征 (1)众数:一组数据中___出__现__次__数__最__多_____的那个数据,叫 做这组数据的众数. (2)中位数:把 n 个数据按大小顺序排列,处于_最__中___间____ 位置的一个数据叫做这组数据的中位数.
a1+a2+…+an (3)平均数:把________n___________称为 a1,a2,…,an 这 n 个数的平均数.
15
(2)(2014·高考北京卷)从某校随机抽取 100 名学生,获得了
他们一周课外阅读时间(单位:小时)的数据,整理得到数据
分组及频数分布表和频率分布直方图:
组号 1 2 3 4 5 6 7 8 9
合计
分组
[0,2) [2,4) [4,6) [6,8) [8,10) [10,12) [12,14) [14,16) [16,18)
ppt精选
4
(4)标准差与方差:设一组数据 x1,x2,x3,…,xn 的平均
数为-x ,则这组数据的标准差和方差分别是
s=
n1[(x1--x )2+(x2--x )2+…+(xn--x )2]
s2=n1[(x1--x )2+(x2--x )2+…+(xn--x )2]
ppt精选
5
[做一做]
1.(2014·高考四川卷)在“世界读书日”前夕,为了了解某
第十章 统计、统计案例及算法初步
第2讲 用样本估计总体
ppt精选
1
1.统计图表的含义
(1)频率分布表
①含义:把反映总体频率分布的表格称为频率分布表.
②频率分布表的画法步骤:
第一步:求___极__差_____,决定组数和组距,组距=极组差数;
第二步:__分__组______,通常对组内数值所在区间取左闭右开

2025届高中数学一轮复习课件《随机抽样、用样本估计总体》ppt

2025届高中数学一轮复习课件《随机抽样、用样本估计总体》ppt

高考一轮总复习•数学
第21页
(3)(2024·江西吉安模拟)总体由编号为 00,01,02,…,48,49 的 50 个个体组成,利用下面 的随机数表选取 6 个个体,选取方法是从随机数表第 6 行的第 9 列和第 10 列数字开始从
数字 3. 数字 3. 左到右依次选取两个数字,则选出的第 3 个个体的编号为 ( )

高考一轮总复习•数学
第10页
2.总体方差和总体标准差 (1)一般式:如果总体中所有个体的变量值分别为 Y1,Y2,…,YN,总体平均数为 Y ,则
总体方差 S2=N1i=N1 (Yi- Y )2.
(2)加权式:如果总体的 N 个变量值中,不同的值共有 k(k≤N)个,不妨记为 Y1,Y2,…,
Yk,其中 Yi 出现的频数为 fi(i=1,2,…,k),则总体方差为 S2=N1i=k1fi(Yi- Y )2.
高考一轮总复习•数学
第12页
3.简单随机抽样样本平均数、方差的计算公式的推广 (1)若数据 x1,x2,…,xn 的平均数为 x ,则数据 mx1+a,mx2+a,mx3+a,…,mxn +a 的平均数是 m x +a; (2)若数据 x1,x2,…,xn 的方差为 s2,则数据 ax1+b,ax2+b,…,axn+b 的方差为 a2s2. 4.分层随机抽样样本均值、方差的计算公式的推广 如果将总体分为 k 层,第 j 层抽取的样本量为 nj,样本均值为 x j,样本方差为 s2j ,j=
高考一轮总复习•数学
第24页
(3)按随机数法,从随机数表第 6 行的第 9 列和第 10 列数字开始从左到右依次选取两个数 字,超出 因为编号由 2 个数字组成.
00~49 及重复的不选,则编号依次为 33,16,20,38,49,32,…,则选出的第 3 个个体的编 号为 20.故选 D.

高考数学(理)总复习讲义:随机抽样与用样本估计总体

高考数学(理)总复习讲义:随机抽样与用样本估计总体

第三节随机抽样与用样本估计总体1.简单随机抽样(1)抽取方式:逐个不放回抽取;(2)特点:每个个体被抽到的概率相等;(3)常用方法:抽签法和随机数法.⇒利用随机数表抽样时,①选定的初始数和读数的方向是任意的;②对各个个体编号要视总体中的个体数情况而定,且必须保证所编号码的位数一致.2.分层抽样(1)在抽样时,将总体分成互不交叉的层,然后按照一定的比例,从各层独立地抽取一定数量的个体,将各层取出的个体合在一起作为样本,这种抽样方法是一种分层抽样.(2)分层抽样的应用范围:当总体是由差异明显的几个部分组成时,往往选用分层抽样.利用分层抽样要注意按比例抽取,若各层应抽取的个体数不都是整数,则应当调整各层容量,即先剔除各层中“多余”的个体.3.系统抽样(1)系统抽样适用于元素个数很多且均衡的总体.(2)系统抽样的步骤假设要从容量为N的总体中抽取容量为n的样本.①先将总体的N个个体编号;②确定分段间隔k,对编号进行分段.当Nn(n是样本容量)是整数时,取k=Nn;③在第1段用简单随机抽样确定第一个个体编号l(l≤k);④按照一定的规则抽取样本.通常是将l加上间隔k得到第2个个体编号l+k,再加k 得到第3个个体编号l+2k,依次进行下去,直到获取整个样本.4.作频率分布直方图的步骤(1)求极差(即一组数据中最大值与最小值的差);(2)决定组距与组数;(3)将数据分组;(4)列频率分布表;(5)画频率分布直方图.5.频率分布折线图和总体密度曲线(1)频率分布折线图:连接频率分布直方图中各小长方形上端的中点,就得到频率分布折线图.(2)总体密度曲线:随着样本容量的增加,作图时所分的组数增加,组距减小,相应的频率折线图会越来越接近于一条光滑曲线,统计中称这条光滑曲线为总体密度曲线.6.茎叶图统计中还有一种被用来表示数据的图叫做茎叶图,茎是指中间的一列数,叶就是从茎的旁边生长出来的数.7.标准差和方差(1)标准差是样本数据到平均数的一种平均距离.(2)标准差:s=1n[(x1-x)2+(x2-x)2+…+(x n-x)2].(3)方差:s2=1n[(x1-x)2+(x2-x)2+…+(x n-x)2](x n是样本数据,n是样本容量,x是样本平均数).1.标准差与方差的特点反映了各个样本数据聚集于样本平均数周围的程度.标准差(方差)越小,表明各个样本数据在样本平均数周围越集中;标准差(方差)越大,表明各个样本数据在样本平均数的两边越分散.2.平均数、方差的公式推广(1)若数据x1,x2,…,x n的平均数为\x\to(x),那么mx1+a,mx2+a,mx3+a,…,mx n+a的平均数是m\x\to(x)+a.,(2)数据x1,x2,…,x n的方差为s2.,①数据x1+a,x2+a,…,x n+a的方差也为s2;,②数据ax1,ax2,…,ax n的方差为a2s2.[小题查验基础]一、判断题(对的打“√”,错的打“×”)(1)在简单随机抽样中,某一个个体被抽到的可能性与第几次抽取有关,第一次被抽到的可能性最大.()(2)分层抽样中,每个个体被抽到的可能性与层数及分层有关.()(3)平均数、众数与中位数从不同的角度描述了一组数据的集中趋势.()(4)茎叶图一般左侧的叶按从大到小的顺序写,右侧的叶按从小到大的顺序写,相同的数据可以只记一次.()(5)在频率分布直方图中,最高的小长方形底边中点的横坐标是众数.()答案:(1)×(2)×(3)√(4)×(5)√二、选填题1.为了了解某地参加计算机水平测试的5 000名学生的成绩,从中抽取了200名学生的成绩进行统计分析.在这个问题中,这200名学生成绩的全体是( )A.总体B.个体C.从总体中抽取的一个样本D.样本容量解析:选C 根据随机抽样的概念可知选C.2.某学校为调查高三年级的240名学生完成课后作业所需的时间,采取了两种抽样调查方式:第一种由学生会的同学随机抽取24名同学进行调查;第二种由教务处对高三年级的学生进行编号,从001到240,抽取学号最后一位为3的同学进行调查,则这两种抽样方法依次为( )A.分层抽样,简单随机抽样B.简单随机抽样,分层抽样C.分层抽样,系统抽样D.简单随机抽样,系统抽样解析:选D 由三种抽样方法的定义可知,题中第一种方法为简单随机抽样,第二种为系统抽样.3.为评估一种农作物的种植效果,选了n 块地作试验田.这n 块地的亩产量(单位:kg)分别为x 1,x 2,…,x n ,下面给出的指标中可以用来评估这种农作物亩产量稳定程度的是( )A.x 1,x 2,…,x n 的平均数B.x 1,x 2,…,x n 的标准差C.x 1,x 2,…,x n 的最大值D.x 1,x 2,…,x n 的中位数解析:选B 统计问题中,体现数据的稳定程度的指标为数据的方差或标准差.故选B. 4.某学校高一、高二、高三年级的学生人数之比为3∶3∶4,现用分层抽样的方法从该校高中三个年级的学生中抽取容量为50的样本,则应从高二年级抽取________名学生.解析:设应从高二年级抽取x 名学生,则x 50=310,解得x =15. 答案:155.如图是某班8位学生诗词比赛得分的茎叶图,那么这8位学生得分的众数和中位数分别为________.解析:依题意,结合茎叶图,将题中的数由小到大依次排列得到:86,86,90,91,93,93,93,96,因此这8位学生得分的众数是93,中位数是91+932=92.答案:93 92考点一 抽样方法[基础自学过关][题组练透]1.利用简单随机抽样,从n 个个体中抽取一个容量为10的样本.若第二次抽取时,余下的每个个体被抽到的概率为13,则在整个抽样过程中,每个个体被抽到的概率为( )A.14 B.13 C.514D.1027解析:选C 根据题意,9n -1=13,解得n =28.故在整个抽样过程中每个个体被抽到的概率为1028=514.2.福利彩票“双色球”中红球的号码可以从01,02,03,…,32,33这33个两位号码中选取,小明利用如下所示的随机数表选取红色球的6个号码,选取方法是从第1行第9列的数字开始,从左到右依次读取数据,则第四个被选中的红色球的号码为( )A.12B.33C.06D.16解析:选C 被选中的红色球的号码依次为17,12,33,06,32,22.所以第四个被选中的红色球的号码为06.3.利用系统抽样法从编号分别为1,2,3,…,80的80件不同产品中抽取一个容量为16的样本,如果抽出的产品中有一件产品的编号为13,则抽到产品的最大编号为( )A.73B.78C.77D.76解析:选B 样本的分段间隔为8016=5,所以13号在第三组,则最大的编号为13+(16-3)×5=78.4.某电视台在因特网上就观众对其某一节目的喜爱程度进行调查,参加调查的一共有20 000人,其中各种态度对应的人数如下表所示:电视台为了了解观众的具体想法和意见,打算从中抽取100人进行详细的调查,为此要进行分层抽样,那么在分层抽样时,每类人中应抽取的人数分别为( )A.25,25,25,25B.48,72,64,16C.20,40,30,10D.24,36,32,8解析:选D 因为抽样比为10020 000=1200,所以每类人中应抽取的人数分别为4 800×1200=24,7 200×1200=36,6 400×1200=32,1 600×1200=8. 5.为了了解高一、高二、高三学生的身体状况,现用分层抽样的方法抽取一个容量为1 200的样本,三个年级学生人数之比依次为k ∶5∶3,已知高一年级共抽取了240人,则高三年级抽取的人数为________.解析:因为高一年级抽取学生的比例为2401 200=15,所以k k +5+3=15,解得k =2,故高三年级抽取的人数为1 200×32+5+3=360.答案:360[名师微点]1.应用随机数法的两个关键点(1)确定以表中的哪个数(哪行哪列)为起点,以哪个方向为读数的方向;(2)读数时注意结合编号特点进行读取,若编号为两位数字,则两位两位地读取,若编号为三位数字,则三位三位地读取,有超过总体号码或出现重复号码的数字舍去,这样继续下去,直到获取整个样本.2.解决分层抽样题的关键先确定抽样比,然后把各层个体数乘以抽样比,即得各层要抽取的个体数.常用公式: (1)抽样比=样本容量总体容量=各层样本容量各层个体总量;(2)层1的容量∶层2的容量∶层3的容量=样本中层1的容量∶样本中层2的容量∶样本中层3的容量.考点二 频率分布直方图的应用[师生共研过关][典例精析]我国是世界上严重缺水的国家,某市政府为了鼓励居民节约用水,计划调整居民生活用水收费方案,拟确定一个合理的月用水量标准x (吨),一位居民的月用水量不超过x 的部分按平价收费,超出x 的部分按议价收费.为了了解居民用水情况,通过抽样,获得了某年100位居民每人的月均用水量(单位:吨),将数据按照[0,0.5),[0.5,1),…,[4,4.5]分成9组,制成了如图所示的频率分布直方图.(1)求直方图中a 的值;(2)设该市有30万居民,估计全市居民中月均用水量不低于3吨的人数,并说明理由; (3)若该市政府希望使85%的居民每月的用水量不超过标准x (吨),估计x 的值,并说明理由.[解] (1)由频率分布直方图知,月均用水量在[0,0.5)中的频率为0.08×0.5=0.04, 同理,在[0.5,1),[1.5,2),[2,2.5),[3,3.5),[3.5,4),[4,4.5]中的频率分别为0.08,0.20,0.26,0.06,0.04,0.02.由0.04+0.08+0.5×a +0.20+0.26+0.5×a +0.06+0.04+0.02=1, 解得a =0.30.(2)由(1)可知,100位居民中每人月均用水量不低于3吨的频率为0.06+0.04+0.02=0.12.根据样本中的频率,可以估计全市30万居民中月均用水量不低于3吨的人数为300 000×0.12=36 000.(3)因为前6组的频率之和为0.04+0.08+0.15+0.20+0.26+0.15=0.88>0.85, 前5组的频率之和为0.04+0.08+0.15+0.20+0.26=0.73<0.85, 所以2.5≤x <3.由0.30×(x -2.5)=0.85-0.73, 解得x =2.9.所以估计月用水量标准为2.9吨时,85%的居民每月的用水量不超过标准.[解题技法]1.谨记频率分布直方图的相关公式 (1)直方图中各小长方形的面积之和为1.(2)直方图中纵轴表示频率组距,故每组样本的频率为组距×频率组距,即矩形的面积.(3)直方图中每组样本的频数为频率×总数. 2.频率分布直方图中数字特征的计算(1)最高的小长方形底边中点的横坐标即是众数. (2)中位数左边和右边的小长方形的面积和是相等的.(3)平均数是频率分布直方图的“重心”,等于频率分布直方图中每个小长方形的面积乘以小长方形底边中点的横坐标之和.[过关训练]1.(2019·贵阳模拟)在某中学举行的环保知识竞赛中,将三个年级参赛学生的成绩进行整理后分为5组,绘制如图所示的频率分布直方图,图中从左到右依次为第一、第二、第三、第四、第五小组,已知第二小组的频数是40,则成绩在80~100分的学生人数是( )A.15B.18C.20D.25解析:选A 根据频率分布直方图,得第二小组的频率是0.040×10=0.4,∵频数是40,∴样本容量是400.4=100,又成绩在80~100分的频率是(0.010+0.005)×10=0.15,∴成绩在80~100分的学生人数是100×0.15=15.2.某网络营销部门随机抽查了某市200名网友在2018年11月11日的网购金额,所得数据如下表:已知网购金额不超过3千元与超过3千元的人数比恰为3∶2. (1)试确定x ,y ,p ,q 的值,并补全频率分布直方图(如图);(2)该营销部门为了了解该市网友的购物体验,从这200名网友中,用分层抽样的方法从网购金额在(1,2]和(4,5]的两个群体中确定5人进行问卷调查,若需从这5人中随机选取2人继续访谈,则此2人来自不同群体的概率是多少?解:(1)根据题意有⎩⎪⎨⎪⎧16+24+x +y +16+14=200,16+24+x y +16+14=32,解得⎩⎪⎨⎪⎧x =80,y =50,∴p =0.40,q =0.25.补全频率分布直方图如图所示.(2)根据题意,抽取网购金额在(1,2]内的人数为 2424+16×5=3(人). 抽取网购金额在(4,5]内的人数为1624+16×5=2(人). 故此2人来自不同群体的概率P =C 13C 12C 25=35.考点三 茎叶图的应用[师生共研过关][典例精析]某良种培育基地正在培育一小麦新品种A ,将其与原有的一个优良品种B 进行对照试验,两种小麦各种植了25亩,所得亩产量的数据(单位:千克)如下.品种A :357,359,367,368,375,388,392,399,400,405,412,414,415,421,423,423,427,430,430,434,443,445,445,451,454品种B :363,371,374,383,385,386,391,392,394,394,395,397,397,400,401,401,403,406,407,410,412,415,416,422,430(1)作出品种A 与B 亩产量数据的茎叶图; (2)用茎叶图处理现有的数据,有什么优点?(3)通过观察茎叶图,对品种A 与B 的亩产量及其稳定性进行比较,写出统计结论. [解] (1)画出茎叶图如图所示.(2)由于每个品种的数据都只有25个,样本容量不大,画茎叶图很方便;此时茎叶图不仅清晰明了地展示了数据的分布情况,便于比较,没有任何信息损失,而且可以随时记录新的数据.(3)通过观察茎叶图可以看出:①品种A的亩产量的平均数(或均值)比品种B高;②品种A的亩产量的标准差(或方差)比品种B大,故品种A的亩产量的稳定性较差.[解题技法]茎叶图的使用策略(1)茎叶图的绘制需注意:①“叶”的位置只有一个数字,而“茎”的位置的数字位数一般不需要统一;②重复出现的数据要重复记录,不能遗漏,特别是“叶”的位置上的数据.(2)茎叶图通常用来记录两位数的数据,可以用来分析单组数据,也可以用来比较两组数据.通过茎叶图可以确定数据的中位数,数据大致集中在哪个茎,数据是否关于该茎对称,数据分布是否均匀等.[过关训练]1.如图所示的茎叶图记录了甲、乙两组各5名工人某日的产量数据(单位:件).若这两组数据的中位数相等,且平均值也相等,则x和y的值分别为()A.3,5B.5,5C.3,7D.5,7解析:选A甲组数据的中位数为65,由甲、乙两组数据的中位数相等,得y=5.又甲、乙两组数据的平均值相等,∴15×(56+65+62+74+70+x)=15×(59+61+67+65+78),∴x=3.故选A.2.某赛季甲、乙两名篮球运动员每场比赛的得分如茎叶图所示.下列结论错误的是()A.乙运动员得分的中位数是36B.甲运动员发挥的稳定性比乙运动员发挥的稳定性差C.甲运动员的平均分为27分D.乙运动员的得分有613集中在茎3上解析:选C 从茎叶图知,A 、D 是正确的,乙运动员的得分较集中,甲运动员得分较分散,故B 是正确的,甲运动员得分的平均分为29011<27.故选C.考点四 用样本的数字特征估计总体的数字特征[师生共研过关][典例精析]某大学艺术专业的400名学生参加某次测评,根据男女学生人数比例,使用分层抽样的方法从中随机抽取了100名学生,记录他们的分数,将数据按[20,30),[30,40),…,[80,90]分成7组,并整理得到如图所示的频率分布直方图.(1)估计总体的众数;(2)已知样本中分数小于40的学生有5人,试估计总体中分数在区间[40,50)内的人数; (3)已知样本中有一半男生的分数不小于70,且样本中分数不小于70的男女学生人数相等.试估计总体中男生和女生人数的比例.[解] (1)由频率分布直方图可估计总体的众数为70+802=75.(2)由频率分布直方图可知,样本中分数在区间[50,90)内的人数为(0.01+0.02+0.04+0.02)×10×100=90.因为样本中分数小于40的学生有5人,所以样本中分数在区间[40,50)内的人数为100-90-5=5. 设总体中分数在区间[40,50)内的人数为x ,则5100=x 400,解得x =20, 故估计总体中分数在区间[40,50)内的人数为20.(3)由频率分布直方图可知,样本中分数不小于70的人数为(0.04+0.02)×10×100=60. 因为样本中分数不小于70的男女学生人数相等, 所以样本中分数不小于70的男生人数为30.因为样本中有一半男生的分数不小于70,所以样本中男生的人数为60,女生的人数为40. 由样本估计总体,得总体中男生和女生人数的比例约为3∶2.[解题技法]利用样本的数字特征解决优化决策问题的依据(1)平均数反映了数据取值的平均水平;标准差、方差描述了一组数据围绕平均数波动的大小.标准差、方差越大,数据的离散程度越大,越不稳定;标准差、方差越小,数据的离散程度越小,越稳定.(2)用样本估计总体就是利用样本的数字特征来描述总体的数字特征.[过关训练]1.甲、乙两人在一次射击比赛中各射靶5次,两人成绩的条形统计图如图所示,则( )A.甲的成绩的平均数小于乙的成绩的平均数B.甲的成绩的中位数等于乙的成绩的中位数C.甲的成绩的方差小于乙的成绩的方差D.甲的成绩的极差小于乙的成绩的极差 解析:选C 甲的平均数是4+5+6+7+85=6,中位数是6,极差是4,方差是(-2)2+(-1)2+02+12+225=2;乙的平均数是5+5+5+6+95=6,中位数是5,极差是4,方差是(-1)2+(-1)2+(-1)2+02+325=125,比较可得选项C 正确.2.已知一组数据x 1,x 2,x 3,x 4,x 5的方差是2,则数据2x 1,2x 2,2x 3,2x 4,2x 5的标准差为________.解析:由s 2=1n ∑i =1n(x i -x )2=2,则数据2x 1,2x 2,2x 3,2x 4,2x 5的方差是8,标准差为2 2.答案:2 23.甲、乙两人参加某体育项目训练,近期的五次测试成绩(单位:分)如图所示:(1)分别求出甲、乙两人成绩的平均数与方差; (2)根据(1)的结果,对两人的成绩作出评价.解:(1)由题图可得甲、乙两人五次测试的成绩分别为 甲:10分,13分,12分,14分,16分; 乙:13分,14分,12分,12分,14分. x 甲=10+13+12+14+165=13, x 乙=13+14+12+12+145=13,s 2甲=15×[(10-13)2+(13-13)2+(12-13)2+(14-13)2+(16-13)2]=4, s 2乙=15×[(13-13)2+(14-13)2+(12-13)2+(12-13)2+(14-13)2]=0.8. (2)由s 2甲>s 2乙,可知乙的成绩较稳定.从题图看,甲的成绩基本呈上升趋势,而乙的成绩上下波动,因此甲的成绩在不断提高,而乙的成绩则无明显提高.[课时跟踪检测]一、题点全面练1.(2018·石家庄模拟)某校一年级有男生560人,女生420人,用分层抽样的方法从该年级全体学生中抽取一个容量为140的样本,则此样本中男生人数为()A.80B.120C.160D.240解析:选A因为男生和女生的比例为560∶420=4∶3,样本容量为140,所以应该抽取男生的人数为140×44+3=80,故选A.2.一个总体中有600个个体,随机编号为001,002,…,600,利用系统抽样方法抽取容量为24的一个样本,总体分组后在第一组随机抽得的编号为006,则在编号为051~125之间抽得的编号为()A.056,080,104B.054,078,102C.054,079,104D.056,081,106解析:选D系统抽样的间隔为60024=25,编号为051~125之间抽得的编号为006+2×25=056,006+3×25=081,006+4×25=106.3.(2019·天水模拟)甲、乙两名同学6次考试的成绩统计如图所示,甲、乙两组数据的平均数分别为x甲,x乙,标准差分别为s甲,s乙,则()A.x甲<x乙,s甲<s乙B.x甲<x乙,s甲>s乙C.x甲>x乙,s甲<s乙D.x甲>x乙,s甲>s乙解析:选C由图可知,甲同学除第二次考试成绩略低于乙同学外,其他考试成绩都远高于乙同学,可知x甲>x乙.图中数据显示甲同学的成绩比乙同学稳定,故s甲<s乙.4.(2019·中山模拟)某商场在国庆黄金周的促销活动中,对10月1日9时至14时的销售额进行统计,其频率分布直方图如图所示.已知9时至10时的销售额为3万元,则9时至14时的销售总额为()A.10万元B.12万元C.15万元D.30万元解析:选D由图知,9时至10时的销售额频率为0.1,因此9时至14时的销售总额为30.1=30(万元),故选D.5.(2019·昆明调研)如图是1951~2016年我国的年平均气温变化的折线图.根据图中信息,下列结论正确的是()A.1951年以来,我国的年平均气温逐年增高B.1951年以来,我国的年平均气温在2016年再创新高C.2000年以来,我国每年的年平均气温都高于1981~2010年的平均值D.2000年以来,我国的年平均气温的平均值高于1981~2010年的平均值解析:选D由图可知,1951年以来,我国的年平均气温变化是有起伏的,不是逐年增高的,所以选项A错误;1951年以来,我国的年平均气温最高的不是2016年,所以选项B错误;2012年的年平均气温低于1981~2010年的平均值,所以选项C错误;2000年以来,我国的年平均气温的平均值高于1981~2010年的平均值,所以选项D正确.故选D.6.样本中共有五个个体,其值分别为0,1,2,3,m.若该样本的平均值为1,则其方差为()A.105 B.305C. 2D.2解析:选D依题意得m=5×1-(0+1+2+3)=-1,样本方差s2=15[(-1)2+02+12+22+(-2)2]=2,即所求的样本方差为2.7.(2018·南宁模拟)已知某地区中小学生人数和近视情况分别如图甲和图乙所示.为了了解该地区中小学生的近视形成原因,用分层抽样的方法抽取2%的学生进行调查,则样本容量和抽取的高中生近视人数分别为()A.100,20B.200,20C.200,10D.100,10解析:选B 由题图甲可知学生总人数是10 000,样本容量为10 000×2%=200,抽取的高中生人数是2 000×2%=40,由题图乙可知高中生的近视率为50%,所以高中生的近视人数为40×50%=20,故选B.8.为了了解某校高三美术生的身体状况,抽查了部分美术生的体重,将所得数据整理后,作出了如图所示的频率分布直方图.已知图中从左到右的前3个小组的频率之比为1∶3∶5,第2个小组的频数为15,则被抽查的美术生的人数是________.解析:设被抽查的美术生的人数为n ,因为后2个小组的频率之和为(0.037 5+0.012 5)×5=0.25,所以前3个小组的频率之和为0.75.又前3个小组的频率之比为1∶3∶5,第2个小组的频数为15,所以前3个小组的频数分别为5,15,25,所以n =5+15+250.75=60.答案:609.随着智能手机的普及,网络购物越来越受到人们的青睐,某研究性学习小组对使用智能手机的利与弊随机调查了10位同学,得到的满意度打分如茎叶图所示.若这组数据的中位数、平均数分别为a ,b ,则a ,b 的大小关系是________.解析:已知茎叶图中的数据分别为75,76,77,81,83,87,89,93,94,95,则中位数a =12×(83+87)=85,平均数b =110×(75+76+77+81+83+87+89+93+94+95)=85,故a =b . 答案:a =b10.将某选手的9个得分去掉1个最高分,去掉1个最低分,7个剩余分数的平均分为91.现场作的9个分数的茎叶图后来有1个数据模糊,无法辨认,在图中以x 表示,则7个剩余分数的方差为________.解析:由图可知去掉的两个数是87,99,所以87+90×2+91×2+94+90+x =91×7,解得x =4.故s 2=17[(87-91)2+(90-91)2×2+(91-91)2×2+(94-91)2×2]=367.答案:367二、专项培优练(一)易错专练——不丢怨枉分1.设某总体是由编号为01,02,…,19,20的20个个体组成,利用下面的随机数表选取6个个体,选取方法是从随机数表第1行的第3列数字开始从左到右依次选取两个数字,则选出来的第6个个体编号为________.1818 0792 4544 1716 5809 7983 8619 6206 7650 0310 5523 6405 0526 6238解析:由题意可得,选取的这6个个体分别为18,07,17,16,09,19,故选出的第6个个体编号为19.答案:192.已知一组正数x 1,x 2,x 3,x 4的方差s 2=14(x 21+x 22+x 23+x 24-16),则数据x 1+2,x 2+2,x 3+2,x 4+2的平均数为________.解析:设正数x 1,x 2,x 3,x 4的平均数为x ,则s 2=14[(x 1-x )2+(x 2-x )2+(x 3-x )2+(x 4-x )2],得s 2=14(x 21+x 22+x 23+x 24)-x 2,又已知s 2=14(x 21+x 22+x 23+x 24-16)=14(x 21+x 22+x 23+x 24)-4,所以x 2=4,所以x =2,故14[(x 1+2)+(x 2+2)+(x 3+2)+(x 4+2)]=x +2=4.答案:4(二)交汇专练——融会巧迁移3.[与概率的交汇]如图是某位篮球运动员8场比赛得分的茎叶图,其中一个数据染上污渍用x 代替,那么这位运动员这8场比赛的得分平均数不小于得分中位数的概率为( )A.15 B.310 C.35D.710解析:选B 由茎叶图可知0≤x ≤9且x ∈N ,中位数是17+10+x 2=27+x2,这位运动员这8场比赛的得分平均数为18(7+8+7+9+x +3+1+10×4+20×2)=18(x +115),由18(x+115)≥27+x2,得3x ≤7,即x =0,1,2,所以这位运动员这8场比赛的得分平均数不小于得分中位数的概率为310.4.[与数列、不等式的交汇]我市某高中从高三年级甲、乙两个班中各选出7名学生参加2018年全国高中数学联赛(河南初赛),他们取得的成绩(满分140分)的茎叶图如图所示,其中甲班学生成绩的中位数是81,乙班学生成绩的平均数是86,若正实数a ,b 满足a ,G ,b 成等差数列且x ,G ,y 成等比数列,则1a +4b的最小值为( )A.49B.2C.94D.9解析:选C 由甲班学生成绩的中位数是81,可知81为甲班7名学生的成绩按从小到大的顺序排列的第4个数,故x =1.由乙班学生成绩的平均数为86,可得(-10)+(-6)+(-4)+(y -6)+5+7+10=0,解得y =4.由x ,G ,y 成等比数列,可得G 2=xy =4,由正实数a ,b 满足a ,G ,b 成等差数列,可得G =2,a +b =2G =4,所以1a +4b =⎝⎛⎭⎫1a +4b ×⎝⎛⎭⎫a 4+b 4=14⎝⎛⎭⎫1+b a +4a b +4≥14×(5+4)=94(当且仅当b =2a 时取等号).故1a +4b 的最小值为94,选C.(三)素养专练——学会更学通5.[数据分析]PM2.5是指大气中直径小于或等于2.5微米的颗粒物,也称为可入肺颗粒物.如图是根据环保部门某日早6点至晚9点在A 县、B 县两个地区附近的PM2.5监测点统计的数据(单位:毫克/立方米)列出的茎叶图,A 县、B 县两个地区浓度的方差较小的是( )A.A 县B.B 县C.A 县、B 县两个地区相等D.无法确定解析:选A 根据茎叶图中的数据可知,A 县的数据都集中在0.05和0.08之间,数据分布比较稳定,而B 县的数据分布比较分散,不如A 县数据集中,所以A 县的方差较小.6.[数学运算、数据分析]有A ,B ,C ,D ,E 五位工人参加技能竞赛培训.现分别从A ,B 二人在培训期间参加的若干次预赛成绩中随机抽取8次.用茎叶图表示这两组数据:(1)A ,B 二人预赛成绩的中位数分别是多少?(2)现要从A ,B 中选派一人参加技能竞赛,从平均状况和方差的角度考虑,你认为派哪位工人参加合适?请说明理由.(3)若从参加培训的5位工人中选2人参加技能竞赛,求A ,B 二人中至少有一人参加技能竞赛的概率.解:(1)A 的中位数是83+852=84,B 的中位数是84+822=83.(2)派B 参加比较合适.理由如下:x B =18(78+79+81+82+84+88+93+95)=85,x A =18(75+80+80+83+85+90+92+95)=85,s 2B =18[(78-85)2+(79-85)2+(81-85)2+(82-85)2+(84-85)2+(88-85)2+(93-85)2+(95-85)2]=35.5,s 2A =18[(75-85)2+(80-85)2+(80-85)2+(83-85)2+(85-85)2+(90-85)2+(92-85)2+(95-85)2]=41,因为x A =x B ,但s 2B < s 2A ,说明B 稳定,派B 参加比较合适.(3)A ,B 都没参加技能竞赛的概率P =C 23C 25=310,故A ,B 二人中至少有一人参加技能竞赛的概率为1-310=710.7.[数据分析、数学建模]今年西南一地区遭遇严重干旱,某乡计划向上级申请支援,为上报需水量,乡长事先抽样调查了100户村民的月均用水量,得到这100户村民月均用水量的频率分布表如表:(月均用水量的单位:吨)(1)请完成该频率分布表,并画出相对应的频率分布直方图和频率分布折线图; (2)估计样本的中位数是多少;(3)已知上级将按每户月均用水量向该乡调水,若该乡共有1 200户,请估计上级支援该乡的月调水量是多少吨?解:(1)频率分布表与相应的频率分布直方图和频率分布折线图如下:。

随机抽样用样本估计总体正态分布.ppt

随机抽样用样本估计总体正态分布.ppt

各自特点
从总体中逐个 抽取
将总体分成几 层进行抽取
将总体均分成 几部分,按事 先确定的规则 在各部分抽取
相互联 系
最基本 的抽样 方法
各层抽 样时采 用简单 随机抽

在起始 部分抽 样时采 用简单 随机抽

23
适用范 围
总体中 的个体 数较少
总体由 差异明 显的几 部分组

总体中 的个体 数较多
2.频率分布直方图会使样本的一些数字特征更明显,
9
(2)依题意,ξ 的可能取值为 0,1,2,3,则 P(ξ=0)=CC31382=1545,P(ξ=1)=CC14C31228=2585, P(ξ=2)=CC24C31218=1525,P(ξ=3)=CC31342=515. 因此,ξ 的分布列如下:
所以 Eξ=0×1545+1×2585+2×1525+3×515=1.
体的方差最小,0
21
1.统计的基本思想方法是用样本估计总体,即用局 部推断整体,这就要求样本应具有很好的代表性, 而样本良好客观的代表性,完全依赖抽样方法. 三种抽样方法的比较:
22
类别 简单随机抽样
分层抽样
系统抽样
共同点
①抽样过程中 每个个体被抽 取的概率是相 等的;②均属 于不放回抽样
在区间(68,75)中的概率.
7
素材1
设矩形的长为 a,宽为 b,其比满足 b∶a=
5-1 2
≈0.618,这种矩形给人以美感,称为黄金矩形.黄金矩
形常应用于工艺品设计中.下面是某工艺品厂随机抽取
两个批次的初加工矩形宽度与长度的比值样本:
甲批次:0.598 0.625 0.628 0.595 0.639

高考数学一轮总复习课件:随机抽样、用样本估计总体

高考数学一轮总复习课件:随机抽样、用样本估计总体

6.(2020·天津)从一批零件中抽取 80 个,测量其直径(单位: mm),将所得数据分为 9 组:[5.31,5.33),[5.33,5.35),…,[5.45, 5.47),[5.47,5.49],并整理得到如下频率分布直方图,则在被抽 取的零件中,直径落在区间[5.43,5.47)内的个数为( B )
n 的样本进行调查,其中从丙车间的产品中抽取了 3 件,则 n=
(D ) A.9
B.10
C.12
D.13
【解析】 由分层抽样可得630=2n60,解得 n=13.
【讲评】 进行分层抽样的相关计算时,常利用以下关系式 巧解:
①总样体本的容个量数nN=该层该抽层取的的个个体体数数; ②总体中某两层的个体数之比等于样本中这两层抽取的个 体数之比.
5.对某商店一个月内每天的顾客人数进行了统计,得到样本 的茎叶图(如图所示),则该样本的中位数、众数、极差分别是( A )
A.46,45,56 B.46,45,53 C.47,45,56 D.45,47,53
解析 从茎叶图中可以看出样本数据的中位数为中间两个数的 平均数,即45+2 47=46,众数是 45,极差为 68-12=56,故选择 A.
状元笔记
(1)一个抽样试验能否用抽签法,关键看两点:一是制签是否 方便;二是号签是否易搅匀.一般地,当总体容量和样本容量都 较小时可用抽签法.
(2)在使用随机数表时,如遇到取两位数或三位数,可从选择 的随机数表中的某行某列的数字计起,每两个或每三个作为一个 单位,自左向右选取,有超过总体号码或出现重复号码的数字舍 去.
个最高分、1 个最低分,得到 7 个有效评分.7 个有效评分与 9 个
原始评分相比,不变的数字特征是( A )

高考数学复习考点知识专题讲解讲义63---随机抽样、用样本估计总体

高考数学复习考点知识专题讲解讲义63---随机抽样、用样本估计总体

命题点2 折线图 例2 (2017·全国Ⅲ)某城市为了解游客人数的变化规律,提高旅游服务质量, 收集并整理了2014年1月至2016年12月期间月接待游客量(单位:万人)的数据, 绘制了右面的折线图. 根据该折线图,下列结论错误的是
√A.月接待游客量逐月增加
B.年接待游客量逐年增加 C.各年的月接待游客量高峰期大致在7,8月 D.各年1月至6月的月接待游客量相对于7月至12月,波动性更小,变化比较平稳
4%a 30%a
新农村 建设后 37%×2a=74%a 5%×2a=10%a 30%×2a=60%a
新农村建设 后变化情况
增加 增加了一倍以上
增加了一倍
结论
A错 B对 C对
养殖收入+第 (30%+6%)a (30%+28%)
三产业收入 =36%a
×2a=116%a
超过经济收入 D对
2a的一半
故选A.
B.新农村建设后,其他收入增加了一倍以上 C.新农村建设后,养殖收入增加了一倍 D.新农村建设后,养殖收入与第三产业收入的总和超过
了经济收入的一半
解析 设新农村建设前,农村的经济收入为a,则新农村建设后,农村的经济 收入为2a. 新农村建设前后,各项收入的对比如下表:
种植收入 其他收入 养殖收入
新农村 建设前 60%a
思维升华
SI WEI SHENG HUA
(1)通过扇形统计图可以很清楚的表示出各部分数量同总数之间的关系. (2)折线图可以显示随时间(根据常用比例放置)而变化的连续数据,因此非 常适用于显示在相等时间间隔下数据的趋势. (3)由茎叶图可以清晰地看到数据的分布情况,这一点同频率分布直方图类 似.它优于频率分布直方图的第一点是从茎叶图中能看到原始数据,没有任 何信息损失,第二点是茎叶图便于记录和表示.其缺点是当样本容量较大时, 作图较烦琐.

2013年高考数学总复习 10-1 随机抽样课件 新人教B版

2013年高考数学总复习 10-1 随机抽样课件 新人教B版

④按照事先确定的规则抽取样本.通常是将 S 加上 间隔 k,得到第 2 个个体编号 S+k,再将(S+k)加上 k, 得到第 3 个个体编号 S+2k, 这样继续下去, 获得容量为 n 的样本.其样本编号依次是:S,S+k,S+2k,„,S +(n-1)k.
5.分层抽样 (1)定义: 当总体由有明显差别的几部分组成时, 按某 种特征在抽样时将总体中的各个个体分成互不交叉的层, 然后按照一定的比例,从各层独立地抽取一定数量的个 体,将各层取出的个体合在一起作为样本,这种抽样的方 法叫做分层抽样.
四、随机变量及其分布(理) (1)在对具体问题的分析中,理解取有限值的离散型 随机变量及其分布列的概念,认识分布列对于刻画随机 现象的重要性. (2)通过实例(如彩票抽奖), 理解超几何分布及其导出 过程,并能进行简单的应用.
(3)在具体情境中,了解条件概率和两个事件相互独 立的概念,理解 n 次独立重复试验的模型及二项分布, 并能解决一些简单的实际问题. (4)通过实例,理解取有限值的离散型随机变量的均 值、方差的概念,能计算简单离散型随机变量的均值、 方差,并能解决一些实际问题. (5)通过实际问题,借助直观(如实际问题的直方图), 认识正态分布曲线的特点及曲线所表示的意义.
知识归纳 1.总体、个体、样本 把所考察对象的某一数值指标的全体构成的集合看 成总体,构成总体的每一个元素为个体.从总体中随机 抽取若干个个体构成的集合叫做总体的一个样本.
2.随机抽样 抽样时保持每一个个体都可能被抽到,每一个个体 被抽到的机会是均等的,满足这样条件的抽样是随机抽 样. 3.简单随机抽样 (1)定义:设一个总体含有 N 个个体,从中逐个不放 回地抽取 n 个个体作为样本(n≤N),如果每次抽取时, 总体内的各个个体被抽到的机会都相等,称这种抽样方 法为简单随机抽样.

高三总复习数学精品课件 随机抽样、用样本估计总体

高三总复习数学精品课件 随机抽样、用样本估计总体

11
常见误区 1.不论哪种抽样方法,总体中的每一个个体入样的概率是相同的.
频率 2.易忽视频率分布直方图中纵轴表示的应为组距.
12
1.判断正误(正确的打“√”,错误的打“×”)
(1)简单随机抽样是一种不放回抽样.
(√ )
(2)在抽签法中,先抽的人抽中的可能性大.
(× )
(3)一组数据的方差越大,说明这组数据的波动越大.
15
√A.电视机销量最大的是第四季度 √B.电冰箱销量最小的是第四季度
C.电视机的全年销量最大
√D.洗衣机的全年销量最小
16
解析:对于 A,对比四个季度中,第四季度所销售的电视机所占百分比最大, 但由于销售总量未知,所以销量不一定最大.同理,易知 B 不一定正确.在 四个季度中,电视机在每个季度的销量所占百分比都是最大,即在每个季度 销量都是最多的,所以全年销量最大的是电视机,C 正确.对于 D,洗衣机 在第四季度所占百分比不是最小的,故 D 不一定正确.
(√ )
(4)在频率分布直方图中,小矩形的面积越大,表示样本数据落在该区间内的
频率越大.
(√ )
(5)频率分布表和频率分布直方图是一组数据频率分布的两种形式,前者准
确,后者直观.
(√ )
13
2.某工厂生产甲、乙、丙三种型号的产品,产品的数量之比为 3∶5∶7,
现用分层抽样的方法抽出容量为 n 的样本,其中甲种型号的产品有 18 件,
10
2.巧用四个有关的结论 (1)若 x1,x2,…,xn 的平均数为-x ,那么 mx1+a,mx2+a,…,mxn+a 的 平均数为 m-x +a; (2)数据 x1,x2,…,xn 与数据 x′1=x1+a,x′2=x2+a,…,x′n=xn+a 的 方差相等,即数据经过平移后方差不变; (3)若 x1,x2,…,xn 的方差为 s2,那么 ax1+b,ax2+b,…,axn+b 的方差 为 a2s2; (4)s2=n1∑i=n1 (xi--x )2=n1∑i=n1x2i --x 2,即各数平方的平均数减去平均数的平方.

高考理科数学一轮复习课件随机抽样与用样本估计总体

高考理科数学一轮复习课件随机抽样与用样本估计总体

THANK YOU
感谢聆听
理解并掌握用样本估计总体思想和方法
用样本频率估计总体概率
通过大量重复试验得到的样本频率可以近似 代替总体概率。
用样本均值估计总体均值
当样本量足够大时,样本均值可以近似代替 总体均值。
用样本方差估计总体方差
通过计算样本数据的方差来估计总体数据的 波动情况。
用样本分布估计总体分布
通过观察样本数据的分布情况来推断总体数 据的可能分布。
分层标准选择和层次划分
分层标准选择
在选择分层标准时,应该考虑与研究目的密切相关的因素,同时保证各层之间的 差异明显且易于划分。常见的分层标准包括地理位置、人口特征、经济水平等。
层次划分
在划分层次时,应该根据分层标准将总体划分为若干个互不重叠的层,并保证各 层内的个体具有相似的特征。同时,各层的样本量应该根据总体中该层的比例进 行分配。
02
简单随机抽样方法及应用
简单随机抽样定义及步骤
01
定义:简单随机抽样是一种最基本的随机抽样方法,它从 总体中逐个不放回地随机抽取样本,直到达到所需的样本 容量为止。
02
步骤
03
1. 确定总体和样本容量;
04
2. 对总体进行编号;
05
3. 利用随机数表或计算机程序生成随机数;
06
4. 根据生成的随机数从总体中抽取样本。
案例分析:系统抽样在高考数学中应用
案例二
某校高三数学模拟考试成绩分析
背景
某校高三年级进行了多次数学模拟考试,需要对考试成绩 进行分析以评估教学效果和考生备考情况。
实施过程
该校采用系统抽样的方法,从每次模拟考试中抽取了一定 数量的试卷作为样本,并对这些试卷的得分情况进行了统 计分析。

2013年全国高考数学试题分类汇编随机抽样、用样本估计总体

2013年全国高考数学试题分类汇编随机抽样、用样本估计总体

11.3随机抽样、用样本估计总体考点一随机抽样1.(2013江西,5,5分)总体由编号为01,02,…,19,20的20个个体组成.利用下面的随机数表选取5个个体,选取方法是从随机数表第1行的第5列和第6列数字开始由左到右依次选取两个数字,则选出来的第5个个体的编号为( )7816 6572 0802 6314 0702 4369 9728 01983204 9234 4935 8200 3623 4869 6938 7481A.08B.07C.02D.01答案 D2.(2013湖南,3,5分)某工厂甲、乙、丙三个车间生产了同一种产品,数量分别为120件、80件、60件.为了解它们的产品质量是否存在显著差异,用分层抽样方法抽取了一个容量为n的样本进行调查,其中从丙车间的产品中抽取了3件,则n=( )A.9B.10C.12D.13答案 D3.(2013陕西,19,12分)有7位歌手(1至7号)参加一场歌唱比赛,由500名大众评委现场投票决定歌手名次.根据年龄将大众评委分为五组,各组的人数如下:组别 A B C D E人数50 100 150 150 50(1)为了调查评委对7位歌手的支持情况,现用分层抽样方法从各组中抽取若干评委,其中从B组抽取了6人,请将其余各组抽取的人数填入下表;组别 A B C D E人数50 100 150 150 50抽取人数 6(2)在(1)中,若A,B两组被抽到的评委中各有2人支持1号歌手,现从这两组被抽到的评委中分别任选1人,求这2人都支持1号歌手的概率.解析(1)由题设知,分层抽样的抽取比例为6%,所以各组抽取的人数如下表:组别 A B C D E人数50 100 150 150 50 抽取人数 3 6 9 9 3(2)记从A组抽到的3个评委为a1,a2,a3,其中a1,a2支持1号歌手;从B组抽到的6个评委为b1,b2,b3,b4,b5,b6,其中b1,b2支持1号歌手.从{a1,a2,a3}和{b1,b2,b3,b4,b5,b6}中各抽取1人的所有结果为:由以上树状图知所有结果共18种,其中2人都支持1号歌手的有a1b1,a1b2,a2b1,a2b2,共4种,故所求概率P==.考点二统计图表4.(2013辽宁,5,5分)某班的全体学生参加英语测试,成绩的频率分布直方图如图.数据的分组依次为:[20,40),[40,60),[60,80),[80,100].若低于60分的人数是15,则该班的学生人数是( )A.45B.50C.55D.60答案 B5.(2013重庆,6,5分)下图是某公司10个销售店某月销售某产品数量(单位:台)的茎叶图,则数据落在区间[22,30)内的频率为( )1 8 92 1 2 2 7 93 0 0 3A.0.2B.0.4C.0.5D.0.6答案 B6.(2013四川,7,5分)某学校随机抽取20个班,调查各班中有网上购物经历的人数,所得数据的茎叶图如图所示.以组距为5将数据分组成[0,5),[5,10),…,[30,35),[35,40]时,所作的频率分布直方图是( )答案 A7.(2013课标全国Ⅰ,18,12分)为了比较两种治疗失眠症的药(分别称为A药,B药)的疗效,随机地选取20位患者服用A药,20位患者服用B药,这40位患者在服用一段时间后,记录他们日平均增加的睡眠时间(单位:h).试验的观测结果如下:服用A药的20位患者日平均增加的睡眠时间:0.6 1.2 2.7 1.5 2.8 1.8 2.2 2.3 3.2 3.52.5 2.6 1.2 2.7 1.5 2.93.0 3.1 2.3 2.4服用B药的20位患者日平均增加的睡眠时间:3.2 1.7 1.9 0.8 0.9 2.4 1.2 2.6 1.3 1.41.6 0.5 1.8 0.62.1 1.1 2.5 1.2 2.7 0.5(1)分别计算两组数据的平均数,从计算结果看,哪种药的疗效更好?(2)根据两组数据完成下面茎叶图,从茎叶图看,哪种药的疗效更好?解析(1)设A药观测数据的平均数为,B药观测数据的平均数为,由观测结果可得=(0.6+1.2+1.2+1.5+1.5+1.8+2.2+2.3+2.3+2.4+2.5+2.6+2.7+2.7+2.8+2.9+3.0+3.1+3.2+3.5)=2.3,=(0.5+0.5+0.6+0.8+0.9+1.1+1.2+1.2+1.3+1.4+1.6+1.7+1.8+1.9+2.1+2.4+2.5+2.6+2.7+3.2)=1.6.由以上计算结果可得>,因此可看出A药的疗效更好.(2)由观测结果可绘制如下茎叶图:从以上茎叶图可以看出,A药疗效的试验结果有的叶集中在茎2,3上,而B药疗效的试验结果有的叶集中在茎0,1上,由此可看出A药的疗效更好.考点三样本的数字特征8.(2013山东,10,5分)将某选手的9个得分去掉1个最高分,去掉1个最低分,7个剩余分数的平均分为91.现场作的9个分数的茎叶图后来有1个数据模糊,无法辨认,在图中以x表示:则7个剩余分数的方差为( )A. B. C.36 D.答案 B9.(2013湖北,12,5分)某学员在一次射击测试中射靶10次,命中环数如下:7,8,7,9,5,4,9,10,7,4则(1)平均命中环数为;(2)命中环数的标准差为.答案(1)7 (2)210.(2013辽宁,16,5分)为了考察某校各班参加课外书法小组的人数,从全校随机抽取5个班级,把每个班级参加该小组的人数作为样本数据.已知样本平均数为7,样本方差为4,且样本数据互不相同,则样本数据中的最大值为.答案1011.(2013安徽,17,12分)为调查甲、乙两校高三年级学生某次联考数学成绩情况,用简单随机抽样,从这两校中各抽取30名高三年级学生,以他们的数学成绩(百分制)作为样本,样本数据的茎叶图如下:(1)若甲校高三年级每位学生被抽取的概率为0.05,求甲校高三年级学生总人数,并估计甲校高三年级这次联考数学成绩的及格率(60分及60分以上为及格);(2)设甲、乙两校高三年级学生这次联考数学平均成绩分别为、,估计-的值.解析(1)设甲校高三年级学生总人数为n.由题意知,=0.05,即n=600.样本中甲校高三年级学生数学成绩不及格人数为5,据此估计甲校高三年级此次联考数学成绩及格率为1-=.(2)设甲、乙两校样本平均数分别为'1、'2,根据样本茎叶图可知,30('1-'2)=30'1-30'2=(7-5)+(55+8-14)+(24-12-65)+(26-24-79)+(22-20)+92=2+49-53-77+2+92=15.因此'1-'2=0.5.故-的估计值为0.5分.12.(2013北京,16,13分)下图是某市3月1日至14日的空气质量指数趋势图.空气质量指数小于100表示空气质量优良,空气质量指数大于200表示空气重度污染.某人随机选择3月1日至3月13日中的某一天到达该市,并停留2天.(1)求此人到达当日空气质量优良的概率;(2)求此人在该市停留期间只有1天空气重度污染的概率;(3)由图判断从哪天开始连续三天的空气质量指数方差最大?(结论不要求证明)解析(1)在3月1日至3月13日这13天中,1日、2日、3日、7日、12日、13日共6天的空气质量优良,所以此人到达当日空气质量优良的概率是.(2)根据题意,事件“此人在该市停留期间只有1天空气重度污染”等价于“此人到达该市的日期是4日,或5日,或7日,或8日”.所以此人在该市停留期间只有1天空气重度污染的概率为.(3)从3月5日开始连续三天的空气质量指数方差最大.考点四统计与概率13.(2013陕西,5,5分)对一批产品的长度(单位:毫米)进行抽样检测,下图为检测结果的频率分布直方图.根据标准,产品长度在区间[20,25)上为一等品,在区间[15,20)和[25,30)上为二等品,在区间[10,15)和[30,35]上为三等品.用频率估计概率,现从该批产品中随机抽取1件,则其为二等品的概率是( )A.0.09B.0.20C.0.25D.0.45答案 D14.(2013课标全国Ⅱ,19,12分)经销商经销某种农产品,在一个销售季度内,每售出1 t 该产品获利润500元,未售出的产品,每1 t亏损300元.根据历史资料,得到销售季度内市场需求量的频率分布直方图,如图所示.经销商为下一个销售季度购进了130 t该农产品,以X(单位:t,100≤X≤150)表示下一个销售季度内的市场需求量,T(单位:元)表示下一个销售季度内经销该农产品的利润.(1)将T表示为X的函数;(2)根据直方图估计利润T不少于57 000元的概率.解析(1)当X∈[100,130)时,T=500X-300(130-X)=800X-39 000.当X∈[130,150]时,T=500×130=65 000.所以T=(2)由(1)知利润T不少于57 000元当且仅当120≤X≤150.由直方图知需求量X∈[120,150]的频率为0.7,所以下一个销售季度内的利润T不少于57 000元的概率的估计值为0.7.15.(2013四川,18,12分)某算法的程序框图如图所示,其中输入的变量x在1,2,3,…,24这24个整数中等可能随机产生.(1)分别求出按程序框图正确编程运行时输出y的值为i的概率P i(i=1,2,3);(2)甲、乙两同学依据自己对程序框图的理解,各自编写程序重复运行n次后,统计记录了输出y的值为i(i=1,2,3)的频数.以下是甲、乙所作频数统计表的部分数据.甲的频数统计表(部分)运行次数n 输出y的值为1的频数输出y的值为2的频数输出y的值为3的频数30 14 6 10 …………2 100 1 027 376 697乙的频数统计表(部分)运行次数n 输出y的值为1的频数输出y的值为2的频数输出y的值为3的频数30 12 11 7…………2 100 1 051 696 353当n=2 100时,根据表中的数据,分别写出甲、乙所编程序各自输出y的值为i(i=1,2,3)的频率(用分数表示),并判断两位同学中哪一位所编程序符合算法要求的可能性较大. 解析(1)变量x是在1,2,3,…,24这24个整数中随机产生的一个数,共有24种可能.当x从1,3,5,7,9,11,13,15,17,19,21,23这12个数中产生时,输出y的值为1,故P1=; 当x从2,4,8,10,14,16,20,22这8个数中产生时,输出y的值为2,故P2=;当x从6,12,18,24这4个数中产生时,输出y的值为3,故P3=.所以,输出y的值为1的概率为,输出y的值为2的概率为,输出y的值为3的概率为.(6分)(2)当n=2 100时,甲、乙所编程序各自输出y的值为i(i=1,2,3)的频率如下:输出y的值为1的频率输出y的值为2的频率输出y的值为3的频率甲乙比较频率趋势与概率,可得乙同学所编程序符合算法要求的可能性较大.(12分)。

2013届高考数学总复习教学案:用样本估计总体

2013届高考数学总复习教学案:用样本估计总体

用样本估计总体[知识能否忆起]一、作频率分布直方图的步骤1.求极差(即一组数据中最大值与最小值的差).2.确定组距与组数.3.将数据分组.4.列频率分布表.5.画频率分布直方图.二、频率分布折线图和总体密度曲线1.频率分布折线图:连接频率分布直方图中各小长方形上端的中点,就得频率分布折线图.2.总体密度曲线:随着样本容量的增加,作图时所分的组数增加,组距减小,相应的频率折线图会越来越接近于一条光滑曲线,即总体密度曲线.三、样本的数字特征数字特征定义众数在一组数据中,出现次数最多的数据叫做这组数据的众数中位数将一组数据按大小依次排列,把处在最中间位置的一个数据(或最中间两个数据的平均数)叫做这组数据的中位数,在频率分布直方图中,中位数左边和右边的直方图的面积相等平均数样本数据的算术平均数.即x=1n(x1+x2+…+x n)方差s2=1n[(x1-x)2+(x2-x)2+…+(x n-x)2],其中s为标准差四、茎叶图茎叶图的优点是可以保留原始数据,而且可以随时记录,方便记录与表示.[小题能否全取]12 42035 6301 14 1 21.(教材习题改编)( ) A .23与26 B .31与26 C .24与30D .26与30解析:选B 观察茎叶图可知,这组数据的众数是31,中位数是26.2.(教材习题改编)把样本容量为20的数据分组,分组区间与频数如下:[10,20),2;[20,30),3;[30,40),4;[40,50),5;[50,60),4;[60,70],2,则在区间[10,50)上的数据的频率是( )A .0.05B .0.25C .0.5D .0.7解析:选D 由题知,在区间[10,50)上的数据的频数是2+3+4+5=14,故其频率为1420=0.7.3.(2012·长春模拟)从某小学随机抽取100名同学,将他们的身高(单位:厘米)数据绘制成频率分布直方图由图中数据可知身高在[120,130]内的学生人数为( )A .20B .25C .30D .35解析:选C 由题意知a ×10+0.35+0.2+0.1+0.05=1, 则a =0.03,故学生人数为0.3×100=30.4.(教材习题改编)甲、乙两人比赛射击,两人所得的平均环数相同,其中甲所得环数的方差为5,乙所得环数如下:5、6、9、10、5,那么这两人中成绩较稳定的是________.解析:x =7,s 2乙=4.4,则s 2甲>s 2乙,故乙的成绩较稳定. 答案:乙5.(2012·山西大同)将容量为n 的样本中的数据分为6组,绘制频率分布直方图,若第一组至第六组的数据的频率之比为2∶3∶4∶6∶4∶1,且前三组数据的频数之和为27,则n =________.解析:依题意得,前三组的频率总和为2+3+42+3+4+6+4+1=920,因此有27n =920,即n =60.答案:601.在频率分布直方图中,中位数左边和右边的直方图的面积相等,由此可以估计中位数的值,而平均数的估计值等于频率分布直方图中每个小矩形的面积乘以小矩形底边中点的横坐标之和,众数是最高的矩形的中点的横坐标.2.注意区分直方图与条形图,条形图中的纵坐标刻度为频数或频率,直方图中的纵坐标刻度为频率/组距.3.方差与原始数据的单位不同,且平方后可能夸大了偏差的程度,虽然方差与标准差在刻画样本数据的分散程度上是一样的,但在解决实际问题时,一般多采用标准差.用样本的频率分布估计总体分布典题导入[例1] (2012·广东高考)某校100名学生期中考试语文成绩的频率分布直方图如图所示,其中成绩分组区间是:[50,60),[60,70),[70,80),[80,90),[90,100].(1)求图中a 的值;(2)根据频率分布直方图,估计这100名学生语文成绩的平均分;(3)若这100名学生语文成绩某些分数段的人数(x )与数学成绩相应分数段的人数(y )之比如下表所示,求数学成绩在[50,90)之外的人数.分数段 [50,60) [60,70) [70,80) [80,90) x ∶y1∶12∶13∶44∶5[自主解答] (1)由频率分布直方图知(2a +0.02+0.03+0.04)×10=1,解得a =0.005. (2)由频率分布直方图知这100名学生语文成绩的平均分为55×0.005×10+65×0.04×10+75×0.03×10+85×0.02×10+95×0.005×10=73(分).(3)由频率分布直方图知语文成绩在[50,60),[60,70),[70,80),[80,90)各分数段的人数依次为0.005×10×100=5,0.04×10×100=40,0.03×10×100=30,0.02×10×100=20.由题中给出的比例关系知数学成绩在上述各分数段的人数依次为5,40×12=20,30×43=40,20×54=25.故数学成绩在[50,90)之外的人数为100-(5+20+40+25)=10.在本例条件下估计样本数据的众数.解:众数应为最高矩形的中点对应的横坐标,故约为65.由题悟法解决频率分布直方图问题时要抓住 (1)直方图中各小长方形的面积之和为1.(2)直方图中纵轴表示频率组距,故每组样本的频率为组距×频率组距,即矩形的面积.(3)直方图中每组样本的频数为频率×总体数.以题试法1.(2012·深圳调研)某中学组织了“迎新杯”知识竞赛,从参加考试的学生中抽出若干名学生,并将其成绩绘制成频率分布直方图(如图),其中成绩的范围是[50,100],样本数据分组为[50,60),[60,70),[70,80),[80,90),[90,100],已知样本中成绩小于70分的个数是36,则样本中成绩在[60,90)内的学生人数为________.解析:依题意得,样本中成绩小于70分的频率是(0.010+0.020)×10=0.3;样本中成绩在[60,90)内的频率是(0.020+0.030+0.025)×10=0.75,因此样本中成绩在[60,90)内的学生人数为36×0.750.3=90.答案:90茎叶图的应用典题导入[例2] (2012·陕西高考)从甲、乙两个城市分别随机抽取16台自动售货机,对其销售额进行统计,统计数据用茎叶图表示(如图所示).设甲、乙两组数据的平均数分别为x 甲、x 乙,中位数分别为m甲、m 乙,则( )A.x 甲<x 乙,m 甲>m 乙B.x 甲<x 乙,m 甲<m 乙C.x 甲>x 乙,m 甲>m 乙D.x 甲>x 乙,m 甲<m 乙[自主解答] x甲=116(41+43+30+30+38+22+25+27+10+10+14+18+18+5+6+8)=34516,x 乙=116(42+43+48+31+32+34+34+38+20+22+23+23+27+10+12+18)=45716. ∴x甲<x 乙.又∵m 甲=20,m 乙=29,∴m 甲<m 乙. [答案] B由题悟法由茎叶图可以清晰地看到数据的分布情况,这一点同频率分布直方图类似.它优于频率分布直方图的第一点是从茎叶图中能看到原始数据,没有任何信息损失;第二点是茎叶图便于记录和表示.其缺点是当样本容量较大时,作图较繁.以题试法2.(2012·淮北模考)如图所示的茎叶图记录了一组数据,关于这组数据,其中说法正确的序号是________.0 7 8 9 9 9 11223①众数是9;②平均数是10;③中位数是9或10;④标准差是3.4.解析:由茎叶图知,该组数据为7,8,9,9,9,10,11,12,12,13,∴众数为9,①正确;中位数是9+102=9.5,③错;平均数是x =110(7+8+9+9+9+10+11+12+12+13)=10,②正确;方差是s 2=110[(7-10)2+(8-10)2+(9-10)2+(9-10)2+(9-10)2+(10-10)2+(11-10)2+(12-10)2+(12-10)2+(13-10)2]=3.4,标准差s = 3.4,④错.答案:①②样本的数字特征典题导入[例3] (1)(2012·江西高考)样本(x 1,x 2,…,x n )的平均数为x -,样本(y 1,y 2,…,y m )的平均数为y -(x -≠y -).若样本(x 1,x 2,…,x n ,y 1,y 2,…,y m )的平均数z -=αx -+(1-α)y -,其中0<α<12,则n ,m 的大小关系为( )A .n <mB .n >mC .n =mD .不能确定(2)(2012·山东高考)在某次测量中得到的A 样本数据如下:82,84,84,86,86,86,88,88,88,88.若B 样本数据恰好是A 样本数据每个都加2后所得数据,则A ,B 两样本的下列数字特征对应相同的是( )A .众数B .平均数C .中位数D .标准差[自主解答] (1)x =x 1+x 2+…+x n n ,y =y 1+y 2+…+y m m ,z =x 1+x 2+…+x n +y 1+y 2+…+y mm +n ,则z =n x +m y m +n =n m +n x +mm +n y .由题意知0<n m +n <12,∴n <m .(2)对样本中每个数据都加上一个非零常数时不改变样本的方差和标准差,众数、中位数、平均数都发生改变.[答案] (1)A (2)D由题悟法(1)众数体现了样本数据的最大集中点,但无法客观地反映总体特征. (2)中位数是样本数据居中的数.(3)标准差、方差描述了一组数据围绕平均数波动的大小.标准差、方差越大,数据越分散,标准差、方差越小,数据越集中.以题试法3.(2012·淄博一检)一农场在同一块稻田中种植一种水稻,其连续8年的产量(单位:kg)如下:450,430,460,440,450,440,470,460,则该组数据的方差为( )A .120B .80C .15D .150解析:选D根据题意知,该组数据的平均数为450+430+460+440+450+440+470+4608=450,所以该组数据的方差为18×(02+202+102+102+02+102+202+102)=150.1.(2013·豫西五校联考)某人5次上班途中所花的时间(单位:分钟)分别为8,12,10,11,9,估计此人每次上班途中平均花费的时间为( )A .8分钟B .9分钟C .11分钟D .10分钟解析:选D 依题意,估计此人每次上班途中平均花费的时间为8+12+10+11+95=10分钟.2.(2012·湖北高考)容量为20的样本数据,分组后的频数如下表: 分组 [10,20) [20,30) [30,40) [40,50) [50,60) [60,70) 频数234542则样本数据落在区间[10,40)的频率为( ) A .0.35 B .0.45 C .0.55D .0.65解析:选B 求得该频数为2+3+4=9,样本容量是20,所以频率为920=0.45.3.某厂10名工人在一个小时内生产零件的个数分别是15,17,14,10,15,17,17,16,14,12,设该组数据的平均数为a ,中位数为b ,众数为c ,则有( )A .a >b >cB .b >c >aC .c >a >bD .c >b >a解析:选D 把该组数据按从小到大的顺序排列为10,12,14,14,15,15,16,17,17,17,其平均数a =110×(10+12+14+14+15+15+16+17+17+17)=14.7,中位数b =15+152=15,众数c =17,则a <b <c .4.(2013·济宁模拟)为了解一片大约一万株树木的生长情况,随机测量了其中100株树木的底部周长(单位:cm).根据所得数据画出的样本频率分布直方图如图所示,那么在这片树木中,底部周长小于110 cm 的株数大约是( )A .3 000B .6 000C .7 000D .8 000解析:选C 底部周长小于110 cm 的频率为:(0.01+0.02+0.04)×10=0.7,所以底部周长小于110 cm 的株数大约是10 000×0.7=7 000.5.(2012·江西高考)小波一星期的总开支分布如图1所示,一星期的食品开支如图2所示,则小波一星期的鸡蛋开支占总开支的百分比为( )图1图2A .30%B .10%C .3%D .不能确定解析:选C 由图1得到小波一星期的总开支,由图2得到小波一星期的食品开支,从而再借助图2计算出鸡蛋开支占总开支的百分比.由图2知,小波一星期的食品开支为30+40+100+80+50=300元,由图1知,小波一星期的总开支为30030%=1 000元,则小波一星期的鸡蛋开支占总开支的百分比为301 000×100%=3%.6.(2012·江西盟校二联)若一个样本容量为8的样本的平均数为5,方差为2.现样本中又加入一个新数据5,此时样本容量为9,平均数为x ,方差为s 2,则( )A.x =5,s 2<2B.x =5,s 2>2C.x >5,s 2<2D.x >5,s 2>2解析:选A 设18(x 1+x 2+…+x 8)=5,∴19(x 1+x 2+…+x 8+5)=5, ∴x =5,由方差定义及意义可知加新数据5后,样本数据取值的稳定性比原来强,∴s 2<2.7.(2012·湖北模拟)下图为150辆汽车通过某路段时速度的频率分布直方图,则速度在[60,70)内的汽车大约有________辆.解析:由频率分布直方图可知,汽车速度在[60,70)内的频率为0.04×10=0.4,故速度在[60,70)内的汽车为150×0.4=60辆.答案:608.(2012·湖南高考)如图所示是某学校一名篮球运动员在五场比赛中所得分数的茎叶图,则该运动员在这五场比赛中得分的方差为________.(注:方差s 2=1n[(x 1-x )2+(x 2-x )2+…+(x n -x )2],其中x 为x 1,x 2,…,x n 的平均数)解析:该运动员五场比赛中的得分为8,9,10,13,15,平均得分x =8+9+10+13+155=11,方差s2=15[(8-11)2+(9-11)2+(10-11)2+(13-11)2+(15-11)2]=6.8.答案:6.89.(2012·北京海淀)甲和乙两个城市去年上半年每月的平均气温(单位:℃)用茎叶图记录如下,根据茎叶图可知,两城市中平均温度较高的城市是________,气温波动较大的城市是________.解析:根据茎叶图可知,甲城市上半年的平均温度为9+13+17×2+18+226=16,乙城市上半年的平均温度为12+14+17+20+24+276=19,故两城市中平均温度较高的是乙城市,观察茎叶图可知,甲城市的温度更加集中在峰值附近,故乙城市的温度波动较大.答案:乙乙10.(2012·郑州模拟)某中学共有1 000名学生参加了该地区高三第一次质量检测的数学考试,数学成绩如下表所示:数学成绩分组[0,30)[30,60)[60,90)[90,120)[120,150] 人数6090300x 160样的方法抽取100名同学进行问卷调查,甲同学在本次测试中数学成绩为95分,求他被抽中的概率;(2)已知本次数学成绩的优秀线为110分,试根据所提供数据估计该中学达到优秀线的人数;(3)作出频率分布直方图,并估计该学校本次考试的数学平均分(同一组中的数据用该组区间的中点值作代表).解:(1)分层抽样中,每个个体被抽到的概率均为样本容量总体中个体总数,故甲同学被抽到的概率P=110.(2)由题意得x=1 000-(60+90+300+160)=390.故估计该中学达到优秀线的人数m =160+390×120-110120-90=290.(3)频率分布直方图如图所示.该学校本次考试的数学平均分. x =60×15+90×45+300×75+390×105+160×1351 000=90.估计该学校本次考试的数学平均分为90分.11. (2012·江西重点中学联考)某日用品按行业质量标准分成五个等级,等级系数X 依次为1,2,3,4,5.现从一批该日用品中随机抽取20件,对其等级系数进行统计分析,得到频率分布表如下:X 1 2 3 4 5 频率a0.20.45bc(1)若所抽取的20件日用品中,等级系数为4的恰有3件,等级系数为5的恰有2件,求a ,b ,c 的值;(2)在(1)的条件下,将等级系数为4的3件日用品记为x 1,x 2,x 3,等级系数为5的2件日用品记为y 1,y 2,现从x 1,x 2,x 3,y 1,y 2这5件日用品中任取2件(假定每件日用品被取出的可能性相同),写出所有可能的结果,并求这2件日用品的等级系数恰好相等的概率.解:(1)由频率分布表得a +0.2+0.45+b +c =1, 即a +b +c =0.35.因为抽取的20件日用品中,等级系数为4的恰有3件,所以b =320=0.15.等级系数为5的恰有2件,所以c =220=0.1.从而a =0.35-b -c =0.1. 所以a =0.1,b =0.15,c =0.1.(2)从日用品x 1,x 2,x 3,y 1,y 2中任取2件,所有可能的结果为:{x 1,x 2},{x 1,x 3},{x 1,y 1},{x 1,y 2},{x 2,x 3},{x 2,y 1},{x 2,y 2},{x 3,y 1},{x 3,y 2},{y 1,y 2},共10个.设事件A 表示“从日用品x 1,x 2,x 3,y 1,y 2中任取2件,其等级系数相等”,则A 包含的基本事件为:{x 1,x 2},{x 1,x 3},{x 2,x 3},{y 1,y 2},共4个.故所求的概率P (A )=410=0.4.12.(2012·北京高考)近年来,某市为了促进生活垃圾的分类处理,将生活垃圾分为厨余垃圾、可回收物和其他垃圾三类,并分别设置了相应的垃圾箱.为调查居民生活垃圾分类投放情况,现随机抽取了该市三类垃圾箱中总计1 000吨生活垃圾,数据统计如下(单位:吨):(1)试估计厨余垃圾投放正确的概率; (2)试估计生活垃圾投放错误的概率;(3)假设厨余垃圾在“厨余垃圾”箱、“可回收物”箱、“其他垃圾”箱的投放量分别为a ,b ,c ,其中a >0,a +b +c =600.当数据a ,b ,c 的方差s 2最大时,写出a ,b ,c 的值(结论不要求证明),并求此时s 2的值.( 注:s 2=1n [(x 1-x )2+(x 2-x )2+…+(x n -x )2],其中x 为数据x 1,x 2,…,x n 的平均数 )解:(1)厨余垃圾投放正确的概率约为“厨余垃圾”箱里厨余垃圾量厨余垃圾总量=400400+100+100=23.(2)设“生活垃圾投放错误”为事件A ,则事件A 表示“生活垃圾投放正确”. 事件A 的概率约为“厨余垃圾”箱里厨余垃圾量、“可回收物”箱里可回收物量与“其他垃圾”箱里其他垃圾量的总和除以生活垃圾总量,即P (A )约为400+240+601 000=0.7,所以P (A )约为1-0.7=0.3.(3)当a =600,b =c =0时,s 2取得最大值.因为x =13(a +b +c )=200,所以s 2=13×[(600-200)2+(0-200)2+(0-200)2]=80 000.1.(2013·西宁模拟)已知一组数据:a 1,a 2,a 3,a 4,a 5,a 6,a 7构成公差为d 的等差数列,且这组数据的方差等于1,则公差d 等于( )A .±14B .±12C .±128D .无法求解解析:选B 这组数据的平均数为a 1+a 2+a 3+a 4+a 5+a 6+a 77=7a 47=a 4,又因为这组数据的方差等于1,所以17[(a 1-a 4)2+(a 2-a 4)2+(a 3-a 4)2+(a 4-a 4)2+(a 5-a 4)2+(a 6-a 4)2+(a 7-a 4)2]=(3d )2+(2d )2+(d )2+0+(d )2+(2d )2+(3d )27=1,即4d 2=1,解得d =±12.2.(2012·安徽高考)甲、乙两人在一次射击比赛中各射靶5次,两人成绩的条形统计图如图所示,则( )A .甲的成绩的平均数小于乙的成绩的平均数B .甲的成绩的中位数等于乙的成绩的中位数C .甲的成绩的方差小于乙的成绩的方差D .甲的成绩的极差小于乙的成绩的极差解析:选C 由题意可知,甲的成绩为4,5,6,7,8,乙的成绩为5,5,5,6,9.所以甲、乙的成绩的平均数均为6,A 错;甲、乙的成绩的中位数分别为6,5,B 错;甲、乙的成绩的方差分别为15×[(4-6)2+(5-6)2+(6-6)2+(7-6)2+(8-6)2]=2,15×[(5-6)2+(5-6)2+(5-6)2+(6-6)2+(9-6)2]=125,C 对;甲、乙的成绩的极差均为4,D 错.3.(2012·山西山大附中月考)如图是某市有关部门根据该市干部的月收入情况,画出的样本频率分布直方图,已知图中第一组的频数为4 000,请根据该图提供的信息解答下列问题.(1)求样本中月收入在[2 500,3 500)的人数;(2)为了分析干部的收入与年龄、职业等方面的关系,必须从样本中按月收入用分层抽样方法抽出100人作进一步分析,则月收入在[1 500,2 000)的这组中应抽多少人?(3)试估计样本数据的中位数.解:(1)由题知,月收入在[1 000,1 500)的频率为0.000 8×500=0.4,又月收入在[1 000,1 500)的有4 000人,故样本容量n =4 0000.4=10 000.又月收入在[1 500,2 000)的频率为0.000 4×500=0.2, 月收入在[2 000,2 500)的频率为0.000 3×500=0.15, 月收入在[3 500,4 000]的频率为0.000 1×500=0.05,所以月收入在[2 500,3 500)的频率为1-0.4-0.2-0.15-0.05=0.2. 故样本中月收入在[2 500,3 500]的人数为0.2×10 000=2 000.(2)由(1)知,月收入在[1 500,2 000)的人数为0.2×10 000=2 000,再从10 000人中用分层抽样的方法抽出100人,则月收入在[1 500,2 000)的这组中应抽取100×2 00010 000=20(人).(3)由(1)知,月收入在[1 000,2 000)的频率为0.4+0.2=0.6>0.5,故样本数据的中位数为1 500+0.5-0.40.000 4=1 500+250=1 750.1.(2012·陕西高考)对某商店一个月内每天的顾客人数进行了统计,得到样本的茎叶图(如图所示),则该样本的中位数、众数、极差分别是( )A .46,45,56B .46,45,53C .47,45,56D .45,47,53解析:选A 从茎叶图中可以看出样本数据的中位数为中间两个数的平均数,即45+472=46,众数为45,极差为68-12=56.2.(2012·济南调研)如图是2012年在某大学自主招生面试环节中,七位评委为某考生打出的分数的茎叶统计图,去掉一个最高分和一个最低分后,所剩数据的平均数和方差分别为( )A .84,4.84B .84,1.6C .85,1.6D .85,4解析:选C 依题意得,去掉一个最高分和一个最低分后,所剩数据的平均数为80+15×(4×3+6+7)=85,方差为15×[3×(84-85)2+(86-85)2+(87-85)2]=1.6.。

2013届高考数学用样本估计总体复习课件和过关试题

2013届高考数学用样本估计总体复习课件和过关试题

2013届高考数学用样本估计总体复习课件和过关试题2013年高考数学总复习10-2用样本估计总体但因为测试新人教B版1.(文)(2011•重庆文,4)从一堆苹果中任取10只,称得它们的质量如下(单位:克):12512012210513011411695120134则样本数据落在114.5,124.5)内的频率为()A.0.2B.0.3C.0.4D.0.5答案]C解析]在10个测出的数值中,有4个数据落在114.5,124.5)内,它们是:120、122、116、120,故频率P=410=0.4,选C.(理)已知样本:10861013810121178911912910111212那么频率为0.25的范围是()A.5.5~7.5B.7.5~9.5C.9.5~11.5D.11.5~13.5答案]D解析]样本容量为20,频率若为0.25,则在此组的频数应为20×0.25=5.列出频率分布表如下:分组频数频率(5.5,7.5)20.1(7.5,9.5)60.3(9.5,11.5)70.35(11.5,13.5)50.25可知选D.点评]解答此类问题,只要数出各小组的频数即可选出答案.2.(文)(2011•安庆模拟)如下图是根据某校10位高一同学的身高(单位:cm)画出的茎叶图,其中左边的数字从左到右分别表示学生身高的百位数字和十位数字,右边的数字表示学生身高的个位数字,从图中可以得到这10位同学身高的中位数是()A.161cmB.162cmC.163cmD.164cm答案]B解析]由给定的茎叶图可知,这10位同学身高的中位数为161+1632=162(cm).(理)(2011•福州市期末)如下图是歌手大奖赛中,七位评委为甲、乙两名选手打出的分数的茎叶图(其中m为数字0~9中的一个),去掉一个最高分和一个最低分后,甲、乙两名选手得分的平均数分别为a1,a2,则一定有()A.a1>a2B.a2>a1C.a1=a2D.a1、a2的大小不确定答案]B解析]由于去掉一个最高分和一个最低分,则甲去掉70和(90+m)乙去掉79和93,故a1=15(1+5×3+4)+80=84,a2=15(4×3+6+7)+80=85,∴a2>a1.3.(文)(2011•咸阳模拟)样本容量为100的频率分布直方图如下图所示,根据样本的频率分布直方图估计,样本数据落在2,10)内的频率为a,则a的值为()A.0.1B.0.2C.0.3D.0.4答案]D解析]样本数据落在2,10)内的频率为a=(0.02+0.08)×4=0.4.(理)(2011•济宁模拟)为了解一片大约一万株树木的生长情况,随机测量了其中100株树木的底部周长(单位:cm).根据所得数据画出的样本频率分布直方图如下图,那么在这片树木中,底部周长小于110cm的株数大约是()A.3000B.6000C.7000D.8000答案]C解析]∵底部周长小于110cm的频率为(0.01+0.02+0.04)×10=0.7,∴1万株中底部小于110cm的株数为0.7×10000=7000.点评]用样本的频率作为总体频率的估计值.4.(2011•安徽江南十校联考)已知一组正数x1,x2,x3,x4的方差为s2=14(x21+x22+x23+x24-16),则数据x1+2,x2+2,x3+2,x4+2的平均数为()A.2B.3C.4D.6答案]C解析]设x1,x2,x3,x4的平均值为x-,则s2=14(x1-x-)2+(x2-x-)2+(x3-x-)2+(x4-x-)2]=14(x21+x22+x23+x24-4x-2),∴4x-2=16,∴x-=2,x-=-2(舍),∴x1+2,x2+2,x3+2,x4+2的平均数为4,故选C.5.(文)(2011•东北三校联考)甲、乙两位同学在高三的5次月考中数学成绩统计如茎叶图所示,若甲、乙两人的平均成绩分别是x甲,x乙,则下列叙述正确的是()甲乙8727868882910A.x甲>x乙;乙比甲成绩稳定B.x甲>x乙;甲比乙成绩稳定C.x甲D.x甲答案]C解析]从茎叶图中可见甲的成绩在70~80段有3个,其余两段各1个,而乙的成绩在80~90段有2个,90以上有2个,故乙的平均成绩较好,∴x甲甲的成绩散布在(72,92)内,乙的成绩在(78,91)内,且乙的成绩的分布较集中,∴乙比甲稳定,故选C.(理)(2011•广州调研)甲、乙、丙、丁四人参加奥运会射击项目选拔赛,四人的平均成绩和方差如下表所示:从这四个人中选择一人参加奥运会射击项目比赛,最佳人选是()甲乙丙丁平均环数x-8.68.98.98.2方差s23.53.52.15.6A.甲B.乙C.丙D.丁答案]C解析]由表可知,乙、丙的平均成绩最好,平均环数为8.9;但乙的方差大,说明乙的波动性大,所以丙为最佳人选,故选C. 6.(2011•海南五校联考)一个容量为10的样本数据,组成一个公差不为0的等差数列{an},若a3=8,且a1,a3,a7成等比数列,则此样本数据的平均数和中位数分别是()A.13,13B.13,12C.12,13D.13,14答案]A解析]设等差数列{an}的公差为d,因为a1a7=a23,所以(8-2d)(8+4d)=82,又d≠0,∴d=2,易得这10个数据为4,6,8,10,12,14,16,18,20,22,计算得其平均数为13,中位数为12+142=13.7.(文)(2010•浙江文)在如图所示的茎叶图中,甲、乙两组数据的中位数分别是________,________.甲乙82991345254826785535667答案]4546解析]由茎叶图知,甲、乙两组数据数均为9,其中位数均为从小到大排列的中间那个数,将甲、乙两组数据前后各去掉4个数即可得到.点评]找中位数前后去掉数时,前边从小到大,后边从大到小.(理)(2010•福建莆田市质检)在某电视台举办的挑战主持人大赛上,七位评委为某选手打出的分数的茎叶统计图如下图所示,去掉一个最高分和一个最低分后,所剩数据的方差是________.7884465697答案]45解析]去掉最高分93分和最低分78分后,剩下数据的平均数为x-=80+15(4+4+6+5+6)=85,故所剩数据的方差为s2=15(84-85)2×2+(86-85)2×2+(85-85)2]=45.。

(江西版)高考数学总复习 第十章10.6 随机抽样与用样本估计总体教案 理 北师大版

(江西版)高考数学总复习 第十章10.6 随机抽样与用样本估计总体教案 理 北师大版

2013年高考第一轮复习数学北师(江西版)理第十章10.6 随机抽样与用样本估计总体考纲要求1.理解随机抽样的必要性和重要性.2.会用简单随机抽样方法从总体中抽取样本;了解分层抽样和系统抽样方法.3.了解分布的意义和作用,会列频率分布表、会画频率分布直方图、频率折线图、茎叶图,理解它们各自的特点.4.理解样本数据标准差的意义和作用,会计算数据标准差.5.能从样本数据中提取基本的数字特征(如平均数、标准差),并给出合理的解释.6.会用样本的频率分布估计总体分布,会用样本的基本数字特征估计总体的基本数字特征,理解用样本估计总体的思想.7.会用随机抽样的基本方法和样本估计总体的思想解决一些简单的实际问题.知识梳理1.总体、个体、样本、样本容量的概念统计中所考察对象的全体构成的集合看做总体,构成总体的每个元素作为个体,从总体中抽取的__________所组成的集合叫样本,样本中个体的____叫样本容量.2.简单随机抽样一般地,设一个总体含有N个个体,从中逐个______地抽取n个个体作为样本(n≤N),如果每次抽取时总体内的各个个体被抽到的__________,就把这种抽样方法叫做简单随机抽样.最常用的简单随机抽样的方法有两种:______和__________.3.系统抽样当总体中的个体比较多时,首先把总体分成均衡的若干部分,然后________________,从每一部分中抽取一个个体,得到所需要的样本,这种抽样方法叫做系统抽样.4.分层抽样一般地,在抽样时,将总体分成互不交叉的层,然后按照__________,从各层独立地抽取一定数量的个体,将各层取出的个体合在一起作为样本,这种抽样方法是分层抽样.5.用样本的频率分布估计总体分布(1)频率分布表与频率分布直方图频率分布表和频率分布直方图,是从各个小组数据在样本容量中所占比例大小的角度,来表示数据分布规律,它可以使我们看到整个样本数据的频率分布情况.绘制频率分布直方图的步骤为:①________;②__________________;③____________;④__________;⑤__________.(2)频率分布折线图连接频率分布直方图中______________,就得到频率分布折线图.(3)总体密度曲线总体密度曲线反映了总体在各个范围内取值的百分比,它能给我们提供更加精细的信息.(4)茎叶图统计中还有一种被用来表示数据的图叫做茎叶图.茎是指____的一列数,叶是从茎的____生长出来的数.6.用样本的数字特征估计总体的数字特征(1)众数:一组数据中出现次数最多的数.(2)中位数:将数据从小到大排列,若有奇数个数,则最中间的数是中位数;若有偶数个数,则中间两数的平均数是中位数.(3)平均数:x=________,反映了一组数据的平均水平.(4)标准差:s=______________________________,反映了样本数据的离散程度.(5)方差:s2=________________,反映了样本数据的离散程度.(6)平均数、方差的性质:若数据x1,x2,…,x n的平均数为x,方差为s2,那么数据mx1+a,mx2+a,…,mx n+a的平均数为______,方差为______.基础自测1.要从已编号(1~50)的50枚最新研制的某型号导弹中随机抽取5枚来进行发射试验,用每部分选取的号码间隔一样的系统抽样方法,确定所选取的5枚导弹的编号可能是( ).A.5,10,15,20,25 B.3,13,23,33,43 C.1,2,3,4,5 D.2,4,8,16,22 2.一个样本数据按从小到大的顺序排列为:13,14,19,x,23,27,28,31,其中,中位数为22,则x等于( ).A.21 B.22 C.23 D.203.如图是某学校举行的运动会上,七位评委为某体操项目打出的分数的茎叶统计图,去掉一个最高分和一个最低分后,所剩数据的平均数和方差分别为( ).A.84,4.84 B.84,1.6 C.85,1.6 D.85,44.某高校甲、乙、丙、丁四个专业分别有150,150,400,300名学生.为了解学生的就业倾向,用分层抽样的方法从该校这四个专业共抽取40名学生进行调查,应在丙专业抽取的学生人数为__________.5.某个容量为100的样本的频率分布直方图如下,则在区间[4,5)上的数据的频数为__________.思维拓展1.抽签法的优点和缺点各是什么?提示:优点是能够保证每个个体入选样本的机会相等(得到的样本是简单随机样本),缺点是:①当总体中的个体数较多时,制作号签的成本将会增加,使得抽签法成本高(费时、费力);②号签较多时,把它们“搅拌均匀”就比较困难,结果很难保证每个个体入选样本的可能性相等,从而产生坏样本(即代表性差的样本)的可能性增加.2.在用系统抽样的方法选取样本时,如果总体中的个体数不能被样本容量整除时,该怎么办?提示:可以在总体中剔除一些个体,因为每个个体被剔除的机会均等,也就是它们不被剔除的机会相等,所以整个抽样过程仍然能保证每个个体被抽取的机会相等.3.三种抽样方法的联系与适用范围是什么?提示:4.在电视大奖赛中,计算评委打分的平均值时,为什么要去掉一个最高分和一个最低分?提示:平均数与样本的每一个数据都有关,所以任意一个样本数据的改变都会引起平均数的改变,平均数虽然能反映更多的关于样本数据的信息,但它受数据中极端值的影响较大,会使它在估计总体时的可靠性降低.5.茎叶图、频率分布表和频率分布直方图在描述数据分布时各有什么特点?提示:茎叶图由所有样本数据构成,没有损失任何样本信息,可以随时记录;而频率分布表和频率分布直方图则损失了样本的一些信息,必须在完成抽样后才能制作.频率分布表和频率分布直方图可以直观地反映样本数据的总体分布情况.一、简单随机抽样【例1】某大学为了支援我国西部教育事业,决定从2012年应届毕业生报名的18名志愿者中,选取6人组成志愿小组.请用抽签法和随机数法设计抽样方案.方法提炼1.一个抽样试验能否用抽签法,关键看两点:一是抽签是否方便;二是号签是否容易搅匀.一般地,当总体容量和样本容量都较小时可用抽签法.2.随机数表中共随机出现0,1,2,…,9十个数字,也就是说,在表中的每个位置上出现各个数字的机会都是相等的.在使用随机数表时,如遇到三位数或四位数时,可从选择的随机数表中的某行某列的数字记起,每三个或每四个作为一个单位,按事先确定的读数方向选取,有超过总体号码或出现重复号码的数字舍去.请做[针对训练]4二、系统抽样【例2】某单位在岗职工共624人,为了调查工人用于上班途中的时间,该单位工会决定抽取10%的工人进行调查,请问如何采用系统抽样法完成这一抽样?方法提炼1.当总体中的个体数较多,并且没有明显的层次差异时,可用系统抽样的方法,把总体分成均衡的几部分,按照预先制定的规则,从每一部分抽取一个个体,得到需要的样本.2.在利用系统抽样时,经常遇到总体容量不能被样本容量整除的情况,这时可以先从总体中随机地剔除几个个体,使得总体中剩余的个体数能被样本容量整除.请做[针对训练]3三、分层抽样【例3】某政府机关在编人员100人,其中副处级以上干部10人,一般干部70人,工人20人.上级机关为了了解职工对政府机构改革的意见,要从中抽取一个容量为20的样本,试确定用何种方法抽取,请具体实施操作.方法提炼分层抽样适用于总体是由差异明显的几部分组成的情况,这样更能反映总体的情况,是等可能抽样.当各层抽取的个体数目确定后,每层中的样本抽取可用简单随机抽样或系统抽样的方法.用分层抽样法抽样的关键是确定抽样比,抽样比=样本容量总体中的个体数=每层抽取的个体数该层的个体数.用抽样比乘以该层的个体数等于在该层中抽取的个体数.请做[针对训练]1四、用样本的频率分布估计总体分布【例4】某市2010年4月1日~4月30日对空气污染指数的监测数据如下(主要污染物为可吸入颗粒物):61,76,70,56,81,91,92,91,75,81,88,67,101,103,95,91,77,86,81,83,82,82,64,79,86,85,75,71,49,45.(1)完成频率分布表;(2)作出频率分布直方图;(3)根据国家标准,污染指数在0~50之间时,空气质量为优;在51~100之间时,为良;在101~150之间时,为轻微污染;在151~200之间时,为轻度污染.请你依据所给数据和上述标准,对该市的空气质量给出一个简短评价.方法提炼频率分布直方图是从各个小组数据在样本容量中所占比例大小的角度,表示数据分布的规律.图中各小长方形的面积等于相应各组的频率,它直观反映了数据在各个小组的频率的大小.请做[针对训练]2五、用样本的数字特征估计总体【例5】从甲、乙两种玉米苗中各抽取10株,分别测得它们的株高如下:(单位:cm) 甲:25,41,40,37,22,14,19,39,21,42;乙:27,16,44,27,44,16,40,40,16,40.问:(1)哪种玉米的苗长得高?(2)哪种玉米的苗长得齐?方法提炼1.用样本的平均数、方差可以估计总体的平均数和方差.平均数可反映总体取值的平均水平,方差可以反映总体的稳定性,方差越大,稳定性越差,方差越小,稳定性越好.2.茎叶图的优点是保留了原始数据,便于记录及表示,能反映数据在各段上的分布情况.但是茎叶图不能直接反映总体的分布情况,往往要根据茎叶图所给数据求出其数字特征,进一步估计总体情况.请做[针对训练]5考情分析从近三年的高考试题统计分析可以看出,本部分在高考中主要考查用分层抽样抽取样本,用频率分布直方图、茎叶图计算平均数和方差等内容.如果对以上问题单独考查,通常是以选择题或填空题的形式出现,若对以上问题结合概率统计知识考查就会以解答题的形式出现,题目难度往往不大,属中低档题.针对训练1.(2011福建高考,文4)某校选修乒乓球课程的学生中,高一年级有30名,高二年级有40名,现用分层抽样的方法在这70名学生中抽取一个样本,已知在高一年级的学生中抽取了6名,则在高二年级的学生中应抽取的人数为( ).A.6 B.8 C.10 D.122.(2011江西高考,文7)为了普及环保知识,增强环保意识,某大学随机抽取30名学生参加环保知识测试,得分(十分制)如图所示,假设得分值的中位数为m e,众数为m o,平均值为x,则( ).A .m e =m o =xB .m e =m o <xC .m e <m o <xD .m o <m e <x3.在一次抽样活动中,采用了系统抽样.若第1组中选中的为2号,第2组中选中的为7号,则第5组中选中的应为________号.4.下面的抽样方法是简单随机抽样吗?为什么?(1)从无数个个体中抽取20个个体作为样本;(2)从50台冰箱中一次性抽取5台冰箱进行质量检查;(3)某班有40名同学,指定个子最高的5名同学参加学校组织的篮球赛;(4)一彩民选号,从装有36个大小、形状都相同的号签的盒子中无放回地抽出6个号签.5. (2011辽宁高考,理19)某农场计划种植某种新作物,为此对这种作物的两个品种(分别称为品种甲和品种乙)进行田间试验.选取两大块地,每大块地分成n 小块地,在总共2n 小块地中,随机选n 小块地种植品种甲,另外n 小块地种植品种乙.(1)假设n =4,在第一大块地中,种植品种甲的小块地的数目记为X ,求X 的分布列和数学期望;(2)试验时每大块地分成8小块,即n =8,试验结束后得到品种甲和品种乙在各小块地上2应该种植哪一品种?附:样本数据x 1,x 2,…,x n 的样本方差s 2=1n[(x 1-x )2+(x 2-x )2+…+(x n -x )2],其中x 为样本平均数.参考答案基础梳理自测知识梳理1.一部分个体 数目2.不放回 机会都相等 抽签法 随机数法3.按照预先定出的规则4.一定的比例5.(1)①求极差 ②决定组距与组数 ③将数据分组 ④列频率分布表 ⑤画频率分布直方图 (2)各小长方形上端的中点 (4)中间 旁边6.(3)12n x x x n ++(5)222211[()+()()]n x x x x x x n --++- (6)m x +a m 2m 2基础自测1.B 解析:系统抽样又称等距抽样,选取的各个编号之间间隔应相同.2.A 解析:因为样本数据个数为偶数,中位数为x +232=22,故x =21. 3.C 解析:去掉最高分93,最低分79.平均数为15(84+84+86+84+87)=85, 方差s 2=15[(84-85)2+(84-85)2+(86-85)2+(84-85)2+(87-85)2]=1.6. 4.16 解析:由分层抽样的定义可知,应抽丙专业的人数为40×400150+150+300+400=40×25=16(人). 5.30 解析:样本数据在[1,4)和[5,6]上的频率为(0.05+0.10+0.15+0.40)×1=0.7,故样本数据在[4,5)上的频率为1-0.7=0.3,其频数为100×0.3=30.考点探究突破【例1】解:抽签法:第一步,将18名志愿者编号,编号为1,2,3, (18)第二步,将18个号码分别写在18张外形完全相同的纸条上,并揉成团,制成号签. 第三步,将18个号签放入一个不透明的盒子里,充分搅匀.第四步,从盒子中逐个抽取6个号签,并记录上面的编号.第五步,所得号码对应的志愿者,就是志愿小组的成员.随机数法:第一步,将18名志愿者编号,编号为01,02,03, (18)第二步,在随机数表中任选一数作为开始,按任意方向读数,比如第8行第29列的数7开始,向右读.第三步,从数7开始,向右读,每次取两位,凡不在01~18中的数,或已读过的数,都跳过去不作记录,依次可得到12,07,15,13,02,09.第四步,找出以上号码对应的志愿者,就是志愿小组的成员.【例2】解:(1)将624名职工用随机方式编号由000至623.(2)利用随机数法从总体中剔除4人.(3)将剩下的620名职工重新编号由000至619.(4)分段,取间隔k =62062=10,将总体分成62组,每组含10人. (5)从第一段,即为000至009号随机抽取一个号l .(6)按编号将l,10+l,20+l ,…,610+l 共62个号码选出.这62个号码所对应的职工组成样本.【例3】解:因机构改革关系到各人的不同利益,故采用分层抽样的方法为妥.∵10020=5,105=2,705=14,205=4, ∴从副处级以上干部中抽取2人,从一般干部中抽取14人,从工人中抽取4人.因副处级以上干部与工人人数都较少,把他们分别按1~10编号与1~20编号,然后制作号签,采用抽签法分别抽取2人和4人;对一般干部70人采用00,01,…,69编号,然后用随机数表法抽取14人.【例4】解:(1)(2)频率分布直方图:(3)答对下述两条中的一条即可:①该市一个月中空气污染指数有2天处于优的水平,占当月天数的115.有26天处于良的水平,占当月天数的1315.处于优或良的天数共有28天,占当月天数的1415.说明该市空气质量基本良好.②轻微污染有2天,占当月天数的115.污染指数在80以上的接近轻微污染的天数有15天,加上处于轻微污染的天数,共有17天,占当月天数的1730,超过50%.说明该市空气质量有待进一步改善.【例5】解:(1)x 甲=110(25+41+40+37+22+14+19+39+21+42)=30, x 乙=110(27+16+44+27+44+16+40+40+16+40)=31, ∴x 甲<x 乙.(2)2s 甲=110[(25-30)2+(41-30)2+(40-30)2+(37-30)2+(22-30)2+(14-30)2+(19-30)2+(39-30)2+(21-30)2+(42-30)2]=104.2, 同理2s 乙=128.8,∴2s 甲<2s 乙.∴乙种玉米的苗长得高,甲种玉米的苗长得整齐.演练巩固提升针对训练1.B 解析:分层抽样的原理是按照各部分所占的比例抽取样本,设从高二年级抽取的学生数为n ,则3040=6n,解得n =8. 2.D 解析:由题目所给的统计图示可知,30个得分中,按大小顺序排好后,中间的两个得分为5,6,故中位数me =6+52=5.5, 又众数mo =5,平均值 x =3×2+4×3+5×10+6×6+7×3+8×2+9×2+10×230=17930,∴o e m m x <<. 3.22 解析:由题意知抽样间隔为7-2=5,所以第5组选中的号码应为2+(5-1)×5=22.4.解:(1)不是简单随机抽样.因为总体的个数是无限的,而不是有限的.(2)不是简单随机抽样.虽然“一次性”抽取和“逐个”抽取不影响个体被抽到的可能性,但简单随机抽样的定义要求的是“逐个抽取”.(3)不是简单随机抽样.因为是指定5名同学参加比赛,每个个体被抽到的可能性是不同的,不是等可能抽样.(4)是简单随机抽样.因为总体中的个体数是有限的,并且是从总体中逐个进行抽取的,是不放回、等可能地进行抽样.5.解:(1)X 可能的取值为0,1,2,3,4,且P (X =0)=481C =170,P (X =1)=134448C C C =835, P (X =2)=224448C C C =1835,P (X =3)=134448C C C =835, P (X =4)=481C =170,即X 的分布列为X 的数学期望为 EX =0×170+1×835+2×1835+3×835+4×170=2.(2)品种甲的每公顷产量的样本平均数和样本方差分别为:x 甲=18(403+397+390+404+388+400+412+406)=400, 2s 甲=18[32+(-3)2+(-10)2+42+(-12)2+02+122+62]=57.25.品种乙的每公顷产量的样本平均数和样本方差分别为:x乙=18(419+403+412+418+408+423+400+413)=412,2 s 乙=18[72+(-9)2+02+62+(-4)2+112+(-12)2+12]=56.由以上结果可以看出,品种乙的样本平均数大于品种甲的样本平均数,且两品种的样本方差差异不大,故应该选择种植品种乙.。

  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

2013年高考第一轮复习数学北师(江西版)理第十章10.6 随机抽样
与用样本估计总体练习
一、选择题
1.某校高三年级有男生500人,女生400人.为了解该年级学生的健康情况,从男生中任意抽取25人,从女生中任意抽取20人进行调查,这种抽样方法是( ).A.简单随机抽样 B.抽签法
C.随机数法 D.分层抽样
2.若某校高一年级8个班参加合唱比赛的得分如茎叶图所示,则这组数据的中位数和平均数分别是( ).
A.91.5和91.5 B.91.5和92
C.91和91.5 D.92和92
3.一段高速公路有300盏太阳能标志灯,其中进口的有30盏,联合研制的有75盏,国产的有195盏,为了掌握每个标志灯的使用情况,要从中抽取一个容量为20的样本,若采用分层抽样的方法,抽取的进口标志灯的数量为( ).
A.2 B.3 C.5 D.13
4.某棉纺厂为了了解一批棉花的质量,从中随机抽测了100根棉花纤维的长度(棉花纤维的长度是棉花质量的重要指标),所得数据都在区间[5,40]中,其频率分布直方图如图所示,则在抽测的100根中,纤维的长度小于20 mm的棉花根数为( ).
A.20 B.30 C.40 D.50
5.某服装加工厂某月生产A,B,C三种产品共4 000件,为了保证产品质量,进行抽样检验,根据分层抽样的结果
由于不小心,表格中A产品的样本容量比C产品的样本容量多10,根据以上信息,可得C产品数量是( ).A.80 B.800 C.90 D.900
6.如图,样本A和B分别取自两个不同的总体,它们的样本平均数分别为x A和x B,样本标准差分别为s A和s B,则( ).
A.x A>x B,s A>s B
B.x A<x B,s A>s B
C.x A>x B,s A<s B
D.x A<x B,s A<s B
二、填空题
7.(2011天津高考,理9)一支田径队有男运动员48人,女运动员36人.若用分层抽样的方法从该队的全体运动员中抽取一个容量为21的样本,则抽取男运动员的人数为__________.
8.(2011浙江高考,文13)某中学为了解学生数学课程的学习情况,在3 000名学生中随机抽取200名,并统计这200名学生的某次数学考试成绩,得到了样本的频率分布直方图(如图).根据频率分布直方图推测,这3 000名学生在该次数学考试中成绩小于60分的学生数是________.
9.某单位200名职工的年龄分布情况如图,现要从中抽取40名职工作样本.用系统抽样法,将全体职工随机按1~200编号,并按编号顺序平均分为40组(1~5号,6~10号,…,196~200号).若第5组抽出的号码为22,则第8组抽出的号码应是__________.若用分层抽样方法,则40岁以下年龄段应抽取__________人.
三、解答题
10.为了对某课题进行研究,用分层抽样方法从三所高校A,B,C的相关人员中,抽取
(1)求x,y;
(2)若从高校B,C抽取的人中选2人作专题发言,求这2人都来自高校C的概率.
11.(2011广东高考,文17)在某次测验中,有6位同学的平均成绩为75分,用x n表示编号为n(n=1,2
(1)求第66
(2)从前5位同学中,随机地选2位同学,求恰有1位同学成绩在区间(68,75)中的概率.
12.某校从参加高三模拟考试的学生中随机抽取60名学生,将其数学成绩(均为整数)分成六段[90,100),[100,110),…,[140,150)后得到如下部分频率分布直方图.观察图形的信息,回答下列问题:
(1)求分数在[120,130)内的频率,并补全这个频率分布直方图;
(2)统计方法中,同一组数据常用该组区间的中点值作为代表,据此估计本次考试的平均分;
(3)用分层抽样的方法在分数段为[110,130)的学生中抽取一个容量为6的样本,将该样本看成一个总体,从中任取2人,求至多有1人在分数段[120,130)内的概率.
参考答案
一、选择题
1.D 解析:因为总体是由差异明显的两部分组成,所以选用的是分层抽样.
2.A 解析:按照从小到大的顺序排列为87,89,90,91,92,93,94,96.
∵有8个数据,∴中位数是中间两个的平均数:91+922
=91.5, 平均数:
87+89+90+91+92+93+94+968
=91.5. 3.A 解析:抽取的样本容量与总体中的个体数的比值为20300=115
, 所以抽取的样本中,进口的标志灯抽取的数量为30×115
=2. 4.B 解析:由频率分布直方图观察得棉花纤维长度小于20 mm 的根数为(0.01+0.01+0.04)×5×100=30.
5.B 解析:设C 产品数量为x .由B 种产品样本容量∶产品数量=1∶10知拿出了110
的产品做样本,
又∵A 产品的数量比C 多100件,由x +2 300+(x +100)=4 000得C 产品数量为800.
6.B 解析:x A =2.5+10+5+7.5+2.5+106=37.56
, x B =15+10+12.5+10+12.5+106
=706
, 显然x A <x B ,s 是标准差,反映的是数据的波动程度,可以看出A 图中数据的波动较大,而B 图则较为有规律,而且波动幅度较小,所以B 的稳定性好,稳定性好的标准差小,选B.
二、填空题
7.12 解析:设抽取男运动员人数为n ,则女运动员人数21-n .由分层抽样知:
n 48=21-n 36
,∴n =12. 8.600 解析:由频率分布直方图易得,成绩低于60分的频率为0.002×10+0.006×10+0.012×10=0.2,故3 000名学生中成绩低于60分的学生数为3 000×0.2=600.
9.37 20 解析:由分组可知,抽号的间隔为5,又因为第5组抽出的号码为22,所以第6组抽出的号码为27,第7组抽出的号码为32,第8组抽出的号码为37.
40岁以下的年龄段的职工数为200×0.5=100,则应抽取的人数为40200
×100=20(人). 三、解答题
10.解:(1)由题意可得x 18=236=y 54
,所以x =1,y =3. (2)记从高校B 抽取的2人为b 1,b 2,从高校C 抽取的3人为c 1,c 2,c 3,则从高校B ,C 抽取的5人中选2人作专题发言的基本事件有(b 1,b 2),(b 1,c 1),(b 1,c 2),(b 1,c 3),(b 2,c 1),(b 2,c 2),(b 2,c 3),(c 1,c 2),(c 1,c 3),(c 2,c 3)共10种.
设选中的2人都来自高校C 的事件为X ,则X 包含的基本事件有(c 1,c 2),(c 1,c 3),(c 2,
c 3)共3种.因此P (X )=310
. 故选中的2人都来自高校C 的概率为310
. 11.解:(1)由题意知x 1+x 2+x 3+x 4+x 5+x 6==75×6=450,
∴x 6=450-(70+76+72+70+72)=90.
∴s 2=(70-75)2+(76-75)2+…+(90-75)26
=49. ∴s =7.
(2)由题意知本题是一个古典概型,试验发生包含的事件是从5位同学中选2个,共有10种结果,满足条件的事件是恰有1位成绩在区间(68,75)中,共有4种结果,根据古典概型得
到P =410
=0.4. 12.解:(1)分数在[120,130)内的频率为1-(0.1+0.15+0.15+0.25+0.05)=1-0.7
=0.3,频率组距=0.310
=0.03,补全后的直方图如下.
(2)平均分为 x =95×0.1+105×0.15+115×0.15+125×0.3+135×0.25+145×0.05=121.
(3)由题意,[110,120)分数段的人数为60×0.15=9,[120,130)分数段的人数为60×0.3=18.
∵用分层抽样的方法在分数段为[110,130)的学生中抽取一个容量为6的样本,
∴需在[110,120)分数段内抽取2人,并分别记为m ,n ;在[120,130)分数段内抽取4人,并分别记为a ,b ,c ,d .
设“从样本中任取2人,至多有1人在分数段[120,130)内”为事件A ,则基本事件共有:(m ,n ),(m ,a ),…,(m ,d ),(n ,a ),…,(n ,d ),(a ,b ),…,(c ,d )共15种,
则事件A 包含的基本事件有:(m ,n ),(m ,a ),(m ,b ),(m ,c ),(m ,d ),(n ,a ),(n ,b ),(n ,c ),(n ,d )共9种.
∴P (A )=915=35
.。

相关文档
最新文档