2019-2020年高三数学第一轮复习讲义(76)抽样方法、总体分布的估计
高三数学人教版总体分布的估计知识点归纳总结知识点总结

高三数学人教版总体分布的估计知识点归纳总结知识点总结总体分布的估计是统计学中常用的手法,为此整理了总体分布的估计知识点,请大家查看。
样本估计总体,是研究统计问题的一个基本思想方法,即用样本平均数估计总体平均数(即总体期望值――描述一个总体的平均水平);用样本方差估计总体方差(方差和标准差是描述一个样本和总体的波动大小的特征数,方差或标准差越小,表示这个样本或总体的波动越小,即越稳定)。
一般地,样本容量越大,这种估计就越精确。
总体估计要掌握:(1)表(频率分布表);(2)图(频率分布直方图)。
提醒:直方图的纵轴(小矩形的高)一般是频率除以组距的商(而不是频率),横轴一般是数据的大小,小矩形的面积表示频率
其中,样本指是指从全部的调查对象提取出来进行调查的个体
个体指总体中的每一个考察的对象,
总体指考察的对象的全体,
样本容量指样本中个体的数目。
例如,为了调查全国人口的寿命,抽查了十一个省市的2500名城镇居民,这个问题中2500名城镇居民的寿命的全体是样本。
2500是样本容量。
某个人的寿命是个体。
全国人口寿命是总体。
总体分布的估计知识点的全部内容就是这些,更多精彩内容请持续关注。
抽样方法与总体分布的估计

频数为0.32×150=48.
•
PPT文档演模板
答案 B
抽样方法与总体分布的估计
5.(长沙模拟)如图是某学校一名篮球运动 员在五场比赛中所得分数的茎叶图,则
•该运动员在这五场比赛中得分的方差为________.
答案 6.8
PPT文档演模板
抽样方法与总体分布的估计
考向一 抽样方法
•【例1】从某厂生产的802辆轿车中抽取80辆测试某项 性 能.请合理选择抽样方法进行抽样,并写出抽样过 程. [审题视点] 因为802不能整除80,为了保证“等距” 分段,应先剔除2个个体.
PPT文档演模板
抽样方法与总体分布的估计
•(3)平均数
样本数据的算术平均数,即 =__________________. (4)方差与标准差
方差:s2=__________________________________.
标准差:s= _____________________________________.
抽样方法与总体分布的估计
•
考点自测
1.(山东)采用系统抽样方法从960人中抽取32人做 问卷调查.为此将他们随机编号为1,2,…, 960,分组后在第一组采用简单随机抽样的方法 抽到的号码为9.抽到的32人中,编号落入区间 [1,450]的人做问卷A,编号落入区间[451,750]的 人做问卷B,其余的人做问卷C.则抽到的人中, 做问卷B的人数为 ( ). •A.7 B.9 C.10 D.15
PPT文档演模板
抽样方法与总体分布的估计
•第三步:从第1段即1,2,…,10这10个编号中,用简单随 机抽样的方法抽取一个编号(如5)作为起始编号; •第四步:从5开始,再将编号为15,25,…,795的个体抽 出,得到一个容量为80的样本.
高考数学一轮总复习课件:随机抽样、用样本估计总体

6.(2020·天津)从一批零件中抽取 80 个,测量其直径(单位: mm),将所得数据分为 9 组:[5.31,5.33),[5.33,5.35),…,[5.45, 5.47),[5.47,5.49],并整理得到如下频率分布直方图,则在被抽 取的零件中,直径落在区间[5.43,5.47)内的个数为( B )
n 的样本进行调查,其中从丙车间的产品中抽取了 3 件,则 n=
(D ) A.9
B.10
C.12
D.13
【解析】 由分层抽样可得630=2n60,解得 n=13.
【讲评】 进行分层抽样的相关计算时,常利用以下关系式 巧解:
①总样体本的容个量数nN=该层该抽层取的的个个体体数数; ②总体中某两层的个体数之比等于样本中这两层抽取的个 体数之比.
5.对某商店一个月内每天的顾客人数进行了统计,得到样本 的茎叶图(如图所示),则该样本的中位数、众数、极差分别是( A )
A.46,45,56 B.46,45,53 C.47,45,56 D.45,47,53
解析 从茎叶图中可以看出样本数据的中位数为中间两个数的 平均数,即45+2 47=46,众数是 45,极差为 68-12=56,故选择 A.
状元笔记
(1)一个抽样试验能否用抽签法,关键看两点:一是制签是否 方便;二是号签是否易搅匀.一般地,当总体容量和样本容量都 较小时可用抽签法.
(2)在使用随机数表时,如遇到取两位数或三位数,可从选择 的随机数表中的某行某列的数字计起,每两个或每三个作为一个 单位,自左向右选取,有超过总体号码或出现重复号码的数字舍 去.
个最高分、1 个最低分,得到 7 个有效评分.7 个有效评分与 9 个
原始评分相比,不变的数字特征是( A )
抽样方法、总体分布的估计

简单随机抽样、系统抽 题型一 样 ①抽签法、随机数表法 思维提 ; 示 ②系统抽样的步骤.
题型二 思维提示
分层抽样 由差异明显的几部 分组成的总体适于 用分层抽样
题型三 思维提示
频率分布条形图的有关 问题 条形图与频率分布直方 图的区别
例3
为了估计某人的射击技术状况,在他的 训练记录中抽取了50次进行检验,他命中的 环数如下:
(3)注意频率分布条形图和频率分布直方图
是两个不同的概念.虽然它们的横轴表示 的内容是相同的,但是频率分布条形图的 纵轴(矩形的高)表示频率;频率分布直方图 的纵轴(矩形的高)表示频率与组距的比值, 其相应组距上的频率等于该组距上的矩形 的面积. (4)无论样本容量多大,用样本频率分布估 计总体分布时,所作的只是一种估计,可 能出现误差甚至错误,也允许存在误 差.当然希望这种误差越小越好,因此常 在条件许可下,适当增加样本容量,合理
(1)请作出频率分布表,并画出频率分布直
方图; (2)估计纤度落在[1.38,1.50)中的概率及纤 度小于1.40的概率是多少? (3)统计方法中,同一组数据常用该组区间 的中点值(例如:区间[1.30,1.34)的中点值 是1.32)作为代表.据此,估计纤度的期 望. [分析] 按题目要求作出频率分布表、绘出 频率分布.抽样方法 全体 (1)总体:所要考查的对象的 个体 叫做总体,其中每一个要考察的对象称
为 .总体与个体之间的关系类似 从总体中抽取一部分个体 集合与元素之间的关系. 样本的容量 (2)样本: 叫做总 体的一个样本,样本中个体的数目称 为 .样本和总体之间的 关系类似于子集与集合之间的关系.
分组 频数 [解] (1)频率分布表如下: [1.30,1.34) 4 [1.34,1.38) 25 [1.38,1.42) 30 [1.42,1.46) 29 [1.46,1.50) 10 [1.50,1.54) 2 100 合计
高考数学一轮复习学案抽样方法、总体分布的估计

12.3 抽样方法、总体分布的估计一、知识梳理(一)抽样1.简单随机抽样:设一个总体的个体数为N .如果通过逐个抽取的方法从中抽取一个样本,且每次抽取时各个个体被抽到的概率相等,就称这样的抽样为简单随机抽样⑴用简单随机抽样从含有N 个个体的总体中抽取一个容量为n 的样本时,每次抽取一个个体时任一个体被抽到的概率为N1;在整个抽样过程中各个个体被抽到的概率为Nn; ⑵简单随机抽样的特点是,逐个抽取,且各个个体被抽到的概率相等; ⑶简单随机抽样方法,体现了抽样的客观性与公平性,是其他更复杂抽样方法的基础.(4).简单随机抽样的特点:它是不放回抽样;它是逐个地进行抽取;它是一种等概率抽样 简单抽样常用方法:(1)抽签法:先将总体中的所有个体(共有N 个)编号(号码可从1到N ),并把号码写在形状、大小相同的号签上(号签可用小球、卡片、纸条等制作),然后将这些号签放在同一个箱子里,进行均匀搅拌,抽签时每次从中抽一个号签,连续抽取n 次,就得到一个容量为n 的样本适用范围:总体的个体数不多时优点:抽签法简便易行,当总体的个体数不太多时适宜采用抽签法.(2)随机数表法: 随机数表抽样“三步曲”:第一步,将总体中的个体编号;第二步,选定开始的数字;第三步,获取样本号码2.系统抽样:当总体中的个体数较多时,可将总体分成均衡的几个部分,然后按预先定出的规则,从每一部分抽取一个个体,得到需要的样本,这种抽样叫做系统抽样.系统抽样的步骤:①采用随机的方式将总体中的个体编号为简便起见,有时可直接采用个体所带有的号码,如考生的准考证号、街道上各户的门牌号,等等②为将整个的编号分段(即分成几个部分),要确定分段的间隔k 当Nn(N为总体中的个体的个数,n 为样本容量)是整数时,k=N n ;当Nn不是整数时,通过从总体中剔除一些个体使剩下的总体中个体的个数N '能被n 整除,这时k=N n'.③在第一段用简单随机抽样确定起始的个体编号l ④按照事先确定的规则抽取样本(通常是将l 加上间隔k ,得到第2个编号l +k,第3个编号l +2k ,这样继续下去,直到获取整个样本)①系统抽样适用于总体中的个体数较多的情况,它与简单随机抽样的联系在于:将总体均分后的每一部分进行抽样时,采用的是简单随机抽样;②与简单随机抽样一样,系统抽样是等概率抽样,它是客观的、公平的. ③总体中的个体数恰好能被样本容量整除时,可用它们的比值作为系统抽样的间隔;当总体中的个体数不能被样本容量整除时,可用简单随机抽样先从总体中剔除少量个体,使剩下的个体数能被样本容量整除在进行系统抽样3.分层抽样:当已知总体由差异明显的几部分组成时,为了使样本更充分地反映总体的情况,常将总体分成几部分,然后按照各部分所占的比例进行抽样,这种抽样叫做分层抽样,所分成的部分叫做层体,称这样的抽样为不放回抽样;如果每次抽出个体后再将它放回总体,称这样的抽样为放回抽样.随机抽样、系统抽样、分层抽样都是不放回抽样(二)总体分布1.总体:在数理统计中,通常把被研究的对象的全体叫做总体.2.频率分布:用样本估计总体,是研究统计问题的基本思想方法,样本中所有数据(或数据组)的频数和样本容量的比,就是该数据的频率.所有数据(或数据组)的频率的分布变化规律叫做样本的频率分布.可以用样本频率表、样本频率分布条形图或频率分布直方图来表示.3.总体分布:从总体中抽取一个个体,就是一次随机试验,从总体中抽取一个容量为n的样本,就是进行了n次试验,试验连同所出现的结果叫随机事件,所有这些事件的概率分布规律称为总体分布.4.总体密度曲线:样本容量越大,所分组数越多,各组的频率就越接近于总体在相应各组取值的概率.设想样本容量无限增大,分组的组距无限缩小,那么频率分布直方图就会无限接近于一条光滑曲线,这条曲线叫做总体密度曲线.它反映了总体在各个范围内取值的概率.根据这条曲线,可求出总体在区间(a,b)内取值的概率等于总体密度曲线,直线x=a,x=b及x轴所围图形的面积.0.5 时间(小时) 0 1.0 1.5 2.0二、基础训练1.一个总体中共有10个个体,用简单随机抽样的方法从中抽取一容量为3的样本,则某特定个体入样的概率是CA.310C 3B.89103⨯⨯C.103 D.101 2.(2004年江苏,6)某校为了了解学生的课外阅读情况,随机调查了50名学生,得到他们在某一天各自课外阅读所用时间的数据,结果用下面的条形图表示.根据条形图可得这50名学生这一天平均每人的课外阅读时间为BA.0.6 hB.0.9 hC.1.0 hD.1.5 h3.一个年级有12个班,每个班有50名同学,随机编号为1~50号,为了了解他们在课外的兴趣爱好,要求每班的33号学生留下来参加阅卷调查,这里运用的抽样方法是DA.分层抽样法B.抽签法C.随机数表法D.系统抽样法4.为调查参加运动会的1000名运动员的年龄情况,从中抽查了100名运动员的年龄,就这个问题来说,下列说法正确的是A.1000名运动员是总体B.每个运动员是个体C.抽取的100名运动员是样本D.样本容量是100 解析:这个问题我们研究的是运动员的年龄情况.因此应选D. 答案:D5.一个容量为n 的样本,分成若干组,已知某数的频数和频率分别为40、0.125,则n 的值为A.640B.320C.240D.160解析:∵n40=0.125,∴n =320.故选B.答案:B6.某单位有老年人27人,中年人54人,青年人81人,为了调查他们的健康状况,需从他们中抽取一个容量为36的样本,在简单随机抽样、系统抽样、分层抽样这三种方法中较合适的抽样方法是___________.解析:要研究的总体里各部分情况差异较大,因此用分层抽样. 答案:分层抽样那么分数在[100,110)中的频率和分数不满110分的累积频率分别是______________、_______(精确到0.01).解析:由频率计算方法知:总人数=45.分数在[100,110)中的频率为458=0.178≈0.18.分数不满110分的累积频率为458652+++=4521≈0.47.答案:0.18 0.47三、例题剖析【例1】 (2004年湖南,5)某公司在甲、乙、丙、丁四个地区分别有150个、120个、180个、150个销售点.公司为了调查产品销售的情况,需从这600个销售点中抽取一个容量为100的样本,记这项调查为①;在丙地区中有20个特大型销售点,要从中抽取7个调查其销售收入和售后服务情况,记这项调查为②.则完成①、②这两项调查宜采用的抽样方法依次是A.分层抽样法,系统抽样法B.分层抽样法,简单随机抽样法C.系统抽样法,分层抽样法D.简单随机抽样法,分层抽样法剖析:此题为抽样方法的选取问题.当总体中个体较多时宜采用系统抽样;当总体中的个体差异较大时,宜采用分层抽样;当总体中个体较少时,宜采用随机抽样.依据题意,第①项调查应采用分层抽样法、第②项调查应采用简单随机抽样法.故选B. 答案:B评述:采用什么样的抽样方法要依据研究的总体中的个体情况来定.【例2】 (2004年福建,15)一个总体中有100个个体,随机编号为0,1,2,…,99,依编号顺序平均分成10个小组,组号依次为1,2,3,…,10.现用系统抽样方法抽取一个容量为10的样本,规定如果在第1组随机抽取的号码为m ,那么在第k 小组中抽取的号码个位数字与m +k 的个位数字相同.若m =6,则在第7组中抽取的号码是___________.剖析:此问题总体中个体的个数较多,因此采用系统抽样.按题目中要求的规则抽取即可.∵m =6,k =7,m +k =13,∴在第7小组中抽取的号码是63. 答案:63评述:当总体中个体个数较多而差异又不大时可采用系统抽样.采用系统抽样在每小组内抽取时应按规则进行.【例3】 把容量为100的某个样本数据分为10组,并填写频率分布表,若前七组的累积频率为0.79,而剩下三组的频数成公比大于2的整数等比数列,则剩下三组中频数最高的一组的频数为___________.剖析:已知前七组的累积频率为0.79,而要研究后三组的问题,因此应先求出后三组的频率之和为1-0.79=0.21,进而求出后三组的共有频数,或者先求前七组共有频数后,再计算后三组的共有频数.由已知知前七组的累积频数为0.79×100=79,故后三组共有的频数为21,依题意qq a --⋅1)1(31=21,a 1(1+q +q 2)=21.∴a 1=1,q =4.∴后三组频数最高的一组的频数为16.答案:16评述:此题剖析只按第二种思路给出了解答,你能按第一种思路来解吗?(1)列出频率分布表;(2)画出频率分布直方图和累积频率分布图;(3)估计电子元件寿命在100~400 h 以内的概率; (4)估计电子元件寿命在400 h 以上的概率.剖析:通过本题可掌握总体分布估计的各种方法和步骤.(2)频率分布直方图如下:(h ) 1.0.0.0.0.(3)由累积频率分布图可以看出,寿命在100~400 h 内的电子元件出现的频率为0.65,所以我们估计电子元件寿命在100~400 h 内的概率为0.65.(4)由频率分布表可知,寿命在400 h 以上的电子元件出现的频率为0.20+0.15=0.35,故我们估计电子元件寿命在400 h 以上的概率为0.35.评述:画频率分布条形图、直方图时要注意纵、横坐标轴的意义.【例5】 某批零件共160个,其中,一级品48个,二级品64个,三级品32个,等外品16个.从中抽取一个容量为20的样本.请说明分别用简单随机抽样、系统抽样和分层抽样法抽取时总体中的每个个体被取到的概率均相同.【例6】一个容量为100的样本,数据的分组和各组的一些相关信息如下:(1)完成上表;(2)画出频率分布直方图和累积频率分布图;(3)根据累积频率分布图,总体中小于22的样本数据大约占多大的百分比?〒〒〒〒〒〒〒〒〒〒〒〒〒〒〒〒〒〒〒〒〒〒〒〒〒〒〒〒〒〒〒〒〒〒〒 四、同步练习 g3.1099 抽样方法、总体分布的估计1.某公司甲、乙、丙、丁四个地区分别有150 个、120个、180个、150个销售点.公司为了调查产品销售的情况,需从这600个销售点中抽取一个容量为100的样本,记这项调查为①;在丙地区中有20个特大型销售点,要从中抽取7个调查其收入和售后服务等情况,记这项调查为②.则完成①、②这两项调查宜采用的抽样方法依次是 ( B )()A 分层抽样法,系统抽样法()B 分层抽样法,简单随机抽样法 ()C 系统抽样法,分层抽样法 ()D 简单随机抽样法,分层抽样法2.已知样本方差由102211(5)10i i s x ==-∑,求得,则1210x x x +++= 50 . 3.设有n 个样本12,,,n x x x ,其标准差为x s ,另有n 个样本12,,,n y y y ,且35k k y x =+(1,2,,)k n = ,其标准差为y s ,则下列关系正确的是 ( B )()A 35y x s s =+ ()B 3y x s s =()C y x s = ()D 5y x s =+时间(小时)4.某校为了了解学生的课外阅读情况,随机调查了50名学生,得到他们在某一天各自课外阅读所用时间的数据,结果用右侧的条形图表示. 根据条形图可得这50名学生这一天平均每人的课外阅读时间为 ( B ) ()A 0.6小时 ()B 0.9小时()C 1.0小时 ()D 1.5小时5.x 是12100,,x x x 的平均数,a 是1240,,x x x 的平均数,b 是4142100,,x x x 的平均数,则x ,a ,b 之间的关系为4060100a bx +=.6.某校有老师200人,男学生1200人,女学生1000人.现用分层抽样的方法从所有师生中抽取一个容量为n 的样本;已知从女学生中抽取的人数为80人,则n =112.7.一个总体中有100个个体,随机编号0,1,2,…,99,依编号顺序平均分成10个小 组,组号依次为1,2,3,…,10.现用系统抽样方法抽取一个容量为10的样本,规定如果在第1组随机抽取的号码为m ,那么在第k 组中抽取的号码个位数字与m k +的个位数字相同,若6m =,则在第7组中抽取的号码是 63 .8.在样本的频率分布直方图中,共有11个小长方形,若中间一个小长方形的面积等于其他10个小长方形的面积之和的14,且样本容量为160,则中间一组的频数为 32 . 9.某中学有员工160人,其中中高级教师48人,一般教师64人,管理人员16人,行政人员32人,从中抽取容量为20的一个样本.以此例说明,无论使用三种常用的抽样方法中的哪一种方法,总体中的每个个体抽到的概率都相同.10. 现有30个零件,需从中抽取10个进行检查,问如何采用简单随机抽样得到一个容量为10的样本?11.质检部门对甲、乙两种日光灯的使用时间进行了破坏性试验,10次试验得到的两 种日光灯的使用时间如下表所示,问:哪一种质量相对好一些?(2)画出频率分布直方图;(3)根据累积频率分布,估计小于134的数据约占多少百分比.13.为检测某种产品的质量,抽取了一个容量为30的样本,检测结果为一级品5件,二级品8件,三级品13件,次品4件。
高三数学第一轮复习--抽样方法与总体分布的估计

1.为调查参加运动会的1000名运动员的年龄情况,从中抽查了100
名运动员的年龄,就这个问题来说,下列说法正确的是( D )
2.一个总体中共有10个个体,用简单随机抽样的方法从中抽取一个
容量为3的样本,则某特定个体入样的概率是(C )
A. 3
B. 3
C. 3
D. 1
C
3 10
10 9 8
10
10
系统抽样、分层抽样这三种方法中较合适的抽样方法是___________
0.18 0.47 分别是______________、_______(精确到0.01). 总体分布:从总体中抽取一个个体,就是一次随机试验,从总体中抽取一个容量为n的样本,就是进行了n次试验,试验连同所出现的
结果叫随机事件,所有这些事件的概率分布规律称为总体分布.
1.了解简单随机抽样、分层抽样及系统抽样的意义,会 用它们对简单实际问题进行抽样. 2.会用样本频率分布估计总体分布. 3.会用样本估计总体平均值和方差.
在本章的复习中,要理解几种抽样方法的区别与联 系.应充分注意一些重要概念的实际意义,理解概率统 计中处理问题的基本思想方法,掌握所学的概率统计 知识的实际应用.
2
5
6
简单随机抽样:一般地,设一个总体的个体数为N,如果通过逐个抽取的方法从中抽取一个样本,且每次抽取时各个个体被抽到的概率
分数段 [100,110) 相等,就称这样的抽样为简单随机抽样.
[110,120 )
[110,120
)[120,130)
频率分布:用样本估计总体,是研究统计问题的基本思想方法,样本中所有数据(或数据组)的频数和样本容量的比,就是该数据的
(2)样本数据落在范围
5.某班学生在一次数学考试中成绩分布如下表: 某单位有职工100人,不到35岁的有45人,35岁到49岁的有25人,剩下的为50岁以上的人,用分层抽样法从中抽取20人,各年龄段分别
抽样方法跟总体分布的估计

抽样方法跟总体分布的估计抽样方法是指从总体中选取一部分样本来进行研究或调查的方法,其目的是通过对样本数据的分析,推断或估计总体的特征和参数。
抽样方法的选择对研究的结果至关重要,因为不恰当的抽样方法可能导致样本偏倚,从而使总体的估计结果失真。
常见的抽样方法包括简单随机抽样、分层抽样、整群抽样、系统抽样和多阶段抽样等。
下面对这些方法进行详细说明。
简单随机抽样是从总体中随机选取样本的方法,每个样本都有相同的被选中的概率。
这种方法可以减少样本选择的主观因素,并能够反映总体特征。
但在实际操作过程中,随机选样的困难度较高,需要随机数发生器进行操作。
分层抽样是将总体划分为若干个相互独立的层,并从每个层中随机选取一定数量的样本。
这种抽样方法适用于总体分层特征明显的情况,可以确保每个层都能被充分代表。
整群抽样则是将总体划分为若干个相互不重叠但完全相似的整群,随机选取其中若干群作为样本进行研究。
这种方法适用于总体内群体特征相近的情况,可以减少样本选择的成本。
系统抽样是根据其中一种规律从总体中选取样本,如每隔一定间隔选取一个样本。
这种方法的优势在于实施简单,适用于总体有明显的排列顺序的情况。
多阶段抽样是将总体按照多个层次划分,并在每个层次中随机选择样本。
这种方法适用于总体复杂,样本选择难度大的情况,可以减少样本选择的成本。
抽样方法的选择应根据研究目的、总体属性和可行性来确定。
在进行抽样之前,需要对总体进行充分了解,确定抽样框架,制定合理的抽样方案。
总体分布的估计是通过对样本数据的分析,利用统计模型和方法来推断总体的特征和参数。
常用的估计方法有点估计和区间估计。
点估计是利用样本数据得出总体参数点估计值的方法,常见的点估计方法有最大似然估计、矩估计和贝叶斯估计等。
点估计可以得到总体参数的一个具体估计值,但缺点是无法给出估计值的准确性。
区间估计是利用样本数据得出总体参数区间估计值的方法,常见的区间估计方法有置信区间和可信区间等。
版高考数学一轮总复习概率统计中的抽样与估计计算

版高考数学一轮总复习概率统计中的抽样与估计计算高考数学一轮总复习概率统计中的抽样与估计计算概率统计是高考数学中的重要部分,其中抽样与估计计算是一个核心概念。
在这篇文章中,我们将详细探讨抽样与估计计算的方法和应用。
一、抽样方法在统计学中,抽样是指从总体中选取一部分个体进行测量或调查的方法。
常用的抽样方法包括随机抽样、分层抽样和系统抽样。
1. 随机抽样随机抽样是指从总体中按照一定的概率分布随机选取样本的方法。
它的特点是每个个体都有相同的概率被选入样本,从而保证样本的代表性和可靠性。
2. 分层抽样分层抽样是将总体按照某种特征分成若干层,然后从每一层中随机选取样本。
这种方法可以保证每一层都有代表性的样本,从而提高估计的准确性。
3. 系统抽样系统抽样是指按照一定的规则,从总体中选取样本。
例如,从总体中每隔一定的间隔选取一个个体作为样本,这样就能保证样本的随机性和均匀性。
二、估计计算方法抽样得到的样本是我们对总体的一个估计。
估计计算是根据样本数据,推断总体参数的方法。
常用的估计计算方法有点估计和区间估计。
1. 点估计点估计是根据样本数据,用一个确定的数值来估计总体参数。
常见的点估计方法有样本均值、样本方差和样本比例。
例如,根据样本均值估计总体均值。
2. 区间估计区间估计是指根据样本数据,给出一个范围,来估计总体参数落在该范围内的概率。
常见的区间估计方法有正态分布的置信区间和二项分布的置信区间。
例如,根据正态分布的置信区间估计总体均值。
三、应用举例下面通过一个具体的例子来说明抽样与估计计算的应用。
假设我们想要估计某个城市的失业率。
我们可以采用随机抽样的方法,在整个城市的居民中随机选取一部分进行调查。
得到的样本数据可以用来计算样本的失业率。
假设我们得到的样本数据中有1000个人,其中有200人失业。
那么,我们可以用样本的失业率来估计总体的失业率。
样本的失业率为200/1000=0.2,即20%。
通过区间估计,我们可以得到总体失业率落在一定范围内的概率。
高考数学第一轮复习 10.1 抽样方法与总体估计课件 文

二、用样本的频率分布估计总体分布 1.频率分布表与频率分布直方图:频率分布表和频率 分布直方图,是从各个小组数据在样本容量中所占比例大小 的角度,来表示数据分布规律,它可以使我们看到整个样本 数据的频率分布情况.
绘制频率分布直方图时,应避免将样本中的数据作为分 点,通常使分点的数值比样本中的数据多一位小数,这样可 使数据都能够分布在分组之中.此外,注意频率分布直方图 的纵轴是频率/组距.
三、用样本的数字特征估计总体的数字特征 1.众数:一组数据中出现次数最多的数. 2.中位数:将数据从小到大排列,若有奇数个数,则 最中间的数是中位数;若有偶数个数,则中间两数的平均数 是中位数.
A.46,45,56 B.46,45,53 C.47,45,56 D.45,47,53
由茎叶图知中位数是最中间的两个数 45,47 的平均 数 46,出现最多的 45 是众数,极差是 56.故选 A.
A
3.对某种电子元件的使用寿命进行跟踪调查,所得样 本频率分布直方图如图所示,由图可知这一批电子元件中寿 命在 100~300 h 的电子元件的数量与寿命在 300~600 h 的 电子元件的数量的比是( ).
一、随机抽样 1.总体、个体、样本、样本容量的概念:统计中所考 察对象的全体构成的集合看作总体,构成总体的每个元素作 为个体,从总体中抽取的__一部分个体__所组成的集合叫作 样本,样本中个体的__数目__叫作样本容量.
2.简单随机抽样:一般地,设一个总体含有 N 个个体, 从中逐个不放回地抽取 n 个个体作为样本(n≤N),如果每次
高中数学:抽样方法与总体分布的估计

抽样方法与总体分布的估计 一、高考考点梳理1.随机抽样例1.对一个容量为N 的总体抽取容量为n 的样本,当选取简单随机抽样、系统抽样和分层抽样三种不同方法抽取样本时,总体中每个个体被抽中的概率分别为p 1,p 2,p 3,则( )A.p 1=p 2<p 3B.p 2=p 3<p 1C.p 1=p 3<p 2D.p 1=p 2=p 32.用样本估计总体通常我们对总体作出的估计一般分成两种:一种是用样本的频率分布估计总体的频率分布;另一种是用样本的数字特征估计总体的数字特征(1)用样本的频率分布估计总体的频率分布①频率分布直方图的理解a.纵轴表示组距频率,即小长方形的高=组距频率; b.小长方形的面积=组距×组距频率=频率; c.数据落在各小组内的频率用各小长方形的面积表示,各小长方形的面积总和等于1.②频率分布折线图a.频率分布折线图:连接频率分布直方图中各小长方形上端的中点,就得到频率分布折线图;b.总体密度曲线:随着样本容量的增加,作图时所分组数不断增多,组距减小,相应的频率分布折线图会越来越接近一条光滑曲线,即总体密度曲线。
③茎叶图的特点茎是指中间的一列数,通常为十位;叶是从茎的旁边生长出来的数,通常为个位。
(2)用样本的数字特征估计总体的数字特征①平均数、中位数、众数 数字特征 样本数据 平均数样本数据的算数平均数 中位数将数据按大小顺序依次排列, 处在最中间位置的一个数据(或最中间两个数据的平均数) 众数出现次数最多的数据②样本方差与标准差设样本的元素为n x x x ,,,21 ,样本的平均数为x ,则a.样本方差:()()()[]2222121s x x x x x x nn -++-+-= b.样本标准差: ()()()[]222211s x x x x x x n n -++-+-=③关于平均数、方差的有关性质a.若n x x x ,,,21 的平均数为x ,则a ,,,21+++n mx a mx a mx 的平均数为a x m +;b.若n x x x ,,,21 的方差为s 2,则a ,,,21+++n mx a mx a mx 的方差为22m s 。
高三数学第一轮复习讲义抽样方法总体分布的估计

城东蜊市阳光实验学校第76课时课题:抽样方法、总体分布的估计高三数学第一轮复习讲义〔76〕一.复习目的:抽样方法、总体分布的估计1.会用简单随机抽样法、系统抽样法、分层抽样法等常用方法从总体中抽取样本; 2.理解统计的根本思想,会用样本频率估计总体分布. 二.知识要点:1.〔1〕统计的根本思想是. 〔2〕平均数的概念. 〔3〕方差公式为. 2.常用的抽样方法是. 三.课前预习:1.某公司甲、乙、丙、丁四个地区分别有150个、120个、180个、150个销售点.公司为了调查产品销售的情况,需从这600个销售点中抽取一个容量为100的样本,记这项调查为①;在丙地区中有20个特大型销售点,要从中抽取7个调查其收入和售后效劳等情况,记这项调查为②.那么完成①、②这两项调查宜采用的抽样方法依次是〔B 〕 ()A 分层抽样法,系统抽样法 ()B 分层抽样法,简单随机抽样法 ()C 系统抽样法,分层抽样法()D 简单随机抽样法,分层抽样法2.样本方差由102211(5)10i i s x ==-∑,求得,那么1210x x x +++=50.3.设有n 个样本12,,,n x x x ,其标准差为x s ,另有n 个样本12,,,n y y y ,且35k k y x =+(1,2,,)k n =,其标准差为y s ,那么以下关系正确的选项是〔B 〕()A 35y x s s =+()B 3y x s s =()C y x s =()D 5y x s =+4.某校为了理解学生的课外阅读情况,随机调查了50名学生,得到他们在某一天各自课外阅读所用时间是是的数据,结果用右侧的条形图表示.根据条形图可得这50名学生这一天平均每人的课外阅读时间是是为〔B 〕()A 0.6小时()B 0.9小时 ()C 1.0小时()D 小时5.x 是12100,,x x x 的平均数,a 是1240,,x x x 的平均数,b 是4142100,,x x x 的平均数,那么x ,a ,b 之间的关系为4060100a bx +=.6.某校有教师200人,男学生1200人,女学生1000人.现用分层抽样的方法从所有师生中抽取一个容量为n 的样本;从女学生中抽取的人数为80人,那么n=112.7.一个总体中有100个个体,随机编号0,1,2,…,99,依编号顺序平均分成10个小组,组号依次为1,2,3,…,10.现用系统抽样方法抽取一个容量为10的样本,规定假设在第1组随机抽取的号码为m ,那么在第k 组中抽取的号码个位数字与m k +的个位数字一样,假设6m =,那么在第7组中抽取的号码是63.8.在样本的频率分布直方图中,一一共有11个小长方形,假设中间一个小长方形的面积等于其他10个小长方形的面积之和的14,且样本容量为160,那么中间一组的频数为32. 四.例题分析:例1.某中学有员工160人,其中中高级教师48人,一般教师64人,管理人员16人,行政人员32人,从中抽取容量为20的一个样本.以此例说明,无论使用三种常用的抽样方法中的哪一种方法,总体中的每个个体抽到的概率都一样.解:〔1〕〔简单随机抽样〕可采用抽签法,将160人从1到160编号,然后从中抽取20个签,与签号一0.5 时间是是(小0 1.02.0样的20个人被选出.显然每个个体抽到的概率为2011608=. 〔2〕〔系统抽样法〕将160人从1到160编号,,按编号顺序分成20组,每组8人,先在第一组中用抽签法抽出k 号〔18k ≤≤〕,其余组的8k n +(1,2,3,19)n =也被抽到,显然每个个体抽到的概率为18. 〔3〕〔分层抽样法〕四类人员的人数比为3:4:1:2,又34206,2081010⨯=⨯= 12202,2041010⨯=⨯=,所以从中高级教师、一般教师、管理人员、行政人员中分别抽取6人、8人、2人、4人,每个个体抽到的概率为18.例2.质检部门对甲、乙两种日光灯的使用时间是是进展了破坏性试验,10次试验得到的两种日光灯的使用时间是是如下表所示,问:哪一种质量相对好一些?甲x =乙x ∵甲x 例3.下表给出了某120名12岁男生的身高统计分组与频数〔单位:cm 〕.〔1〕列出样本的频率分布表〔含累积频率〕; 〔2〕画出频率分布直方图;〔3〕根据累积频率分布,估计小于134的数据约占多少百分比.甲 乙解:〔1〕样本的频率分布表与累积频率表如下:122126130134138142146150154158身高〔cm〕五.课后作业:班级学号姓名1.一个单位有职工160人,其中业务人员96人,管理人员40人,后勤人员24人,为理解职工身体情况,要从中抽取一个容量为20的样本,如用分层抽样,那么管理人员应抽到多少个〔〕2.欲对某商场作一简要审计,通过检查发票及销售记录的2%来快速估计每月的销售总额.现采用如下方法:从某本50张的发票存根中随机抽一张,如15号,然后按序往后将65号,115号,165号,…发票上的销售额组成一个调查样本.这种抽取样本的方法是〔〕()A 简单随机抽样()B 系统抽样()C 分层抽样()D 其它方式的抽样3.在抽查某产品的尺寸过程中,将其尺寸分成假设干组,[,]a b 是其中一组,抽查出的个体数在该组上的频率为m ,该组上的直方图的高为h ,那么||a b -等于〔〕()A hm ()B h m ()C mh()D 与,m h 无关 4.一个总体的个数为n ,用简单随机抽样的方法,抽取一个容量为2的样本,个体a 第一次未被抽到,个体a 第一次未被抽到第二次被抽到,以及整个过程中个体a 被抽到的概率分别是.5.某工厂消费A 、B 、C 三种不同型号的产品,产品数量之比依次为2:3:5.现用分层抽样方法抽出一个容量为n 的样本,样本中A 种型号产品有16件,那么此样本的容量n =.6.有一组数据:)(,,,,321321n n x x x x x x x x ≤≤≤≤ ,它们的算术平均值为10,假设去掉其中最大的n x ,余下数据的算术平均值为9;假设去掉其中最小的1x ,余下数据的算术平均值为11,那么1x 关于n 的表达式为;n x 关于n 的表达式为.7.为了比较甲、乙两位划艇运发动的成绩,在一样的条件下对他们进展了6次测验,测得他们的平均速度〔/m s 〕分别如下:甲:3.0 乙:试根据以上数据,判断他们谁更优秀.8.有一个容量为100的样本,数据的分组及各组的频数如下:〔1〕列出样本的频率分布表;〔2〕画出频率分布直方图;〔3〕估计数据小于30的概率.9.100名学生分四个兴趣小组参加物理、化学、数学、计算机竞赛辅导,人数别是30、27、23、20.〔1〕列出学生参加兴趣小组的频率分布表;〔2〕画出表示频率分布的条形图.。
高三理科数学一轮复习8:统计与概率—抽样方法与总体分布的估计讲义

高三理科数学一轮复习8:统计与概率—抽样方法与总体分布的估计1.现要完成下列3项抽样调查:①从10盒酸奶中抽取3盒进行食品卫生检查;②科技报告厅有32排,每排有40个座位,有一次报告会恰好坐满了听众,报告会结束后,为了听取意见,需要请32名听众进行座谈.③东方中学共有160名教职工,其中一般教师120名,行政人员16名,后勤人员24名.为了了解教职工对学校在校务公开方面的意见,拟抽取一个容量为20的样本.较为合理的抽样方法是()A.①简单随机抽样,②系统抽样,③分层抽样B.①简单随机抽样,②分层抽样,③系统抽样C.①系统抽样,②简单随机抽样,③分层抽样D.①分层抽样,②系统抽样,③简单随机抽样2.要从已经编号(1~60)的60枚最新研制的某型号导弹中随机抽取6枚来进行发射试验,用每部分选取的号码间隔一样的系统抽样方法确定所选取的6枚导弹的编号可能是()A.5,10,15,20,25,30 B.3,13,23,33,43,53C.1,2,3,4,5,6 D.2,4,8,16,32,483.某校共有学生2 000名,各年级男、女生人数如下表.已知在全校学生中随机抽取1名,抽到二年级女生的概率是0.19)A.24 B.184.某中学开学后从高一年级的学生中随机抽取90名学生进行家庭情况调查,经过一段时间后再次从这个年级随机抽取100名学生进行学情调查,发现有20名同学上次被抽到过,估计这个学校高一年级的学生人数为()A.180 B.400 C.450 D.2 0005.甲、乙两人在一次射击比赛中各射靶5次,两人成绩的条形统计图如图所示,则()A.甲的成绩的平均数小于乙的成绩的平均数B.甲的成绩的中位数等于乙的成绩的中位数C.甲的成绩的方差小于乙的成绩的方差D.甲的成绩的极差小于乙的成绩的极差6.一组数据的平均数是2.8,方差是3.6,若将这组数据中的每一个数据都加上60,得到一组新数据,则所得新数据的平均数和方差分别是()A.57.2,3.6 B.57.2,56.4 C.62.8,63.6 D.62.8,3.67.如图,样本A和B分别取自两个不同的总体,它们的样本平均数分别为x A和x B,样本标准差分别为s A和s B,则()A.x A>x B,s A>s B B.x A<x B,s A>s BC.x A>x B,s A<s B D.x A<x B,s A<s B8.从甲、乙两班分别任意抽出10名学生进行英语口语测验,其测验成绩的方差分别为S12= 13.2,S22=26.26,则()A.甲班10名学生的成绩比乙班10名学生的成绩整齐B.乙班10名学生的成绩比甲班10名学生的成绩整齐C.甲、乙两班10名学生的成绩一样整齐D.不能比较甲、乙两班10名学生成绩的整齐程度9.某农贸市场出售西红柿,当价格上涨时,供给量相应增加,而需求量相应减少,具体调查结果如下表: 表1 市场供给量 表2 市场需求量根据以上提供的信息,市场供需平衡点(即供给量和需求量相等时的单价)应在区间 ( )A .(2.3,2.6)内B .(2.4,2.6)内C .(2.6,2.8)内D .(2.8,2.9)内10.为了了解某校高三学生的视力情况,随机地抽查了该校100名高三学生的视力情况,得到频率分布直方图如图,由于不慎将部分数据丢失,但知道后五组频数和为62,设视力在4.6到4.8之间的学生数为a ,最大频率为0.32,则a 的值为 ( )A .64B .54C .48D .27 11.下图是某学校举行的运动会上,七位评委为某体操项目打出的分数的茎叶统计图,去掉一个最高分和一个最低分后,所剩数据的平均数和方差分别为( )A .84,4.84B .84,1.6C .85,1.6D .85,412. 123i =,,)的图象如下所示,则( )A .123μμμ<=,123σσσ=>B .123μμμ>=,123σσσ=<C .123μμμ=<,123σσσ<=D .123μμμ<=,123σσσ=<13.一个总体有100个个体,随机编号为0,1,2,…,99,依编号顺序平均分成10组,组号依次为1,2,3,…,10,现用系统抽样方法抽取一个容量为10的样本,规定如果在第1组中随机抽取的号码为m ,那么在第k 组中抽取的号码个位数字与m +k 的个位数字相同,若m =6,则在第7组中抽取的号码是_____.14.某学院的A ,B ,C 三个专业共有1 200名学生.为了调查这些学生勤工俭学的情况,拟采用分层抽样的方法抽取一个容量为120的样本.已知该学院的A 专业有380名学生,B 专业有420名学生,则在该学院的C 专业应抽取________名学生.15.一个总体分为A ,B 两层,用分层抽样方法从总体中抽取一个容量为10的样本.已知B 层中每个个体被抽到的概率都为112,则总体中的个体数为________.16.某学校为了解学生数学课程的学习情况,在1 000名学生中随机抽取200名,并统计这200名学生的某次数学考试成绩,得到了样本的频率分布直方图(如图)根据频率分布直方图可估计这1 000名学生在该次数学考试中成绩不低于60分的学生人数是________.17.某年级120名学生在一次百米测试中,成绩全部介于13秒与18秒之间.将测试结果分成5组:[13,14),[14,15),[15,16),[16,17),[17,18],得到如图所示的频率分布直方图.如果从左到右的5个小矩形的面积之比为1∶3∶7∶6∶3,那么成绩在[16,18]的学生人数是______________________.解答题1.海关对同时从C B A ,,三个不同地区进口的某种商品进行抽样检测,从各地区进口此种商品的数量(单位:件)如右表所示,工作人员用分层抽样的方法从这些商品中共抽取6件进行检测(1)求这6件样品中来自C B A ,,各地区商品的数量;(2)若在这6件样品中随机抽取2件送往甲机构进一步检测,求这2件商品来自相同地区的概率.2.编号为A 1,A 216(i )用运动员的编号列出所有可能的抽取结果; (ii )求这2人得分之和大于50分的概率. 3.电视传媒为了解某市100万观众对足球节目的收视情况,随机抽取了100名观众进行调查.如图是根据调查结果绘制的观众每周平均收看足球节目时间的频率分布直方图,将每周平均收看足球节目时间不低于1.5小时的观众称为“足球迷”, 并将其中每周平均收看足球节目时间不低于2.5小时的观众称为“铁杆足球迷”.(1)试估算该市“足球迷”的人数,并指出其中“铁杆足球迷”约为多少人;(2)该市要举办一场足球比赛,已知该市的足球场可容纳10万名观众.根据调查,如果票价定为100元/张,则非“足球迷”均不会到现场观看,而“足球迷”均愿意前往现场观看.如果票价提高10x 元/张()x N ∈,则“足球迷”中非“铁杆足球迷”愿意前往观看的人数会减少10%x ,至少定为多少元/张时,才能使前往现场观看足球比赛的人数不超过10万人?12.某校高一某班的某次数学测试成绩(满分为100分)的茎叶图和频率分布直方图都受了不同程度的破坏,但可见部分如图,据此解答下列问题:(1)求分数在[50,60]的频率及全班人数;(2)求分数在[80,90]之间的频数,并计算频率分布直方图中[80,90]间的矩形的高.13.汽车行业是碳排放量比较大的行业之一,欧盟规定,从2012年开始,对CO2排放量超过130 g/km的MI型新车进行惩罚(视为排放量超标),某检测单位对甲、乙两类MI型品牌的新车各抽取了5辆进行CO2排放量检测,记录如下(单位:g/km):2乙(1)求甲类品牌汽车的排放量的平均值及方差;(2)若乙类品牌汽车比甲类品牌汽车CO2的排放量稳定性好,求x的取值范围.14.已知某单位有50名职工,现要从中抽取10名职工,将全体职工随机按1~50编号,并按编号顺序平均分成10组,按各组内抽取的编号依次增加5进行系统抽样.(1)若第5组抽出的号码为22,写出所有被抽出职工的号码;(2)分别统计这10名职工的体重(单位:公斤),获得体重数据的茎叶图如图所示,求该样本的方差;(3)在(2)的条件下,从这10名职工中随机抽取两名体重不轻于73公斤(≥73公斤)的职工,求体重为76公斤的职工被抽取到的概率.第十一章 统计与概率 第1讲 抽样方法与总体分布的估计1.为了解所加工一批零件的长度,抽测了其中200个零件的长度,在这个问题中,200个零件的长度是( ) A .总体B .个体是每一个零件C .总体的一个样本D .样本容量解析 200个零件的长度是总体的一个样本. 答案 C2.用随机数表法从100名学生(其中男生25人)中抽取20人进行评教,某男学生被抽到的概率是( ) A .1100 B .125 C .15 D .14解析 从容量N =100的总体中抽取一个容量为n =20的样本,每个个体被抽到的概率都是n N =15.答案 C3.样本中共有五个个体,其值分别为a ,0,1,2,3.若该样本的平均值为1,则样本方差为( ) A .65B .65C . 2D .2解析 由题可知样本的平均值为1,所以a +0+1+2+35=1,解得a =-1,所以样本的方差为15[(-1-1)2+(0-1)2+(1-1)2+(2-1)2+(3-1)2]=2. 答案 D4.甲、乙两人在一次射击比赛中各射靶5次,两人成绩的条形统计图如图所示,则( )A .甲的成绩的平均数小于乙的成绩的平均数B .甲的成绩的中位数等于乙的成绩的中位数C .甲的成绩的方差小于乙的成绩的方差D .甲的成绩的极差小于乙的成绩的极差解析 由题意可知,甲的成绩为4,5,6,7,8,乙的成绩为5,5,5,6,9.所以甲、乙的成绩的平均数均为6,A 错;甲、乙的成绩的中位数分别为6,5,B 错;甲、乙的成绩的方差分别为15×[(4-6)2+(5-6)2+(6-6)2+(7-6)2+(8-6)2]=2,15×[(5-6)2+(5-6)2+(5-6)2+(6-6)2+(9-6)2]=125,C 对;甲、乙的成绩的极差均为4,D 错.答案 C5.为了检查某超市货架上的奶粉是否含有三聚氰胺,要从编号依次为1到50的袋装奶粉中抽取5袋进行检验,用每部分选取的号码间隔一样的系统抽样方法确定所选取的5袋奶粉的编号可能是( )A .5,10,15,20,25B .2,4,8,16,32C .1,2,3,4,5D .7,17,27,37,47解析 利用系统抽样,把编号分为5段,每段10个,每段抽取一个,号码间隔为10,故选D . 答案 D6.一组数据的平均数是2.8,方差是3.6,若将这组数据中的每一个数据都加上60,得到一组新数据,则所得新数据的平均数和方差分别是( )A .57.2,3.6B .57.2,56.4C .62.8,63.6D .62.8,3.6 解析 平均数增加,方差不变. 答案 D 二、填空题7.体育彩票000001~100000编号中,凡彩票号码最后三位数为345的中一等奖,采用的抽样方法是________.解析 系统抽样的步骤可概括为:总体编号,确定间隔,总体分段,在第一段内确定起始个体编号,每段内规则取样等几步.该抽样符合系统抽样的特点. 答案 系统抽样8.某学校为了解学生数学课程的学习情况,在1 000名学生中随机抽取200名,并统计这200名学生的某次数学考试成绩,得到了样本的频率分布直方图(如图)根据频率分布直方图可估计这1 000名学生在该次数学考试中成绩不低于60分的学生人数是________.解析 低于60分学生所占频率为(0.002+0.006+0.012)×10=0.2,故低于60分的学生人数为1 000×0.2=200,所以不低于60分的学生人数为1 000-200=800. 答案 8009.沈阳市某高中有高一学生600人,高二学生500人,高三学生550人,现对学生关于消防安全知识了解情况进行分层抽样调查,若抽取了一个容量为n 的样本,其中高三学生有11人,则n 的值等于________.解析 由n 600+500+550=11550,得n =33(人)答案 3310.某年级120名学生在一次百米测试中,成绩全部介于13秒与18秒之间.将测试结果分成5组:[13,14),[14,15),[15,16),[16,17),[17,18],得到如图所示的频率分布直方图.如果从左到右的5个小矩形的面积之比为1∶3∶7∶6∶3,那么成绩在[16,18]的学生人数是 __________________________________________________________________.解析 成绩在[16,18]的学生的人数所占比例为6+31+3+7+6+3=920,所以成绩在[16,18]的学生人数为120×920=54.答案 54 三、解答题11.某公路设计院有工程师6人,技术员12人,技工18人,要从这些人中抽取n 个人参加市里召开的科学技术大会.如果采用系统抽样和分层抽样的方法抽取,不用剔除个体,如果参会人数增加1个,则在采用系统抽样时,需要在总体中先剔除1个个体,求n . 解 总体容量为6+12+18=36.当样本容量是n 时,由题意知,系统抽样的间隔为36n ,分层抽样的比例是n 36,抽取的工程师人数为n36×6=n 6,技术员人数为n 36×12=n 3,技工人数为n 36×18=n2,所以n 应是6的倍数,36的约数,即n =6,12,18.当样本容量为(n +1)时,总体容量是35人,系统抽样的间隔为35n +1,因为35n +1必须是整数,所以n只能取6.即样本容量n =6.12.某校高一某班的某次数学测试成绩(满分为100分)的茎叶图和频率分布直方图都受了不同程度的破坏,但可见部分如图,据此解答下列问题:(1)求分数在[50,60]的频率及全班人数;(2)求分数在[80,90]之间的频数,并计算频率分布直方图中[80,90]间的矩形的高. 解 (1)分数在[50,60]的频率为0.008×10=0.08.由茎叶图知,分数在[50,60]之间的频数为2,所以全班人数为20.08=25.(2)分数在[80,90]之间的频数为25-2-7-10-2=4,频率分布直方图中[80,90]间的矩形的高为425÷10=0.016.13.汽车行业是碳排放量比较大的行业之一,欧盟规定,从2012年开始,对CO2排放量超过130 g/km的MI型新车进行惩罚(视为排放量超标),某检测单位对甲、乙两类MI型品牌的新车各抽取了5辆进行CO2排放量检测,记录如下(单位:g/km):2乙(1)求甲类品牌汽车的排放量的平均值及方差;(2)若乙类品牌汽车比甲类品牌汽车CO2的排放量稳定性好,求x的取值范围.解(1)甲类品牌汽车的CO2排放量的平均值x甲=80+110+120+140+1505=120(g/km),甲类品牌汽车的CO2排放量的方差s2甲=-2+-2+-2+-12+-25=600.(2)由题意知乙类品牌汽车的CO2排放量的平均值x乙=100+120+x+y+1605=120(g/km),得x+y=220,故y=220-x,所以乙类品牌汽车的CO2排放量的方差s2乙=-2+-2+x-2+-x-2+-25,因为乙类品牌汽车比甲类品牌汽车CO2的排放量稳定性好,所以s2乙<s2甲,解得90<x<130.14.已知某单位有50名职工,现要从中抽取10名职工,将全体职工随机按1~50编号,并按编号顺序平均分成10组,按各组内抽取的编号依次增加5进行系统抽样.(1)若第5组抽出的号码为22,写出所有被抽出职工(2)的号码;(2)分别统计这10名职工的体重(单位:公斤),获得体重数据的茎叶图如图所示,求该样本的方差;(3)在(2)的条件下,从这10名职工中随机抽取两名体重不轻于73公斤(≥73公斤)的职工,求体重为76公斤的职工被抽取到的概率.解(1)由题意,第5组抽出的号码为22.因为k+5×(5-1)=22,所以第1组抽出的号码应该为2,抽出的10名职工的号码分别为2,7,12,17,22,27,32,37,42,47.(2)因为10名职工的平均体重为x=110(81+70+73+76+78+79+62+65+67+59)=71,所以样本方差为:s2=110(102+12+22+52+72+82+92+62+42+122)=52.(3)从10名职工中随机抽取两名体重不轻于73公斤的职工,共有10种不同的取法:(73,76),(73,78),(73,79),(73,81),(76,78),(76,79),(76,81),(78,79),(78,81),(79,81)记“体重为76公斤的职工被抽取”为事件A,它包括的事件有(73,76),(76,78),(76,79),(76,81)共4个.故所求概率为P(A)=410=2 5.2.下列命题中的真命题是( )①若命题:0,sin p x x x ∃<≥,命题q :函数()22x f x x =-仅有两个零点,则命题p q ⌝∨为真命题; ②若变量,x y 的一组观测数据()()()1122,,,,,,n n x y x y x y 均在直线21y x =+上,则y x 与的线性相关系数1r =;③若[],0,1a b ∈,则使不等式 A .①② B .①③ C .② D .②③3.从甲、乙两班分别任意抽出10名学生进行英语口语测验,其测验成绩的方差分别为S 12= 13.2,S 22=26.26,则A .甲班10名学生的成绩比乙班10名学生的成绩整齐B .乙班10名学生的成绩比甲班10名学生的成绩整齐C .甲、乙两班10名学生的成绩一样整齐D .不能比较甲、乙两班10名学生成绩的整齐程度4.某农贸市场出售西红柿,当价格上涨时,供给量相应增加,而需求量相应减少,具体调查结果如下表: 表1 市场供给量 表2 市场需求量根据以上提供的信息,市场供需平衡点(即供给量和需求量相等时的单价)应在区间( )A .(2.3,2.6)内B .(2.4,2.6)内C .(2.6,2.8)内 D .(2.8,2.9)内 5. ,123i =,,)的图象如下所示,则( )A .123μμμ<=,123σσσ=>B .123μμμ>=,123σσσ=<C .123μμμ=<,123σσσ<=D .123μμμ<=,123σσσ=<参考答案1.B【解析】试题分析:根据系统抽样的定义即可进行判断.解:∵每个考场抽取座位号为15号考生试卷质检,∴座号间距都为30,满足系统抽样的定义,即这种抽样方法是系统抽样,故选:B .点评:本题主要考查系统抽样的定义和应用,比较基础.2.A【解析】 试题分析:命题:0,sin p x x x ∃<≥是真命题,所以命题p q ⌝∨为真命题,故①是真命题;由线性相关的定义可知②正确;③不正确,故选A .考点:1.复合命题真假的判断;2.几何概率;3.线性相关.3.A【解析】考点:极差、方差与标准差.分析:根据所给的测验成绩的方差,得到两个方差的大小关系S 12<S 22,即甲班的10名同学的成绩比乙班的10名同学的成绩整齐,波动小.解答:解:∵测验成绩的方差分别为S 12=13.2,S 22=26.26,∴S 12<S 22,∴甲班的10名同学的成绩比乙班的10名同学的成绩整齐,波动小,故选A .点评:本题考查极差、方差与标准差,本题解题的关键是理解方差的意义,当两组数据的方差大小进行比较时,方差小的数据比较稳定.4.C【解析】由已知中表格所给的数据,我们结合答案中的四个区间,分别分析区间端点对应的供给量与需求量的关系,如果区间两个端点的表示供给量与需求量的关系的不等号方向是相反的,则市场供需平衡点(即供给量和需求量相等时的单价)应在该区间.解答:解:∵单价等于2.8时,供给量=70∴当单价小于2.6时,由于2.6<2.8∴供给量<70而此时,需要量>70故此时,供给量<需要量而当单价等于2.6时,需求量=70∴当单价大于2.8时,∵2.8>2.6∴供给量>70而此时,需要量<70故此时,供给量>需要量综上所述,市场供需平衡点(即供给量和需求量相等时的单价)应在区间(2.6,2.8)内故选C5.D【解析】三、解答题(题型注释)1.某校兴趣小组进行了一项“娱乐与年龄关系”的调查,对 15~65岁的人群随机抽取1000人的样本,进行了一次“是否是电影明星追星族”调查,得到如下各年龄段样本人数频率分布直方图和“追星族”统计表:(1)求,a b 的值.(2)设从45岁到65岁的人群中,随机抽取2人,用样本数据估计总体,ξ表示其中“追星族”的人数,求ξ分布列、期望和方差.2.某校高一某班的一次数学测试成绩的茎叶图和频率分布直方图都受到不同程度的破坏,(阴影部分为破坏部分)其可见部分如下,据此解答如下问题:(Ⅰ)计算频率分布直方图中[80,90)间的矩形的高;(Ⅱ)若要从分数在[80,100]之间的试卷中任取两份分析学生失分情况,求在抽取的试卷中,至少有一份的分数在[90,100]之间的概率;(Ⅲ)根据频率分布直方图估计这次测试的平均分.3.(本小题满分12分)海关对同时从C B A ,,三个不同地区进口的某种商品进行抽样检测,从各地区进口此种商品的数量(单位:件)如右表所示,工作人员用分层抽样的方法从这些商品中共抽取6件进行检测(1)求这6件样品中来自C B A ,,各地区商品的数量;(2)若在这6件样品中随机抽取2件送往甲机构进一步检测,求这2件商品来自相同地区的概率.4.编号为A 1,A 2,…,A 16的16名篮球运动员在某次训练比赛中的得分记录如下:(Ⅱ)从得分在区间[20,30)内的运动员中随机抽取2人,(i )用运动员的编号列出所有可能的抽取结果;(ii )求这2人得分之和大于50分的概率.5.电视传媒为了解某市100万观众对足球节目的收视情况,随机抽取了100名观众进行调查.如图是根据调查结果绘制的观众每周平均收看足球节目时间的频率分布直方图,将每周平均收看足球节目时间不低于1.5小时的观众称为“足球迷”, 并将其中每周平均收看足球节目时间不低于2.5小时的观众称为“铁杆足球迷”.(1)试估算该市“足球迷”的人数,并指出其中“铁杆足球迷”约为多少人;(2)该市要举办一场足球比赛,已知该市的足球场可容纳10万名观众.根据调查,如果票价定为100元/张,则非“足球迷”均不会到现场观看,而“足球迷”均愿意前往现场观看.如果票价提高10x 元/张()x N ∈,则“足球迷”中非“铁杆足球迷”愿意前往观看的人数会减少10%x ,“铁杆足球迷”愿意前往观看的人数会减少问票价至少定为多少元/张时,才能使前往现场观看足球比赛的人数不超过10万人?6. “你低碳了吗?”这是某市为倡导建设资源节约型社会而发布的公益广告里的一句话.活动组织者为了解这则广告的宣传效果,随机抽取了100名年龄段在[10,20),[20,30),,[50,60)的市民进行问卷调查,由此得到样本的频率分布直方图如图所示. (1)求随机抽取的市民中年龄段在[30,40)的人数;(2)从不小于40岁的人中按年龄段分层抽样的方法随机抽取8人,求[50,60)年龄段抽取的人数;(3)从按(2)中方式得到的8人中再抽取3人作为本次活动的获奖者,记X 为年龄在[50,60)年龄段的人数,求X 的分布列及数学期望.参考答案1.(1)300;0.1;(2)见解析【解析】试题分析:(1)先由频率分布直方图计算出在[15,25]年龄段的样本人数,再根据“追星族”统计表即可计算出该段追星人数a;先由频率分布直方图计算出在[45,55]年龄段的样本人数,再由“追星族”统计表知该组“追星族”人数为3,3除以该组样本人数即为占本组的频率;(2)由[45,65]范围内样本数据即可求出抽到“追星族”的概率,由二项分布知识知,在该组中随机抽2人,抽到“追星族”的人数符合二项分布,由二项分布即可写出分布列,计算出期望与方查.试题解析:(1)由题设知[15,25)这组人数为0.04×10×1000=400, 1分故a=0.75×400=300 2分[45,55)这组人数为0.003×10×1000=30,故分综上,a=300,b=0.1. 4分(2).由[45,65]ξ~B(2分故ξ的分布列是分分考点:频率分布直方图;二项分布;应用意识2.(Ⅰ)0.016(Ⅱ)0.6(Ⅲ)73.8【解析】试题分析:(Ⅰ)先由平率分布直方图计算出分数在[50,60]间的频率,由茎叶图知:分数在[50,60)之间的频数,算出全班人数,由茎叶图知分数不在[80,90)之间的人数,从而求出分数在[80,90)之间的人数即频数,频数除以总人数即为频率,再除以组距即为矩形的高;(Ⅱ)设出分数在[80,90)间的分数编号及分数在[90,100]之间的分数编号,列出在[80,100]之间的试卷中任取两份的基本事件,数出基本事件个数,数出至少有一份在[90,100]之间的基本事件个数,根据古典概型公式即可求出其概率;(Ⅲ)算出个分数段的频率,以个分数段的中点值为代表分数乘以相应的概率即平均分数.⨯=,由茎叶图知:分数在[50,60)试题解析:(Ⅰ)分数在[50,60)的频率为0.008100.08之间的频数为2,所以全班人数为 2分∴分数在[80,90)之间的人数为25214-=人. 3分 所以[80,90)间的矩形的高为分 (Ⅱ)将[80,90)之间的4个分数编号为1,2,3,4, [90,100]之间的2个分数 编号为5,6,在[80,100]之间的试卷中任取两份的基本事件为:(1,2),(1,3),(1,4),(1,5),(1,6), (2,3),(2,4),(2,5),(2,6),(3,4),(3,5),(3,6),(4,5),(4,6),(5,6)共15个. 6分 其中,至少有一份在[90,100]之间的基本事件有9个,故至少有一份分数在[90,100]之间的概率是分10分所以估计这次测试的平均分为:550.08650.28750.4850.16950.0873.8⨯+⨯+⨯+⨯+⨯=. 12分考点:茎叶图,频率分布直方图,总体估计,古典概型,均值估计,应用意识3.(1) A ,B ,C 三个地区的商品被选取的件数分别为1,3,2.(2)这2 【解析】试题分析:(1)从而得到样本中包含三个地区的个体数量分别是:(2)设6件来自A ,B ,C 三个地区的样品分别为12312;,,;,A B B B C C ,写出抽取的这2件商品构成的所有基本事件:123{,},{,},{,}A B A B A B ,12{,},{,}A C A C ,1213111223{,},{,}{,},{,};{,}B B B B B C B C B B ,2122313212{,},{,},{,},{,},{,}B C B C B C B C C C ,共15个.记事件D :“抽取的这2件商品来自相同地区”,写出事件D 包含的基本事件:12132312{,},{,}{,},{,}B B B B B B C C 共4个.由每个样品被抽到的机会均等,因此这些基本事件的出现是等可能的,利用古典概型概率的计算公式得解.试题解析:(1)所以样本中包含三个地区的个体数量分别是:所以A ,B ,C 三个地区的商品被选取的件数分别为1,3,2.(2)设6件来自A ,B ,C 三个地区的样品分别为12312;,,;,A B B B C C ,则抽取的这2件商品构成的所有基本事件为: 123{,},{,},{,}A B A B A B ,12{,},{,}A C A C ,1213111223{,},{,}{,},{,};{,}B B B B B C B C B B ,2122313212{,},{,},{,},{,},{,}B C B C B C B C C C ,共15个.每个样品被抽到的机会均等,因此这些基本事件的出现是等可能的,记事件D :“抽取的这2件商品来自相同地区”,则事件D 包含的基本事件有:12132312{,},{,}{,},{,}B B B B B B C C 共4个.2 考点:分层抽样,古典概型.4.(Ⅰ)4,6,6(Ⅱ)(i )(A 3,A 4),(A 3,A 5),(A 3,A 10),(A 3,A 11),(A 3,A 13),(A 4,A 5),(A 4,A 10),(A 4,A 11),(A 4,A 13),(A 5,A 10),(A 5,A 11),(A 5,A 13),(A 10,A 11),(A 10,A 13),(A 11,A 13)共15种(ii )【解析】试题分析:(I )根据已知中编号为A 1,A 2,…,A 16的16名篮球运动员在某次训练比赛中的得分记录表,我们易得出得分在对应区间内的人数.(II )(i )根据(I )的结论,我们易列出在区间[20,30)内的运动员中随机抽取2人,所有可能的抽取结果;(ii )列出这2人得分之和大于50分的基本事件的个数,代入古典概型公式即可得到这2人得分之和大于50分的概率.解:(I )由已知中编号为A 1,A 2,…,A 16的16名篮球运动员在某次训练比赛中的得分记录表易得: 得分在区间[10,20)上的共4人,在区间[20,30)上的共6人,在区间[30,40]上的共6人, 故答案为4,6,6(II )(i )得分在区间[20,30)上的共6人,编号为A 3,A 4,A 5,A 10,A 11,A 13,从中随机抽取2人,计为(X ,Y ),则所有可能的抽取结果有:(A 3,A 4),(A 3,A 5),(A 3,A 10),(A 3,A 11),(A 3,A 13),(A 4,A 5),(A 4,A 10),(A 4,A 11),(A 4,A 13),(A 5,A 10),(A 5,A 11),(A 5,A 13),(A 10,A 11),(A 10,A 13),(A 11,A 13)共15种.(ii )从得分在区间[20,30)内的运动员中随机抽取2人,这2人的得分之和大于50分的基本事件有: (A 4,A 5),(A 4,A 10),(A 4,A 11),(A 5,A 10),(A 10,A 11)共5种故这2人得分之和大于50分的概率P==点评:本题主要考查用列举法计算随机事件所含的基本事件烽、古典概型及其概率计算公式等基础知识,考查数据处理能力及运用概率知识解决简单的实际问题的能力.5.(1)16万“足球迷”, 3万“铁杆足球迷”,(2)140元/张 【解析】试题分析:(1)利用频数等于频率乘以总数,样本中“足球迷”出现的频率=(0.160.100.06)0.516%++⨯=“足球迷”的人数=10016%16⨯=,同理可求:“铁杆足球迷”=100(0.060.5)3⨯⨯=,(2)如果票价定为100元/张,则非“足球迷”均不会到现场观看,而“足球迷”均愿意前往现场观看,现场观看足球比赛的人数超过10万人,所以设票价为10010x +元,则一般“足球迷”中约有13(110%)x -万人,“铁杆足球. 2131136600x x +-≥由x N ∈,4x ∴≥即平均票价至少定为100+40=140元,才能使前往现场观看足球比赛的“足球迷”不超过10万人.解:(1)样本中“足球迷”出现的频率=(0.160.100.06)0.516%++⨯= (2分)“足球迷”的人数=10016%16⨯=(万) (4分)“铁杆足球迷”=100(0.060.5)3⨯⨯=(万)所以16万“足球迷”中,“铁杆足球迷”约有3万人. (6分)(2)设票价为10010x +元,则一般“足球迷”中约有13(110%)x -万人,“铁杆足球迷”万人去现场看球. (3分) 分)化简得:2131136600x x +-≥,由x N ∈,4x ∴≥ (7分)即平均票价至少定为100+40=140元,才能使前往现场观看足球比赛的“足球迷”不超过10万人.(8分)考点:频率分布直方图6.(1)35;(2)2;(3。
版高考数学一轮总复习11.4抽样方法与总体分布的估计课件

件时,估计该工厂获利2 000×8.1=16 200(元).
因为从A,B生产线共随机抽取的200件产品中,A生产线生产的一等级产
品有20件,B生产线生产的一等级产品有35件,由样本频率估计总体概率,
得该工厂生产的产品为一等级产品的概率为 20 35 = 11 ,当产品产量为
200 40
2 000件时,估计该工厂一等级产品获利2 000× 11×10=5 500(元).
考法二 样本的数字特征及其应用 1.平均数、中位数、众数与方差、标准差都是重要的数字特征,利用它 们可对总体进行一种简明的描述,它们所反映的情况有着重要的实际意 义,平均数、中位数、众数可描述总体的集中趋势,方差和标准差可描述 波动大小. 2.有关平均数、方差的一些结论 1)若x1,x2,…,xn的平均数为 x,那么mx1+a,mx2+a,mx3+a,…,mxn+a的平均数是m x +a. 2)设数据x1,x2,…,xn的方差为s2,则 ①数据x1+a,x2+a,…,xn+a的方差也为s2; ②数据ax1,ax2,…,axn的方差为a2s2.
解析 (1)从A生产线随机抽取的100件产品获利的平均数为 x1= 1 ×(10×20+8
100
×60+6×20)=8(元),方差为
= s12
×1[(10-8)2×20+(8-8)2×60+(6-8)2×20]=
100
1.6;
从B生产线随机抽取的100件产品获利的平均数为 x2= 1 ×(10×35+8×40+
A.2.25吨 B.2.24吨 C.2.06吨 D.2.04吨
×0.5=0.0 4.同理,月均用水量在[0.5,1),[1.5,2),[2,2.5),[3,3.5),[3.5,4),[4,4.5]的频率分 别为0.08,0.21,0.25,0.06,0.04,0.02.由1-(0.04+0.08+0.21+0.25+0.06+0.04+0. 02)=2××a,解得a=0.30,设中位数为x吨.因为前5组的频率之和为0.04+0. 08+0.15+0.21+0.25=0.73>0.5,前4组的频率之和为0.04+0.08+0.15+0.21=0. 48<0.5,所以2≤x×(x-2)=0.5-0.48,解得x=2.04. 答案 D
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
第76课时 课题:抽样方法、总体分布的估计
2019-2020年高三数学第一轮复习讲义(76)抽样方法、总体分布的
估计
一.复习目标: 抽样方法、总体分布的估计
1.会用简单随机抽样法、系统抽样法、分层抽样法等常用方法从总体中抽取样本;
2.了解统计的基本思想,会用样本频率估计总体分布.
二.知识要点:
1.(1)统计的基本思想是 .
(2)平均数的概念 .
(3)方差公式为 .
2.常用的抽样方法是 .
三.课前预习:
1.某公司甲、乙、丙、丁四个地区分别有150 个、120个、180个、150个销售点.公司为了调查产品销售的情况,需从这600个销售点中抽取一个容量为100的样本,记这项调查为①;在丙地区中有20个特大型销售点,要从中抽取7个调查其收入和售后服务等情况,记这项调查为②.则完成①、②这两项调查宜采用的抽样方法依次是 ( B ) ()A 分层抽样法,系统抽样法 ()B 分层抽样法,简单随机抽样法 ()C 系统抽样法,分层抽样法
()D 简单随机抽样法,分层抽样法 2.已知样本方差由10
221
1(5)10i i s x ==-∑,求得,则1210x x x +++= 50 . 3.设有n 个样本12,,,n x x x ,其标准差为x s ,另有n 个样本12,,,n y y y ,且35k k y x =+ (1,2,,)k n =,其标准差为y s ,则下列关系正确的是 ( B )
()A 35y x s s =+ ()B 3y x s s = ()C 3y x s s = ()D 35y x s s =+
4.某校为了了解学生的课外阅读情况,随机调查了50
名学生,得到他们在某一天各自课外阅读所用时间的数
据,结果用右侧的条形图表示. 根据条形图可得这50
名学生这一天平均每人的课外阅读时间为 ( B )
()A 0.6小时 ()B 0.9小时 ()C 1.0小时 ()D 1.5小时
5.x 是12100,,x x x 的平均数,a 是1240,,x x x 的平均数,b 是4142100,,x x x 的平均数,则x ,a ,b 之间的关系为4060100
a b x +=. 6.某校有老师200人,男学生1200人,女学生1000人.现用分层抽样的方法从所有师生中抽取一个容量为n 的样本;已知从女学生中抽取的人数为80人,则n =112.
7.一个总体中有100个个体,随机编号0,1,2,…,99,依编号顺序平均分成10个小 组,组号依次为1,2,3,…,10.现用系统抽样方法抽取一个容量为10的样本,规定如果在第1组随机抽取的号码为m ,那么在第k 组中抽取的号码个位数字与m k +的个位数字相同,若6m =,则在第7组中抽取的号码是 63 .
8.在样本的频率分布直方图中,共有11个小长方形,若中间一个小长方形的面积等于其他
10个小长方形的面积之和的14,且样本容量为160,则中间一组的频数为 32 . 四.例题分析: 0.5 人数(人) 时间(小时) 20 10
5
0 1.0 1.5 2.0 15
例1.某中学有员工160人,其中中高级教师48人,一般教师64人,管理人员16人,行政人员32人,从中抽取容量为20的一个样本.以此例说明,无论使用三种常用的抽样方法中的哪一种方法,总体中的每个个体抽到的概率都相同.
解:(1)(简单随机抽样)可采用抽签法,将160人从1到160编号,然后从中抽取20个
签,与签号相同的20个人被选出.显然每个个体抽到的概率为
2011608
=. (2)(系统抽样法)将160人从1到160编号,,按编号顺序分成20组,每组8人,先在第一组中用抽签法抽出k 号(18k ≤≤),其余组的8k n +(1,2,3,19)n =也被抽到,显然每个个体抽到的概率为18
. (3)(分层抽样法)四类人员的人数比为3:4:1:2,又34206,2081010
⨯=⨯= 12202,2041010
⨯=⨯=,所以从中高级教师、一般教师、管理人员、行政人员中分别抽取6人、8人、2人、4人,每个个体抽到的概率为18. 例2.质检部门对甲、乙两种日光灯的使用时间进行了破坏性试验,10次试验得到的两种日光灯的使用时间如下表所示,问:哪一种质量相对好一些?
解:甲的平均使用寿命为:
甲x =
10
1214032130321202211012100⨯+⨯+⨯+⨯+⨯ =2121(h ), 甲的平均使用寿命为 : 乙x =10
1214022130521201211012100⨯+⨯+⨯+⨯+⨯=2121(h ), 甲的方差为:2甲S =10
199919114212
2222+⨯+⨯+⨯+=129(h 2), 乙的方差为:2乙S =10
1214022130521201211012100⨯+⨯+⨯+⨯+⨯=109(h 2), ∵甲x =乙x ,且2甲S >2乙S ,∴乙的质量好一些.
例3.下表给出了某学校120名12岁男生的身高统计分组与频数(单位:cm ). 区间 [122,126) [126,130) [130,134) [134,138) [138,142) [142,146) [146,150) [150,154) [154,158) 人 5 8 10 22 33 20 11 6 5
甲 使用时间(h ) 频数 2100 1 2110 2 2120 3 2130 3 2140 1 乙 使用时间(h ) 频数
2100 1 2110 1 2120 5 2130 2 2140 1
数
(1)列出样本的频率分布表(含累积频率);
(2)画出频率分布直方图;
(3)根据累积频率分布,估计小于134的数据约占多少百分比.
解:(1)样本的频率分布表与累积频率表如下: (2)频率分布直方图如下:
(3)根据累积频率分布,小于134的数据约占
23100%19.2%120
⨯≈. 区间 [122,126) [126,130) [130,134) [134,138) [138,142) [142,146) [146,150) [150,154) [154,158) 人数 5 8 10 22 33 20 11 6 5
频率 241 151 121 6011 4011 61
12011 201 241 累积频率 241 12013 12023 81
2013 6049 120109 2423 1 频率/组距
122 126 130 134 138 142 146 150 154 158 身高(cm )
961 24011 16011 48011 241 481 601 801 · · ·· · ·
五.课后作业: 班级 学号 姓名
1.一个单位有职工160人,其中业务人员96人,管理人员40人,后勤人员24人,为了解职工身体情况,要从中抽取一个容量为20的样本,如用分层抽样,则管理人员应抽到多少个 ( )
()A 3 ()B 12 ()C 5 ()D 10
2.欲对某商场作一简要审计,通过检查发票及销售记录的2%来快速估计每月的销售总额.现采用如下方法:从某本50张的发票存根中随机抽一张,如15号,然后按序往后将65号,115号,165号,…发票上的销售额组成一个调查样本.这种抽取样本的方法是 ( )
()A 简单随机抽样 ()B 系统抽样 ()C 分层抽样 ()D 其它方式的抽样
3.在抽查某产品的尺寸过程中,将其尺寸分成若干组,[,]a b 是其中一组,抽查出的个体数在该组上的频率为m ,该组上的直方图的高为h ,则||a b -等于 ( )
()A hm ()B h m ()C m h
()D 与,m h 无关 4.一个总体的个数为n ,用简单随机抽样的方法,抽取一个容量为2的样本,个体a 第一次未被抽到,个体a 第一次未被抽到第二次被抽到,以及整个过程中个体a 被抽到的概率分别是 .
5.某工厂生产A 、B 、C 三种不同型号的产品,产品数量之比依次为2:3:5.现用分层抽样方法抽出一个容量为n 的样本,样本中A 种型号产品有16件,那么此样本的容量n = .
6.有一组数据:)(,,,,321321n n x x x x x x x x ≤≤≤≤ ,它们的算术平均值为10,若去掉其中最大的n x ,余下数据的算术平均值为9;若去掉其中最小的1x ,余下数据的算术平均值为11,则1x 关于n 的表达式为 ;n x 关于n 的表达式为 .
7.为了比较甲、乙两位划艇运动员的成绩,在相同的条件下对他们进行了6次测验,测得他们的平均速度(/m s )分别如下:
甲:2.7 3.8 3.0 3.7 3.5 3.1
乙:2.9 3.9 3.8 3.4 3.6 2.8
试根据以上数据,判断他们谁更优秀.
8.有一个容量为100的样本,数据的分组及各组的频数如下:
区间 [12,15) [15,18) [18,21) [21,24) [24,27) [27,30) [30,133)
频数 6 16 18 22 20 10 8
(1)列出样本的频率分布表;(2)画出频率分布直方图;(3)估计数据小于30的概率.
9.100名学生分四个兴趣小组参加物理、化学、数学、计算机竞赛辅导,人数别是30、27、23、20.(1)列出学生参加兴趣小组的频率分布表;
(2)画出表示频率分布的条形图.。