抽样方法与总体分布的估计
抽样方法与总体分布的估计
![抽样方法与总体分布的估计](https://img.taocdn.com/s3/m/1de25292b4daa58da1114a7b.png)
频数为0.32×150=48.
•
PPT文档演模板
答案 B
抽样方法与总体分布的估计
5.(长沙模拟)如图是某学校一名篮球运动 员在五场比赛中所得分数的茎叶图,则
•该运动员在这五场比赛中得分的方差为________.
答案 6.8
PPT文档演模板
抽样方法与总体分布的估计
考向一 抽样方法
•【例1】从某厂生产的802辆轿车中抽取80辆测试某项 性 能.请合理选择抽样方法进行抽样,并写出抽样过 程. [审题视点] 因为802不能整除80,为了保证“等距” 分段,应先剔除2个个体.
PPT文档演模板
抽样方法与总体分布的估计
•(3)平均数
样本数据的算术平均数,即 =__________________. (4)方差与标准差
方差:s2=__________________________________.
标准差:s= _____________________________________.
抽样方法与总体分布的估计
•
考点自测
1.(山东)采用系统抽样方法从960人中抽取32人做 问卷调查.为此将他们随机编号为1,2,…, 960,分组后在第一组采用简单随机抽样的方法 抽到的号码为9.抽到的32人中,编号落入区间 [1,450]的人做问卷A,编号落入区间[451,750]的 人做问卷B,其余的人做问卷C.则抽到的人中, 做问卷B的人数为 ( ). •A.7 B.9 C.10 D.15
PPT文档演模板
抽样方法与总体分布的估计
•第三步:从第1段即1,2,…,10这10个编号中,用简单随 机抽样的方法抽取一个编号(如5)作为起始编号; •第四步:从5开始,再将编号为15,25,…,795的个体抽 出,得到一个容量为80的样本.
必修3 抽样方法与总体分布的估计
![必修3 抽样方法与总体分布的估计](https://img.taocdn.com/s3/m/112b191190c69ec3d5bb75ae.png)
抽样方法与总体分布的估计【知识要点】1.简单随机抽样:设一个总体的个数为N 。
如果通过逐个抽取的方法从中抽取一个样本,且每次抽取时各个个体被抽到的概率相等,就称这样的抽样为简单随机抽样。
实现简单随机抽样,常用抽签法和随机数表法2.系统抽样:当总体中的个数较多时,可将总体分成均衡的几个部分,然后按照预先定出的规则,从每一部分抽取1个个体,得到所需要的样本,这种抽样叫做系统抽样(也称为机械抽样)。
系统抽样的步骤可概括为:(1)将总体中的个体编号。
采用随机的方式将总体中的个体编号;(2)将整个的编号进行分段。
为将整个的编号进行分段,要确定分段的间隔k .当n N 是整数时,nN k =;当n N 不是整数时,通过从总体中剔除一些个体使剩下的个体数N ´能被n 整除,这时nN k '=; (3)确定起始的个体编号。
在第1段用简单随机抽样确定起始的个体边号l ; (4)抽取样本。
按照先确定的规则(常将l 加上间隔k )抽取样本:k n l k l k l l )1(,,2,,-+⋅⋅⋅++。
3.分层抽样:当已知总体由差异明显的几部分组成时,常将总体分成几部分,然后按照各部分所占的比进行抽样,这种抽样叫做分层抽样,其中所分成的各部分叫做层4、频率分布直方图、折线图与茎叶图样本中所有数据(或数据组)的频率和样本容量的比,就是该数据的频率。
所有数据(或数据组)的频率的分布变化规律叫做频率分布,可以用频率分布直方图、折线图、茎叶图来表示。
频率分布直方图:具体做法如下:(1)求极差(即一组数据中最大值与最小值的差);(2)决定组距与组数;(3)将数据分组;(4)列频率分布表;(5)画频率分布直方图。
注:频率分布直方图中小正方形的面积=组距×组距频率=频率。
折线图:连接频率分布直方图中小长方形上端中点,就得到频率分布折线图。
总体密度曲线:当样本容量足够大,分组越多,折线越接近于一条光滑的曲线,此光滑曲线为总体密度曲线。
抽样方法与总体分布的估计
![抽样方法与总体分布的估计](https://img.taocdn.com/s3/m/b068f5e85727a5e9856a61f9.png)
抽样方法与总体分布的估计●知识梳理1.简单随机抽样:一样地,设一个总体的个体数为N ,假如通过逐个抽取的方法从中抽取一个样本,且每次抽取时各个个体被抽到的概率相等,就称如此的抽样为简单随机抽样.2.分层抽样:当已知总体由差异明显的几部分组成时,为了使样本更充分地反映总体的情形,常将总体分成几部分,然后按照各部分所占的比进行抽样,这种抽样叫做分层抽样.3.两种抽样方法的比较(略).4.总体:在数理统计中,通常把被研究的对象的全体叫做总体.5.频率分布:用样本估量总体,是研究统计问题的差不多思想方法,样本中所有数据(或数据组)的频数和样本容量的比,确实是该数据的频率.所有数据(或数据组)的频率的分布变化规律叫做样本的频率分布.能够用样本频率表、样本频率分布条形图或频率分布直方图来表示.6.总体分布:从总体中抽取一个个体,确实是一次随机试验,从总体中抽取一个容量为n 的样本,确实是进行了n 次试验,试验连同所显现的结果叫随机事件,所有这些事件的概率分布规律称为总体分布.●点击双基1.为调查参加运动会的1000名运动员的年龄情形,从中抽查了100名运动员的年龄,就那个问题来说,下列说法正确的是A.1000名运动员是总体B.每个运动员是个体C.抽取的100名运动员是样本D.样本容量是1002.一个总体中共有10个个体,用简单随机抽样的方法从中抽取一个容量为3的样本,则某特定个体入样的概率是A.310C 3B.89103⨯⨯C.103 D.101 3.一个容量为n 的样本,分成若干组,已知某数的频数和频率分别为40、0.125,则n 的值为 A.640 B.320 C.240 D.1604.某单位有老年人27人,中年人54人,青年人81人,为了调查他们的健康状况,需从他们中抽取一个容量为36的样本,在简单随机抽样、系统抽样、分层抽样这三种方法中较合适的抽样方法是___________.那么分数在[100,110)中的频率和分数不满110分的累积频率分别是______________、_______(精确到0.01).●典例剖析【例1】 (2004年湖南,5)某公司在甲、乙、丙、丁四个地区分别有150个、120个、180个、150个销售点.公司为了调查产品销售的情形,需从这600个销售点中抽取一个容量为100的样本,记这项调查为①;在丙地区中有20个特大型销售点,要从中抽取7个调查其销售收入和售后服务情形,记这项调查为②.则完成①、②这两项调查宜采纳的抽样方法依次是A.分层抽样法,系统抽样法B.分层抽样法,简单随机抽样法C.系统抽样法,分层抽样法D.简单随机抽样法,分层抽样法【例2】 (2004年福建,15)一个总体中有100个个体,随机编号为0,1,2,…,99,依编号顺序平均分成10个小组,组号依次为1,2,3,…,10.现用系统抽样方法抽取一个容量为10的样本,规定假如在第1组随机抽取的号码为m ,那么在第k 小组中抽取的号码个位数字与m +k 的个位数字相同.若m =6,则在第7组中抽取的号码是___________.【例3】 把容量为100的某个样本数据分为10组,并填写频率分布表,若前七组的累积频率为0.79,而剩下三组的频数成公比大于2的整数等比数列,则剩下三组中频数最高的一组的频数为___________.(1)列出频率分布表;(2)画出频率分布直方图和累积频率分布图;(3)估量电子元件寿命在100~400 h 以内的概率; (4)估量电子元件寿命在400 h 以上的概率.剖析:通过本题可把握总体分布估量的各种方法和步骤. 解:(1)频率分布表如下:(2)频率分布直方图如下:100 200 300 400 500 600 寿命(h )寿命(h )1.000.800.600.400.20累(3)由累积频率分布图能够看出,寿命在100~400 h 内的电子元件显现的频率为0.65,因此我们估量电子元件寿命在100~400 h 内的概率为0.65.(4)由频率分布表可知,寿命在400 h 以上的电子元件显现的频率为0.20+0.15=0.35,故我们估量电子元件寿命在400 h 以上的概率为0.35.评述:画频率分布条形图、直方图时要注意纵、横坐标轴的意义. ●闯关训练 夯实基础1.(2004年江苏,6)某校为了了解学生的课外阅读情形,随机调查了50名学生,得到他们在某一天各自课外阅读所用时刻的数据,结果用下面的条形图表示,依照条形图可得这50名学生这一天平均每人的课外阅读时刻为2015105人数(人)时间(h )0 0.5 1.0 1.5 2.0A.0.6 hB.0.9 hC.1.0 hD.1.5 h 2.某单位有职工100人,不到35岁的有45人,35岁到49岁的有25人,剩下的为50岁以上的人,用分层抽样法从中抽取20人,各年龄段分别抽取的人数为A.7,5,8B.9,5,6C.6,5,9D.8,5,73.某单位共有N 个职工,要从N 个职工中采纳分层抽样法抽取n 个样本,已知该单位的某一部门有M 个职员,那么从这一部门中抽取的职工数为___________.4.下图是容量为100的样本的频率分布直方图,试依照图形中的数据填空:组距0.00.00.02样本数据(1)样本数据落在范畴[6,10)内的频率为___________; (2)样本数据落在范畴[10,14)内的频数为___________; (3)总体在范畴[2,6)内的概率约为___________.●思悟小结1.采纳什么抽样方法,要视情形来定:当总体中的个体较少时,一样可用随机抽样;当总体中的个体较多时,一样可用系统抽样;当总体由差异明显的几部分组成时,一样可用分层抽样.2.用样本估量总体,是研究统计问题的一个差不多思想方法.用样本估量总体,本节要紧研究在整体上用样本的频率分布估量总体的分布.教学点睛1.常用的抽样方法有三种:简单随机抽样、系统抽样、分层抽样,其中第一种是最简单、最差不多的抽样方法.三种抽样方法的共同点:差不多上等概率抽样,表达了抽样的公平性;三种抽样方法各有其特点和适用的范畴.2.总体分布反映了总体在各个范畴内取值的概率.当总体中所取不同数值比较少时,常用条形图表示相应样本的频率分布;否则,常用频率分布直方图表示相应样本的频率分布.3.系统抽样的步骤:(1)将总体中的个体随机编号;(2)将编号分段;(3)在第1段中用简单随机抽样确定起始的个体编号;(4)按照事先研究的规则抽取样本.4.分层抽样的步骤:(1)分层;(2)按比例确定每层抽取个体的个数;(3)各层抽样(方法能够不同);(4)汇合成样本.5.解决总体分布估量问题的一样程序如下:(1)先确定分组的组数(最大数据与最小数据之差除以组距得组数);(2)分别运算各组的频数及频率(频率=总数频数);(3)画出频率分布直方图,并作出相应的估量.6.条形图是用其高度表示取各值的频率;直方图是用图形面积的大小表示在各区间内取值的频率;累积频率分布图是一条折线,利用任意两端值的累积频率之差表示样本数据在这两点值之间的频率.。
第77课抽样方法与总体分布的估计
![第77课抽样方法与总体分布的估计](https://img.taocdn.com/s3/m/c4d78d79f242336c1fb95e0f.png)
第77课 抽样方法与总体分布的估计一、教学目标1.了解简单随机抽样、系统抽样、分层抽样等抽样方法的特点及适用范围;2.会用简单随机抽样法、系统抽样法、分层抽样法从总体中抽取样本;3.会列样本频率分布表,会画频率分布直方图、折线图、茎叶图,体会它们的特点,会用样本的频率分布估计总体分布的规律. 二、基础知识回顾与梳理1、统计的基本思想是 .【教学建议】统计学的基本思想方法是用样本估计总体,即通过从总体中抽取一个样本,根据样本的情况去估计总体的相应情况.因此,样本的抽取是否得当,对于研究总体来说就十分关键.要突出抽样方法的重要性。
2、为了了解参加一次知识竞赛的1252名学生的成绩,决定采用系统抽样的方法抽取一个容量为50的样本,那么总体中应随机剔除的个体的数目是 .【教学建议】本题改编自课本习题,主要是如何处理样本容量不能整除总体容量的问题,而这是在实际操作中经常碰到的.答案为2.3、一工厂生产了某种产品16800件,它们来自甲、乙、丙3条生产线,为检查这批产品的质量,决定采用分层抽样的方法进行抽样,已知甲,乙,丙三条生产线抽取的个体数组成一个等差数列,则乙生产线生产了 件产品.【教学建议】由甲、乙、丙三条生产线抽取的个体数组成一个等差数列得出乙生产线生产的产品占13,从而得到答案为5600.4、在抽查某产品尺寸的过程中,将其尺寸分成若干组,[,]a b 是其中一组,抽查出的个体数在该组上的频率为m ,该组上的直方图的高为h ,则||a b = .【教学建议】矩形的高度表示每一组的频率除以组距,宽度则表示各组的组距,则答案为m h. 三、诊断练习1、教学处理:课前由学生自主完成4道小题,并要求将解题过程扼要地写在学习笔记栏.课前抽查批阅部分同学的解答,了解学生的思路及主要错误.点评时呈现典型错误,以纠正学生错误的认识.2、诊断练习点评题1:对总数为N 的一批零件抽取一个容量为30的样本,若每个零件被抽到的概率为0.25,则N 的值 为 .【分析与点评】简单随机抽样是在特定总体中抽取样本,总体中每一个个体被抽取的可能性是等同的,如果用从个体数为N 的总体中抽取一个容量为n 的样本,那么每个个体被抽取的可能性等于nN,易得答案为120.题2.用简单随机抽样方法从含有6个个体的总体中,抽取一个容量为2的样本,某一个体a “第一次被抽到的概率”、“第二次被抽到的概率”、“在整个抽样过程中被抽到”的概率分别是【分析与点评】简单随机抽样是在特定总体中抽取样本,总体中每一个个体被抽取的可能性是等同的,某一个体a “第一次被抽到的概率”为16、“第二次被抽到的概率”为16、“在整个抽样过程中被抽到”的概率是13题3.一个田径队,有男运动员56人,女运动员42人,比赛后,立即用分层抽样的方法,从全体队员中抽出一个容量为28的样本进行尿样兴奋剂检查,其中男运动员应抽 . 【分析与点评】根据男运动员在总体中的比例,不难得出抽取的人数为16名。
2018数学文一轮课件:11-2-1 抽样方法与总体分布的估计 精品
![2018数学文一轮课件:11-2-1 抽样方法与总体分布的估计 精品](https://img.taocdn.com/s3/m/63cfc9eb87c24028905fc31e.png)
[解析] (1)由系统抽样知识知,第一组 1~8 号;第二组为 9~16 号;第三组为 17~24 号;第四组为 25~32 号;第五组为 33~40 号.
第一组抽出号码为 2,则依次为 10,18,26,34. (2)抽取比例为5602+80420=928800=27,所以样本中男生人数为 560×27=160.
撬题·对点题 必刷题
2.7+3.2)=1.6.
-- 由以上计算结果可知: x > y ,由此可看出 A 药的疗效更好.
②由观测结果可绘制如下茎叶图:
从以上茎叶图可以看出,A 药疗效的试验结果有170的叶集中在“2.”,“3.”上,而 B 药疗效的试验结果有 170的叶集中在“0.”,“1.”上,由此可看出 A 药的疗效更好.
2.如图是容量为 150 的样本的频率分布直方图,则样本数据落在[6,10)内的频数为( )
A.12 C.60
B.48 D.80
解析 落在[6,10)内的频率为 0.08×4=0.32,故频数为 0.32×150=48.
3.为了检查某超市货架上的饮料是否含有塑化剂,要从编号依次为 1 到 50 的塑料瓶装饮料中抽取 5
(2)特点与方法
(3)系统抽样的概念 当总体中的个体数较多时,可将总体分成 均衡的几个部分 ,然后按照预先定出的规则,从每一部分 抽取一个个体,得到所需要的样本,这种抽样方法叫做系统抽样(也称为机械抽样或等距抽样). (4)系统抽样的特点 ①适用于元素个数很多且均衡的总体. ②各个个体被抽到的机会均等. ③总体分组后,在起始部分采用的是简单随机抽样. ④如果总体容量 N 能被样本容量 n 整除,则抽样间隔为 k=Nn,如果总体容量 N 不能被样本容量 n 整 除,可随机地从总体中剔除余数,然后再按系统抽样的方法抽样.
新高考数学总复习专题十一抽样方法与总体分布的估计课件
![新高考数学总复习专题十一抽样方法与总体分布的估计课件](https://img.taocdn.com/s3/m/3e125e0bb94ae45c3b3567ec102de2bd9605de3b.png)
位数.其中第25百分位数也称为第一四分位数或下四分位数等,第75百分
位数也称为第三四分位数或上四分位数等. 4)计算一组n个数据的第p百分位数的步骤如下: ①按从小到大排列原始数据; ②计算i=n×p%; ③若i不是整数,而大于i的比邻整数为j,则第p百分位数为第j项数据,若i是 整数,则第p百分位数为第i项与第(i&的一等级产品有20件,B生产线生产的一
等级产品有35件,由样本频率估计总体概率,得该工厂生产产品为一等级
产品的概率估计值为
20 35 200
=
11 40
,当产品产量为2
000件时,估计该工厂一
等级产品获利2 000× 11 ×10=5 500(元).
40
11.4 抽样方法与总体散布的估计
考点一 随机抽样 1.简单随机抽样 1)定义:一般地,设一个总体含有N(N为正整数)个个体,从中逐个抽取n(1≤ n<N)个个体作为样本,如果抽取是放回的,且每次抽取时总体内的各个个 体被抽到的概率都相等,我们把这样的抽样方法叫做放回简单随机抽样; 如果抽取是不放回的,且每次抽取时总体内未进入样本的各个个体被抽 到的概率都相等,我们把这样的抽样方法叫做不放回简单随机抽样,放回 简单随机抽样和不放回简单随机抽样统称为简单随机抽样. 2)最常用的方法:随机数法和抽签法.
A.2.25吨 B.2.24吨 C.2.06吨 D.2.04吨
解析 由频率散布直方图可知,月均用水量在[0,0.5)的频率为0.08×0.5= 0.04.同理,月均用水量在[0.5,1),[1.5,2),[2,2.5),[3,3.5),[3.5,4),[4,4.5]的频率分 别为0.08,0.21,0.25,0.06,0.04,0.02.由1-(0.04+0.08+0.21+0.25+0.06+0.04+0. 02)=2×0.5×a,解得a=0.30,设中位数为x吨.因为前5组的频率之和为0.04+ 0.08+0.15+0.21+0.25=0.73>0.5,前4组的频率之和为0.04+0.08+0.15+0.21= 0.48<0.5,所以2≤x<2.5.由0.50×(x-2)=0.5-0.48,解得x=2.04.
7.43抽样方法与总体分布的估计
![7.43抽样方法与总体分布的估计](https://img.taocdn.com/s3/m/4db5b72ceefdc8d376ee32af.png)
3.下图是 2014 年歌手大奖赛中,七位评委为甲、 乙两名选手打出的分数的茎叶图(其中 m 为数字 0~9 中的一个),去掉一个最高分和一个最低分后,甲、乙 两名选手得分的平均数分别为 a1、a2,则一定有( B )
A.a1>a2 B.a2>a1 C.a1=a2 D.a1,a2 大小与 m 的值有关
④列频率分布表(下图)
分组 频数 频率 累计频率 [t0,t1) r1 f1 f1 [t1,t2) r2 f2 f1+f2 „ „ „ „ [tk-1,tk] rk fk f1+f2+„+fk=1
⑤画频率分布直方图,将区间[a,b)标在横轴上, 纵轴表示频率与组距的比值,以每个组距形叫做 频率分布直方图 .
【 解 析 】 抽 样 比 例 60∶3 = 20∶1 , 则 n = 120+80+60 =13. 20
2.(2013 江西)总体由编号为 01,02,„,19, 20 的 20 个个体组成.利用下面的随机数表选取 5 个 个体,选取方法是从随机数表第 1 行的第 5 列和第 6 列数字开始由左到右依次选取两个数字,则选出来的 第 5 个个体的编号为( D ) 7816 6572 0802 6314 0702 4369 9728 0198 3204 9234 4935 8200 3623 4869 6938 7481 A.08 B.07 C.02 D.01
1 2 2 2 x x x [( x - ) + ( x - ) +„+ ( x - ) ] 2 n n 1 叫做这组数据 的方差,而 s 叫做标准差. 1 2 2 2 2 x [( x + x +„+ x ) - n ] . 1 2 n 2 n (2)公式 s = .
(3)当一组数据 x1,x2,„,xn 中各数较大时,可以 将各数据减去一个适当的常数 a,得到 x1′=x1-a, 2 x2′=x2-a,„,xn′=xn- a ,则 s 1 2 2 2 2 x [( x ′ + x ′ +„+ x ′ ) - n ′ ] 1 2 n n = . 4.利用频率分布直方图估计样本的数字特征 (1)中位数:在频率分布直方图中,中位数左边和右 边的直方图的面积应该相等,由此可以估计中位数值. (2)平均数:平均数的估计值等于每个小矩形的面积 乘以矩形底边中点横坐标之和. (3)众数:最高的矩形的中点的横坐标.
抽样方法、总体分布的估计
![抽样方法、总体分布的估计](https://img.taocdn.com/s3/m/dc17cd5d77232f60ddcca18e.png)
简单随机抽样、系统抽 题型一 样 ①抽签法、随机数表法 思维提 ; 示 ②系统抽样的步骤.
题型二 思维提示
分层抽样 由差异明显的几部 分组成的总体适于 用分层抽样
题型三 思维提示
频率分布条形图的有关 问题 条形图与频率分布直方 图的区别
例3
为了估计某人的射击技术状况,在他的 训练记录中抽取了50次进行检验,他命中的 环数如下:
(3)注意频率分布条形图和频率分布直方图
是两个不同的概念.虽然它们的横轴表示 的内容是相同的,但是频率分布条形图的 纵轴(矩形的高)表示频率;频率分布直方图 的纵轴(矩形的高)表示频率与组距的比值, 其相应组距上的频率等于该组距上的矩形 的面积. (4)无论样本容量多大,用样本频率分布估 计总体分布时,所作的只是一种估计,可 能出现误差甚至错误,也允许存在误 差.当然希望这种误差越小越好,因此常 在条件许可下,适当增加样本容量,合理
(1)请作出频率分布表,并画出频率分布直
方图; (2)估计纤度落在[1.38,1.50)中的概率及纤 度小于1.40的概率是多少? (3)统计方法中,同一组数据常用该组区间 的中点值(例如:区间[1.30,1.34)的中点值 是1.32)作为代表.据此,估计纤度的期 望. [分析] 按题目要求作出频率分布表、绘出 频率分布.抽样方法 全体 (1)总体:所要考查的对象的 个体 叫做总体,其中每一个要考察的对象称
为 .总体与个体之间的关系类似 从总体中抽取一部分个体 集合与元素之间的关系. 样本的容量 (2)样本: 叫做总 体的一个样本,样本中个体的数目称 为 .样本和总体之间的 关系类似于子集与集合之间的关系.
分组 频数 [解] (1)频率分布表如下: [1.30,1.34) 4 [1.34,1.38) 25 [1.38,1.42) 30 [1.42,1.46) 29 [1.46,1.50) 10 [1.50,1.54) 2 100 合计
高中数学:抽样方法与总体分布的估计
![高中数学:抽样方法与总体分布的估计](https://img.taocdn.com/s3/m/99f87719854769eae009581b6bd97f192279bf10.png)
抽样方法与总体分布的估计 一、高考考点梳理1.随机抽样例1.对一个容量为N 的总体抽取容量为n 的样本,当选取简单随机抽样、系统抽样和分层抽样三种不同方法抽取样本时,总体中每个个体被抽中的概率分别为p 1,p 2,p 3,则( )A.p 1=p 2<p 3B.p 2=p 3<p 1C.p 1=p 3<p 2D.p 1=p 2=p 32.用样本估计总体通常我们对总体作出的估计一般分成两种:一种是用样本的频率分布估计总体的频率分布;另一种是用样本的数字特征估计总体的数字特征(1)用样本的频率分布估计总体的频率分布①频率分布直方图的理解a.纵轴表示组距频率,即小长方形的高=组距频率; b.小长方形的面积=组距×组距频率=频率; c.数据落在各小组内的频率用各小长方形的面积表示,各小长方形的面积总和等于1.②频率分布折线图a.频率分布折线图:连接频率分布直方图中各小长方形上端的中点,就得到频率分布折线图;b.总体密度曲线:随着样本容量的增加,作图时所分组数不断增多,组距减小,相应的频率分布折线图会越来越接近一条光滑曲线,即总体密度曲线。
③茎叶图的特点茎是指中间的一列数,通常为十位;叶是从茎的旁边生长出来的数,通常为个位。
(2)用样本的数字特征估计总体的数字特征①平均数、中位数、众数 数字特征 样本数据 平均数样本数据的算数平均数 中位数将数据按大小顺序依次排列, 处在最中间位置的一个数据(或最中间两个数据的平均数) 众数出现次数最多的数据②样本方差与标准差设样本的元素为n x x x ,,,21 ,样本的平均数为x ,则a.样本方差:()()()[]2222121s x x x x x x nn -++-+-= b.样本标准差: ()()()[]222211s x x x x x x n n -++-+-=③关于平均数、方差的有关性质a.若n x x x ,,,21 的平均数为x ,则a ,,,21+++n mx a mx a mx 的平均数为a x m +;b.若n x x x ,,,21 的方差为s 2,则a ,,,21+++n mx a mx a mx 的方差为22m s 。
抽样方法与总体分布的估计
![抽样方法与总体分布的估计](https://img.taocdn.com/s3/m/3efadd804128915f804d2b160b4e767f5bcf8052.png)
抽样方法与总体分布的估计在统计学中,抽样是指从总体中选取一部分个体进行观察和测量的过程。
抽样方法的选择是统计研究的重要环节,将直接影响到对总体分布的估计。
抽样方法一般分为概率抽样和非概率抽样两种。
概率抽样是指以确定的概率规则随机抽取样本,每个个体有确定的概率被选中,如简单随机抽样、分层抽样和系统抽样等。
非概率抽样是指个体被选入样本的概率不可确定,无法通过概率规则进行抽样,如方便抽样、判断抽样和定额抽样等。
简单随机抽样是一种常用的概率抽样方法,即从总体中抽取n个个体,每个个体被选中的概率相等。
简单随机抽样可以保证样本与总体之间的代表性,并且可以应用于任何样本容量的情况。
分层抽样则是将总体分成若干个层次,然后从各个层次中分别进行简单随机抽样。
这种方法可以保证各个层次在样本中的比例与总体中的比例相同,适用于当总体具有明显的层次结构时。
系统抽样是指按照一定间隔从总体中随机选择一个个体作为初始个体,然后以固定的间隔选择后续的个体,直到达到样本容量。
概率抽样方法是基于随机性的,可以使得抽样结果具有代表性,从而可以通过对样本数据的分析来推断总体的特征。
在进行总体分布的估计时,可以利用样本数据的统计量,如样本均值、样本方差等,对总体参数进行估计。
利用抽样数据进行总体分布的估计是统计学中的重要内容,旨在通过样本数据来推断总体的分布特征。
常见的对总体分布的估计方法包括点估计和区间估计。
点估计是指通过样本数据得到总体参数的一个估计值,常用的点估计方法包括最大似然估计和矩估计等。
最大似然估计是基于样本数据的似然函数,通过使似然函数最大化来得到总体参数的估计值。
矩估计是通过样本矩的特征来估计总体参数,如样本均值、样本方差等。
点估计方法可以对总体的分布参数进行估计,但无法提供估计值的准确度信息。
区间估计是对总体参数进行估计时,给出一个区间范围,该范围内有一定的置信度包含总体参数的真值。
常见的区间估计方法包括置信区间法和预测区间法。
12.3 抽样方法、总体分布的估计
![12.3 抽样方法、总体分布的估计](https://img.taocdn.com/s3/m/677b02ec9ec3d5bbfd0a74ac.png)
那么频率分布直方图就会无限接近于一条光滑曲线 ——总体密度曲线.总体密度曲线反映了总体分布, 即反映了总体在各个范围内取值的 百分比 .
基础自测
1.在简单随机抽样中,某一个个体被抽到的可能性 ( C ) A.与第几次抽样有关,第一次抽到的可能性最大 B.与第几次抽样有关,第一次抽到的可能性最小 C.与第几次抽样无关,每一次抽到的可能性相等 D.与第几次抽样无关,与抽取几个样本有关
解析 ①中总体由差异明显的几部分构成,宜采用分 层抽样法,②中总体中的个体数较少,宜采用简单随 机抽样法.
3.(2009· 陕西文,5)某单位共有老、中、青职工 430 人,其中有青年职工 160 人,中年职工人数是老年 职工人数的 2 倍.为了解职工身体状况,现采用分 层抽样方法进行调查,在抽取的样本中有青年职工 32 人,则该样本中的老年职工人数为( B ) A. 9 B.18 C.27 D.36
(2)不同层次的人员情况有明显差异,故采用分层抽 样.
解
用分层抽样方法抽取.
具体实施抽取如下: (1)∵20∶100=1∶5, 10 70 20 ∴ 5 =2, 5 =14, 5 =4, ∴从副处级以上干部中抽取 2 人,从一般干部中抽取 14 人,从工人中抽取 4 人. (2)因副处级以上干部与工人的人数较少, 他们分别按 1~10 编号与 1~20 编号,然后采用抽签法分别抽取 2 人和 4 人;对一般干部 70 人采用 00,01,02,…,69 编号,然后用随机数表法抽取 14 人. (3)将 2 人,4 人,14 人的编号汇合在一起就取得了容 量为 20 的样本.
§12.3
抽样方法、总体分布的估计 基础知识 自主学习
要点梳理
1.抽样方法 (1)简单随机抽样 ①定义:设一个总体含有 N 个个体,从中 逐个不
第1讲抽样方法与总体分布的估计
![第1讲抽样方法与总体分布的估计](https://img.taocdn.com/s3/m/dbef2d8beefdc8d377ee328d.png)
• 【真题探究】► (2012·江苏)某学校高一、高二、高三年 级的学生人数之比为3∶3∶4,现用分层抽样的方法从该 校高中三个年级的学生中抽取容量为50的样本,则应从 高二年级抽取________名学生. [教你审题] 一审 等比例性质; 二审 抽取的样本容量.
•[答案] 15
• 【试一试】 (2013·徐州模拟)从某小学随机抽取100名同 学,这些同学身高都不低于100厘米,将他们的身高(单 位:厘米)数据绘制成频率分布直方图(如图).现用分层 抽样的方法从身高在[120,130),[130,140),[140,150]三 组学生中,选取18人参加一项活动,则从身高在 [140,150]内的学生中选取的人数应为________.
•(1)求这次铅球测试成绩合格的人数; •(2)若由直方图来估计这组数据的中位数,指出该中位数 在第几组内,并说明理由.
•考向三 用样本的数字特征估计总体的数字特征
•【例3】►甲乙二人参加某体育项目训练,近期的五次测试 • 成绩得分情况如图.
(1)分别求出两人得分的平均数与方差; (2)根据图和上面算得的结果,对两人的训练成绩作出评价. [审题视点] (1)先通过图象统计出甲、乙二人的成绩; (2)利用公式求出平均数、方差,再分析两人的成绩,作出评 价.
[审题视点] 因为802不能整除80,为了保证“等距”分段,应 先剔除2个个体.
•第三步:从第1段即1,2,…,10这10个编号中,用简单随 机抽样的方法抽取一个编号(如5)作为起始编号; •第四步:从5开始,再将编号为15,25,…,795的个体抽 出,得到一个容量为80的样本.
解决系统抽样问题的两个关键步骤为: (1)分段的方法应依据抽取的样本容量而定,即根据定义每 段抽取一个样本. (2)起始编号的确定应用简单随机抽样的方法,一旦起始编 号确定,其他编号便随之确定了.
抽样方法与总体分布的估计
![抽样方法与总体分布的估计](https://img.taocdn.com/s3/m/d09dd9820b4c2e3f56276333.png)
§11.5 抽样方法与总体分布的估计
知识清单
考点一 随机抽样 1.简单随机抽样 (1)定义:一般地,设一个总体含有N个个体,从中逐个① 不放
回 地抽 取n个个体作为样本(n≤N),如果每次抽取时各个个体被抽到的机
会都 相等,就把这种抽样方法叫做简单随机抽样. (2)最常用的简单随机抽样方法有两种:随机数法和抽签法.
2 3 7 3 3 3 111
5 10 10 500 125
(2)根据题意5,年1龄0 分10别为5 4110岁,4170岁5,5030岁的教师过关的概率分别为 , ,
300
∴p= =0.65,第四组共有1 000×0.15=150人,∴a=150×0.4=60,
23
第五组共有1 000×0.1=100人,∴q=30÷100=0.3.
5 10
3
10
综上,a=60,3p=07.65,q7=0.31.47
2 7 7 3 3 7 224 56
5 10 10 500
5 10 10
6 z 2y,
若用分层抽样的 y方2 法6抽(z 取61),2个观测点的数据,则容城应抽取的数据个数 为12× =4,故选C.
12 6 12 18
方法 2 频率分布直方图的应用
用频率分布直方图解决相关问题时,应正确理解图中各个量的意义,识 图掌握信息是解决该类问题的关键.频率分布直方图有以下几个特点: (1)纵轴表示频率/组距;(2)频率分布直方图中各小长方形高的比就是相 应各组的频率之比;(3)直方图中各小长方形的面积是相应各组的频率, 所有的小长方形的面积之和等于1,即频率之和为1.
考点二 用样本估计总体 1.频率分布表:把反映总体频率分布的表格称为频率分布表. 2.频率分布直方图:能够反映样本的频率分布规律的直方图. 3.频率分布折线图:将频率分布直方图中各相邻的矩形的上底边的
11.4 抽样方法与总体分布的估计
![11.4 抽样方法与总体分布的估计](https://img.taocdn.com/s3/m/2d1fe1454a7302768f993935.png)
11.4 抽样方法与总体分布的估计挖命题【考情探究】考点内容解读5年考情预测热度考题示例考向关联考点1.随机抽样①理解随机抽样的必要性和重要性.②会用简单随机抽样方法从总体中抽取样本;了解分层抽样和系统抽样方法2017江苏,3,5分分层抽样★★★2.用样本估计总体①了解分布的意义和作用,会列频率分布表、会画频率分布直方图、频率折线图、茎叶图,理解它们各自的特点.②理解样本数据标准差的意义和作用,会计算数据标准差.③能从样本数据中提取基本的数字特征(如平均数、标准差),并给出合理的解释.④会用样本的频率分布估计总体分布,会用样本的基本数字特征估计总体的基本数字特征,理解用样本估计总体的思想⑤会用随机抽样的基本方法和样本估计总体的思想解决一些简单的实际问题2018课标Ⅰ,3,5分统计图中的扇形图2018课标Ⅲ,18,12分茎叶图的应用统计案例2018课标Ⅱ,18,12分折线图的应用变量间的相关关系2017课标Ⅰ,19,12分样本平均数和标准差的应用正态分布2017课标Ⅱ,18,12分利用频率分布直方图求中位数的估计值独立性检验2015课标Ⅱ,18,12分茎叶图的绘制和应用用频率估计概率分析解读对于随机抽样,主要考查三种抽样方法,尤其是分层抽样和系统抽样,一般以选择题或填空题的形式出现;对于用样本估计总体,主要考查利用频率分布直方图、茎叶图、样本的数字特征估计总体,若单独命题一般以选择题或填空题的形式出现,分值约为5分,属容易题;也常出现在解答题中,分值约为12分,属中档题.考查学生的数据分析能力和逻辑推理能力.破考点【考点集训】考点一随机抽样1.(2018福建福州3月质量检测,2)为了解某地区的“微信健步走”活动情况,拟从该地区的人群中抽取部分人员进行调查,事先已了解到该地区老、中、青三个年龄段人员的“微信健步走”活动情况有较大差异,而男女“微信健步走”活动情况差异不大.在下面的抽样方法中,最合理的抽样方法是( )A.简单随机抽样B.按性别分层抽样C.按年龄段分层抽样D.系统抽样答案 C2.在简单随机抽样中,某一个个体被抽到的可能性( )A.与第n次有关,第一次可能性最大B.与第n次有关,第一次可能性最小C.与第n次无关,与抽取的第n个样本有关D.与第n次无关,每次可能性相等答案 D考点二用样本估计总体1.(2018广东茂名五大联盟学校3月联考,2)甲、乙两组数的数据如茎叶图所示,则甲、乙的平均数、方差、极差及中位数相同的是( )A.极差B.方差C.平均数D.中位数答案 C2.(2017安徽淮北第二次模拟,4)为比较甲乙两地某月11时的气温情况,随机选取该月5天11时的气温数据(单位:℃)制成如图所示的茎叶图,已知甲地该月11时的平均气温比乙地该月11时的平均气温高1℃,则甲地该月11时的平均气温的标准差为( )甲乙9 82 6 8 92 m 03 1 1A.2B.√2C.10D.√10答案 B3.(2017山西大学附属中学第二次模拟,3)某高二(1)班一次阶段性考试数学成绩的茎叶图和频率分布直方图可见部分如图,根据图中的信息,可确定被抽测的人数及分数在[90,100]内的人数分别为( )A.20,2B.24,4C.25,2D.25,4答案 C炼技法【方法集训】方法1 抽样方法的选择1.(2017安徽宣城二模,3)一支田径队共有运动员98人,其中女运动员42人,用分层抽样的,则男运动员应抽取( )方法抽取一个样本,每名运动员被抽到的概率都是27A.18人B.16人C.14人D.12人答案 B2.一个总体中有100个个体,随机编号为0,1,2,…,99.依编号顺序平均分成10个小组,组号依次为一,二,三,…,十.现用系统抽样方法抽取一个容量为10的样本,如果在第一组随机抽取的号码为m,那么在第k组中抽取的号码个位数字与m+k的个位数字相同.若m=6,则在第七组中抽取的号码是( )A.63B.64C.65D.66答案 A方法2 频率分布直方图的应用1.(2018陕西榆林第二中学模拟,13)某学校为了调查学生在学科教辅书方面的支出情况,抽出了一个容量为n的样本,其频率分布直方图如图所示,其中支出的钱数在[30,40)的同学比支出的钱数在[10,20)的同学多26人,则n的值为.答案1002.(2018安徽马鞍山第一次教学质量检测,13)已知样本容量为200,在样本的频率分布直方,则该组图中,共有n个小矩形,若中间一个小矩形的面积等于其余(n-1)个小矩形面积和的13的频数为.答案50方法3 样本的数字特征及其应用1.(2017广东广雅中学、江西南昌二中联考,4)某市重点中学奥数培训班共有14人,分为两个小组,在一次阶段性考试中两个小组成绩的茎叶图如图所示,其中甲组学生成绩的平均数是88,乙组学生成绩的中位数是89,则m+n的值是( )甲组乙组8796 4 88 3 n 85 m 29 2 2 5A.10B.11C.12D.13答案 C2.(2018山东济南一模,3)已知某7个数的平均数为4,方差为2,现加入一个新数据4,此时这8个数的平均数为x,方差为s2,则( )A.x=4,s2<2B.x=4,s2>2 x>4,s2<2 D.x>4,s2>2过专题【高考】A组统一命题·课标卷题组1.(2018课标Ⅰ,3,5分)某地区经过一年的新农村建设,农村的经济收入增加了一倍,实现翻番.为更好地了解该地区农村的经济收入变化情况,统计了该地区新农村建设前后农村的经济收入构成比例,得到如下饼图:则下面结论中不正确的是( )A.新农村建设后,种植收入减少B.新农村建设后,其他收入增加了一倍以上C.新农村建设后,养殖收入增加了一倍D.新农村建设后,养殖收入与第三产业收入的总和超过了经济收入的一半答案 A2.(2017课标Ⅲ,3,5分)某城市为了解游客人数的变化规律,提高旅游服务质量,收集并整理了2014年1月至2016年12月期间月接待游客量(单位:万人)的数据,绘制了下面的折线图.根据该折线图,下列结论错误的是( )A.月接待游客量逐月增加B.年接待游客量逐年增加C.各年的月接待游客量高峰期大致在7,8月D.各年1月至6月的月接待游客量相对于7月至12月,波动性更小,变化比较平稳3.(2015课标Ⅱ,18,12分)某公司为了解用户对其产品的满意度,从A,B两地区分别随机调查了20个用户,得到用户对产品的满意度评分如下:A地区: 62 73 81 92 95 85 74 64 53 7678 86 95 66 97 78 88 82 76 89B地区: 73 83 62 51 91 46 53 73 64 8293 48 65 81 74 56 54 76 65 79(1)根据两组数据完成两地区用户满意度评分的茎叶图,并通过茎叶图比较两地区满意度评分的平均值及分散程度(不要求计算出具体值,给出结论即可);A地区B地区456789(2)根据用户满意度评分,将用户的满意度从低到高分为三个等级:满意度评分低于70分70分到89分不低于90分满意度等级不满意满意非常满意记事件C:“A地区用户的满意度等级高于B地区用户的满意度等级”.假设两地区用户的评价结果相互独立.根据所给数据,以事件发生的频率作为相应事件发生的概率,求C的概率.解析(1)两地区用户满意度评分的茎叶图如下:A地区B地区4 6 835 1 3 6 46 4 26 2 4 5 56 8 8 6 47 3 3 4 6 939 2 8 6 58 3 2 117 5 5 29 1 3通过茎叶图可以看出,A地区用户满意度评分的平均值高于B地区用户满意度评分的平均值;A地区用户满意度评分比较集中,B地区用户满意度评分比较分散.(2)记C A1表示事件:“A地区用户的满意度等级为满意或非常满意”;C A2表示事件:“A地区用户的满意度等级为非常满意”;C B1表示事件:“B地区用户的满意度等级为不满意”;C B2表示事件:“B地区用户的满意度等级为满意”,则C A1与C B1独立,C A2与C B2独立,C B1与C B2互斥,C=C B1C A1∪C B2C A2. P(C)=P(C B1C A1∪C B2C A2)=P(C B1C A1)+P(C B2C A2)=P(C B1)P(C A1)+P(C B2)P(C A2).由所给数据得C A1,C A2,C B1,C B2发生的频率分别为1620,420,1020,820,故P(C A1)=1620,P(C A2)=420,P(C B1)=1020,P(C B2)=820,P(C)=1020×1620+820×420=0.48.思路分析(1)将A、B地区数据逐一填入茎叶图,然后通过茎叶图作比较.(2)设出事件且指明事件间的关系,利用相应概率公式得结论.B组自主命题·省(区、市)卷题组考点一随机抽样1.(2014湖南,2,5分)对一个容量为N的总体抽取容量为n的样本,当选取简单随机抽样、系统抽样和分层抽样三种不同方法抽取样本时,总体中每个个体被抽中的概率分别为p1,p2,p3,则( )A.p1=p2<p3B.p2=p3<p1C.p1=p3<p2D.p1=p2=p3答案 D2.(2017江苏,3,5分)某工厂生产甲、乙、丙、丁四种不同型号的产品,产量分别为200,400,300,100件.为检验产品的质量,现用分层抽样的方法从以上所有的产品中抽取60件进行检验,则应从丙种型号的产品中抽取件.答案183.(2015湖南,13,5分)在一次马拉松比赛中,35名运动员的成绩(单位:分钟)的茎叶图如图所示.若将运动员按成绩由好到差编为1~35号,再用系统抽样方法从中抽取7人,则其中成绩在区间[139,151]上的运动员人数是.答案4考点二用样本估计总体1.(2016山东,3,5分)某高校调查了200名学生每周的自习时间(单位:小时),制成了如图所示的频率分布直方图,其中自习时间的范围是[17.5,30],样本数据分组为[17.5,20),[20,22.5),[22.5,25),[25,27.5),[27.5,30].根据直方图,这200名学生中每周的自习时间不少于22.5小时的人数是( )A.56B.60C.120D.140答案 D2.(2015安徽,6,5分)若样本数据x1,x2,…,x10的标准差为8,则数据2x1-1,2x2-1,…,2x10-1的标准差为( )A.8B.15C.16D.32答案 C3.(2016江苏,4,5分)已知一组数据4.7,4.8,5.1,5.4,5.5,则该组数据的方差是.答案0.14.(2016四川,16,12分)我国是世界上严重缺水的国家,某市政府为了鼓励居民节约用水,计划调整居民生活用水收费方案,拟确定一个合理的月用水量标准x(吨),一位居民的月用水量不超过x的部分按平价收费,超出x的部分按议价收费.为了了解居民用水情况,通过抽样,获得了某年100位居民每人的月均用水量(单位:吨),将数据按照[0,0.5),[0.5,1),…,[4,4.5]分成9组,制成了如图所示的频率分布直方图.(1)求直方图中a的值;(2)设该市有30万居民,估计全市居民中月均用水量不低于3吨的人数,并说明理由;(3)若该市政府希望使85%的居民每月的用水量不超过标准x(吨),估计x的值,并说明理由.解析(1)由频率分布直方图知,月均用水量在[0,0.5)中的频率为0.08×0.5=0.04,同理,在[0.5,1),[1.5,2),[2,2.5),[3,3.5),[3.5,4),[4,4.5)中的频率分别为0.08,0.20,0.26,0.06,0.04,0.02.由0.04+0.08+0.5×a+0.20+0.26+0.5×a+0.06+0.04+0.02=1,解得a=0.30.(2)由(1),100位居民每人月均用水量不低于3吨的频率为0.06+0.04+0.02=0.12.由以上样本的频率分布,可以估计全市30万居民中月均用水量不低于3吨的人数为300 000×0.12=36000.(3)因为前6组的频率之和为0.04+0.08+0.15+0.20+0.26+0.15=0.88>0.85,而前5组的频率之和为0.04+0.08+0.15+0.20+0.26=0.73<0.85,所以2.5≤x<3.由0.3×(x-2.5)=0.85-0.73,解得x=2.9.所以,估计月用水量标准为2.9吨时,85%的居民每月的用水量不超过标准.思路分析由图易知组距为0.5,再由频率之和等于1即可求出a;由图可知前6组的频率之和为0.88>0.85,前5组的频率之和为0.73<0.85,说明x∈[2.5,3),再由0.3×(x-2.5)=0.85-0.73即可求出x.C组教师专用题组1.(2015湖北,2,5分)我国古代数学名著《数书九章》有“米谷粒分”题:粮仓开仓收粮,有人送来米1534石,验得米内夹谷,抽样取米一把,数得254粒内夹谷28粒,则这批米内夹谷约为( )A.134石B.169石C.338石D.1365石答案 B2.(2015陕西,2,5分)某中学初中部共有110名教师,高中部共有150名教师,其性别比例如图所示,则该校女教师的人数为( )A.167B.137C.123D.93答案 B3.(2015课标Ⅱ,3,5分,0.782)根据下面给出的2004年至2013年我国二氧化硫年排放量(单位:万吨)柱形图,以下结论中不正确的是( )A.逐年比较,2008年减少二氧化硫排放量的效果最显著B.2007年我国治理二氧化硫排放显现成效C.2006年以来我国二氧化硫年排放量呈减少趋势D.2006年以来我国二氧化硫年排放量与年份正相关答案 D4.(2015重庆,3,5分)重庆市2013年各月的平均气温(℃)数据的茎叶图如下:0891258200338312则这组数据的中位数是( )A.19B.20C.21.5D.23答案 B5.(2014广东,6,5分)已知某地区中小学生人数和近视情况分别如图1和图2所示.为了解该地区中小学生的近视形成原因,用分层抽样的方法抽取2%的学生进行调查,则样本容量和抽取的高中生近视人数分别为( )图1图2A.200,20B.100,20C.200,10D.100,10答案 A6.(2014山东,7,5分)为了研究某药品的疗效,选取若干名志愿者进行临床试验.所有志愿者的舒张压数据(单位:kPa)的分组区间为[12,13),[13,14),[14,15),[15,16),[16,17],将其按从左到右的顺序分别编号为第一组,第二组,……,第五组.如图是根据试验数据制成的频率分布直方图.已知第一组与第二组共有20人,第三组中没有疗效的有6人,则第三组中有疗效的人数为( )A.6B.8C.12D.18答案 C7.(2015江苏,2,5分)已知一组数据4,6,5,8,7,6,那么这组数据的平均数为.答案68.(2014天津,9,5分)某大学为了解在校本科生对参加某项社会实践活动的意向,拟采用分层抽样的方法,从该校四个年级的本科生中抽取一个容量为300的样本进行调查.已知该校一年级、二年级、级、四年级的本科生人数之比为4∶5∶5∶6,则应从一年级本科生中抽取名学生.答案609.(2014江苏,6,5分)为了了解一片经济林的生长情况,随机抽测了其中60株树木的底部周长(单位:cm),所得数据均在区间[80,130]上,其频率分布直方图如图所示,则在抽测的60株树木中,有株树木的底部周长小于100cm.答案2410.(2015广东,17,12分)某工厂36名工人的年龄数据如下表.工人编号年龄工人编号年龄工人编号年龄工人编号年龄140103619272834244113120432939340123821413043441133922373138533144323343242640154524423353745163925373437842173826443549943183627423639(1)用系统抽样法从36名工人中抽取容量为9的样本,且在第一分段里用随机抽样法抽到的年龄数据为44,列出样本的年龄数据;(2)计算(1)中样本的均值x和方差s2;(3)36名工人中年龄在x-s与x+s之间有多少人?所占的百分比是多少(精确到0.01%)?解析(1)由系统抽样,将36名工人分为9组(4人一组),每组抽取一名工人.因为在第一分段里抽到的是年龄为44的工人,即编号为2的工人,故所抽样本的年龄数据为44,40,36,43,36,37,44,43,37.=40;(2)均值x=44+40+36+43+36+37+44+43+379方差×[(44-40)2+(40-40)2+(36-40)2+(43-40)2+(36-40)2+(37-40)2+(44-40)2+(43-40)2+(37-s2=1940)2]=100.9(3)由(2)可知s=103.由题意,年龄在(40-103,40+103)内的工人共有23人,所占的百分比为2336×100%≈63.89%.11.(2014广东,17,13分)随机观测生产某种零件的某工厂25名工人的日加工零件数(单位:件),获得数据如下:30,42,41,36,44,40,37,37,25,45,29,43,31,36,49,34,33,43,38,42,32,34,46,39,36.根据上述数据得到样本的频率分布表如下:分组频数频率[25,30]30.12(30,35]50.20(35,40]80.32(40,45]n1f1(45,50]n2f2(1)确定样本频率分布表中n1,n2,f1和f2的值;(2)根据上述频率分布表,画出样本频率分布直方图;(3)根据样本频率分布直方图,求在该厂任取4人,至少有1人的日加工零件数落在区间(30,35]的概率.解析(1)n1=7,n2=2,f1=0.28,f2=0.08.(2)样本频率分布直方图如图所示.(3)根据样本频率分布直方图,得每人的日加工零件数落在区间(30,35]的概率为0.2,设所取的4人中,日加工零件数落在区间(30,35]的人数为ξ,则ξ~B(4,0.2),P(ξ≥1)=1-P(ξ=0)=1-(1-0.2)4=1-0.4096=0.5904,所以4人中,至少有1人的日加工零件数落在区间(30,35]的概率为0.5904.【模拟】一、选择题(每小题5分,共30分)1.(2019届全国Ⅰ卷高三五省优创名校联考,3)图1为某省2018年1~4月快递业务量统计图,图2是该省2018年1~4月快递业务收入统计图,下列对统计图理解错误的是( )A.2018年1~4月的业务量,3月最高,2月最低,差值接近2000万件B.2018年1~4月的业务量同比增长率均超过50%,在3月最高C.从两图来看,2018年1~4月中的同一个月的快递业务量与收入的同比增长率并不完全一致D.从1~4月来看,该公司2018年快递业务收入同比增长率逐月增长答案 D2.(2019届河南名校联盟“尖子生”调研考试(二),5)为了测试小班教学的实践效果,王老师对A、B两班的学生进行了阶段测试,并将所得成绩统计成茎叶图.记本次测试中,A、B两班学生的平均成绩分别为x A,x B,A、B两班学生成绩的方差分别为s A2,s B2,则观察茎叶图可知( )A.x A<x B,s A2<s B2B.x A>x B,s A2<s B2C.x A<x B,s A2>s B2D.x A>x B,s A2>s B2答案 B3.(2018山东济南外国语学校12月考试,4)给出下列四个命题:①将A,B,C三种个体按3∶1∶2的比例分层抽样调查,若抽取的A个体的个体数为12个,则样本容量为30;②一组数据1、2、3、4、5的平均数、中位数相同;③甲组数据的方差为5,乙组数据为5、6、9、10、5,那么这两组数据中较稳定的是甲;④统计的10个样本数据为95,105,114,116,120,120,122,125,130,134,则样本数据落在[114.5,124.5]内的频率为0.4.其中真命题为( )A.①②B.②③C.③④D.②④答案 D4.(2018湖北部分重点中学模拟,3)某商场对某一商品搞活动,已知该商品每一个的进价为3元,销售价为8元,每天售出的第20个及之后的半价出售.该商场统计了近10天这种商品的销量,如图所示,设x(个)为每天商品的销量,y(元)为该商场每天销售这种商品的利润.从日利润不少于96元的几天里任选2天,则选出的这2天日利润都是97元的概率为( )A.19B.110C.15D.18答案 B5.(2018湖北襄阳四校4月联考,7)某种产品的质量以其质量指标值来衡量,质量指标值越大表明质量越好,且质量指标值大于或等于100的产品为优质产品.现用两种新配方(分别称为A配方和B配方)做试验,各生产了100件这种产品,并测量了每件产品的质量指标值(都在区间[90,110]内),将这些数据分成4组:[90,95),[95,100),[100,105),[105,110],得到如下两个频率分布直方图:已知这2种配方生产的产品利润y(单位:百元)与其质量指标值t的关系式均为{-1,t <95,0,95≤t <100,1,100≤t <105,2,t ≥105.若以上面数据的频率作为概率,分别从用A 配方和B 配方生产的产品中随机抽取一件,且抽取这两件产品相互独立,则抽得的这两件产品利润之和为0的概率为( )A.0.125B.0.195C.0.215D.0.235 答案 B6.(2018湖南衡阳二模,4)已知样本x 1,x 2,…,x n 的平均数为x,样本y 1,y 2,…,y m 的平均数为y(x ≠y),若样本x 1,x 2,…,x n ,y 1,y 2,…,y m 的平均数z=ax+(1-a)y,其中0<a<12,则n,m(n,m ∈N *)的大小关系为( )A.n=mB.n ≥mC.n<mD.n>m 答案 C二、填空题(每小题5分,共10分)7.(2019届广东中山一中等七校联合体高三第二次(11月)联考,14)假设要考察某公司生产的狂犬疫苗的剂量是否达标,现从500支疫苗中抽取50支进行检验,利用随机数表抽取样本时,先将500支疫苗按000,001,…,499进行编号,如果从随机数表的第7行第8列的数开始向右读,则第3支疫苗的编号 . (下面摘取了随机数表的第7行至第9行)84 42 17 53 31 57 24 55 06 88 77 04 74 47 67 21 76 33 50 25 83 92 12 06 76(第7行) 63 01 63 78 59 16 95 56 67 19 98 10 50 71 75 12 86 73 58 07 44 39 52 38 79(第8行) 33 21 12 34 29 78 64 56 07 82 52 42 07 44 38 15 51 00 13 42 99 66 02 79 54(第9行) 答案 0688.(2017湖南长沙一模,14)空气质量指数(Air Quality Index,简称AQI)是定量描述空气质量状况的指数,空气质量按照AQI 大小分为六级,0~50为优;51~100为良;101~150为轻度污染;151~200为中度污染;201~300为重度污染;大于300为严重污染.从某地一环保人士某年的AQI 记录数据中,随机抽取10个,用茎叶图记录如下.根据该统计数据,估计此地该年AQI 大于100的天数约为 .(该年为365天)4 5 5 0 7 5 4 9 3 011 7 8 19 9 215答案 146三、解答题(共25分)9.(2019届四川成都高新区10月月考,18)高新区某高中德育处为了调查学生对“一带一路”的关注情况,在全校组织了“一带一路知多少”的知识问卷测试,并从中随机抽取了12份问卷,得到其测试成绩(百分制)的茎叶图如下:(1)写出该样本的中位数,若该校共有3 000名学生,试估计该校测试成绩在70分以上的人数;(2)从所抽取的70分以上的学生中再随机选取4人,用ξ表示测试成绩在80分以上的人数,求ξ的分布列和数学期望.解析 (1)由茎叶图可得中位数为76,样本中70分以上的学生所占比为812=23,故可估计该校测试成绩在70分以上的学生人数为3 000×23=2 000.(2)由题意可得ξ的可能取值为0,1,2,3,4. P(ξ=0)=C 40C 44C 84=170,P(ξ=1)=C 41C 43C 84=1670=835,P(ξ=2)=C 42C 42C 84=1835,P(ξ=3)=C 43C 41C 84=835,P(ξ=4)=C 44C 4C 84=170.∴ξ的分布列为ξ 01234P1708351835835170∴E(ξ)=0×170+1×835+2×1835+3×835+4×170=2.思路分析 (1)根据茎叶图中的数据可得中位数,然后根据样本中70分以上的学生所占的比例可得总体中70分以上的人数.(2)根据题意得到ξ的可能取值,分别求出对应的概率进而得到分布列,然后可得期望.10.(2018江西新余二模,18)“一带一路”是“丝绸之路经济带”和“21世纪海上丝绸之路”的简称.某市为了了解人们对“一带一路”的认知程度,对不同年龄和不同职业的人举办了一次“一带一路”知识竞赛,满分为100分(90分及以上为认知程度高).现从参赛者中抽取了x人,按年龄分成5组,第一组:[20,25),第二组:[25,30),第三组:[30,35),第四组:[35,40),第五组:[40,45),得到如图所示的频率分布直方图,已知第一组有6人.(1)求x;(2)求抽取的x人的年龄的中位数(结果保留整数);(3)从该市大学生、军人、医务人员、工人、个体户,五种人中用分层抽样的方法依次抽取6人,42人,36人,24人,12人,分别记为1~5组,从这5个按年龄分的组和5个按职业分的组中每组各选派1人参加知识竞赛,分别代表相应组的成绩,年龄组中1~5组的成绩分别为93,96,97,94,90,职业组中1~5组的成绩分别为93,98,94,95,90.(i)分别求5个年龄组和5个职业组成绩的平均数和方差;(ii)以上述数据为依据,评价5个年龄组和5个职业组对“一带一路”的认知程度,并谈谈你的感想.解析(1)根据频率分布直方图得第一组的频率为0.01×5=0.05,∴6=0.05,∴x=120.x(2)设中位数为a,则0.01×5+0.07×5+(a-30)×0.06=0.5,≈32,则中位数为32.∴a=953(3)(i)5个年龄组成绩的平均数为x1=1×(93+96+97+94+90)=94,方差为5s12=1×[(-1)2+22+32+02+(-4)2]=6.55个职业组成绩的平均数为x2=1×(93+98+94+95+90)=94,方差为5s22=1×[(-1)2+42+02+12+(-4)2]=6.8.5(ii)从平均数来看两组的认知程度相同,从方差来看年龄组的认知程度更稳定.(感想合理即可)。
抽样方法与总体分布的估计
![抽样方法与总体分布的估计](https://img.taocdn.com/s3/m/a2bc147c66ec102de2bd960590c69ec3d4bbdb78.png)
抽样方法与总体分布的估计概述:抽样是统计学中非常重要的概念,它可以帮助我们从一个庞大的总体中选择出一部分个体,从而对总体的特征进行推断和估计。
在实际应用中,我们很难对整个总体进行研究,因此抽样方法能够帮助我们通过研究抽取的样本来对总体进行估计和推断。
抽样方法:1.简单随机抽样:简单随机抽样是指从总体中随机地选择一部分个体作为样本,每个个体被选中的概率是相等的。
这种抽样方法能够减少主观因素的干扰,得到较为可靠的估计结果。
2.分层抽样:分层抽样是将总体分成若干个互不重叠的子总体,然后在每个子总体中进行简单随机抽样。
这样可以保证样本的代表性,并且可以在不同子总体中设置不同的抽样比例,更好地反映总体的各个特征。
3.系统抽样:系统抽样是按照一定的规则从总体中选择个体作为样本,例如每隔k个个体选取一个个体。
这种抽样方法适用于总体中个体之间的顺序关系比较明显,具有方便和高效的特点。
4.整群抽样:整群抽样是将总体划分为若干个群体,然后随机地选择几个群体,对选择的群体进行抽样。
这种抽样方法在样本容量较小时,能够减少抽样误差,提高估计结果的可靠性。
总体分布的估计:估计总体分布是指通过样本推断总体的概率分布情况。
常见的总体分布估计方法有以下几种:1.参数估计:根据样本统计量的分布特征,推断总体分布中的参数值。
例如,通过样本均值来估计总体均值,通过样本方差来估计总体方差等。
2.核密度估计:核密度估计通过考虑每个样本点附近一定范围内的密度来估计总体分布的概率密度函数。
该方法可以克服一些分布假设的限制,更加灵活地估计总体分布。
3.经验分布函数:经验分布函数通过计算累积概率来估计总体的分布。
该方法不对总体的具体分布形式进行假设,适用于对总体分布不了解或不确定的情况。
4.模型拟合:模型拟合是指将已知的概率分布模型与样本进行拟合,从而得到总体的估计分布。
常用的拟合方法包括最大似然估计和贝叶斯估计等。
总结:抽样方法和总体分布的估计是统计学中重要的内容。
§5抽样方法与总体分布的估计
![§5抽样方法与总体分布的估计](https://img.taocdn.com/s3/m/13407d2711a6f524ccbff121dd36a32d7375c7b8.png)
§5抽样方法与总体分布的估计抽样方法与总体分布的估计是统计学中一个重要的概念和技术。
它涉及到从总体中选择一个样本来推断总体特征的过程。
本文将介绍抽样方法的基本原理、常用的抽样方法以及如何使用抽样方法来估计总体分布。
一、抽样方法的基本原理抽样方法是通过从总体中选择一个样本来推断总体特征的方法。
它的基本原理是假设从总体中选择一个具有代表性的样本,样本中的个体与总体中的个体具有相似的特征。
通过对样本数据的统计分析,可以得出关于总体特征的推断。
抽样方法的基本原理包括以下几个关键概念:1.总体:总体是指研究人群或对象的全体,可以是有界的,也可以是无限的。
2.样本:样本是从总体中选择的一个部分。
样本应该具有代表性,即样本中的个体应该和总体中的个体具有相似的特征。
3.样本容量:样本容量是指样本中包含的个体数量。
样本容量越大,样本的代表性越好,对总体特征的推断也越准确。
4.代表性:样本的代表性是指样本中的个体能够准确反映总体的特点。
抽样方法的选择取决于多种因素,包括总体大小、资源限制、时间限制以及研究目的等。
下面将介绍几种常用的抽样方法。
二、常用的抽样方法1. 简单随机抽样(Simple Random Sampling):简单随机抽样是从总体中以相等的概率独立地抽取样本个体的方法。
这种方法要求每个个体具有相等的机会被选入样本中,使样本具有代表性。
2. 分层抽样(Stratified Sampling):分层抽样将总体分为若干个层级,然后从每个层级中抽取样本。
这种方法可以确保每个层级在样本中的比例与总体中的比例相同。
3. 系统抽样(Systematic Sampling):系统抽样是按照一些固定的规则抽取样本个体的方法。
例如,选择一个起点,然后每隔一定间隔选择一个个体,直到达到所需的样本容量。
4. 整群抽样(Cluster Sampling):整群抽样是将总体分为若干个群组(或簇),然后从每个群组中随机选择一个或多个群组作为样本。
抽样方法跟总体分布的估计
![抽样方法跟总体分布的估计](https://img.taocdn.com/s3/m/a5e7922d793e0912a21614791711cc7930b77846.png)
抽样方法跟总体分布的估计抽样方法是指从总体中选取一部分样本来进行研究或调查的方法,其目的是通过对样本数据的分析,推断或估计总体的特征和参数。
抽样方法的选择对研究的结果至关重要,因为不恰当的抽样方法可能导致样本偏倚,从而使总体的估计结果失真。
常见的抽样方法包括简单随机抽样、分层抽样、整群抽样、系统抽样和多阶段抽样等。
下面对这些方法进行详细说明。
简单随机抽样是从总体中随机选取样本的方法,每个样本都有相同的被选中的概率。
这种方法可以减少样本选择的主观因素,并能够反映总体特征。
但在实际操作过程中,随机选样的困难度较高,需要随机数发生器进行操作。
分层抽样是将总体划分为若干个相互独立的层,并从每个层中随机选取一定数量的样本。
这种抽样方法适用于总体分层特征明显的情况,可以确保每个层都能被充分代表。
整群抽样则是将总体划分为若干个相互不重叠但完全相似的整群,随机选取其中若干群作为样本进行研究。
这种方法适用于总体内群体特征相近的情况,可以减少样本选择的成本。
系统抽样是根据其中一种规律从总体中选取样本,如每隔一定间隔选取一个样本。
这种方法的优势在于实施简单,适用于总体有明显的排列顺序的情况。
多阶段抽样是将总体按照多个层次划分,并在每个层次中随机选择样本。
这种方法适用于总体复杂,样本选择难度大的情况,可以减少样本选择的成本。
抽样方法的选择应根据研究目的、总体属性和可行性来确定。
在进行抽样之前,需要对总体进行充分了解,确定抽样框架,制定合理的抽样方案。
总体分布的估计是通过对样本数据的分析,利用统计模型和方法来推断总体的特征和参数。
常用的估计方法有点估计和区间估计。
点估计是利用样本数据得出总体参数点估计值的方法,常见的点估计方法有最大似然估计、矩估计和贝叶斯估计等。
点估计可以得到总体参数的一个具体估计值,但缺点是无法给出估计值的准确性。
区间估计是利用样本数据得出总体参数区间估计值的方法,常见的区间估计方法有置信区间和可信区间等。
12-06 抽样方法与总体分布的估计
![12-06 抽样方法与总体分布的估计](https://img.taocdn.com/s3/m/1f0f308c83d049649b66582d.png)
12-06 抽样方法与总体分布的估计点一点——明确目标掌握常见的简单抽样方法,理解用样本的频率分布来估计总体的概率分布的基本思想,了解正态分布的简单性质.做一做——热身适应1.一个总体中共有10个个体,用简单随机抽样的方法从中抽取一容量为3的样本,则某特定个体入样的概率是.解析:简单随机抽样中每一个体的入样概率为Nn.答案:1032.(2004年江苏,6)某校为了了解学生的课外阅读情况,随机调查了50名学生,得到他们在某一天各自课外阅读所用时间的数据,结果用下面的条形图表示.根据条形图可得这50名学生这一天平均每人的课外阅读时间为.211时间(h)1.01.5解析:一天平均每人的课外阅读时间应为一天的总阅读时间与学生数的比,即5050.2105.1100.1205.050⨯+⨯+⨯+⨯+⨯=0.9 h.答案:0.9 h3.一个年级有12个班,每个班有50名同学,随机编号为1~50号,为了了解他们在课外的兴趣爱好,要求每班的33号学生留下来参加阅卷调查,这里运用的抽样方法是A.分层抽样法B.抽签法C.随机数表法D.系统抽样法答案:D4.如果随机变量ξ~N(μ,σ2),且Eξ=3,Dξ=1,则P(-1<ξ≤1)等于A.2Φ(1)-1B.Φ(4)-Φ(2)C.Φ(2)-Φ(4)D.Φ(-4)-Φ(-2)解析:对正态分布,μ=Eξ=3,σ2=Dξ=1,故P(-1<ξ≤1)=Φ(1-3)-Φ(-1-3)=Φ(-2)-Φ(-4)=Φ(4)-Φ(2).答案:B理一理——疑难要点1.抽样当总体中的个体较少时,一般可用简单随机抽样;当总体中的个体较多时,一般可用系统抽样;当总体由差异明显的几部分组成时,一般可用分层抽样,而简单随机抽样作为一种最简单的抽样方法,又在其中处于一种非常重要的地位.实施简单随机抽样,主要有两种方法:抽签法和随机数表法.特别提示在三种抽样中,简单随机抽样是最简单、最基本的抽样方法,其他两种抽样方法是建立在它的基础上的.三种抽样方法的共同点是:它们都是等概率抽样,体现了抽样的公平性.三种抽样方法各有其特点和适用范围,在抽样实践中要根据具体情况选用相应的抽样方法.2.样本与总体用样本估计总体是研究统计问题的一种思想方法.当总体中的个体取不同数值很少时,其频率分布表由所取样本的不同数值及其相应的频率来表示,其几何表示就是相应的条形图,当总体中的个体取不同值较多,甚至无限时,其频率分布的研究要通过整理样本数据达到.频率分布随着样本容量的增大更加接近总体分布,当样本容量无限增大且分组的组距无限缩小时,频率分布直方图就会演变成一条光滑曲线——反映总体分布的频率密度曲线,基于频率分布与相应的总体分布的关系,且通常我们并不知道一个总体的分布,因此,我们往往是从总体中抽取一个样本,用样本的频率分布去估计相应的总体分布.用样本估计总体,除在整体上用样本的频率分布去估计总体的分布以外,还可以从特征数上进行估计,即用样本的平均数去估计总体的平均数,用关于样本的方差(标准差)去估计总体的方差(标准差).3.正态分布正态分布在实际生产、生活中有着广泛的应用,很多变量,如测量的误差、产品的尺寸等服从或近似服从正态分布,利用正态分布的有关性质可以对产品进行假设检验.拨一拨——思路方法【例1】 某批零件共160个,其中,一级品48个,二级品64个,三级品32个,等外品16个.从中抽取一个容量为20的样本.请说明分别用简单随机抽样、系统抽样和分层抽样法抽取时总体中的每个个体被取到的概率均相同.剖析:要说明每个个体被取到的概率相同,只需计算出用三种抽样方法抽取个体时,每个个体被取到的概率.解:(1)简单随机抽样法:可采取抽签法,将160个零件按1~160编号,相应地制作1~160号的160个签,从中随机抽20个.显然每个个体被抽到的概率为16020=81.(2)系统抽样法:将160个零件从1至160编上号,按编号顺序分成20组,每组8个.然后在第1组用抽签法随机抽取一个号码,如它是第k 号(1≤k ≤8),则在其余组中分别抽取第k +8n (n =1,2,3,…,19)号,此时每个个体被抽到的概率为81.(3)分层抽样法:按比例16020=81,分别在一级品、二级品、三级品、等外品中抽取48×81=6个,64×81=8个,32×81=4个,16×81=2个,每个个体被抽到的概率分别为486,648,324,162,即都是81.综上可知,无论采取哪种抽样,总体的每个个体被抽到的概率都是81.评述:三种抽样方法的共同点就是每个个体被抽到的概率相同,这样样本的抽取体现了公平性和客观性.思考讨论现有20张奖券,已知只有一张能获奖,甲从中任摸一张,中奖的概率为201,刮开一看没中奖.乙再从余下19张中任摸一张,中奖概率为191,这样说甲、乙中奖的概率不一样,是否正确?【例2】 设有一样本x 1,x 2,…,x n ,其标准差为s x ,另有一样本y 1,y 2,…,y n ,其中y i =3x i +2(i =1,2,…,n ),其标准差为s y ,求证:s y =3s x .证明:∵x =nx x x n++21,∴y =ny y y n++21=nx x x n )23()23()23(21++++++=nnx x x n 2)(321+++ =3x +2.∴s y 2=n1[(y 12+y 22+…+y n 2)-n y 2]=n 1[(3x 1+2)2+(3x 2+2)2+…+(3x n +2)2-n (3x +2)2]=n 1[9(x 12+x 22+…+x n 2)+12(x 1+x 2+…+x n )+4n -n (9x 2+12x +4)] =n9[(x 12+x 22+…+x n 2)-n x 2]=9s x 2.∵s x ≥0,s y ≥0, ∴s y =3s x .【例3】 将温度调节器放置在贮存着某种液体的容器内,调节器设定在d ℃,液体的温度ξ(单位:℃)是一个随机变量,且ξ~N (d ,0.52).(1)若d =90°,求ξ<89的概率; (2)若要保持液体的温度至少为80 ℃的概率不低于0.99,问d 至少是多少?(其中若η~N (0,1),则Φ(2)=P (η<2)=0.9772,Φ(-2.327)=P (η<-2.327)=0.01). 剖析:(1)要求P (ξ<89)=F (89), ∵ξ~N (d ,0.5)不是标准正态分布,而给出的是Φ(2),Φ(-2.327),故需转化为标准正态分布的数值.(2)转化为标准正态分布下的数值求概率p ,再利用p ≥0.99,解d . 解:(1)P (ξ<89)=F (89)=Φ(5.09089-)=Φ(-2)=1-Φ(2)=1-0.9772=0.0228.(2)由已知d 满足0.99≤P (ξ≥80),即1-P (ξ<80)≥1-0.01,∴P (ξ<80)≤0.01. ∴Φ(5.080d -)≤0.01=Φ(-2.327).∴5.080d -≤-2.327.∴d ≤81.1635.故d 至少为81.1635.评述:(1)若ξ~N (0,1),则η=σμξ-~N (0,1).(2)标准正态分布的密度函数f(x )是偶函数,x <0时,f (x )为增函数,x >0时,f (x )为减函数. 深化拓展在实际生活中,常用统计中假设检验的思想检验产品是否合格,方法是:(1)提出统计假设:某种指标服从正态分布N (μ,σ2);(2)确定一次试验中的取值a ;(2)作出统计推断:若a ∈(μ-3σ,μ+3σ),则接受假设,若a ∈(μ-3σ,μ+3σ),则拒绝假设.如:某砖瓦厂生产的砖的“抗断强度”ξ服从正态分布N (30,0.8),质检人员从该厂某一天生产的1000块砖中随机抽查一块,测得它的抗断强度为27.5 kg/cm 2,你认为该厂这天 生产的这批砖是否合格?为什么?分析:由于在一次试验中ξ落在区间(μ-3σ,μ+3σ)内的概率为0.997,故ξ几乎必然落在上述区间内.于是把μ=30,σ=0.8代入,算出区间(μ-3σ,μ+3σ)=(27.6,32.4),而27.5∉(27.6,32.4).∴据此认为这批砖不合格.【例4】 已知测量误差ξ~N (2,100)(cm ),必须进行多少次测量,才能使至少有一次测量误差的绝对值不超过8 cm 的频率大于0.9?解:设η表示n 次测量中绝对误差不超过8 cm 的次数,则η~B (n ,p ). 其中P =P (|ξ|<8)=Φ(1028-)-Φ(1028--)=Φ(0.6)-1+Φ(1)=0.7258-1+0.8413=0.5671.由题意,∵P (η≥1)>0.9,n 应满足P (η≥1)=1-P (η=0)=1-(1-p )n >0.9,∴n >)5671.01lg()9.01lg(--=4329.0lg 1-=2.75.因此,至少要进行3次测量,才能使至少有一次误差的绝对值不超过8 cm 的概率大于0.9.练一练——巩固提高1.对总数为N 的一批零件抽取一个容量为30的样本,若每个零件被抽取的概率为0.25,则N 等于 .解析:∵N30=0.25,∴N =120.答案:1202.(2003年全国,14)某公司生产三种型号的轿车,产量分别为1200辆、6000辆和2000辆,为检验该公司的产品质量,现用分层抽样的方法抽取46辆进行检验,这三种型号的轿车依次应抽取______辆、______辆、______辆.解析:因总轿车数为9200辆,而抽取46辆进行检验,抽样比例为920046=2001,而三种型号的轿车有显著区别.根据分层抽样分为三层按2001比例分别有6辆、30辆、10辆.答案:6 30 103.下图是一样本的频率分布直方图,其中(4,7)内的频数为4,数据在[1,4)∪[7,15)内的频率为__________,样本容量为__________.分析:本题考查一样本在给定区间内的频率及该样本的容量.注意用相应的直方图面积来表示在各个区间内取值的频率时,所有小矩形的面积和等于1.解:在(4,7)内的频率为P 1,且33231=P ,所以P 1=112.所以数据在[1,4)∪[7,15)内的频率为.119设样本容量为n ,则1124=n ,解得n =22.答案:119, 224.设随机变量ξ~N (μ,σ),且P (ξ≤C )=P (ξ>C ),则C 等于 A.0 B.σ C.-μ D.μ 解析:由正态曲线的图象关于直线x =μ对称可得答案为D.答案:D5.某厂生产的零件外直径ξ~N (8.0,1.52)(mm ),今从该厂上、下午生产的零件中各随机取出一个,测得其外直径分别为7.9 mm 和7.5 mm ,则可认为 A.上、下午生产情况均为正常 B.上、下午生产情况均为异常 C.上午生产情况正常,下午生产情况异常 D.上午生产情况异常,下午生产情况正常 解析:根据3σ原则,在8+3×1.5=8.45(mm )与8-3×1.5=7.55(mm )之外时为异常.答案:C6.随机变量ξ服从正态分布N (0,1),如果P (ξ<1)=0.8413,求P (-1<ξ<0). 解:∵ξ~N (0,1),∴P (-1<ξ<0)=P (0<ξ<1)=Φ(1)-Φ(0)=0.8413-0.5=0.3413.7.公共汽车门的高度是按照确保99%以上的成年男子头部不跟车门顶部碰撞设计的,如果某地成年男子的身高ξ~N (173,72)(cm ),问车门应设计多高?解:设公共汽车门的设计高度为x cm ,由题意,需使P (ξ≥x )<1%. ∵ξ~N (173,72),∴P (ξ≤x )=Φ(7173-x )>0.99.查表得7173-x >2.33,∴x >189.31,即公共汽车门的高度应设计为190 cm ,可确保99%以上的成年男子头部不跟车门顶部碰撞.8.一投资者在两个投资方案中选择一个,这两个投资方案的利润x (万元)分别服从正态分布N (8,32)和N (6,22),投资者要求利润超过5万元的概率尽量地大,那么他应选择哪一个方案?解:对第一个方案,有x ~N (8,32),于是P (x >5)=1-P (x ≤5)=1-F (5)=1-Φ(385-)=1-Φ(-1)=1-[1-Φ(1)]=Φ(1)=0.8413.对第二个方案,有x ~N (6,22),于是P (x >5)=1-P (x ≤5)=1-F (5)=1-Φ(265-)=1-Φ(-0.5)=Φ(0.5)=0.6915.相比之下,“利润超过5万元”的概率以第一个方案为好,可选第一个方案. 想一想——拓展发散一个容量为100的样本,数据的分组和各组的一些相关信息如下:(2)画出频率分布直方图和累积频率分布图;(3)根据累积频率分布图,总体中小于22的样本数据大约占多大的百分比?解:(1)(2)频率分布直方图及累积频率分布图如下:横坐标为22,落在21~24的区间内,折线图在这段区间上的线段所在的直线方程是y-0.3=21243.051.0--(x-21),即y=0.07x-1.17.当x=22时,y=1.54-0.17=0.37.因此,总体中小于22的数据大约占37%.。