2012年高考第一轮复习数学:12.1 抽样方法与总体分布的估计
最新高考第一轮复习数学:12.1抽样方法与总体分布的估计教案(含习题及答案)
最新高考第一轮复习数学:12.1抽样方法与总体分布的估计教案〔含习题及答案〕*第十二章统计●网络体系总览统计抽样方法简单随机抽样系统抽样分层抽样总体分布的估计样本频率分布总体平均值与方差的估计样本平均数的估计样本方差的估计样本标准差的估计样本频率分布表样本频率分布条形图样本频率分布直方图●考点目标定位1.了解简单随机抽样、分层抽样及系统抽样的意义,会用它们对简单实际问题进行抽样.2.会用样本频率分布估计总体分布.3.会用样本估计总体平均值和方差. ●复习方略指南在本章的复习中,要理解几种抽样方法的区别与联系.应充分注意一些重要概念的实际意义,理解概率统计中处理问题的根本思想方法,掌握所学的概率统计知识的实际应用.这局部内容高考命题趋向主要以选择题、填空题为主,重点考查根底知识、根本概念及其简单的应用.对有关概率统计的应用题要多加关注.12.1 抽样方法与总体分布的估计●知识梳理1.简单随机抽样:一般地,设一个总体的个体数为N,如果通过逐个抽取的方法从中抽取一个样本,且每次抽取时各个个体被抽到的概率相等,就称这样的抽样为简单随机抽样.2.分层抽样:当总体由差异明显的几局部组成时,为了使样本更充分地反映总体的情况,常将总体分成几局部,然后按照各局部所占的比进行抽样,这种抽样叫做分层抽样.3.两种抽样方法的比拟〔略〕.4.总体:在数理统计中,通常把被研究的对象的全体叫做总体.5.频率分布:用样本估计总体,是研究统计问题的根本思想方法,样本中所有数据〔或数据组〕的频数和样本容量的比,就是该数据的频率.所有数据〔或数据组〕的频率的分布变化规律叫做样本的频率分布.可以用样本频率表、样本频率分布条形图或频率分布直方图来表示.6.总体分布:从总体中抽取一个个体,就是一次随机试验,从总体中抽取一个容量为n的样本,就是进行了n次试验,试验连同所出现的结果叫随机事件,所有这些事件的概率分布规律称为总体分布.●点击双基1.为调查参加运动会的1000名运发动的年龄情况,从中抽查了100名运发动的年龄,就这个问题来说,以下说法正确的选项是A.1000名运发动是总体B.每个运发动是个体C.抽取的100名运发动是样本D.样本容量是100 解析:这个问题我们研究的是运发动的年龄情况.因此应选D. 答案:D2.一个总体中共有10个个体,用简单随机抽样的方法从中抽取一个容量为3的样本,那么某特定个体入样的概率是A.33C10 B.310?9?8 C.3 10 D.1 103,所以选C. 10解析:用简单随机抽样法从中抽取,那么每个个体被抽到的概率都相同为答案:C3.一个容量为n的样本,分成假设干组,某数的频数和频率分别为40、0.125,那么n的值为A.640B.320C.240D.160解析:∵40=0.125,∴n=320.应选B. n答案:B4.某单位有老年人27人,中年人54人,青年人81人,为了调查他们的健康状况,需从他们中抽取一个容量为36的样本,在简单随机抽样、系统抽样、分层抽样这三种方法中较适宜的抽样方法是___________.解析:要研究的总体里各局部情况差异较大,因此用分层抽样. 答案:分层抽样5.某班学生在一次数学考试中成绩分布如下表:分数段人数分数段人数分数段人数[0,80〕 2 [100,110〕 8 [130,140〕 4 [80,90〕 5 [110,120 〕 12 [140,150〕 2 [90,100〕 6 [120,130〕 6 那么分数在[100,110〕中的频率和分数不满110分的累积频率分别是______________、_______〔精确到0.01〕.解析:由频率计算方法知:总人数=45.分数在[100,110〕中的频率为分数不满110分的累积频率为≈0.18. 452?5?6?821=≈0.47.4545答案:0.18 0.47●典例剖析【例1】〔2022年湖南,5〕某公司在甲、乙、丙、丁四个地区分别有150个、120个、180个、150个销售点.公司为了调查产品销售的情况,需从这600个销售点中抽取一个容量为100的样本,记这项调查为①;在丙地区中有20个特大型销售点,要从中抽取7个调查其销售收入和售后效劳情况,记这项调查为②.那么完成①、②这两项调查宜采用的抽样方法依次是A.分层抽样法,系统抽样法B.分层抽样法,简单随机抽样法C.系统抽样法,分层抽样法D.简单随机抽样法,分层抽样法剖析:此题为抽样方法的选取问题.当总体中个体较多时宜采用系统抽样;当总体中的个体差异较大时,宜采用分层抽样;当总体中个体较少时,宜采用随机抽样.依据题意,第①项调查应采用分层抽样法、第②项调查应采用简单随机抽样法.应选B. 答案:B评述:采用什么样的抽样方法要依据研究的总体中的个体情况来定.【例2】〔2022年福建,15〕一个总体中有100个个体,随机编号为0,1,2,…,99,依编号顺序平均分成10个小组,组号依次为1,2,3,…,10.现用系统抽样方法抽取一个容量为10的样本,规定如果在第1组随机抽取的号码为m,那么在第k小组中抽取的号码个位数字与m+k的个位数字相同.假设m=6,那么在第7组中抽取的号码是___________.剖析:此问题总体中个体的个数较多,因此采用系统抽样.按题目中要求的规那么抽取即可.∵m=6,k=7,m+k=13,∴在第7小组中抽取的号码是63. 答案:63评述:当总体中个体个数较多而差异又不大时可采用系统抽样.采用系统抽样在每小组内抽取时应按规那么进行.【例3】把容量为100的某个样本数据分为10组,并填写频率分布表,假设前七组的累积频率为0.79,而剩下三组的频数成公比大于2的整数等比数列,那么剩下三组中频数最高的一组的频数为___________.剖析:前七组的累积频率为0.79,而要研究后三组的问题,因此应先求出后三组的频率之和为1-0.79=0.21,进而求出后三组的共有频数,或者先求前七组共有频数后,再计算后三组的共有频数.×100=79,故后三组共有的频数为21,依题意a1?(1?q3)=21,a1〔1+q+q2〕=21.∴a1=1,q=4.∴后三组频数最高的一组的频数为16.1?q答案:16评述:此题剖析只按第二种思路给出了解答,你能按第一种思路来解吗?【例4】对某电子元件进行寿命追踪调查,情况如下:寿命〔h〕个数 100~200 20 200~300 30 300~400 80 400~500 40 500~600 30 〔1〕列出频率分布表;〔2〕画出频率分布直方图和累积频率分布图;〔3〕估计电子元件寿命在100~400 h以内的概率;〔4〕估计电子元件寿命在400 h以上的概率.剖析:通过此题可掌握总体分布估计的各种方法和步骤. 解:〔1〕频率分布表如下:寿命〔h〕 100~200 200~300 300~400 400~500 500~600 合计频数 20 30 80 40 30 200 频率 0.10 0.15 0.40 0.20 0.15 1 累积频率 0.10 0.25 0.65 0.85 1 〔2〕频率分布直方图如下:频率组距100 200 300 400 500 600 寿命(h) 累积频率1.000.800.600.400.20220 200 300 400 500 600 寿命(h)〔3〕由累积频率分布图可以看出,寿命在100~400 h内的电子元件出现的频率为0.65,所以我们估计电子元件寿命在100~400 h内的概率为0.65.〔4〕由频率分布表可知,寿命在400 h以上的电子元件出现的频率为0.20+0.15=0.35,故我们估计电子元件寿命在400 h以上的概率为0.35.评述:画频率分布条形图、直方图时要注意纵、横坐标轴的意义. ●闯关训练夯实根底1.〔2022年江苏,6〕某校为了了解学生的课外阅读情况,随机调查了50名学生,得到他们在某一天各自课外阅读所用时间的数据,结果用下面的条形图表示,根据条形图可得这50名学生这一天平均每人的课外阅读时间为人数(人)20221050 0.5 1.0 1.5 2.0时间(h) A.0.6 h B.0.9 h 解析:C.1.0 hD.1.5 h5?2?10?(1?1.5)?20?0.5=0.9.50答案:B2.某单位有职工100人,不到35岁的有45人,35岁到49岁的有25人,剩下的为50岁以上的人,用分层抽样法从中抽取20人,各年龄段分别抽取的人数为A.7,5,8B.9,5,6C.6,5,9D.8,5,7解析:45×202201=×45=9,25×=5,30×=6.51005100答案:B3.某单位共有N个职工,要从N个职工中采用分层抽样法抽取n个样本,该单位的某一部门有M个员工,那么从这一部门中抽取的职工数为___________. 答案:Mn N4.以下图是容量为100的样本的频率分布直方图,试根据图形中的数据填空:频率组距0.090.080.02〔1〕样本数据落在范围[6,10〕内的频率为___________;〔2〕样本数据落在范围[10,14〕内的频数为___________;〔3〕总体在范围[2,6〕内的概率约为___________. 答案:〔1〕0.32 〔2〕36 〔3〕0.085.举例说明简单随机抽样和分层抽样两种抽样方法,无论使用哪一种抽样方法,总体中的每一个个体被抽到的概率都相等.解:袋中有160个小球,其中红球48个,蓝球64个,白球16个,黄球32个,从中抽取20个作为一个样本.〔1〕使用简单随机抽样:每个个体被抽到的概率为2 6 10 14 18 样本数据201=. 16083×20=6个;蓝球应抽10〔2〕使用分层抽样:四种球的个数比为3∶4∶1∶41268241×20=8个;白球应抽×20=2个;黄球应抽×8培养能力6.某工厂生产的产品,可分为一等品、二等品、三等品三类,根据抽样检验的记录有一等品54个、二等品140个、三等品6个.〔1〕估计三种产品的概率;〔2〕画出频率分布条形图. 解:〔1〕0.27,0.7,0.03. 〔2〕频率分布条形图如下.频率0.70.270.03一等品二等品三等品产品等级 7.有点难度哟!某县政府机关在编人员100人,其中副处级以上干部10人,一般干部70人,工人20人,上级人事部门为了了解职工对机构改革的意见,要从中抽取一个容量为20的样本,试说明具体实施方法,并证明用这种抽样方法可使总体中每个个体被抽到的概率相等.解:因机构改革关系到所有人的利益,故采用分层抽样方法较宜.202211=,∴10×=2,70×=14,20×=4.21141以上干部被抽到的概率为=,一般干部被抽到的概率为=,工人被抽到的概率为105705∵。
高中总复习第一轮数学 第十二章概率与统计(理)12.1 离散型随机变量的分布列
第十二章概率与统计(理)网络体系总览考点目标定位1.离散型随机变量的分布列.离散型随机变量的期望和方差.2.抽样方法、总体分布的估计、正态分布、线性回归.复习方略指南在复习中,要注意理解变量的多样性,深化函数的思想方法在实际问题中的应用,充分注意一些概念的实际意义,理解概率中处理问题的基本思想方法,掌握所学概率知识的实际应用.1.把握基本题型应用本章知识要解决的题型主要分两大类:一类是应用随机变量的概念,特别是离散型随机变量分布列以及期望与方差的基础知识,讨论随机变量的取值范围,取相应值的概率及期望、方差的求解计算;另一类主要是如何抽取样本及如何用样本去估计总体.作为本章知识的一个综合应用,教材以实习作业作为一节给出,应给予足够的重视.2.强化双基训练主要是培养扎实的基础知识,迅捷准确的运算能力,严谨的判断推理能力.3.强化方法选择特别在教学中要掌握思维过程,引导学生发现解决问题的方法,达到举一反三的目的,还要进行题后反思,使学生在大脑记忆中构建良好的数学认知结构,形成条理化、有序化、网络化的有机体系.4.培养应用意识要挖掘知识之间的内在联系,从形式结构、数字特征、图形图表的位置特点等方面进行联想和试验,找到知识的“结点”.再有就是将实际问题转化为纯数学问题进行训练,以培养利用所学知识解决实际问题的能力.12.1 离散型随机变量的分布列巩固·夯实基础一、自主梳理1.随机变量的概念如果随机试验的结果可以用一个变量表示,那么这样的变量叫做随机变量,它常用希腊字母ξ、η等表示.(1)离散型随机变量.如果对于随机变量可能取的值,可以按一定次序一一列出,那么这样的随机变量叫做离散型随机变量.(2)若ξ是随机变量,η=aξ+b,其中a、b是常数,则η也是随机变量.2.离散型随机变量的分布列(1)概率分布(分布列).设离散型随机变量ξ可能取的值为x1,x2,…,x i,…,ξ取每一个值x i(i=1,2,…)的概率P(ξ=x i)=p i,则称表为随机变量ξ的概率分布,简称ξ的分布列.(2)二项分布.如果在一次试验中某事件发生的概率是p,那么在n 次独立重复试验中这个事件恰好发生k 次的概率是P(ξ=k)=C k n p k q n-k .C k n p k q n-k =b(k;n,p). 二、点击双基1.抛掷两颗骰子,所得点数之和为ξ,那么ξ=4表示的随机试验结果是( ) A.一颗是3点,一颗是1点 B.两颗都是2点C.两颗都是4点D.一颗是3点,一颗是1点或两颗都是2点 解析:对A 、B 中表示的随机试验的结果,随机变量均取值4,而D 是 ξ=4代表的所有试验结果.掌握随机变量的取值与它刻画的随机试验的结果的对应关系是理解随机变量概念的关键. 答案:DA.1B.1±22 C.1+22 D.1-22解析:∵0.5+1-2q+q 2=1,∴q=1±22. 当q=1+22时,1-2q<0,与分布列的性质矛盾, ∴q=1-22. 答案:D3.已知随机变量ξ的分布列为P(ξ=k)=k21,k=1,2,…,则P(2<ξ≤4)等于( ) A.163 B.41 C.161 D.51 解析:P(2<ξ≤4)=P(ξ=3)+P(ξ=4)=321+421=163.答案:A4.某批数量较大的商品的次品率为10%,从中任意地连续取出5件,其中次品数ξ的分布列为 __________________________.解析:本题中商品数量较大,故从中任意抽取5件(不放回)可以看作是独立重复试验n=5,因而次品数ξ服从二项分布, 即ξ—B(5,0.1).5.某射手有5发子弹,射击一次命中目标的概率为0.9,如果命中就停止射击,否则一直到子弹用尽,则耗用子弹数ξ的分布列为___________________________. 解析:ξ可以取1,2,3,4,5,P(ξ=1)=0.9,P(ξ=2)=0.1×0.9=0.09,P(ξ=3)=0.12×0.9=0.009,P(ξ=4)=0.13×0.9=0.000 9,P(ξ=5)=0.14=0.000 1. 诱思·实例点拨【例1】 一袋中装有5只球,编号为1,2,3,4,5,在袋中同时取3只,以ξ表示取出的三只球中的最小号码,写出随机变量ξ的分布列.剖析:因为在编号为1,2,3,4,5的球中,同时取3只,所以小号码可能是1或2或3,即ξ可以取1,2,3.解:随机变量ξ的可能取值为1,2,3.当ξ=1时,即取出的三只球中最小号码为1,则其他两只球只能在编号为2,3,4,5的四只球中任取两只,故有P (ξ=1)=3524C C =106=53;当ξ=2时,即取出的三只球中最小号码为2,则其他两只球只能在编号为3,4,5的三只球中任取两只,故有P (ξ=2)=3523C C =103;当ξ=3时,即取出的三只球中最小号码为3,则其他两只球只能在编号为4,5的两只球中任取两只,故有P (ξ=3)=3522C C =101.讲评:求随机变量的分布列,重要的基础是概率的计算,如古典概率、互斥事件的概率、相互独立事件同时发生的概率、n 次独立重复试验有k 次发生的概率等.本题中基本事件总数,即n=C 35,取每一个球的概率都属古典概率(等可能性事件的概率).【例2】(2005北京高考,理)甲、乙两人各进行3次射击,甲每次击中目标的概率为21,乙每次击中目标的概率为32. (1)记甲击中目标的次数为ξ,求ξ的概率分布及数学期望E ξ;(2)求乙至多击中目标2次的概率;(3)求甲恰好比乙多击中目标2次的概率.剖析:(1)甲射击有击中目标与击不中目标两个结果,且3次射击是3次独立重复试验.∴ξ—B(3,21).(2)“乙至多击中目标2次”的对立事件是“乙击中目标3次”.(3)“甲恰好比乙多击中目标2次”即“甲击中2次乙没击中目标或甲击中目标3次乙击中1次”.解:(1)P(ξ=0)=C 03(21)3=81; P(ξ=1)=C 13(21)3=83;P(ξ=2)=C 23(21)3=83;P(ξ=3)=C 33(21)3=81.∵ξ—B(3,2), ∴E ξ=3×21=1.5.(2)乙至多击中目标2次的概率为1-C 33(32)3=2719. (3)设甲恰好比乙多击中目标2次为事件A,甲恰好击中目标2次且乙恰好击中目标0次为事件B 1,甲恰好击中目标3次且乙恰好击中目标1次为事件B 2,则A=B 1+B 2,B 1、B 2为互斥事件,∴P(A)=P(B 1)+P(B 2)=83×271+81×92=241. ∴甲恰好比乙多击中目标2次的概率为241.讲评:求离散型随机变量的概率分布的步骤为:(1)找出随机变量ξ的所有可能的值x i (i=1,2,…);(2)求出各值的概率P(ξ=x i )=p i ;(3)列成表格.【例3】(2005广东高考)箱中装有大小相同的黄、白两种颜色的乒乓球,黄、白乒乓球的数量比为s ∶t.现从箱中每次任意取出一个球,若取出的是黄球则结束,若取出的是白球,则将其放回箱中,并继续从箱中任意取出一个球,但取球的次数最多不超过n 次.以ξ表示取球结束时已取到白球的次数. (1)求ξ的分布列; (2)求ξ的数学期望.解:(1)ξ的可能取值为0,1,2,…,n.(2)ξ的数学期望为E ξ=0×t s s ++1×2)(t s st++2×32)(t s st ++…+(n-1)×n n t s st )(1+-+n ×n n t s t )(+. ① t s t +E ξ=3)(t s st ++42)(2t s st ++…+n n t s st n )()2(1+--+1)()1(++-n n t s st n +11)(+++n n t s nt . ②①-②,得E ξ=s t +1)()1(-+-n n t s s t n -n n t s t n )()1(+--nn t s s nt )(1++. 讲评:本题是几何分布问题,其中用到数列的错位相减法求和,注意运算的严谨性.。
【三年考点汇总】2012年高考数学考点汇总36抽样方法、总体分布的估计(人教大纲版)
考点36 抽样方法、总体分布的估计
一、选择题
1.(2012·四川高考文科·T3)交通管理部门为了解机动车驾驶员(简称驾驶员)对某新法规的知晓情况,对甲、乙、丙、丁四个社区做分层抽样调查。
假设四个社区驾驶员的总人数为,其中甲社区有驾驶员96人。
若在甲、乙、丙、丁四个社区抽取驾驶员的人数分别为12,21,25,43,则这四个社区驾驶员的总人数为()
A、101
B、808
C、1212
D、2012 【解题指南】由分层抽样的定义求解,甲社区驾驶员的抽样比例和四个社区驾驶员总人数的抽样比例相同.
【解析】选B.甲社区驾驶员的抽样比例为,四个社区驾驶员总人数的抽样比例为,由得.。
抽样方法与总体分布的估计
抽样方法与总体分布的估计在统计学中,抽样是指从总体中选取一部分个体进行观察和测量的过程。
抽样方法的选择是统计研究的重要环节,将直接影响到对总体分布的估计。
抽样方法一般分为概率抽样和非概率抽样两种。
概率抽样是指以确定的概率规则随机抽取样本,每个个体有确定的概率被选中,如简单随机抽样、分层抽样和系统抽样等。
非概率抽样是指个体被选入样本的概率不可确定,无法通过概率规则进行抽样,如方便抽样、判断抽样和定额抽样等。
简单随机抽样是一种常用的概率抽样方法,即从总体中抽取n个个体,每个个体被选中的概率相等。
简单随机抽样可以保证样本与总体之间的代表性,并且可以应用于任何样本容量的情况。
分层抽样则是将总体分成若干个层次,然后从各个层次中分别进行简单随机抽样。
这种方法可以保证各个层次在样本中的比例与总体中的比例相同,适用于当总体具有明显的层次结构时。
系统抽样是指按照一定间隔从总体中随机选择一个个体作为初始个体,然后以固定的间隔选择后续的个体,直到达到样本容量。
概率抽样方法是基于随机性的,可以使得抽样结果具有代表性,从而可以通过对样本数据的分析来推断总体的特征。
在进行总体分布的估计时,可以利用样本数据的统计量,如样本均值、样本方差等,对总体参数进行估计。
利用抽样数据进行总体分布的估计是统计学中的重要内容,旨在通过样本数据来推断总体的分布特征。
常见的对总体分布的估计方法包括点估计和区间估计。
点估计是指通过样本数据得到总体参数的一个估计值,常用的点估计方法包括最大似然估计和矩估计等。
最大似然估计是基于样本数据的似然函数,通过使似然函数最大化来得到总体参数的估计值。
矩估计是通过样本矩的特征来估计总体参数,如样本均值、样本方差等。
点估计方法可以对总体的分布参数进行估计,但无法提供估计值的准确度信息。
区间估计是对总体参数进行估计时,给出一个区间范围,该范围内有一定的置信度包含总体参数的真值。
常见的区间估计方法包括置信区间法和预测区间法。
高考数学一轮复习学案抽样方法、总体分布的估计
12.3 抽样方法、总体分布的估计一、知识梳理(一)抽样1.简单随机抽样:设一个总体的个体数为N .如果通过逐个抽取的方法从中抽取一个样本,且每次抽取时各个个体被抽到的概率相等,就称这样的抽样为简单随机抽样⑴用简单随机抽样从含有N 个个体的总体中抽取一个容量为n 的样本时,每次抽取一个个体时任一个体被抽到的概率为N1;在整个抽样过程中各个个体被抽到的概率为Nn; ⑵简单随机抽样的特点是,逐个抽取,且各个个体被抽到的概率相等; ⑶简单随机抽样方法,体现了抽样的客观性与公平性,是其他更复杂抽样方法的基础.(4).简单随机抽样的特点:它是不放回抽样;它是逐个地进行抽取;它是一种等概率抽样 简单抽样常用方法:(1)抽签法:先将总体中的所有个体(共有N 个)编号(号码可从1到N ),并把号码写在形状、大小相同的号签上(号签可用小球、卡片、纸条等制作),然后将这些号签放在同一个箱子里,进行均匀搅拌,抽签时每次从中抽一个号签,连续抽取n 次,就得到一个容量为n 的样本适用范围:总体的个体数不多时优点:抽签法简便易行,当总体的个体数不太多时适宜采用抽签法.(2)随机数表法: 随机数表抽样“三步曲”:第一步,将总体中的个体编号;第二步,选定开始的数字;第三步,获取样本号码2.系统抽样:当总体中的个体数较多时,可将总体分成均衡的几个部分,然后按预先定出的规则,从每一部分抽取一个个体,得到需要的样本,这种抽样叫做系统抽样.系统抽样的步骤:①采用随机的方式将总体中的个体编号为简便起见,有时可直接采用个体所带有的号码,如考生的准考证号、街道上各户的门牌号,等等②为将整个的编号分段(即分成几个部分),要确定分段的间隔k 当Nn(N为总体中的个体的个数,n 为样本容量)是整数时,k=N n ;当Nn不是整数时,通过从总体中剔除一些个体使剩下的总体中个体的个数N '能被n 整除,这时k=N n'.③在第一段用简单随机抽样确定起始的个体编号l ④按照事先确定的规则抽取样本(通常是将l 加上间隔k ,得到第2个编号l +k,第3个编号l +2k ,这样继续下去,直到获取整个样本)①系统抽样适用于总体中的个体数较多的情况,它与简单随机抽样的联系在于:将总体均分后的每一部分进行抽样时,采用的是简单随机抽样;②与简单随机抽样一样,系统抽样是等概率抽样,它是客观的、公平的. ③总体中的个体数恰好能被样本容量整除时,可用它们的比值作为系统抽样的间隔;当总体中的个体数不能被样本容量整除时,可用简单随机抽样先从总体中剔除少量个体,使剩下的个体数能被样本容量整除在进行系统抽样3.分层抽样:当已知总体由差异明显的几部分组成时,为了使样本更充分地反映总体的情况,常将总体分成几部分,然后按照各部分所占的比例进行抽样,这种抽样叫做分层抽样,所分成的部分叫做层体,称这样的抽样为不放回抽样;如果每次抽出个体后再将它放回总体,称这样的抽样为放回抽样.随机抽样、系统抽样、分层抽样都是不放回抽样(二)总体分布1.总体:在数理统计中,通常把被研究的对象的全体叫做总体.2.频率分布:用样本估计总体,是研究统计问题的基本思想方法,样本中所有数据(或数据组)的频数和样本容量的比,就是该数据的频率.所有数据(或数据组)的频率的分布变化规律叫做样本的频率分布.可以用样本频率表、样本频率分布条形图或频率分布直方图来表示.3.总体分布:从总体中抽取一个个体,就是一次随机试验,从总体中抽取一个容量为n的样本,就是进行了n次试验,试验连同所出现的结果叫随机事件,所有这些事件的概率分布规律称为总体分布.4.总体密度曲线:样本容量越大,所分组数越多,各组的频率就越接近于总体在相应各组取值的概率.设想样本容量无限增大,分组的组距无限缩小,那么频率分布直方图就会无限接近于一条光滑曲线,这条曲线叫做总体密度曲线.它反映了总体在各个范围内取值的概率.根据这条曲线,可求出总体在区间(a,b)内取值的概率等于总体密度曲线,直线x=a,x=b及x轴所围图形的面积.0.5 时间(小时) 0 1.0 1.5 2.0二、基础训练1.一个总体中共有10个个体,用简单随机抽样的方法从中抽取一容量为3的样本,则某特定个体入样的概率是CA.310C 3B.89103⨯⨯C.103 D.101 2.(2004年江苏,6)某校为了了解学生的课外阅读情况,随机调查了50名学生,得到他们在某一天各自课外阅读所用时间的数据,结果用下面的条形图表示.根据条形图可得这50名学生这一天平均每人的课外阅读时间为BA.0.6 hB.0.9 hC.1.0 hD.1.5 h3.一个年级有12个班,每个班有50名同学,随机编号为1~50号,为了了解他们在课外的兴趣爱好,要求每班的33号学生留下来参加阅卷调查,这里运用的抽样方法是DA.分层抽样法B.抽签法C.随机数表法D.系统抽样法4.为调查参加运动会的1000名运动员的年龄情况,从中抽查了100名运动员的年龄,就这个问题来说,下列说法正确的是A.1000名运动员是总体B.每个运动员是个体C.抽取的100名运动员是样本D.样本容量是100 解析:这个问题我们研究的是运动员的年龄情况.因此应选D. 答案:D5.一个容量为n 的样本,分成若干组,已知某数的频数和频率分别为40、0.125,则n 的值为A.640B.320C.240D.160解析:∵n40=0.125,∴n =320.故选B.答案:B6.某单位有老年人27人,中年人54人,青年人81人,为了调查他们的健康状况,需从他们中抽取一个容量为36的样本,在简单随机抽样、系统抽样、分层抽样这三种方法中较合适的抽样方法是___________.解析:要研究的总体里各部分情况差异较大,因此用分层抽样. 答案:分层抽样那么分数在[100,110)中的频率和分数不满110分的累积频率分别是______________、_______(精确到0.01).解析:由频率计算方法知:总人数=45.分数在[100,110)中的频率为458=0.178≈0.18.分数不满110分的累积频率为458652+++=4521≈0.47.答案:0.18 0.47三、例题剖析【例1】 (2004年湖南,5)某公司在甲、乙、丙、丁四个地区分别有150个、120个、180个、150个销售点.公司为了调查产品销售的情况,需从这600个销售点中抽取一个容量为100的样本,记这项调查为①;在丙地区中有20个特大型销售点,要从中抽取7个调查其销售收入和售后服务情况,记这项调查为②.则完成①、②这两项调查宜采用的抽样方法依次是A.分层抽样法,系统抽样法B.分层抽样法,简单随机抽样法C.系统抽样法,分层抽样法D.简单随机抽样法,分层抽样法剖析:此题为抽样方法的选取问题.当总体中个体较多时宜采用系统抽样;当总体中的个体差异较大时,宜采用分层抽样;当总体中个体较少时,宜采用随机抽样.依据题意,第①项调查应采用分层抽样法、第②项调查应采用简单随机抽样法.故选B. 答案:B评述:采用什么样的抽样方法要依据研究的总体中的个体情况来定.【例2】 (2004年福建,15)一个总体中有100个个体,随机编号为0,1,2,…,99,依编号顺序平均分成10个小组,组号依次为1,2,3,…,10.现用系统抽样方法抽取一个容量为10的样本,规定如果在第1组随机抽取的号码为m ,那么在第k 小组中抽取的号码个位数字与m +k 的个位数字相同.若m =6,则在第7组中抽取的号码是___________.剖析:此问题总体中个体的个数较多,因此采用系统抽样.按题目中要求的规则抽取即可.∵m =6,k =7,m +k =13,∴在第7小组中抽取的号码是63. 答案:63评述:当总体中个体个数较多而差异又不大时可采用系统抽样.采用系统抽样在每小组内抽取时应按规则进行.【例3】 把容量为100的某个样本数据分为10组,并填写频率分布表,若前七组的累积频率为0.79,而剩下三组的频数成公比大于2的整数等比数列,则剩下三组中频数最高的一组的频数为___________.剖析:已知前七组的累积频率为0.79,而要研究后三组的问题,因此应先求出后三组的频率之和为1-0.79=0.21,进而求出后三组的共有频数,或者先求前七组共有频数后,再计算后三组的共有频数.由已知知前七组的累积频数为0.79×100=79,故后三组共有的频数为21,依题意qq a --⋅1)1(31=21,a 1(1+q +q 2)=21.∴a 1=1,q =4.∴后三组频数最高的一组的频数为16.答案:16评述:此题剖析只按第二种思路给出了解答,你能按第一种思路来解吗?(1)列出频率分布表;(2)画出频率分布直方图和累积频率分布图;(3)估计电子元件寿命在100~400 h 以内的概率; (4)估计电子元件寿命在400 h 以上的概率.剖析:通过本题可掌握总体分布估计的各种方法和步骤.(2)频率分布直方图如下:(h ) 1.0.0.0.0.(3)由累积频率分布图可以看出,寿命在100~400 h 内的电子元件出现的频率为0.65,所以我们估计电子元件寿命在100~400 h 内的概率为0.65.(4)由频率分布表可知,寿命在400 h 以上的电子元件出现的频率为0.20+0.15=0.35,故我们估计电子元件寿命在400 h 以上的概率为0.35.评述:画频率分布条形图、直方图时要注意纵、横坐标轴的意义.【例5】 某批零件共160个,其中,一级品48个,二级品64个,三级品32个,等外品16个.从中抽取一个容量为20的样本.请说明分别用简单随机抽样、系统抽样和分层抽样法抽取时总体中的每个个体被取到的概率均相同.【例6】一个容量为100的样本,数据的分组和各组的一些相关信息如下:(1)完成上表;(2)画出频率分布直方图和累积频率分布图;(3)根据累积频率分布图,总体中小于22的样本数据大约占多大的百分比?〒〒〒〒〒〒〒〒〒〒〒〒〒〒〒〒〒〒〒〒〒〒〒〒〒〒〒〒〒〒〒〒〒〒〒 四、同步练习 g3.1099 抽样方法、总体分布的估计1.某公司甲、乙、丙、丁四个地区分别有150 个、120个、180个、150个销售点.公司为了调查产品销售的情况,需从这600个销售点中抽取一个容量为100的样本,记这项调查为①;在丙地区中有20个特大型销售点,要从中抽取7个调查其收入和售后服务等情况,记这项调查为②.则完成①、②这两项调查宜采用的抽样方法依次是 ( B )()A 分层抽样法,系统抽样法()B 分层抽样法,简单随机抽样法 ()C 系统抽样法,分层抽样法 ()D 简单随机抽样法,分层抽样法2.已知样本方差由102211(5)10i i s x ==-∑,求得,则1210x x x +++= 50 . 3.设有n 个样本12,,,n x x x ,其标准差为x s ,另有n 个样本12,,,n y y y ,且35k k y x =+(1,2,,)k n = ,其标准差为y s ,则下列关系正确的是 ( B )()A 35y x s s =+ ()B 3y x s s =()C y x s = ()D 5y x s =+时间(小时)4.某校为了了解学生的课外阅读情况,随机调查了50名学生,得到他们在某一天各自课外阅读所用时间的数据,结果用右侧的条形图表示. 根据条形图可得这50名学生这一天平均每人的课外阅读时间为 ( B ) ()A 0.6小时 ()B 0.9小时()C 1.0小时 ()D 1.5小时5.x 是12100,,x x x 的平均数,a 是1240,,x x x 的平均数,b 是4142100,,x x x 的平均数,则x ,a ,b 之间的关系为4060100a bx +=.6.某校有老师200人,男学生1200人,女学生1000人.现用分层抽样的方法从所有师生中抽取一个容量为n 的样本;已知从女学生中抽取的人数为80人,则n =112.7.一个总体中有100个个体,随机编号0,1,2,…,99,依编号顺序平均分成10个小 组,组号依次为1,2,3,…,10.现用系统抽样方法抽取一个容量为10的样本,规定如果在第1组随机抽取的号码为m ,那么在第k 组中抽取的号码个位数字与m k +的个位数字相同,若6m =,则在第7组中抽取的号码是 63 .8.在样本的频率分布直方图中,共有11个小长方形,若中间一个小长方形的面积等于其他10个小长方形的面积之和的14,且样本容量为160,则中间一组的频数为 32 . 9.某中学有员工160人,其中中高级教师48人,一般教师64人,管理人员16人,行政人员32人,从中抽取容量为20的一个样本.以此例说明,无论使用三种常用的抽样方法中的哪一种方法,总体中的每个个体抽到的概率都相同.10. 现有30个零件,需从中抽取10个进行检查,问如何采用简单随机抽样得到一个容量为10的样本?11.质检部门对甲、乙两种日光灯的使用时间进行了破坏性试验,10次试验得到的两 种日光灯的使用时间如下表所示,问:哪一种质量相对好一些?(2)画出频率分布直方图;(3)根据累积频率分布,估计小于134的数据约占多少百分比.13.为检测某种产品的质量,抽取了一个容量为30的样本,检测结果为一级品5件,二级品8件,三级品13件,次品4件。
抽样方法与总体分布的估计
抽样方法与总体分布的估计概述:抽样是统计学中非常重要的概念,它可以帮助我们从一个庞大的总体中选择出一部分个体,从而对总体的特征进行推断和估计。
在实际应用中,我们很难对整个总体进行研究,因此抽样方法能够帮助我们通过研究抽取的样本来对总体进行估计和推断。
抽样方法:1.简单随机抽样:简单随机抽样是指从总体中随机地选择一部分个体作为样本,每个个体被选中的概率是相等的。
这种抽样方法能够减少主观因素的干扰,得到较为可靠的估计结果。
2.分层抽样:分层抽样是将总体分成若干个互不重叠的子总体,然后在每个子总体中进行简单随机抽样。
这样可以保证样本的代表性,并且可以在不同子总体中设置不同的抽样比例,更好地反映总体的各个特征。
3.系统抽样:系统抽样是按照一定的规则从总体中选择个体作为样本,例如每隔k个个体选取一个个体。
这种抽样方法适用于总体中个体之间的顺序关系比较明显,具有方便和高效的特点。
4.整群抽样:整群抽样是将总体划分为若干个群体,然后随机地选择几个群体,对选择的群体进行抽样。
这种抽样方法在样本容量较小时,能够减少抽样误差,提高估计结果的可靠性。
总体分布的估计:估计总体分布是指通过样本推断总体的概率分布情况。
常见的总体分布估计方法有以下几种:1.参数估计:根据样本统计量的分布特征,推断总体分布中的参数值。
例如,通过样本均值来估计总体均值,通过样本方差来估计总体方差等。
2.核密度估计:核密度估计通过考虑每个样本点附近一定范围内的密度来估计总体分布的概率密度函数。
该方法可以克服一些分布假设的限制,更加灵活地估计总体分布。
3.经验分布函数:经验分布函数通过计算累积概率来估计总体的分布。
该方法不对总体的具体分布形式进行假设,适用于对总体分布不了解或不确定的情况。
4.模型拟合:模型拟合是指将已知的概率分布模型与样本进行拟合,从而得到总体的估计分布。
常用的拟合方法包括最大似然估计和贝叶斯估计等。
总结:抽样方法和总体分布的估计是统计学中重要的内容。
抽样方法跟总体分布的估计
抽样方法跟总体分布的估计抽样方法是指从总体中选取一部分样本来进行研究或调查的方法,其目的是通过对样本数据的分析,推断或估计总体的特征和参数。
抽样方法的选择对研究的结果至关重要,因为不恰当的抽样方法可能导致样本偏倚,从而使总体的估计结果失真。
常见的抽样方法包括简单随机抽样、分层抽样、整群抽样、系统抽样和多阶段抽样等。
下面对这些方法进行详细说明。
简单随机抽样是从总体中随机选取样本的方法,每个样本都有相同的被选中的概率。
这种方法可以减少样本选择的主观因素,并能够反映总体特征。
但在实际操作过程中,随机选样的困难度较高,需要随机数发生器进行操作。
分层抽样是将总体划分为若干个相互独立的层,并从每个层中随机选取一定数量的样本。
这种抽样方法适用于总体分层特征明显的情况,可以确保每个层都能被充分代表。
整群抽样则是将总体划分为若干个相互不重叠但完全相似的整群,随机选取其中若干群作为样本进行研究。
这种方法适用于总体内群体特征相近的情况,可以减少样本选择的成本。
系统抽样是根据其中一种规律从总体中选取样本,如每隔一定间隔选取一个样本。
这种方法的优势在于实施简单,适用于总体有明显的排列顺序的情况。
多阶段抽样是将总体按照多个层次划分,并在每个层次中随机选择样本。
这种方法适用于总体复杂,样本选择难度大的情况,可以减少样本选择的成本。
抽样方法的选择应根据研究目的、总体属性和可行性来确定。
在进行抽样之前,需要对总体进行充分了解,确定抽样框架,制定合理的抽样方案。
总体分布的估计是通过对样本数据的分析,利用统计模型和方法来推断总体的特征和参数。
常用的估计方法有点估计和区间估计。
点估计是利用样本数据得出总体参数点估计值的方法,常见的点估计方法有最大似然估计、矩估计和贝叶斯估计等。
点估计可以得到总体参数的一个具体估计值,但缺点是无法给出估计值的准确性。
区间估计是利用样本数据得出总体参数区间估计值的方法,常见的区间估计方法有置信区间和可信区间等。
高考数学一轮复习 第1讲 抽样方法与总体分布的估计 课
3、解答题
考点梳理
1.三种抽样方法的比较
类别 简单随 机抽样
系统 抽样
分层 抽样
共同点
抽样过 程中每 个个体 被抽取 的概率 相等, 均属于 不放回 抽样
各自特点
相互联系
从总体中逐个抽 取
将总体均分成几 在起始部
部分,按事先确 分抽样时
定的规则在各部 采用简单
分中抽取
随机抽样
各层抽样 将分总层体进分行抽成样几层,时单样采随或用机系简 抽 统
频率分布直方图与茎叶图 助学微博
样本的数字特征
考点自测
二
频率分布直方图的绘制及
应用
【例2】
【训练2】
考向三 用样本的数字特征估计
总体的数字特征
【例3】 【训练3】
快速掌握抽样方法的技巧
A级
1、选择题
2、填空题
3、解答题
B级
1、选择题
2、填空题
单击题号显示结果 1
答案显示
C
单击图标显示详解
A.14 B.16 C.15 D.17 4.(2013·西北工大附 中测试)如图是容量为 150 的样本的频率分布 直方图,则样本数据 落在[6,10)内的频数为 ( ). A.12 B.48
C.60 D.80 5.(2013·长沙模拟)如图是某 学校一名篮球运动员在五场 比赛中所得分数的茎叶图, 则该运动员在这五场比赛中得分的方差为 ________. (注:方差 s2=n1[(x1- x )2+(x2- x )2+…+(xn
出抽样过程.
体.
解 由于总体及样本中的个体数较多,且无明显差
[方法锦囊]
异,因此采用系统抽样的方法,步骤如下: 第一步:先从 802 辆轿车中剔除 2 辆轿车(剔除方法 可用随机数法);
版高考数学一轮总复习概率统计中的抽样与估计计算
版高考数学一轮总复习概率统计中的抽样与估计计算高考数学一轮总复习概率统计中的抽样与估计计算概率统计是高考数学中的重要部分,其中抽样与估计计算是一个核心概念。
在这篇文章中,我们将详细探讨抽样与估计计算的方法和应用。
一、抽样方法在统计学中,抽样是指从总体中选取一部分个体进行测量或调查的方法。
常用的抽样方法包括随机抽样、分层抽样和系统抽样。
1. 随机抽样随机抽样是指从总体中按照一定的概率分布随机选取样本的方法。
它的特点是每个个体都有相同的概率被选入样本,从而保证样本的代表性和可靠性。
2. 分层抽样分层抽样是将总体按照某种特征分成若干层,然后从每一层中随机选取样本。
这种方法可以保证每一层都有代表性的样本,从而提高估计的准确性。
3. 系统抽样系统抽样是指按照一定的规则,从总体中选取样本。
例如,从总体中每隔一定的间隔选取一个个体作为样本,这样就能保证样本的随机性和均匀性。
二、估计计算方法抽样得到的样本是我们对总体的一个估计。
估计计算是根据样本数据,推断总体参数的方法。
常用的估计计算方法有点估计和区间估计。
1. 点估计点估计是根据样本数据,用一个确定的数值来估计总体参数。
常见的点估计方法有样本均值、样本方差和样本比例。
例如,根据样本均值估计总体均值。
2. 区间估计区间估计是指根据样本数据,给出一个范围,来估计总体参数落在该范围内的概率。
常见的区间估计方法有正态分布的置信区间和二项分布的置信区间。
例如,根据正态分布的置信区间估计总体均值。
三、应用举例下面通过一个具体的例子来说明抽样与估计计算的应用。
假设我们想要估计某个城市的失业率。
我们可以采用随机抽样的方法,在整个城市的居民中随机选取一部分进行调查。
得到的样本数据可以用来计算样本的失业率。
假设我们得到的样本数据中有1000个人,其中有200人失业。
那么,我们可以用样本的失业率来估计总体的失业率。
样本的失业率为200/1000=0.2,即20%。
通过区间估计,我们可以得到总体失业率落在一定范围内的概率。
高考数学一轮复习 13.1抽样方法与总体分布的估计精品讲义 理 新人教A版
第十三章统计与统计案例★知识网络★第1讲抽样方法和总体分布的估计★知识梳理★1.三种抽样方法的联系与区别:n(1)从含有N个个体的总体中抽取n个个体的样本,每个个体被抽到的概率为N(2)系统抽样的步骤:①将总体中的个体随机编号;②将编号分段;③在第1段中用简单随机抽样确定起始的个体编号;④按照事先研究的规则抽取样本.(3)分层抽样的步骤:①分层;②按比例确定每层抽取个体的个数;③各层抽样;④汇合成样本.2.总体估计①在数理统计中,通常把被研究的对象的全体叫做总体②样本中所有数据(或数据组)的频数和样本容量的比,就是该数据的频率.所有数据(或数据组)的频率的分布变化规律叫做样本的频率分布.反映频率分布的图表有样本频率表、样本频率分布条形图或频率分布直方图、频率折线图、茎叶图等.③从总体中抽取一个个体,就是一次随机试验,从总体中抽取一个容量为n 的样本,就是进行了n 次试验,试验连同所出现的结果叫随机事件,所有这些事件的概率分布规律称为总体分布.④样本容量越大,所分组数越多,各组的频率就越接近于总体在相应各组取值的概率.设想样本容量无限增大,分组的组距无限缩小,那么频率分布直方图就会无限接近于一条光滑曲线,这条曲线叫做总体密度曲线⑤方差和标准差都是刻画数据波动大小的数字特征,一般地,设一组样本数据1x ,2x ,…,n x ,其平均数为-x ,则方差212)(1 x n s n i i -=∑=,标准差21)(1-=-=∑x x n s ni i⑥样本容量越大,所分组数越多,各组的频率就越接近于总体在相应各组取值的概率.设想样本容量无限增大,分组的组距无限缩小,那么频率分布直方图就会无限接近于一条光滑曲线,这条曲线叫做总体密度曲线. ★重难点突破★重点:弄清楚三种抽样方法的相同与相异之处;能读懂频率分布直方图等各种数据图表;会用样本的基本数字特征估计总体的基本数字特征.难点:从样本数据中提取出基本的数字特征,并给出合理解释重难点:三种抽样方法的特点及通过各种数据图表,分析和处理数据 1. 弄清三种抽样方法的特点、联系与区别是正确选择抽样方法的前提问题1:某市进行一次大型高三调研考试,在每间试室抽取一个学生的成绩作样本,采用的抽样方法是 ;为了解该市A 、B 、C 三类学校的学生答卷情况,采用的抽样方法为 解析:考虑到学生多、个体差异不明显,采用系统抽样,第二种情形由于个体差异明显,采用分层抽样2. 要懂得从图表中提取有用信息 如:在频率分布直方图中①小矩形的面积=组距组距频率⨯=频率②众数最高矩形的中点的横坐标③中位数的左边与右边的直方图的面积相等,可以由此估计中位数的值 ★热点考点题型探析★ 考点1随机抽样题型1:抽样方法的选取[例1 ] (2010·湖南)某公司在甲、乙、丙、丁四个地区分别有150个、120个、180个、150个销售点.公司为了调查产品销售的情况,需从这600个销售点中抽取一个容量为100的样本,记这项调查为①;在丙地区中有20个特大型销售点,要从中抽取7个调查其销售收入和售后服务情况,记这项调查为②.则完成①、②这两项调查宜采用的抽样方法依次是 A.分层抽样法,系统抽样法 B.分层抽样法,简单随机抽样法 C.系统抽样法,分层抽样法 D.简单随机抽样法,分层抽样法 【解题思路】采用什么样的抽样方法要依据研究的总体中的个体情况来定。
高考数学 抽样方法与总体分布的估计 讲题
例2 (2021全国乙文,17,12分)某厂研制了一种生产高精产品的设备,为检 验新设备生产产品的某项指标有无提高,用一台旧设备和一台新设备各 生产了10件产品,得到各件产品该项指标数据如下:
旧设备
9.8
10.3
10.0
10.2
9.9
新设备
10.1
10.4
10.1
10.0
10.1
旧设备
9.8
10.0
考法二 样本的数字特征及其应用 1.平均数、中位数、众数与方差、标准差都是重要的数字特征,利用它 们可对总体进行一种简明的描述,它们所反映的情况有着重要的实际意 义,平均数、中位数、众数可描述总体的集中趋势,方差和标准差可描述 波动大小. 2.有关平均数、方差的一些结论 1)若x1,x2,…,xn的平均数为 x,则mx1+a,mx2+a,mx3+a,…,mxn+a的平均数是mx +a. 2)设数据x1,x2,…,xn的方差为s2,则 ①数据x1+a,x2+a,…,xn+a的方差也为s2; ②数据ax1,ax2,…,axn的方差为a2s2.
属于且仅属于一个子总体,在每个子总体中独立地进行简单随机抽样,再
把所有子总体中抽取的样本合在一起作为总样本,这样的抽样方法称为
分层随机抽样.
2)应用范围:总体由差异明显的几个部分组成.
3)分层随机抽样的关键是根据样本特征的差异进行分层,实质是等比例
抽样,抽样比= 样本容量 = 各层所抽取的个体数 .
0.3)×0.3+(1-0.3)×0.3×0.3=0.189; ②“抽取的3人中有3人在[7.5,8.5)内”=ABC,得P2=P(ABC)=P(A)P(B)· P(C)=0.3×0.3×0.3=0.027, 所以抽取的3人中至少有两人去年可支配收入在[7.5,8.5)内的概率为P1+ P2=0.189+0.027=0.216.
2012届高考数学复习 第91课时 第十一章 概率与统计率-抽样方法、总体分布的估计名师精品教案
第91课时:第十一章 概率与统计率——抽样方法、总体分布的估计课题:抽样方法、总体分布的估计一.复习目标:抽样方法、总体分布的估计1.会用简单随机抽样法、系统抽样法、分层抽样法等常用方法从总体中抽取样本; 2.了解统计的基本思想,会用样本频率估计总体分布. 二.知识要点:1.(1)统计的基本思想是 . (2)平均数的概念 . (3)方差公式为 . 2.常用的抽样方法是 .三.课前预习:1.某公司甲、乙、丙、丁四个地区分别有150 个、120个、180个、150个销售点.公司为了调查产品销售的情况,需从这600个销售点中抽取一个容量为100的样本,记这项调查为①;在丙地区中有20个特大型销售点,要从中抽取7个调查其收入和售后服务等情况,记这项调查为②.则完成①、②这两项调查宜采用的抽样方法依次是( B )()A 分层抽样法,系统抽样法 ()B 分层抽样法,简单随机抽样法 ()C 系统抽样法,分层抽样法()D 简单随机抽样法,分层抽样法2.已知样本方差由102211(5)10i i s x ==-∑,求得,则1210x x x +++=50.3.设有n 个样本12,,,n x x x ,其标准差为x s ,另有n 个样本12,,,n y y y ,且35k k y x =+ (1,2,,)k n =,其标准差为y s ,则下列关系正确的是 ( B )()A 35y x s s =+()B 3y x s s = ()C y x s = ()D 5y x s =+4.某校为了了解学生的课外阅读情况,随机调查了50名学生,得到他们在某一天各自课外阅读所用时间的数据,结果用右侧的条形图表示. 根据条形图可得这50名学生这一天平均每人的课外阅读时间为 ( B )()A 0.6小时 ()B 0.9小时 ()C 1.0小时 ()D 1.5小时0.5 时间(小时)1.52.05.x 是12100,,x x x 的平均数,a 是1240,,x x x 的平均数,b 是4142100,,x x x 的平均数,则x ,a ,b 之间的关系为4060100a bx +=.6.某校有老师200人,男学生1200人,女学生1000人.现用分层抽样的方法从所有师生中抽取一个容量为n 的样本;已知从女学生中抽取的人数为80人,则n =112.7.一个总体中有100个个体,随机编号0,1,2,…,99,依编号顺序平均分成10个小组,组号依次为1,2,3,…,10.现用系统抽样方法抽取一个容量为10的样本,规定如果在第1组随机抽取的号码为m ,那么在第k 组中抽取的号码个位数字与m k +的个位数字相同,若6m =,则在第7组中抽取的号码是 63 .8.在样本的频率分布直方图中,共有11个小长方形,若中间一个小长方形的面积等于其他10个小长方形的面积之和的14,且样本容量为160,则中间一组的频数为 32 .四.例题分析:例1.某中学有员工160人,其中中高级教师48人,一般教师64人,管理人员16人,行政人员32人,从中抽取容量为20的一个样本.以此例说明,无论使用三种常用的抽样方法中的哪一种方法,总体中的每个个体抽到的概率都相同.解:(1)(简单随机抽样)可采用抽签法,将160人从1到160编号,然后从中抽取20个签,与签号相同的20个人被选出.显然每个个体抽到的概率为2011608=. (2)(系统抽样法)将160人从1到160编号,,按编号顺序分成20组,每组8人,先在第一组中用抽签法抽出k 号(18k ≤≤),其余组的8k n +(1,2,3,19)n =也被抽到,显然每个个体抽到的概率为18. (3)(分层抽样法)四类人员的人数比为3:4:1:2,又34206,2081010⨯=⨯= 12202,2041010⨯=⨯=,所以从中高级教师、一般教师、管理人员、行政人员中分别抽取6人、8人、2人、4人,每个个体抽到的概率为18.例2.质检部门对甲、乙两种日光灯的使用时间进行了破坏性试验,10次试验得到的两种日光灯的使用时间如下表所示,问:哪一种质量相对好一些?解:甲的平均使用寿命为:甲x =101214032130321202211012100⨯+⨯+⨯+⨯+⨯ =2121(h ),甲的平均使用寿命为 :乙x =101214022130521201211012100⨯+⨯+⨯+⨯+⨯=2121(h ),甲的方差为:2甲S =101999191142122222+⨯+⨯+⨯+=129(h 2),乙的方差为:2乙S =101214022130521201211012100⨯+⨯+⨯+⨯+⨯=109(h 2),∵甲x =乙x ,且2甲S >2乙S ,∴乙的质量好一些.(1)列出样本的频率分布表(含累积频率); (2)画出频率分布直方图;(3)根据累积频率分布,估计小于134的数据约占多少百分比. 解:(1)样本的频率分布表与累积频率表如下:(2)频率分布直方图如下:(3)根据累积频率分布,小于134的数据约占23100%19.2%120⨯≈. 五.课后作业:1.一个单位有职工160人,其中业务人员96人,管理人员40人,后勤人员24人,为了解职工身体情况,要从中抽取一个容量为20的样本,如用分层抽样,则管理人员应抽到多少个 ( )()A 3 ()B 12 ()C 5 ()D 102.欲对某商场作一简要审计,通过检查发票及销售记录的2%来快速估计每月的销售总额.现采用如下方法:从某本50张的发票存根中随机抽一张,如15号,然后按序往后将65号,115号,165号,…发票上的销售额组成一个调查样本.这种抽取样本的方法是 ( )()A 简单随机抽样 ()B 系统抽样 ()C 分层抽样 ()D 其它方式的抽样3.在抽查某产品的尺寸过程中,将其尺寸分成若干组,[,]a b 是其中一组,抽查出的个体数在该组上的频率为m ,该组上的直方图的高为h ,则||a b -等于 ( )()A hm ()B h m ()C mh()D 与,m h 无关 4.一个总体的个数为n ,用简单随机抽样的方法,抽取一个容量为2的样本,个体a 第一次未被抽到,个体a 第一次未被抽到第二次被抽到,以及整个过程中个体a 被抽到的概率分别是 .5.某工厂生产A 、B 、C 三种不同型号的产品,产品数量之比依次为2:3:5.现用分层抽样方法抽出一个容量为n 的样本,样本中A 种型号产品有16件,那么此样本的容量n = .6.有一组数据:)(,,,,321321n n x x x x x x x x ≤≤≤≤ ,它们的算术平均值为10,若去掉其中最大的n x ,余下数据的算术平均值为9;若去掉其中最小的1x ,余下数据的算术平122 126 130 134 138 142 146 150 154 158 身高(cm )均值为11,则1x关于n的表达式为;n x关于n的表达式为 .7.为了比较甲、乙两位划艇运动员的成绩,在相同的条件下对他们进行了6次测验,测得m s)分别如下:他们的平均速度(/甲:2.7 3.8 3.0 3.7 3.5 3.1乙:2.9 3.9 3.8 3.4 3.6 2.8试根据以上数据,判断他们谁更优秀.8(1)列出样本的频率分布表;(2)画出频率分布直方图;(3)估计数据小于30的概率.9.100名学生分四个兴趣小组参加物理、化学、数学、计算机竞赛辅导,人数别是30、27、23、20.(1)列出学生参加兴趣小组的频率分布表;(2)画出表示频率分布的条形图.。
高三数学第一轮复习 第76课时—抽样方法、总体分布的估计(2)教案
抽样方法、总体分布的估计1.会用简单随机抽样法、系统抽样法、分层抽样法等常用方法从总体中抽取样本; 2.了解统计的基本思想,会用样本频率估计总体分布. 二.知识要点:1.(1)统计的基本思想是 .(2)平均数的概念 . (3)方差公式为 . 2.常用的抽样方法是 . 三.课前预习:1.某公司甲、乙、丙、丁四个地区分别有150 个、120个、180个、150个销售点.公司为了调查产品销售的情况,需从这600个销售点中抽取一个容量为100的样本,记这项调查为①;在丙地区中有20个特大型销售点,要从中抽取7个调查其收入和售后服务等情况,记这项调查为②.则完成①、②这两项调查宜采用的抽样方法依次是 ( B ) ()A 分层抽样法,系统抽样法 ()B 分层抽样法,简单随机抽样法 ()C 系统抽样法,分层抽样法()D 简单随机抽样法,分层抽样法2.已知样本方差由102211(5)10i i s x ==-∑,求得,则1210x x x +++= 50 . 3.设有n 个样本12,,,n x x x ,其标准差为x s ,另有n 个样本12,,,n y y y ,且35k k y x =+ (1,2,,)k n =,其标准差为y s ,则下列关系正确的是 ( B ) ()A 35y x s s =+ ()B 3y x s s = ()C y x s = ()D 5y x s =+4.某校为了了解学生的课外阅读情况,随机调查了50名学生,得到他们在某一天各自课外阅读所用时间的数据,结果用右侧的条形图表示. 根据条形图可得这50名学生这一天平均每人的课外阅读时间为 ( B )()A 0.6小时 ()B 0.9小时()C 1.0小时 ()D 1.5小时5.x 是12100,,x x x 的平均数,a 是1240,,x x x 的平均数,b 是4142100,,x x x 的平均数,则x ,a ,b 之间的关系为4060100a bx +=.6.某校有老师200人,男学生1200人,女学生1000人.现用分层抽样的方法从所有师生中抽取一个容量为n 的样本;已知从女学生中抽取的人数为80人,则n =112.7.一个总体中有100个个体,随机编号0,1,2,…,99,依编号顺序平均分成10个小 组,组号依次为1,2,3,…,10.现用系统抽样方法抽取一个容量为10的样本,规定如果在第1组随机抽取的号码为m ,那么在第k 组中抽取的号码个位数字与m k +的个位数字相同,若6m =,则在第7组中抽取的号码是 63 .8.在样本的频率分布直方图中,共有11个小长方形,若中间一个小长方形的面积等于其他10个小长方形的面积之和的14,且样本容量为160,则中间一组的频数为 32 . 四.例题分析:例1.某中学有员工160人,其中中高级教师48人,一般教师64人,管理人员16人,行政人员32人,从中抽取容量为20的一个样本.以此例说明,无论使用三种常用的抽样方法中的哪一种方法,总体中的每个个体抽到的概率都相同.时间(小解:(1)(简单随机抽样)可采用抽签法,将160人从1到160编号,然后从中抽取20个签,与签号相同的20个人被选出.显然每个个体抽到的概率为2011608=. (2)(系统抽样法)将160人从1到160编号,,按编号顺序分成20组,每组8人,先在第一组中用抽签法抽出k 号(18k ≤≤),其余组的8k n +(1,2,3,19)n =也被抽到,显然每个个体抽到的概率为18.(3)(分层抽样法)四类人员的人数比为3:4:1:2,又34206,2081010⨯=⨯= 12202,2041010⨯=⨯=,所以从中高级教师、一般教师、管理人员、行政人员中分别抽取6人、8人、2人、4人,每个个体抽到的概率为18.例2.质检部门对甲、乙两种日光灯的使用时间进行了破坏性试验,10次试验得到的两种日光灯的使用时间如下表所示,问:哪一种质量相对好一些?解:甲的平均使用寿命为:甲x =101214032130321202211012100⨯+⨯+⨯+⨯+⨯ =2121(h ),甲的平均使用寿命为 :乙x =101214022130521201211012100⨯+⨯+⨯+⨯+⨯=2121(h ),甲的方差为:2甲S =101999191142122222+⨯+⨯+⨯+=129(h 2),乙的方差为:2乙S =101214022130521201211012100⨯+⨯+⨯+⨯+⨯=109(h 2),∵甲x =乙x ,且2甲S >2乙S ,∴乙的质量好一些.(2)画出频率分布直方图;(3)根据累积频率分布,估计小于134的数据约占多少百分比.解:(1)样本的频率分布表与累积频率表如下:(3)根据累积频率分布,小于134的数据约占23100%19.2% 120⨯≈.122 126 130 134 138 142 146 150 154 158 身高(cm)五.课后作业: 班级 学号 姓名 1.一个单位有职工160人,其中业务人员96人,管理人员40人,后勤人员24人,为了解职工身体情况,要从中抽取一个容量为20的样本,如用分层抽样,则管理人员应抽到多少个 ( )()A 3 ()B 12 ()C 5 ()D 10 2.欲对某商场作一简要审计,通过检查发票及销售记录的2%来快速估计每月的销售总额.现采用如下方法:从某本50张的发票存根中随机抽一张,如15号,然后按序往后将65号,115号,165号,…发票上的销售额组成一个调查样本.这种抽取样本的方法是 ( )()A 简单随机抽样 ()B 系统抽样 ()C 分层抽样 ()D 其它方式的抽样3.在抽查某产品的尺寸过程中,将其尺寸分成若干组,[,]a b 是其中一组,抽查出的个体数在该组上的频率为m ,该组上的直方图的高为h ,则||a b -等于 ( )()A hm ()B h m ()C mh()D 与,m h 无关 4.一个总体的个数为n ,用简单随机抽样的方法,抽取一个容量为2的样本,个体a 第一次未被抽到,个体a 第一次未被抽到第二次被抽到,以及整个过程中个体a 被抽到的概率分别是 .5.某工厂生产A 、B 、C 三种不同型号的产品,产品数量之比依次为2:3:5.现用分层抽样方法抽出一个容量为n 的样本,样本中A 种型号产品有16件,那么此样本的容量n = .6.有一组数据:)(,,,,321321n n x x x x x x x x ≤≤≤≤ ,它们的算术平均值为10,若去掉其中最大的n x ,余下数据的算术平均值为9;若去掉其中最小的1x ,余下数据的算术平均值为11,则1x 关于n 的表达式为 ;n x 关于n 的表达式为 .7.为了比较甲、乙两位划艇运动员的成绩,在相同的条件下对他们进行了6次测验,测得他们的平均速度(/m s )分别如下:甲:2.7 3.8 3.0 3.7 3.5 3.1 乙:2.9 3.9 3.8 3.4 3.6 2.8 试根据以上数据,判断他们谁更优秀.8.有一个容量为100的样本,数据的分组及各组的频数如下:的概率.9.100名学生分四个兴趣小组参加物理、化学、数学、计算机竞赛辅导,人数别是30、27、23、20.(1)列出学生参加兴趣小组的频率分布表;(2)画出表示频率分布的条形图.。
高考数学一轮复习第十二章概率与统计12.4.1抽样方法与总体分布的估计课件理
各层抽样时,采 用简单随机抽样 或者系统抽样
总体由差异明显的 几部分组成
命题法 2 用样本估计总体 典例 2 (1)某校 100 名学生期中考试语文成绩的频率分布直方图如图所示,其中成绩分组区间是: [50,60),[60,70),[70,80),[80,90),[90,100]. ①求图中 a 的值; ②根据频率分布直方图,估计这 100 名学生语文成绩的平均分; ③若这 100 名学生语文成绩某些分数段的人数(x)与数学成绩相应分数段的人数(y)之比如下表所示,求 数学成绩在[50,90)之外的人数.
【解题法】 三种抽样方法的比较
类别
共同点
各自特点
相互联系
适用范围
简单随机抽样
从总体中逐个抽取 —
总体中的个数较少
系统抽样
是不放回抽 将总体均分成几部 在起始部分抽样 总体中的个数比较
样,抽样过程 分,按事先确定的规 时,采用简单随 多
中,每个个体 则,在各部分抽取 机抽样
分层抽样
被抽到的机 将总体分成几层,分
1.思维辨析 (1)系统抽样在第 1 段抽样时采用简单随机抽样.( √ ) (2)若为了适合分段或分层而剔除几个个体后再抽样,则对剔除的个体来说是不公平的.( × ) (3)一组数据的平均数—定大于这组数据中的每个数据.( × ) (4)一组数据的方差越大,说明这组数据的波动越大.( √ ) (5)频率分布直方图中,小矩形的面积越大,表示样本数据落在该区间内的频率越高.( √ ) (6)茎叶图中的数据要按从小到大的顺序写,相同的数据可以只记一次.( × )
[考法综述] 高考对随机抽样的考查常以实际应用为背景考查样本的抽取,特别是分层抽样与系统 抽样的理解与计算.利用样本频率分布估计总体分布是高考热点,会列频率分布表,会画频率分布直方图, 小题一般较容易,大题往往结合概率考查,难度中等.
高考数学一轮复习专题:抽样方法与总体分布的估计(教案及同步练习)
1.简单随机抽样(1)定义:一般地,设一个总体含有N 个个体,从中逐个不放回地抽取n 个个体作为样本(n ≤N ),如果每次抽取时总体内的各个个体被抽到的机会都相等,就把这种抽样方法叫做简单随机抽样. (2)最常用的简单随机抽样方法有两种——抽签法和随机数法. 2.系统抽样的步骤一般地,假设要从容量为N 的总体中抽取容量为n 的样本. (1)先将总体的N 个个体编号;(2)确定分段间隔k ,对编号进行分段.当N n (n 是样本容量)是整数时,取k =Nn ;(3)在第1段用简单随机抽样确定第一个个体编号l (l ≤k );(4)按照一定的规则抽取样本.通常是将l 加上间隔k 得到第2个个体编号(l +k ),再加k 得到第3个个体编号(l +2k ),依次进行下去,直到获取整个样本. 3.分层抽样(1)定义:一般地,在抽样时,将总体分成互不交叉的层,然后按照一定的比例,从各层独立地抽取一定数量的个体,将各层取出的个体合在一起作为样本,这种抽样方法是一种分层抽样. (2)分层抽样的应用范围:当总体由差异明显的几个部分组成时,往往选用分层抽样的方法. 【思考辨析】判断下列结论是否正确(请在括号中打“√”或“×”) (1)简单随机抽样是一种不放回抽样.( √ )(2)简单随机抽样每个个体被抽到的机会不一样,与先后有关.( × ) (3)抽签法中,先抽的人抽中的可能性大.( × ) (4)系统抽样在第1段抽样时采用简单随机抽样.( √ )(5)要从1 002个学生中用系统抽样的方法选取一个容量为20的样本,需要剔除2个学生,这样对被剔除者不公平.( × )(6)分层抽样中,每个个体被抽到的可能性与层数及分层有关.( × )1.(教材改编)某公司有员工500人,其中不到35岁的有125人,35~49岁的有280人,50岁以上的有95人,为了调查员工的身体健康状况,从中抽取100名员工,则应在这三个年龄段分别抽取人数为( ) A .33,34,33 B .25,56,19 C .20,40,30 D .30,50,20答案 B解析 因为125∶280∶95=25∶56∶19, 所以抽取人数分别为25,56,19.2.(2015·四川)某学校为了了解三年级、六年级、九年级这三个年级之间的学生视力是否存在显著差异,拟从这三个年级中按人数比例抽取部分学生进行调查,则最合理的抽样方法是( ) A .抽签法 B .系统抽样法 C .分层抽样法 D .随机数法 答案 C解析 根据年级不同产生差异及按人数比例抽取易知应为分层抽样法.3.(1)某学校为了了解2016年高考数学学科的考试成绩,在高考后对1 200名学生进行抽样调查,其中文科400名考生,理科600名考生,艺术和体育类考生共200名,从中抽取120名考生作为样本. (2)从10名家长中抽取3名参加座谈会.Ⅰ.简单随机抽样法 Ⅱ.系统抽样法 Ⅲ.分层抽样法 问题与方法配对正确的是( ) A .(1)Ⅲ,(2)Ⅰ B .(1)Ⅰ,(2)Ⅱ C .(1)Ⅱ,(2)Ⅲ D .(1)Ⅲ,(2)Ⅱ 答案 A解析 通过分析可知,对于(1),应采用分层抽样法,对于(2),应采用简单随机抽样法.4.将参加英语口语测试的1 000名学生编号为000,001,002,…,999,从中抽取一个容量为50的样本,按系统抽样的方法分为50组,如果第一组编号为000,001,002,…,019,且第一组随机抽取的编号为015,则抽取的第35个编号为________. 答案 695解析 由题意可知,第一组随机抽取的编号l =15,分段间隔数k =N n =1 00050=20,则抽取的第35个编号为a 35=15+(35-1)×20=695.5.某学校高一,高二,高三年级的学生人数之比为3∶3∶4,现用分层抽样的方法从该校高中三个年级的学生中抽取容量为50的样本,则应从高二年级抽取________名学生.答案15解析设应从高二年级抽取x名学生,则x∶50=3∶10,解得x=15.题型一简单随机抽样例1(1)以下抽样方法是简单随机抽样的是()A.在某年明信片销售活动中,规定每100万张为一个开奖组,通过随机抽取的方式确定号码的后四位为2709的为三等奖B.某车间包装一种产品,在自动包装的传送带上,每隔30分钟抽一包产品,称其重量是否合格C.某学校分别从行政人员、教师、后勤人员中抽取2人、14人、4人了解对学校机构改革的意见D.用抽签方法从10件产品中选取3件进行质量检验(2)总体由编号为01,02,…,19,20的20个个体组成.利用下面的随机数表选取5个个体,选取方法是从随机数表第1行的第5列和第6列数字开始由左到右依次选取两个数字,则选出来的第5个个体的编号为()A.08 B.07 C.02 D.01答案(1)D(2)D解析(1)选项A、B不是简单随机抽样,因为抽取的个体间的间隔是固定的;选项C不是简单随机抽样,因为总体的个体有明显的层次;选项D是简单随机抽样.(2)由题意知前5个个体的编号为08,02,14,07,01.思维升华应用简单随机抽样应注意的问题(1)一个抽样试验能否用抽签法,关键看两点:一是抽签是否方便;二是号签是否易搅匀.一般地,当总体容量和样本容量都较小时可用抽签法.(2)在使用随机数法时,如遇到三位数或四位数,可从选择的随机数表中的某行某列的数字计起,每三个或四个作为一个单位,自左向右选取,有超过总体号码或出现重复号码的数字舍去.(1)下列抽样试验中,适合用抽签法的有()A.从某厂生产的5 000件产品中抽取600件进行质量检验B.从某厂生产的两箱(每箱18件)产品中抽取6件进行质量检验C.从甲、乙两厂生产的两箱(每箱18件)产品中抽取6件进行质量检验D.从某厂生产的5 000件产品中抽取10件进行质量检验(2)下列抽取样本的方式不属于简单随机抽样的有________________.①从无限多个个体中抽取100个个体作为样本.②盒子里共有80个零件,从中选出5个零件进行质量检验.在抽样操作时,从中任意拿出一个零件进行质量检验后再把它放回盒子里.③从20件玩具中一次性抽取3件进行质量检验.④某班有56名同学,指定个子最高的5名同学参加学校组织的篮球赛. 答案 (1)B (2)①②③④解析 (1)A ,D 中的总体个体数较多,不适宜抽签法,C 中甲、乙两厂的产品质量有区别,也不适宜抽签法,故选B.(2)①不是简单随机抽样.②不是简单随机抽样.由于它是放回抽样.③不是简单随机抽样.因为这是“一次性”抽取,而不是“逐个”抽取.④不是简单随机抽样.因为指定个子最高的5名同学是56名中特指的,不存在随机性,不是等可能抽样. 题型二 系统抽样例2 (1)(2015·湖南)在一次马拉松比赛中,35名运动员的成绩(单位:分钟)的茎叶图如图所示若将运动员按成绩由好到差编为1~35号,再用系统抽样方法从中抽取7人,则其中成绩在区间[139,151]上的运动员人数是( ) A .3 B .4 C .5 D .6(2)某单位有840名职工,现采用系统抽样方法抽取42人做问卷调查,将840人按1,2,…,840随机编号,则抽取的42人中,编号落入区间[481,720]的人数为( ) A .11 B .12 C .13 D .14 答案 (1)B (2)B解析 (1)由题意知,将1~35号分成7组,每组5名运动员,成绩落在区间[139,151]的运动员共有4组,故由系统抽样法知,共抽取4名.故选B.(2)由84042=20,即每20人抽取1人,所以抽取编号落在区间[481,720]的人数为720-48020=24020=12.引申探究1.本例(2)中条件不变,若第三组抽得的号码为44,则在第八组中抽得的号码是________. 答案 144解析 在第八组中抽得的号码为(8-3)×20+44=144.2.本例(2)中条件不变,若在编号为[481,720]中抽取8人,则样本容量为________.答案 28解析 因为在编号[481,720]中共有720-480=240人,又在[481,720]中抽取8人,所以抽样比应为240∶8=30∶1,又因为单位职工共有840人,所以应抽取的样本容量为84030=28.思维升华 (1)系统抽样适用的条件是总体容量较大,样本容量也较大.(2)使用系统抽样时,若总体容量不能被样本容量整除,可以先从总体中随机地剔除几个个体,从而确定分段间隔.(3)起始编号的确定应用简单随机抽样的方法,一旦起始编号确定,其他编号便随之确定.(1)(2017·马鞍山月考)高三(1)班有学生52人,现将所有学生随机编号,用系统抽样方法,抽取一个容量为4的样本,已知5号、31号、44号学生在样本中,则样本中还有一个学生的编号是( ) A .8 B .13 C .15 D .18(2)(2016·烟台模拟)采用系统抽样方法从960人中抽取32人做问卷调查,为此将他们随机编号为1,2,…,960,分组后在第一组采用简单随机抽样的方法抽到的号码为9.抽到的32人中,编号落入区间[1,450]的人做问卷A ,编号落入区间[451,750]的人做问卷B ,其余的人做问卷C .则抽到的人中,做问卷B 的人数为( ) A .7 B .9 C .10 D .15 答案 (1)D (2)C解析 (1)分段间隔为524=13,故还有一个学生的编号为5+13=18,故选D.(2)由系统抽样的特点知:抽取号码的间隔为96032=30,抽取的号码依次为9,39,69,…,939.落入区间[451,750]的有459,489,…,729,这些数构成首项为459,公差为30的等差数列,设有n 项,显然有729=459+(n -1)×30,解得n =10.所以做问卷B 的有10人. 题型三 分层抽样命题点1 求总体或样本容量例3 (1)(2016·东北三校联考)某工厂生产甲、乙、丙三种型号的产品,产品数量之比为3∶5∶7,现用分层抽样的方法抽出容量为n 的样本,其中甲种产品有18件,则样本容量n 等于( ) A .54 B .90 C .45 D .126(2)甲、乙两套设备生产的同类型产品共4 800件,采用分层抽样的方法从中抽取一个容量为80的样本进行质量检测.若样本中有50件产品由甲设备生产,则乙设备生产的产品总数为________件. 答案 (1)B (2)1 800解析 (1)依题意得33+5+7×n =18,解得n =90,即样本容量为90.(2)分层抽样中各层的抽样比相同.样本中甲设备生产的产品有50件,则乙设备生产的产品有30件.在4 800件产品中,甲、乙设备生产的产品总数比为5∶3,所以乙设备生产的产品的总数为1 800件. 命题点2 求某层入样的个体数例4 (1) (2015·北京)某校老年、中年和青年教师的人数见下表,采用分层抽样的方法调查教师的身体状况,在抽取的样本中,青年教师有320人,则该样本中的老年教师人数为( )A.90 B .100 C .180 D .300(2)(2015·福建)某校高一年级有900名学生,其中女生400名.按男女比例用分层抽样的方法,从该年级学生中抽取一个容量为45的样本,则应抽取的男生人数为________. 答案 (1)C (2)25解析 (1)由题意抽样比为3201 600=15,∴该样本中的老年教师人数为900×15=180.(2)由题意知,男生共有500名,根据分层抽样的特点,在容量为45的样本中男生应抽取人数为45×500900=25.思维升华 分层抽样问题类型及解题思路(1)求某层应抽个体数量:按该层所占总体的比例计算.(2)已知某层个体数量,求总体容量或反之:根据分层抽样就是按比例抽样,列比例式进行计算. (3)确定是否应用分层抽样:分层抽样适用于总体中个体差异较大的情况.(1)已知某地区中小学生人数和近视情况分别如图①和图②所示.为了解该地区中小学生的近视形成原因,用分层抽样的方法抽取2%的学生进行调查,则样本容量和抽取的高中生近视人数分别为________.(2)某公司共有1 000名员工,下设若干部门,现采用分层抽样方法,从全体员工中抽取一个样本容量为80的样本,已告知广告部门被抽取了4个员工,则广告部门的员工人数为________. 答案 (1)200,20 (2)50解析 (1)该地区中小学生总人数为 3 500+2 000+4 500=10 000,则样本容量为10 000×2%=200,其中抽取的高中生近视人数为2 000×2%×50%=20.(2)1 00080=x 4,x =50.五审图表找规律典例 (12分)某单位有2 000名职工,老年、中年、青年分布在管理、技术开发、营销、生产各部门中,如下表所示:人数 管理 技术开发 营销 生产 共计 老年 40 40 40 80 200 中年 80 120 160 240 600 青年 40 160 280 720 1 200 共计1603204801 0402 000(1)若要抽取40人调查身体状况,则应怎样抽样?(2)若要开一个25人的讨论单位发展与薪金调整方面的座谈会,则应怎样抽选出席人? (3)若要抽20人调查对广州亚运会举办情况的了解,则应怎样抽样?抽取40人调查身体状况↓(观察图表中的人数分类统计情况) 样本人群应受年龄影响↓(表中老、中、青分类清楚,人数确定) 要以老、中、青分层,用分层抽样 ↓要开一个25人的座谈会 ↓(讨论单位发展与薪金调整)样本人群应受管理、技术开发、营销、生产方面的影响 ↓(表中管理、技术开发、营销、生产分类清楚,人数确定) 要以管理、技术开发、营销、生产人员分层,用分层抽样 ↓要抽20人调查对广州亚运会举办情况的了解↓(可认为亚运会是大众体育盛会,一个单位人员对情况了解相当) 将单位人员看作一个整体 ↓(从表中数据看总人数为2 000) 人员较多,可采用系统抽样规范解答解 (1)按老年、中年、青年分层,用分层抽样法抽取,[1分] 抽取比例为402 000=150.[2分] 故老年人、中年人、青年人各抽取4人、12人、24人.[4分] (2)按管理、技术开发、营销、生产分层,用分层抽样法抽取,[5分] 抽取比例为252 000=180,[6分] 故管理、技术开发、营销、生产各部门抽取2人、4人、6人、13人.[8分] (3)用系统抽样,对全部2 000人随机编号,号码从0001~2000,每100号分为一组,从第一组中用简单随机抽样抽取一个号码,然后将这个号码分别加100,200,…,1 900,共20人组成一个样本.[12分]1.某校选修乒乓球课程的学生中,高一年级有30名,高二年级有40名.现用分层抽样的方法在这70名学生中抽取一个样本,已知在高一年级的学生中抽取了6名,则在高二年级的学生中应抽取的人数为( ) A .6 B .8 C .10 D .12答案 B解析 设样本容量为N ,则N ×3070=6,∴N =14,∴高二年级所抽学生人数为14×4070=8.2.(2017·榆林月考)打桥牌时,将洗好的扑克牌(52张)随机确定一张为起始牌后,开始按次序搬牌,对任何一家来说,都是从52张总体抽取一个13张的样本.这种抽样方法是( ) A .系统抽样 B .分层抽样C .简单随机抽样D .非以上三种抽样方法 答案 A解析 符合系统抽样的特点,故选A.3.对一个容量为N 的总体抽取容量为n 的样本,当选取简单随机抽样、系统抽样和分层抽样三种不同方法抽取样本时,总体中每个个体被抽中的概率分别为p 1,p 2,p 3,则( ) A .p 1=p 2<p 3 B .p 2=p 3<p 1 C .p 1=p 3<p 2 D .p 1=p 2=p 3 答案 D解析 由于三种抽样过程中,每个个体被抽到的概率都是相等的,因此p 1=p 2=p 3.4.为了解1 000名学生的学习情况,采用系统抽样的方法,从中抽取容量为40的样本,则分段的间隔为( ) A .50 B .40 C .25 D .20 答案 C解析 由1 00040=25,可得分段的间隔为25.5.某初级中学有学生270人,其中一年级108人,二、三年级各81人,现要利用抽样方法抽取10人参加某项调查,考虑选用简单随机抽样、分层抽样和系统抽样三种方案,使用简单随机抽样和分层抽样时,将学生按一、二、三年级依次统一编号为1,2,…,270,使用系统抽样时,将学生统一随机编号为1,2,…,270,并将整个编号依次分为10段,如果抽得号码有下列四种情况: ①7,34,61,88,115,142,169,196,223,250 ②5,9,100,107,111,121,180,195,200,265 ③11,38,65,92,119,146,173,200,227,254 ④30,57,84,111,138,165,192,219,246,270 关于上述样本的下列结论中,正确的是( ) A .②、③都不能为系统抽样 B .②、④都不能为分层抽样 C .①、④都可能为系统抽样 D .①、③都可能为分层抽样 答案 D解析 因为③可以为系统抽样,所以选项A 不对;因为②可以为分层抽样,所以选项B 不对;因为④不为系统抽样,所以选项C 不对,故选D.6.将参加夏令营的600名学生编号为001,002,…,600.采用系统抽样方法抽取一个容量为50的样本,且随机抽得的号码为003.这600名学生分住在三个营区,从001到300在第Ⅰ营区,从301到495在第Ⅱ营区,从496到600在第Ⅲ营区,三个营区被抽中的人数依次为( ) A .26,16,8 B .25,17,8 C .25,16,9 D .24,17,9答案 B解析 由题意及系统抽样的定义可知,将这600名学生按编号依次分成50组,每一组各有12名学生,第k (k ∈N *)组抽中的号码是3+12(k -1). 令3+12(k -1)≤300得k ≤1034,因此第Ⅰ营区被抽中的人数是25; 令300<3+12(k -1)≤495得1034<k ≤42,因此第Ⅱ营区被抽中的人数是42-25=17.故选B.7.(2016·山西大同一中月考)用简单随机抽样的方法从含有10个个体的总体中,抽取一个容量为3的样本,其中某一个体a “第一次被抽到”的可能性与“第二次被抽到”的可能性分别是( )A.110,110B.310,15C.15,310D.310,310答案 A解析 在抽样过程中,个体a 每一次被抽中的概率是相等的,因为总体容量为10,故个体a “第一次被抽到”的可能性与“第二次被抽到”的可能性均为110,故选A.8.(2017·天津质检)某大学为了解在校本科生对参加某项社会实践活动的意向,拟采用分层抽样的方法,从该校四个年级的本科生中抽取一个容量为300的样本进行调查,已知该校一年级、二年级、三年级、四年级的本科生人数之比为4∶5∶5∶6,则应从一年级本科生中抽取________名学生. 答案 60解析 设应从一年级本科生中抽取x 名学生,则x 300=44+5+5+6,解得x =60.9.(2016·潍坊模拟)某高中在校学生有2 000人.为了响应“阳光体育运动”的号召,学校开展了跑步和登山的比赛活动.每人都参与而且只能参与其中一项比赛,各年级参与比赛的人数情况如下表:其中a ∶b ∶c =2∶3∶5,全校参与登山的人数占总人数的25.为了了解学生对本次活动的满意程度,从中抽取一个200人的样本进行调查,则从高二年级参与跑步的学生中应抽取的人数为________. 答案 36解析 根据题意,可知样本中参与跑步的人数为200×35=120,所以从高二年级参与跑步的学生中应抽取的人数为120×32+3+5=36.10.一个总体中有90个个体,随机编号0,1,2,…,89,以从小到大的编号顺序平均分成9个小组,组号依次为1,2,3,…,9.现用系统抽样方法抽取一个容量为9的样本,规定如果在第1组随机抽取的号码为m ,那么在第k 组中抽取的号码个位数字与m +k 的个位数字相同,若m =8,则在第8组中抽取的号码是________. 答案 76解析 由题意知m =8,k =8,则m +k =16,也就是第8组抽取的号码个位数字为6,十位数字为8-1=7,故抽取的号码为76.11.200名职工年龄分布如图所示,从中随机抽取40名职工作样本,采用系统抽样方法,按1~200编号,分为40组,分别为1~5,6~10,…,196~200,第5组抽取号码为22,第8组抽取号码为________.若采用分层抽样,40岁以下年龄段应抽取________人.答案 37 20解析 将1~200编号分为40组,则每组的间隔为5,其中第5组抽取号码为22,则第8组抽取的号码应为22+3×5=37;由已知条件200名职工中40岁以下的职工人数为200×50%=100,设在40岁以下年龄段中应抽取x 人,则40200=x100,解得x =20.12.某校共有学生2 000名,各年级男、女学生人数如下表.已知在全校学生中随机抽取1名,抽到二年级女生的概率是0.19.现用分层抽样的方法在全校抽取64名学生,则应在三年级抽取的学生人数为________.答案 16解析 依题意可知二年级的女生有380人,那么三年级的学生人数应该是2 000-373-377-380-370=500,即总体中各个年级的人数比为3∶3∶2,故用分层抽样法应在三年级抽取的学生人数为64×28=16.13.某公路设计院有工程师6人,技术员12人,技工18人,要从这些人中抽取n 个人参加市里召开的科学技术大会.如果采用系统抽样和分层抽样的方法抽取,不用剔除个体,如果参会人数增加1个,则在采用系统抽样时,需要在总体中先剔除1个个体,求n . 解 总体容量为6+12+18=36.当样本容量是n 时,由题意知,系统抽样的间隔为36n ,分层抽样的比例是n 36,抽取的工程师人数为n36×6=n 6,技术员人数为n 36×12=n 3,技工人数为n 36×18=n2, 所以n 应是6的倍数,36的约数,即n =6,12,18.当样本容量为(n +1)时,总体容量是35人,系统抽样的间隔为35n +1,因为35n +1必须是整数,所以n 只能取6.即样本容量n =6.*14.某公司有一批专业技术人员,对他们进行年龄状况和接受教育程度(学历)的调查,其结果(人数分布)如下表:(1)用分层抽样的方法在35~50岁年龄段的专业技术人员中抽取一个容量为5的样本,将该样本看成一个总体,从中任取2人,求至少有1人学历为研究生的概率;(2)在这个公司的专业技术人员中按年龄状况用分层抽样的方法抽取N 个人,其中35岁以下48人,50岁以上10人,再从这N 个人中随机抽取出1人,此人的年龄为50岁以上的概率为539,求x ,y 的值.解 (1)用分层抽样的方法在35~50岁中抽取一个容量为5的样本,设抽取学历为本科的人数为m , ∴3050=m5,解得m =3. 抽取的样本中有研究生2人,本科生3人,分别记作S 1,S 2;B 1,B 2,B 3.从中任取2人的所有等可能基本事件共有10个:(S 1,B 1),(S 1,B 2),(S 1,B 3),(S 2,B 1),(S 2,B 2),(S 2,B 3),(S 1,S 2),(B 1,B 2),(B 1,B 3),(B 2,B 3),其中至少有1人的学历为研究生的基本事件有7个:(S 1,B 1),(S 1,B 2),(S 1,B 3),(S 2,B 1),(S 2,B 2),(S 2,B 3),(S 1,S 2), ∴从中任取2人,至少有1人学历为研究生的概率为710. (2)由题意,得10N =539,解得N =78,∴35~50岁中被抽取的人数为78-48-10=20, ∴4880+x =2050=1020+y, 解得x =40,y =5,即x ,y 的值分别为40,5.第十一章统计与概率第1讲抽样方法与总体分布的估计一、选择题1.为了了解所加工一批零件的长度,抽测了其中200个零件的长度,在这个问题中,200个零件的长度是( ).A.总体 B.个体是每一个零件C.总体的一个样本 D.样本容量解析200个零件的长度是总体的一个样本.答案 C2.用随机数表法从100名学生(其中男生25人)中抽取20人进行评教,某男学生被抽到的概率是( ).A.1100B.125C.15D.14解析从容量N=100的总体中抽取一个容量为n=20的样本,每个个体被抽到的概率都是n N =1 5.答案 C3.样本中共有五个个体,其值分别为a,0,1,2,3.若该样本的平均值为1,则样本方差为( ).A. 65B.65C. 2 D.2解析由题可知样本的平均值为1,所以a+0+1+2+35=1,解得a=-1,所以样本的方差为15[(-1-1)2+(0-1)2+(1-1)2+(2-1)2+(3-1)2]=2.答案 D4.甲、乙两人在一次射击比赛中各射靶5次,两人成绩的条形统计图如图所示,则().A .甲的成绩的平均数小于乙的成绩的平均数B .甲的成绩的中位数等于乙的成绩的中位数C .甲的成绩的方差小于乙的成绩的方差D .甲的成绩的极差小于乙的成绩的极差解析 由题意可知,甲的成绩为4,5,6,7,8,乙的成绩为5,5,5,6,9.所以甲、乙的成绩的平均数均为6,A 错;甲、乙的成绩的中位数分别为6,5,B 错;甲、乙的成绩的方差分别为15×[(4-6)2+(5-6)2+(6-6)2+(7-6)2+(8-6)2]=2,15×[(5-6)2+(5-6)2+(5-6)2+(6-6)2+(9-6)2]=125,C 对;甲、乙的成绩的极差均为4,D 错. 答案 C5.为了检查某超市货架上的奶粉是否含有三聚氰胺,要从编号依次为1到50的袋装奶粉中抽取5袋进行检验,用每部分选取的号码间隔一样的系统抽样方法确定所选取的5袋奶粉的编号可能是( ). A .5,10,15,20,25B .2,4,8,16,32C .1,2,3,4,5D .7,17,27,37,47解析 利用系统抽样,把编号分为5段,每段10个,每段抽取一个,号码间隔为10,故选D. 答案 D6.一组数据的平均数是2.8,方差是3.6,若将这组数据中的每一个数据都加上60,得到一组新数据,则所得新数据的平均数和方差分别是( ).A .57.2,3.6B .57.2,56.4C .62.8,63.6D .62.8,3.6 解析 平均数增加,方差不变. 答案 D 二、填空题7.体育彩票000001~100000编号中,凡彩票号码最后三位数为345的中一等奖,采用的抽样方法是________.解析系统抽样的步骤可概括为:总体编号,确定间隔,总体分段,在第一段内确定起始个体编号,每段内规则取样等几步.该抽样符合系统抽样的特点.答案系统抽样8.某学校为了解学生数学课程的学习情况,在1 000名学生中随机抽取200名,并统计这200名学生的某次数学考试成绩,得到了样本的频率分布直方图(如图).根据频率分布直方图可估计这1 000名学生在该次数学考试中成绩不低于60分的学生人数是________.解析低于60分学生所占频率为(0.002+0.006+0.012)×10=0.2,故低于60分的学生人数为1 000×0.2=200,所以不低于60分的学生人数为1 000-200=800.答案8009.沈阳市某高中有高一学生600人,高二学生500人,高三学生550人,现对学生关于消防安全知识了解情况进行分层抽样调查,若抽取了一个容量为n的样本,其中高三学生有11人,则n的值等于________.解析由n600+500+550=11550,得n=33(人).答案3310.某年级120名学生在一次百米测试中,成绩全部介于13秒与18秒之间.将测试结果分成5组:[13,14),[14,15),[15,16),[16,17),[17,18],得到如图所示的频率分布直方图.如果从左到右的5个小矩形的面积之比为1∶3∶7∶6∶3,那么成绩在[16,18]的学生人数是__________________________________________________________________.解析成绩在[16,18]的学生的人数所占比例为6+31+3+7+6+3=920,所以成绩在[16,18]的学生人数为120×920=54.答案54三、解答题11.某公路设计院有工程师6人,技术员12人,技工18人,要从这些人中抽取n个人参加市里召开的科学技术大会.如果采用系统抽样和分层抽样的方法抽取,不用剔除个体,如果参会人数增加1个,则在采用系统抽样时,需要在总体中先剔除1个个体,求n.解总体容量为6+12+18=36.当样本容量是n时,由题意知,系统抽样的间隔为36n,分层抽样的比例是n36,抽取的工程师人数为n36×6=n6,技术员人数为n36×12=n3,技工人数为n36×18=n2,所以n应是6的倍数,36的约数,即n=6,12,18.当样本容量为(n+1)时,总体容量是35人,系统抽样的间隔为35n+1,因为35n+1必须是整数,所以n只能取6.即样本容量n=6.12.某校高一某班的某次数学测试成绩(满分为100分)的茎叶图和频率分布直方图都受了不同程度的破坏,但可见部分如图,据此解答下列问题:。
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
*第十二章统计●网络体系总览●考点目标定位1.了解简单随机抽样、分层抽样及系统抽样的意义,会用它们对简单实际问题进行抽样.2.会用样本频率分布估计总体分布.3.会用样本估计总体平均值和方差.●复习方略指南在本章的复习中,要理解几种抽样方法的区别与联系.应充分注意一些重要概念的实际意义,理解概率统计中处理问题的基本思想方法,掌握所学的概率统计知识的实际应用.这部分内容高考命题趋向主要以选择题、填空题为主,重点考查基础知识、基本概念及其简单的应用.对有关概率统计的应用题要多加关注.12.1 抽样方法与总体分布的估计●知识梳理1.简单随机抽样:一般地,设一个总体的个体数为N,如果通过逐个抽取的方法从中抽取一个样本,且每次抽取时各个个体被抽到的概率相等,就称这样的抽样为简单随机抽样.2.分层抽样:当已知总体由差异明显的几部分组成时,为了使样本更充分地反映总体的情况,常将总体分成几部分,然后按照各部分所占的比进行抽样,这种抽样叫做分层抽样.3.两种抽样方法的比较(略).4.总体:在数理统计中,通常把被研究的对象的全体叫做总体.5.频率分布:用样本估计总体,是研究统计问题的基本思想方法,样本中所有数据(或数据组)的频数和样本容量的比,就是该数据的频率.所有数据(或数据组)的频率的分布变化规律叫做样本的频率分布.可以用样本频率表、样本频率分布条形图或频率分布直方图来表示.6.总体分布:从总体中抽取一个个体,就是一次随机试验,从总体中抽取一个容量为n 的样本,就是进行了n次试验,试验连同所出现的结果叫随机事件,所有这些事件的概率分布规律称为总体分布.●点击双基1.为调查参加运动会的1000名运动员的年龄情况,从中抽查了100名运动员的年龄,就这个问题来说,下列说法正确的是A.1000名运动员是总体B.每个运动员是个体C.抽取的100名运动员是样本D.样本容量是100解析:这个问题我们研究的是运动员的年龄情况.因此应选D.答案:D2.一个总体中共有10个个体,用简单随机抽样的方法从中抽取一个容量为3的样本,则某特定个体入样的概率是A.310C 3B.89103⨯⨯ C.103 D.101解析:用简单随机抽样法从中抽取,则每个个体被抽到的概率都相同为103,所以选C.答案:C3.一个容量为n 的样本,分成若干组,已知某数的频数和频率分别为40、0.125,则n 的值为A.640B.320C.240D.160解析:∵n40=0.125,∴n =320.故选B.答案:B4.某单位有老年人27人,中年人54人,青年人81人,为了调查他们的健康状况,需从他们中抽取一个容量为36的样本,在简单随机抽样、系统抽样、分层抽样这三种方法中较合适的抽样方法是___________.解析:要研究的总体里各部分情况差异较大,因此用分层抽样. 答案:分层抽样_______(精确到0.01).解析:由频率计算方法知:总人数=45. 分数在[100,110)中的频率为458 =0.178≈0.18.分数不满110分的累积频率为458652+++=4521≈0.47.答案:0.18 0.47 ●典例剖析【例1】 (2004年湖南,5)某公司在甲、乙、丙、丁四个地区分别有150个、120个、180个、150个销售点.公司为了调查产品销售的情况,需从这600个销售点中抽取一个容量为100的样本,记这项调查为①;在丙地区中有20个特大型销售点,要从中抽取7个调查其销售收入和售后服务情况,记这项调查为②.则完成①、②这两项调查宜采用的抽样方法依次是A.分层抽样法,系统抽样法B.分层抽样法,简单随机抽样法C.系统抽样法,分层抽样法D.简单随机抽样法,分层抽样法剖析:此题为抽样方法的选取问题.当总体中个体较多时宜采用系统抽样;当总体中的个体差异较大时,宜采用分层抽样;当总体中个体较少时,宜采用随机抽样.依据题意,第①项调查应采用分层抽样法、第②项调查应采用简单随机抽样法.故选B.答案:B评述:采用什么样的抽样方法要依据研究的总体中的个体情况来定.【例2】(2004年福建,15)一个总体中有100个个体,随机编号为0,1,2,…,99,依编号顺序平均分成10个小组,组号依次为1,2,3,…,10.现用系统抽样方法抽取一个容量为10的样本,规定如果在第1组随机抽取的号码为m,那么在第k小组中抽取的号码个位数字与m+k的个位数字相同.若m=6,则在第7组中抽取的号码是___________.剖析:此问题总体中个体的个数较多,因此采用系统抽样.按题目中要求的规则抽取即可.∵m=6,k=7,m+k=13,∴在第7小组中抽取的号码是63.答案:63评述:当总体中个体个数较多而差异又不大时可采用系统抽样.采用系统抽样在每小组内抽取时应按规则进行.【例3】把容量为100的某个样本数据分为10组,并填写频率分布表,若前七组的累积频率为0.79,而剩下三组的频数成公比大于2的整数等比数列,则剩下三组中频数最高的一组的频数为___________.剖析:已知前七组的累积频率为0.79,而要研究后三组的问题,因此应先求出后三组的频率之和为1-0.79=0.21,进而求出后三组的共有频数,或者先求前七组共有频数后,再计算后三组的共有频数.由已知知前七组的累积频数为0.79×100=79,故后三组共有的频数为21,依题意q qa--⋅1) 1(31=21,a1(1+q+q2)=21.∴a1=1,q=4.∴后三组频数最高的一组的频数为16.答案:16评述:此题剖析只按第二种思路给出了解答,你能按第一种思路来解吗?(1)列出频率分布表;(2)画出频率分布直方图和累积频率分布图;(3)估计电子元件寿命在100~400 h以内的概率;(4)估计电子元件寿命在400 h以上的概率.剖析:通过本题可掌握总体分布估计的各种方法和步骤.解:(1)频率分布表如下:(2)频率分布直方图如下:h )1.0.0.0.0.(3)由累积频率分布图可以看出,寿命在100~400 h 内的电子元件出现的频率为0.65,所以我们估计电子元件寿命在100~400 h 内的概率为0.65.(4)由频率分布表可知,寿命在400 h 以上的电子元件出现的频率为0.20+0.15=0.35,故我们估计电子元件寿命在400 h 以上的概率为0.35.评述:画频率分布条形图、直方图时要注意纵、横坐标轴的意义. ●闯关训练 夯实基础1.(2004年江苏,6)某校为了了解学生的课外阅读情况,随机调查了50名学生,得到他们在某一天各自课外阅读所用时间的数据,结果用下面的条形图表示,根据条形图可得这50名学生这一天平均每人的课外阅读时间为A.0.6 hB.0.9 hC.1.0 hD.1.5 h解析:505.020)5.11(1025⨯++⨯+⨯=0.9.答案:B2.某单位有职工100人,不到35岁的有45人,35岁到49岁的有25人,剩下的为50岁以上的人,用分层抽样法从中抽取20人,各年龄段分别抽取的人数为A.7,5,8B.9,5,6C.6,5,9D.8,5,7解析:45×10020=51×45=9,25×10020=5,30×51=6.答案:B3.某单位共有N 个职工,要从N 个职工中采用分层抽样法抽取n 个样本,已知该单位的某一部门有M 个员工,那么从这一部门中抽取的职工数为___________.答案:NMn4.下图是容量为100的样本的频率分布直方图,试根据图形中的数据填空:(1)样本数据落在范围[6,10)内的频率为___________; (2)样本数据落在范围[10,14)内的频数为___________; (3)总体在范围[2,6)内的概率约为___________. 答案:(1)0.32 (2)36 (3)0.085.举例说明简单随机抽样和分层抽样两种抽样方法,无论使用哪一种抽样方法,总体中的每一个个体被抽到的概率都相等.解:袋中有160个小球,其中红球48个,蓝球64个,白球16个,黄球32个,从中抽取20个作为一个样本.(1)使用简单随机抽样:每个个体被抽到的概率为16020=81.(2)使用分层抽样:四种球的个数比为3∶4∶1∶2.红球应抽103×20=6个;蓝球应抽104×20=8个;白球应抽101×20=2个;黄球应抽102×20=4个.由于486=648=162=324=81,所以,按颜色区分,每个球被抽到的概率也都是81.培养能力6.某工厂生产的产品,可分为一等品、二等品、三等品三类,根据抽样检验的记录有一等品54个、二等品140个、三等品6个.(1)估计三种产品的概率; (2)画出频率分布条形图. 解:(1)0.27,0.7,0.03. (2)频率分布条形图如下.7.有点难度哟!某县政府机关在编人员100人,其中副处级以上干部10人,一般干部70人,工人20人,上级人事部门为了了解职工对机构改革的意见,要从中抽取一个容量为20的样本,试说明具体实施办法,并证明用这种抽样方法可使总体中每个个体被抽到的概率相等.解:因机构改革关系到所有人的利益,故采用分层抽样方法较宜. ∵10020=51,∴10×51=2,70×51=14,20×51=4.故从副处级以上干部中抽取2人,从一般干部中抽取14人,从工人中抽取4人.副处级以上干部被抽到的概率为102=51,一般干部被抽到的概率为7014=51,工人被抽到的概率为204=51,即每个个体被抽到的概率都是10020=51.8.有点难度哟!从一个养鱼池中捕得m 条鱼,作上记号后再放入池中,数日后又捕得n 条鱼,其中k 条有记号,请估计池中有多少条鱼.解:设池中有N 条鱼,第一次捕得m 条作上记号后放入水池中,则池中有记号的鱼占Nm ;第二次捕得n 条,则这n 条鱼是一个样本,其中有记号的鱼占nk .我们用样本来估计总体分布,令nk =Nm ,∴N =kmn .探究创新 9.有点难度哟!1936年,美国进行总统选举,竞选的是民主党的罗斯福和共和党的兰登,罗斯福是在任的总统.美国权威的《文学摘要》杂志社,为了预测总统候选人谁能当选,采用了大规模的模拟选举,他们以电话簿上的地址和俱乐部成员名单上的地址发出1000万封信,收到回信200万封,在调查史上,样本容量这么大是少见的,杂志社花费了大量的人力和物力,他们相信自己的调查统计结果,即兰登将以57%对43%的比例获胜,并大力进行宣传.最后选举结果却是罗斯福以62%对38%的巨大优势获胜,连任总统.这个调查使《文学摘要》杂志社威信扫地,不久只得关门停刊.试分析这次调查失败的原因.解:失败的原因:抽样方法不正确.样本不是从总体(全体美国公民)中随机地抽取,1936年,美国有私人电话和参加俱乐部的家庭,都是比较富裕的家庭.1929~1933年的世界经济危机,使美国经济遭到沉重打击,“罗斯福新政”动用行政手段干预市场经济,损害了部分富人的利益,但广大的美国人民却从中得到了好处.所以,从这部分富人中抽取的样本严重偏离了总体,导致样本不具有代表性.●思悟小结1.采用什么抽样方法,要视情况来定:当总体中的个体较少时,一般可用随机抽样;当总体中的个体较多时,一般可用系统抽样;当总体由差异明显的几部分组成时,一般可用分层抽样.2.用样本估计总体,是研究统计问题的一个基本思想方法.用样本估计总体,本节主要研究在整体上用样本的频率分布估计总体的分布.●教师下载中心 教学点睛1.常用的抽样方法有三种:简单随机抽样、系统抽样、分层抽样,其中第一种是最简单、最基本的抽样方法.三种抽样方法的共同点:都是等概率抽样,体现了抽样的公平性;三种抽样方法各有其特点和适用的范围.2.总体分布反映了总体在各个范围内取值的概率.当总体中所取不同数值比较少时,常用条形图表示相应样本的频率分布;否则,常用频率分布直方图表示相应样本的频率分布.3.系统抽样的步骤:(1)将总体中的个体随机编号;(2)将编号分段;(3)在第1段中用简单随机抽样确定起始的个体编号;(4)按照事先研究的规则抽取样本.4.分层抽样的步骤:(1)分层;(2)按比例确定每层抽取个体的个数;(3)各层抽样(方法可以不同);(4)汇合成样本.5.解决总体分布估计问题的一般程序如下:(1)先确定分组的组数(最大数据与最小数据之差除以组距得组数);(2)分别计算各组的频数及频率(频率=总数频数);(3)画出频率分布直方图,并作出相应的估计.6.条形图是用其高度表示取各值的频率;直方图是用图形面积的大小表示在各区间内取值的频率;累积频率分布图是一条折线,利用任意两端值的累积频率之差表示样本数据在这两点值之间的频率.拓展题例 【例1】 (2004年辽宁省重点高中模拟题)用系统抽样法要从160名学生中抽取容量为20的样本,将160名学生随机地从1~160编号,按编号顺序平均分成20组(1~8号,9~16号,…,153~160号),若第16组抽出的号码为126,则第1组中用抽签的方法确定的号码是___________.解析:不妨设在第1组中随机抽到的号码为x ,则在第16组中应抽出的号码为120+x . 设第1组抽出的号码为x ,则第16组应抽出的号码是8×15+x =126,∴x =6. 答案:6【例2】 (2004年苏、锡、常、镇四市模拟题)某单位有职工160名,其中业务人员120名,管理人员16名,后勤人员24名.为了解职工的某种情况,要从中抽取一个容量为20的样本.若用分层抽样的方法,抽取的业务人员、管理人员、后勤人员的人数应分别为____________.解析:分层抽样应按各层所占的比例从总体中抽取. ∵120∶16∶24=15∶2∶3,又共抽出20人,∴各层抽取人数分别为20×2015=15人,20×202=2人,20×203=3人.答案:15人、2人、3人。