第9章第1讲 随机抽样

合集下载

高中数学知识点:抽样方法

高中数学知识点:抽样方法

高中数学知识点:抽样方法一、简单随机抽样设一个总体的个体数为N,假如通过逐个抽取的方法从中抽取一个样本,且每次抽取时,各个体被抽到的概率相等,就称如此的抽样为简单随机抽样。

一样地假如用简单随机抽样从个体数为N的总体中抽取一个容量为n的样本那么每个个体被抽到的概率等于n/N.常用的简单随机抽样方法有:抽签法、随机数法。

1.抽签法一样地,抽签法确实是把总体中的N个个体编号,把号码写在号签上,将号签放在一个容器中,搅拌平均后,每次从中抽取一个号签,连续抽取n 次,就得到一个容量为n的样本。

2.随机数法随机抽样中,另一个经常被采纳的方法是随机数法,即利用随机数表、随机数骰子或运算机产生的随机数进行抽样。

二、活用随机抽样系统抽样的最差不多特点是“等距性”,每组内所抽取的号码需要依据第一组抽取的号码和组距是唯独确定,每组抽取样本的号码依次构成一个以第一组抽取的号码m为首项,组距d为公差的等差数列{an},第k组抽取样本的号码,ak=m+(k-1)d,如本题中依照第一组的样本号码和组距,可得第k组抽取号码应该为9+30*(k-1)三、系统抽样要练说,先练胆。

说话胆小是幼儿语言进展的障碍。

许多幼儿当众说话时显得可怕:有的结巴重复,面红耳赤;有的声音极低,自讲自听;有的低头不语,扯衣服,扭身子。

总之,说话时外部表现不自然。

我抓住练胆那个关键,面向全体,偏向差生。

一是和幼儿建立和谐的语言交流关系。

每当和幼儿讲话时,我总是笑脸相迎,声音亲切,动作亲昵,排除幼儿恐惧心理,让他能主动的、自由自在地和我交谈。

二是注重培养幼儿敢于当众说话的适应。

或在课堂教学中,改变过去老师讲学生听的传统的教学模式,取消了先举手后发言的约束,多采取自由讨论和谈话的形式,给每个幼儿较多的当众说话的机会,培养幼儿爱说话敢说话的爱好,对一些说话有困难的幼儿,我总是认真地耐心地听,热情地关心和鼓舞他把话说完、说好,增强其说话的勇气和把话说好的信心。

三是要提明确的说话要求,在说话训练中不断提高,我要求每个幼儿在说话时要仪态大方,口齿清晰,声音响亮,学会用眼神。

第9章第1讲 随机抽样

第9章第1讲 随机抽样

号为 1,2,…,1000,从这些新生中用系统抽样方法等距抽取 100 名学生进
行体质测验.若 46 号学生被抽到,则下面 4 名学生中被抽到的是( )
A.8 号学生
B.200 号学生
C.616 号学生
D.815 号学生
解析 根据题意,系统抽样是等距抽样,所以抽样间隔为1100000=10.因
为 46 除以 10 余 6,所以抽到的号码都是除以 10 余 6 的数,结合选项知应
解析 答案
2.(2019·安徽芜湖模拟)为了解高中生在寒假期间每天自主学习的时间, 某校采用系统抽样的方法,从高三年级 900 名学生中抽取 50 名进行相关调 查.先将这 900 名高中生从 1 到 900 进行编号,求得间隔数 k=95000=18, 即每 18 名高中生中抽取 1 名,若在编号为 1~18 的高中生中随机抽取 1 名, 抽到的高中生的编号为 6,则在编号为 37~54 的高中生中抽到的高中生的 编号应该是___4_2____.
为 616.故选 C.
解析 答案
结论探究 本例条件不变,则被抽到的学生的最小编号为___6_____, 最大编号为__9_9_6____.
解析 根据题意,可知此系统抽样的抽样间隔为1100000=10,共分 100 组,46 号在第 5 组,故被抽到的最小编号在第一组,是 46-10×4=6,最 大编号在第 100 组,是 46+10×95=996.
情况,对甲、乙、丙、丁四个社区做分层抽样调查.假设四个社区驾驶员
的总人数为 N,其中甲社区有驾驶员 96 人.若在甲、乙、丙、丁四个社区
解析 答案
2.利用简单随机抽样,从 n 个个体中抽取一个容量为 10 的样本.若
第二次抽取时,余下的每个个体被抽到的概率为13,则在整个抽样过程中,

随机抽样 - 简单 - 讲义

随机抽样 - 简单 - 讲义

随机抽样知识讲解一、统计中的相关概念总体:所考察对象的某一数值指标的全体构成的集合看作总体.个体:构成总体的每一个元素作为个体.样本:从总体中抽出若干个体所组成的集合叫做样本.样本容量:样本中个体的数目叫样本容量.统计的基本思想方法:用样本估计总体,即通常不去直接去研究总体,而是通过从总体中随机抽取一个样本,根据样本的情况去估计总体的相应情况.二、简单随机抽样1.简单随机抽样的概念概念:一般地,从元素个数为N的总体中不放回地抽取容量为n样本,如果每一次抽取时总体中的各个个体有相同的可能性被抽到,这种抽样方法叫做简单随机抽样.2.简单随机抽样的特点1)被抽取样本的总体的个数有限;2)从总体中逐个地进行抽取,使抽样便于在实践中操作;3)它是不放回抽样,使其具有广泛的应用性;4)它是等可能抽样,每个个体被抽到的可能性都是nN,保证了抽样方法的公平性.3.常用的简单随机抽样方法1)抽签法:把总体中的N个个体编号,把号码写在号签上,将号签放在一个容器中,搅拌均匀后,每次从中抽取一张号签,连续抽取n次,就得到一个容量为n的样本.抽签法的步骤:a.编号,即给总体中的所有个体编号,号码可以从1到N.b.制签,即将1~N这N个号码写在形状、大小相同的号签上(号签可以用小球、卡片、纸条等制作).c搅拌均匀,即将号签放在一个不透明的容器中,搅拌均匀..d逐个不放回抽取,即从容器中每次抽取一个号签,并记录其编号,连续抽取n次.抽签法的优缺点:.a优点:简单易行..b缺点:当总体的容量非常大时,费时、费力又不方便.况且,如果号签搅拌的不均匀,可能导致抽样的不公平.2)随机数表法:随机数表是由0,1,2,,9L这10个数字组成的数表,并且表中的每一位置出现各个数字的可能性相同.通过,随机数表,根据实际需要和方便使用的原则,将几个数组合成一组,然后通过随机数表抽取样本.随机数表法的步骤:.a编号,即将总体中的所有个体进行编号(每个号码位数一致);.b在随机数表中任选一个数作为起始号码;.c从选定的数开始按一定的方向读下去,得到的号码若不在编号中,则跳过,若再编号中,则取出,如果得到的号码前面已经取出,也跳过,如此继续下去,直到取满为止;随机数表法的优缺点:.a优点:简单易行,它很好的解决了用抽签法当总体中的个体数较多时制签难的问题..b缺点:当总体中的个体数很多,需要的样本容量也很大时,用随机数表法抽取仍不方便.4.简单随机抽样的应用应用:常用的简单随机抽样方法有抽签法和随机数表法.抽签法一般适用于容量较小的总体,易于操作;随机数表法解决了制签比较麻烦的问题,但在利用“随机数表法”进行简单随机抽样时,要严格按照课本中介绍的步骤,否则易出错误.结合具体的问题,我们应灵活使用这两种方法.三、系统抽样1.系统抽样的概念概念:当总体元素个数很大时,可将总体分成均衡的若干部分,然后按照预先制定的规则,从每一部分抽取一个个体,得到所需要的样本,这种抽样方法叫做系统抽样.(由于抽样样的间隔相等,因此系统抽样也被称作等距抽样)2.系统抽样的步骤:1)编号,即将总体中的个体编号.为方便起见,也可直接利用个体所带有的号码,如准考证号、门牌号等;2)分段,即为将整个的编号进行分段,要确定分段的间隔k .当N n 是整数时,N k n =;当Nn不是整数时,则可用简单随机抽样的方法从总体中剔除一些个体,使剩下的总体中个体个数'N 能被n 整除,这时'N k n=. 3)确定起始个体编号,即由数字1~k 中随机抽取一个数S .4)按照预先确定的规则抽取样本,即通常是将S 依次加上间隔k 的倍数,这样样本的编号依次是:,,2,,(1).S S k S k S n k +++-L3.系统抽样的公平性当N n 是整数时,N k n =;当Nn不是整数时,则可用简单随机抽样的方法从总体中剔除一些个体,使剩下的总体中个体个数'N 能被n 整除,这时'N k n=,上述过程中,总体的每个个体被剔除的可能性相同,也就是说每个个体不被剔除的可能性相同,所以在整个抽样过程中每个个体抽取的可能性仍然相同.4.系统抽样的特点1)适用于总体容量较大的情况;2)剔除多余个体及第一段抽样都用简单随机抽样,因而与简单随机抽样有密切联系; 3)它是等可能抽抽样,每个个体被抽到的可能性都是nN. 四、分层抽样1.分层抽样的概念概念:当总体由有明显差别的几部分组成时,为了使抽取的样本更好地反映总体的情况,我们经常将总体中各个个体按某种特征分成若干个互不重叠的几部分,每一部分叫做层,在各层中按层在总体中所占比例进行简单随机抽样或系统抽样,这样的抽样方法叫做分层抽样.2.分层抽样的步骤1)分层,即将总体中各个个体按某种特征分成若干个互不重叠的几部分; 2)按比例确定每层抽取个体的个数;3)各层抽样,即各层中采用简单随机抽样或系统抽样抽取相应的个数; 4)汇合成样本.3.分层抽样的特点1)适用于总体由差异明显的几部分组成的情况;2)更充分的反映了总体的情况;3)它是等可能抽样,每个个体被抽到的可能性都是nN .五、三种抽样方式的区别与联系典型例题一.选择题(共5小题)1.(2015•湖北)我国古代数学名著《九章算术》有“米谷粒分”题:粮仓开仓收粮,有人送来米1534石,验得米内夹谷,抽样取米一把,数得254粒内夹谷28粒,则这批米内夹谷约为()A.134石B.169石C.338石D.1365石【解答】解:由题意,这批米内夹谷约为1534×≈169石,故选:B.2.(2014•重庆)某中学有高中生3500人,初中生1500人,为了解学生的学习情况,用分层抽样的方法从该校学生中抽取一个容量为n的样本,已知从高中生中抽取70人,则n为()A.100 B.150 C.200 D.250【解答】解:分层抽样的抽取比例为=,总体个数为3500+1500=5000,∴样本容量n=5000×=100.故选:A.3.(2014•广东)为了解1000名学生的学习情况,采用系统抽样的方法,从中抽取容量为40的样本,则分段的间隔为()A.50 B.40 C.25 D.20【解答】解:∵从1000名学生中抽取40个样本,∴样本数据间隔为1000÷40=25.故选:C.4.(2014•湖南)对一个容量为N的总体抽取容量为n的样本,当选取简单随机抽样、系统抽样和分层抽样三种不同方法抽取样本时,总体中每个个体被抽中的概率分别为P1,P2,P3,则()A.P1=P2<P3B.P2=P3<P1C.P1=P3<P2D.P1=P2=P3【解答】解:根据简单随机抽样、系统抽样和分层抽样的定义可知,无论哪种抽样,每个个体被抽中的概率都是相等的,即P1=P2=P3.故选:D.5.(2013•湖南)某工厂甲、乙、丙三个车间生产了同一种产品,数量分别为120件,80件,60件.为了解它们的产品质量是否存在显著差异,用分层抽样方法抽取了一个容量为n的样本进行调查,其中从丙车间的产品中抽取了3件,则n=()A.9 B.10 C.12 D.13【解答】解:∵甲、乙、丙三个车间生产的产品件数分别是120,80,60,∴甲、乙、丙三个车间生产的产品数量的比依次为6:4:3,丙车间生产产品所占的比例,因为样本中丙车间生产产品有3件,占总产品的,所以样本容量n=3÷=13.故选:D.二.填空题(共2小题)6.(2017•江苏)某工厂生产甲、乙、丙、丁四种不同型号的产品,产量分别为200,400,300,100件.为检验产品的质量,现用分层抽样的方法从以上所有的产品中抽取60件进行检验,则应从丙种型号的产品中抽取18件.【解答】解:产品总数为200+400+300+100=1000件,而抽取60件进行检验,抽样比例为=,则应从丙种型号的产品中抽取300×=18件,故答案为:187.(2012•江苏)某学校高一、高二、高三年级的学生人数之比为3:3:4,现用分层抽样的方法从该校高中三个年级的学生中抽取容量为50的样本,则应从高二年级抽取15名学生.【解答】解:∵高一、高二、高三年级的学生人数之比为3:3:4,∴高二在总体中所占的比例是=,∵用分层抽样的方法从该校高中三个年级的学生中抽取容量为50的样本,∴要从高二抽取,故答案为:15三.解答题(共3小题)8.从2开始的200个偶数,即2、4、6、8…400中,用系统抽样的办法抽取20个偶数作样本.【解答】解:S1:编号,把2、4、6、8…400这200个偶从002到400按偶数次序编号;S2:分段,计算分间隔为k==10,把编号从小到大依次分成20段,每段10个号;S3:定首号,在第一段002~020的10个号中,用简单随机抽样的方法,抽取一个号码,假设抽中的是008;S4:取余号,依次抽取008,028,048,068,088,108,128,148,168,188,208,228,248,268,288,308,328,348,368,388.9.某校组织高一学生对所在市的居民中拥有电视机、电冰箱、组合音响的情况进行一次抽样调查,调查结果:3户特困户三种全无;有一种的:电视机1090户,电冰箱747户,组合音响850户;有两种的:电视机、组合音响570户,组合音响、电冰箱420户,电视机、电冰箱520户;“三大件”都有的265户.调查组的同学在统计上述数字时,发现没有记下被调查的居民总户数,你能避免重新调查而解决这个问题吗?【解答】解:由题意,抽样调查总数3+265+255+265+72+305+155+125=1445户,∴有两种的有1445﹣3﹣747﹣265=430户,故比例为3:747:430:265,利用分层抽样即可解决.10.某地区工人的平均工资是15元/小时,标准差为4元/小时.若从该地区抽取n=50个工厂,问所取得样本的平均工资的期望和方差各是多少?平均工资的抽样分布是什么?【解答】解:∵某地区工人的平均工资是15元/小时,∴抽取的样本的期望是15.∵标准差为4元/小时,∴抽取样本的方差是16.抽样分布符合二项分布,即X~N(15,16).。

第01讲 随机抽样、统计图表 (精讲)(学生版)

第01讲 随机抽样、统计图表 (精讲)(学生版)

,,1N Y N N +=∑,,1,2,3k )则总体均值还可以写成加121N Y Y Y NN ++==∑如果从总体中抽取一个容量为n 的样本,它们的变量,2y ,3y n y ,则称1nn y n n ++=为样本均值,又称样本平均数去估计总体平均数Y ;)总体平均数是一个确定的数,样本平均数具有随机性(应为样本具有随机性);D.以全年每一天作为样本3.(2022·新疆·新和县实验中学高一期末)我国古代数学名著《九章算术》有一抽样问题:“今有北乡若干人,西乡三百人,南乡两百人,凡三乡,发役六十人,而北乡需遗十,问北乡人数几何?“其意思为:“今有某地北面若干人,西面有300人,南面有200人,这三面要征调60人,而北面共征调10人(用分层抽样的方法),则北面共有()人.”A.200 B.100 C.400 D.3004.(2022·全国·高一单元测试)我国在贵州省平塘县修建的500米口径球面射电望远镜(FAST)是目前世界上最大单口径射电望远镜.截至2021年5月,该射电望远镜发现脉冲星逾370颗.脉冲星就是旋转的中子星,每一颗脉冲星每两脉冲间隔时间(脉冲星的自转周期)是一定的,最小的自转周期小到0.0014秒,最长的也不过11.765735秒.某天文研究机构观测并统计了其中93颗脉冲星的自转周期,绘制了如图所示的频率分布直方图.在这93颗脉冲星中,自转周期在2秒至10秒的颗数大约为___________ 颗.5.(2022·全国·高一单元测试)某校举行了一次网络安全知识竞赛,满分10分,有10名同学代表班级参加比赛,已知学生得分均为整数,比赛结束后统计这10名同学得分情况如折线图所示,若这10名同学成=___________.绩的极差为a,平均数为b,则a b6.(2022·全国·高一单元测试)挂壁公路是一种最有特色的公路,是在峭壁上开凿而出的奇险公路,其中位于河南辉县的郭亮挂壁公路最为出名,被称为“全球最奇特18条公路”之一.现对该公路某路段上1000辆汽车的行驶速度进行抽样调查,画出频率分布直方图(如图),根据频率分布直方图估计在此路段上汽车行驶速度在区间[85,90)的车辆数为___________,行驶速度不小于90km/h的概率为___________A.09B.13C.23D.24①该考场化学考试获得一等奖的有4人;其意思为:今某地北面有6773人,西面有5227人,南面有若干人,这三面要征调500人,而南面共征调200人(用分层抽样的方法),则南面共有()人.A.7200 B.8000 C.8200 D.88002.(2022·全国·高一单元测试)北京2022年冬奥会吉祥物“冰墩墩”和冬残奥会吉祥物“雪容融”一亮相,好评不断,这是中国文化与奥林匹克精神的一次完美结合.现工厂决定从20只相同的“冰墩墩”,15只相同的“雪容融”和10个相同的北京2022年冬奥会会徽中,采用分层随机抽样的方法,抽取一个容量为n的样本进行质量检测,若“冰墩墩”抽取了4只,则n=______.3.(2022·全国·高一课时练习)某公司生产甲、乙两种产品的数量之比为5:3,现用分层抽样的方法抽出一个样本,已知样本中甲种产品比乙种产品多6件,则甲种产品被抽取的件数为_______. 4.(2022·全国·高一专题练习)某校共有高一、高二、高三学生1290人,其中高一480人,高二比高三多30人,为了解该校学生的身体健康情况,现采用分层抽样方法进行调查,在抽取的样本中有高一学生96人,则该样本中的高三学生人数为________.题型三:统计图表角度1:扇形图、条形图典型例题例题1.(2022·浙江丽水·高一期末)某校高一年级1000名学生的血型统计情况如图所示.某课外兴趣小组为了研究血型与饮食之间的关系,决定采用分层随机抽样的方法从中抽取一个容量为100的样本,则从高一年级A型血的学生中应抽取的人数是()A.11B.22C.110D.220例题2.(2022·全国·高一专题练习)已知某地区中小学生人数和近视情况分别如图甲和图乙所示,为了了解该地区中小学生的近视形成原因,用分层抽样的方法抽取2%的学生进行调查,则样本容量和估计抽取的高中生近视人数分别为()A.180,40 B.180,20 C.180,10 D.100,10例题3.(2022·陕西·大荔县教学研究室高一期末)新冠肺炎期间某商场开通三种平台销售商品,收集一月内的数据如图1;为了解消费者对各平台销售方式的满意程度,该商场用分层抽样的方法抽取4%的顾客进行满意度调查,得到的数据如图2.下列说法错误的是()A.样本容量为240mB.若样本中对平台三满意的人数为40,则40%C.总体中对平台二满意的消费者人数约为300D.样本中对平台一满意的人数为24人同类题型归类练1.(2022·福建·三明一中模拟预测)已知某地区中小学生人数比例和近视情况分别如图甲和图乙所示,为了了解该地区中小学生的近视形成原因,用分层抽样的方法随机抽取1%的学生进行调查,其中被抽取的小学生有80人,则样本容量和该地区的高中生近视人数分别为()A.200,25 B.200,2500 C.8000,25 D.8000,25002.(2022·湖南常德·高一期末)某校为更好地支持学生个性发展,开设了学科拓展类、创新素质类、兴趣爱好类三种类型的校本课程,每位同学从中选择一门课程学习.现对该校6000名学生的选课情况进行了统计,如图①,并用分层抽样的方法从中抽取2%的学生对所选课程进行了满意率调查,如图②.则下列说法错误的是()A.抽取的样本容量为120B.该校学生中对兴趣爱好类课程满意的人数约为1050C.若抽取的学生中对创新素质类课程满意的人数为36,则70aD.该校学生中选择学科拓展类课程的人数为15003.(2022·新疆·乌鲁木齐市第70中高一期末)已知某地A、B、C三个村的人口户数及贫困情况分别如图(1)和图(2)所示,为了解该地三个村的贫困原因,当地政府决定采用分层抽样的方法抽取10%的户数进行调查,则样本容量和抽取C村贫困户的户数分别是()A.100,20B.100,10C.200,20D.200,104.(2022·全国·高一期末)某单位200名职工的年龄分布情况如图所示,现要从中抽取一个容量为40的样本,用分层抽样法应抽取50岁以上年龄段的职工___________人.角度2:折线图典型例题μg/m)例题1.(2022·黑龙江·哈九中高一期末)如图一所示,某市5月1日至10日PM2.5的日均值(单位:3变化的折线图,则该组数据第64百分位数为()A.45B.48C.78D.80例题2.(2022·广西桂林·模拟预测(文))已知全国农产品批发价格200指数月度变化情况如图所示,下列正确的选项是()A.全国农产品夏季价格比冬季低B.全国农产品价格指数2022年每个月逐渐增加C.全国农产品价格指数2022年菜篮子产品价格批发指数与农产品价格指数趋势基本保持一致D.2022年6月农产品批发价格指数大于116.例题3.(2022·辽宁·模拟预测)下图是2020年8月至2021年9月我国智能手机占比情况统计图,记这14-=______.个月的统计数据占比的众数、中位数分别为a,b,则a b例题4.(2022·全国·高三专题练习)下面的折线图给出的是甲、乙两只股票在某年中每月的收盘价格,已知股票甲的极差是6.88元,标准差为2.04元;股票乙的极差为27.47元,标准差为9.63元,根据这两只股票在这一年中的波动程度,给出下列结论:①股票甲在这一年中波动相对较小,表现的更加稳定;②购买股票乙风险高但可能获得高回报;③股票甲的走势相对平稳,股票乙的收盘价格波动较大;④两只股票在全年都处于上升趋势.其中正确的结论是________(填序号).同类题型归类练1.(2022·广西河池·高一期末)某保险公司推出了5个险种:甲,一年期短险;乙,两全保险;丙,理财类保险;丁,定期寿险;戊,重大疾病保险.现对5个险种参保客户进行抽样调查,得出如下的统计图:用样本估计总体,以下四个选项错误的是()A.30~41周岁参保人数最多B.随着年龄的增长,人均参保费用越来越多C.54周岁以下的参保人数约占总参保人数的8%D.定期寿险最受参保人青睐2.(2022·贵州·六盘水市第二中学高一阶段练习)某社区通过公益讲座以普及社区居民的垃圾分类知识.为了解讲座效果,随机抽取10位社区居民,让他们在讲座前和讲座后各回答一份垃圾分类知识问卷,这10位社区居民在讲座前和讲座后问卷答题的正确率如下图,则下列说法错误的是()A.讲座前问卷答题的正确率的中位数小于70%B.讲座后问卷答题的正确率的平均数大于85%C.讲座前问卷答题的正确率的标准差小于讲座后正确率的标准差D.讲座后问卷答题的正确率的极差大于讲座前正确率的极差3.(2022·陕西咸阳·高一期中)空气质量指数AQI是反映空气质量状况的指数,AQI指数的值越小,表明空气质量越好,AQI指数不超过50,空气质量为“优”;AQI指数大于50且不超过100,空气质量为“良”;AQI指数大于100,空气质量为“污染”.如图是某市2021年空气质量指数(AQI)的月折线图.下列关于该市2021年空气质量的叙述中,不正确的是______.(填序号)①全年的平均AQI指数对应的空气质量等级为优或良;②每月都至少有一天空气质量为优;③2月,8月,9月和12月均出现污染天气;④空气质量为“污染”的天数最多的月份是2月份.4.(2022·全国·高一课时练习)下图是一名护士为一位病人测量体温所得数据的折线统计图.以下描述正确的是__________.(填上所有正确的序号)①护士平均每天为病人测量4次体温;②第一天病人病情并未得到有效控制,体温在不断反复;③从第二天凌晨起病人体温在一直下降;④病人体温的极差为2.7℃.角度3:频率分布直方图典型例题例题1.(2022·天津·高考真题)为研究某药品的疗效,选取若干名志愿者进行临床试验,所有志愿者的舒张压数据(单位:kPa)的分组区间为[12,13),[13,14),[14,15),[15,16),[16,17],将其按从左到右的顺序分别编号为第一组,第二组,…,第五组,右图是根据试验数据制成的频率分布直方图.已知第一组与第二组共有20人,第三组中没有疗效的有6人,则第三组中有疗效的人数为()A.8 B.12 C.16 D.18例题2.(2022·全国·高一单元测试)为了进一步推动全市学习型党组织、学习型社会建设,某市组织开展“学习强国”知识测试,从全体测试人员中随机抽取了一部分人的测试成绩,得到频率分布直方图如图所示.假设同组中的每个数据都用该组区间的中点值代替,则估计这部分人的测试成绩的平均数和中位数分别是()A.85,87.5 B.86.75,86.67 C.86.75,85 D.85,85 (1)求表中M,p及图中a的值;(1)求第四个小矩形的高;(2)估算样本的众数、中位数和平均数.同类题型归类练4,5 1.(2022·黑龙江·大庆实验中学高一期末)某个容量为1000的样本的频率分布直方图如下,则在区间[)上的数据的频数为()A.300 B.30 C.20 D.2002.(2022·河北张家口·高一期末)持续两年多的“新冠肺炎”疫情给我们的社会、生产、生活带来了极大的不便,某医学院组织学生展开对“新型冠状病毒”的病理及防治的研究,通过一年多的试验,让学生根据试验结果,写“新冠肺炎的预防和治疗”毕业论文.如图所示是学校对60名学生的论文进行打分并整理后分成5组画出的频率分布直方图,已知从左到右4个小组的频率依次是0.05,0.15,0.35,0.30,那么在这次打分中,这60名学生论文得分的中位数大约是( )(精确到0.1)A .78.1B .78.2C .78.3D .78.43.(2022·新疆·沙湾县第一中学高一期末(文))某地教育部门对某学校学生的阅读素养进行检测,在该校随机抽取了M 名学生进行检测,实行百分制,现将所得的成绩按照[40,50),[50,60),[60,70),[70,80),[80,90),[90,100]分成6组,并根据所得数据作出了如下所示的频数与频率的统计表和频率分布直方图.(1)求出表中,M p 及图中a 的值;(2)估计该校学生阅读素养的成绩中位数以及平均数.4.(2022·河南·商丘市第一高级中学高一阶段练习)第24届冬奥会于2022年2月在北京举行,志愿者的服务工作是冬奥会成功举办的重要保障.某高校承办了北京志愿者选拔的面试工作.现随机抽取了100名候选者的面试成绩,并分成五组:第一组[)45,55,第二组[)55,65,第三组[)65,75,第四组[)75,85,第五组[)85,95,绘制成如图所示的频率分布直方图.已知第三、四、五组的频率之和为0.7,第一组和第五组的(1)求a,b的值;A.8 B.12 C.16 D.18、、A.20B.40C.64D.803.(2021·全国·高考真题(文))为了解某地农村经济情况,对该地农户家庭年收入进行抽样调查,将农户家庭年收入的调查数据整理得到如下频率分布直方图:根据此频率分布直方图,下面结论中不正确的是()A.该地农户家庭年收入低于4.5万元的农户比率估计为6%B.该地农户家庭年收入不低于10.5万元的农户比率估计为10%C.估计该地农户家庭年收入的平均值不超过6.5万元D.估计该地有一半以上的农户,其家庭年收入介于4.5万元至8.5万元之间。

第一讲 简单随机抽样一

第一讲 简单随机抽样一

第一讲简单随机抽样新知探究1.统计的相关概念(1)总体:统计中所考察对象的某一数值指标的全体构成的集合全体叫做总体.(2)个体:总体中的每一个元素叫做个体.(3)样本:从总体中抽出的若干个个体组成的集合叫做样本.(4)样本容量:样本的个体的数目叫做样本容量.(5)随机抽样:满足每一个个体都可能被抽到且被抽到的机会是均等的抽样.2.简单随机抽样(1)定义:从元素个数为N的总体中不放回地抽取容量为n的样本,如果每一次抽取时总体中的各个个体有相同的可能性被抽到,这种抽样方法叫做简单随机抽样.(2)常用方法:抽签法、随机数表法.抽签法的5个步骤随机数表法抽样的3个步骤(1)编号:这里的所谓编号,实际上是新编数字号码.(2)确定读数方向:为了保证选取数字的随机性,应在面对随机数表之前就指出开始数字的纵横位置,然后确定读数方向.(3)获取样本:读数在总体编号内的取出,而读数不在总体编号内的和已取出的不算,依次下去,直至得到容量为n的样本.(3)抽签法的优缺点: ①优点:简单易行. ②缺点:当总体的容量非常大时,费时、费力又不方便;如果标号的纸片或小球搅拌得不均匀,可能导致抽样的不公平.(4)随机数表法⎩⎨⎧ 随机数表计算器或计算机产生的随机数小试牛刀1.在简单随机抽样中,某一个个体被抽到的可能性( )A .与第几次抽样有关,第一次抽到的可能性最大B .与第几次抽样有关,第一次抽到的可能性最小C .与第几次抽样无关,每一次抽到的可能性相等D .与第几次抽样无关,与样本容量也无关解析:选C 由简单随机抽样的定义知C 正确.2.为了了解全校240名高一学生的身高情况,从中抽取40名学生进行测量.下列说法正确的是( )A .总体是240名学生B .个体是每一个学生C .样本是40名学生D .样本容量是40 解析:选D 在这个问题中,总体是240名学生的身高,个体是每个学生的身高,样本是被抽取的40名学生的身高,样本容量是40.因此选D.3.下列抽样试验中,适合用抽签法的有( )A .从某厂生产的3 000件产品中抽取600件进行质量检验B .从某厂生产的两箱(每箱15件)产品中抽取6件进行质量检验C .从甲、乙两厂生产的两箱(每箱15件)产品中抽取6件进行质量检验D .从某厂生产的3 000件产品中抽取10件进行质量检验解析:选B A 、D 中总体的个数较大,不适于用抽签法;C 中甲,乙两厂生产的两箱产品性质可能差别较大,因此未达到搅拌均匀的条件,也不适于用抽签法;B 中个体数和样本容量均较小,且同厂生产的两箱产品,性质差别不大,可以看做是搅拌均匀了,故选B.4.用抽签法进行抽样有以下几个步骤:①制签;②抽签;③将签摇匀;④编号;⑤将抽取的号码对应的个体取出,组成样本.这些步骤的正确顺序为________.答案:④①③②⑤典型例题[典例] 下面抽样方法是简单随机抽样的是( )A.从平面直角坐标系中抽取5个点作为样本B.可口可乐公司从仓库中的1 000瓶可乐中一次性抽取20瓶进行质量检查C.某连队从200名战士中,挑选出50名最优秀的战士去参加抢险救灾活动D.从10个手机中不放回地随机抽取2个进行质量检验(假设10个手机已编好号,对编号随机抽取)[解析] A中平面直角坐标系中有无数个点,这与要求总体中的个体数有限不相符,故错误;B中一次性抽取不符合简单随机抽样逐个抽取的特点,故错误;C中50名战士是最优秀的,不符合简单随机抽样的等可能性,故错误.[答案] D简单随机抽样的判断策略判断一个抽样能否用简单随机抽样,关键是看它是否满足四个特点:①总体的个体数目有限;②从总体中逐个进行抽取;③是不放回抽样;④是等可能抽样.同时还要注意以下几点:①总体的个体性质相似,无明显的层次;②总体的个体数目较少,尤其是样本容量较小;③用简单随机抽样法抽出的样本带有随机性,个体间无固定的距离.[活学活用]下列问题中,最适合用简单随机抽样方法抽样的是( )A.某电影院有32排座位,每排有40个座位,座位号是1~40,有一次报告会坐满了听众,报告会结束后为听取意见,要留下32名听众进行座谈B.从10台冰箱中抽出3台进行质量检查C.某学校有在编人员160人,其中行政人员16人,教师112人,后勤人员32人,教育部门为了解在编人员对学校机构改革的意见,要从中抽取一个容量为20的样本D.某乡农田有:山地800公顷,丘陵1 200公顷,平地2 400公顷,洼地400公顷,现抽取农田48公顷估计全乡农田平均每公顷产量解析:选B A的总体容量较大,用简单随机抽样法比较麻烦;B的总体容量较少,用简单随机抽样法比较方便;C由于学校各类人员对这一问题的看法可能差异很大,不宜采用简单随机抽样法;D总体容量大,且各类田地的差别很大,也不宜采用简单随机抽样法.[典例] 某师范大学为支援西部教育事业发展,计划从应届毕业生中选出一批志愿者.现从符合报名条件的18名志愿者中,选取6人组成志愿小组,请用抽签法设计抽样方案.[解] 第一步,将18名志愿者编号,号码为1,2,3, (18)第二步,将号码分别写在18张大小、形状都相同的纸条上,揉成团,制成号签.第三步,将制好的号签放入一个不透明的袋子中,并搅拌均匀.第四步,从袋子中依次抽取6个号签,并记录上面的编号.第五步,所得号码对应的志愿者就是志愿小组的成员.[活学活用]学校举办元旦晚会,需要从每班选10名男生,8名女生参加合唱节目.某班有男生32名,女生28名,试用抽签法确定该班参加合唱的同学.解:第一步,将32名男生从0到31进行编号;第二步,用相同的纸条做成32个号签,在每个号签上写上这些编号;第三步,将写好的号签放在一个容器内摇匀,不放回地逐个从中抽出10个号签;第四步,相应编号的男生参加合唱;第五步,用相同的办法从28名女生中选出8名参加合唱.[典例] 为适应山东2016年体育高考,舜耕中学从800名应届毕业生中,抽取60名学生进行身体素质测试,请设计抽样方法.[解] (1)将800名同学进行编号,可以编为000,001,002,003, (799)(2)在教材的随机数表中任选一个数,例如选出第3行第4列数5.(3)从选定的数开始向右读(读数的方向也可以是向左、向上、向下等,每次读3个数),得到一个号码593,由于593<799,将它取出,继续向右读,得到907,由于907>799,将它去掉,继续向右读,得到379,242,203,722,…,依次下去,直到取出60个号码,取出这60个号码对应的学生,就得到一个容量为60的样本.[活学活用]现有一批编号为10,11,…,99,100,…,600的元件,打算从中抽取一个容量为6的样本进行质量检验,如何用随机数表法设计抽样方案?解:第一步,将元件的编号调整为010,011,012,...,099,100, (600)第二步,在随机数表中任选一数作为开始,任选一方向作为读数方向.比如,选第6行第7个数3.第三步,从数3开始,向右读,每次读取三位,凡不在010~600中的数跳过去不读,前面已经读过的也跳过去不读,依次可得到321,273,279,600,552,254.第四步,以上这6个号码所对应的6个元件就是所要抽取的对象.(答案不唯一)[层级一学业水平达标]1.为抽查汽车排放尾气的合格率,其环保局在一路口随机抽查,这种抽查是( )A.简单随机抽样B.抽签法抽样C.随机数法抽样D.有放回抽样解析:选D 这是有放回抽样,而不是简单随机抽样.故选D.2.某次考试有70 000名学生参加,为了了解这70 000名考生的数学成绩,从中抽取1 000名考生的数学成绩进行统计分析,下列说法正确的是( ) A.1 000名考生是总体的一个样本B.70 000名考生是总体C.样本容量是1 000D.以上说法都不对解析:选C 由于考察的对象是考生的数学成绩,因此A、B错误,抽取的样本数为样本容量,因此C正确.故选C.3.已知下列抽取样本的方式:①从无限多个个体中抽取100个个体作为样本;②盒子里共有80个零件,从中选出5个零件进行质量检验,在抽样操作时,从中任意拿出1个零件进行质量检验后再把它放回盒子里;③从20件玩具中一次性抽取3件进行质量检验;④某班有56名同学,指定个子最高的5名同学参加学校组织的篮球赛.其中,不是简单随机抽样的是________(填序号).解析:①不是简单随机抽样,因为被抽取的总体的个体数是无限的,而不是有限的;②不是简单随机抽样,因为它是放回抽样;③不是简单随机抽样,因为这是“一次性”抽取,而不是“逐个”抽取;④不是简单随机抽样,因为指定个子最高的5名同学是56名同学中特指的,不存在随机性,不是等可能抽样.答案:①②③④4.某中学高一年级有400人,高二年级有320人,高三年级有280人,若每人被抽到的可能性为20%,用随机数法在该中学抽取容量为n的样本,则n等于________.解析:由n400+320+280=20%,解得n=200.答案:200[层级二应试能力达标] 1.下列抽样方法是简单随机抽样的是( ) A.从50个零件中一次性抽取5个做质量检验B.从50个零件中有放回地抽取5个做质量检验C.从实数集中随机抽取10个分析奇偶性D.运动员从8个跑道中随机选取一个跑道解析:选D A不是,因为“一次性”抽取与“逐个”抽取含义不同;B不是,因为是有放回抽样;C不是,因为实数集是无限集.2.抽签法中确保样本代表性的关键是( )A.抽签B.搅拌均匀C.逐一抽取D.抽取不放回解析:选B 逐一抽取,抽取不放回是简单随机抽样的特点,但不是确保样本代表性的关键,一次抽取与有放回抽取(个体被重复取出可不算再放回)也不影响样本的代表性,抽签也一样.3.某工厂的质检人员对生产的100件产品,采用随机数表法抽取10件检查,对100件产品采用下面的编号方法①1,2,3,...,100;②001,002,...,100;③00,01,02,...,99;④01,02,03, (100)其中正确的序号是( )A.②③④B.③④C.②③D.①②解析:选C 根据随机数表法的步骤可知,①④编号位数不统一,②③正确.4.用简单随机抽样方法从含有10个个体的总体中,抽取一个容量为3的样本,其中某一个体a“第一次被抽到”的可能性和“第二次被抽到”的可能性分别是( )A.110,110B.310,15C.15,310D.310,310解析:选A 简单随机抽样中每个个体被抽取的机会均等,都为1 10 .5.高一(1)班有60名学生,学号从01到60,数学老师在上统计课时,利用随机数表法选5名学生提问,老师首先选定从随机数表的倒数第5行(下表为随机数表的最后5行)第6列的“4”开始,向右读依次选学号提问,则被提问的5个学生的学号为________.33021 44709 79262 33116 80907 77689 69696 4842077713 32822 64679 94095 95735 84535 74703 8289025853 30963 76729 87613 65538 68978 13157 7883464145 71516 11716 58309 89501 59717 56086 3745968585 22783 22621 54263 41128 12663 82362 61855解析:依据选号规则,选取的5名学生的学号依次为:44,33,11,09,07,48.答案:44,33,11,09,07,486.某校有50个班,每班50人,现抽查250名同学进行摸底考试,则每位同学被抽到的可能性为________.解析:根据简单随机抽样的特征,总量为50×50=2 500人.∴每位同学被抽到的可能性为2502 500=1 10.答案:1 107.为了了解参加运动会的2 000名运动员的年龄情况,从中抽取20名运动员的年龄进行统计分析.就这个问题,下列说法中正确的有________.①2 000名运动员是总体;②每个运动员是个体;③所抽取的20名运动员是一个样本;④样本容量为20;⑤这个抽样方法可采用随机数法抽样;⑥采用随机数法抽样时,每个运动员被抽到的机会相等.解析:①2 000名运动员不是总体,2 000名运动员的年龄才是总体;②每个运动员的年龄是个体;③20名运动员的年龄是一个样本.答案:④⑤⑥8.上海某中学从40名学生中选1人作为上海男篮拉拉队的成员,采用下面两种选法:选法一将这40名学生从1~40进行编号,相应地制作1~40的40个号签,把这40个号签放在一个暗箱中搅匀,最后随机地从中抽取1个号签,与这个号签编号一致的学生幸运入选;选法二将39个白球与1个红球(球除颜色外,其他完全相同)混合放在一个暗箱中搅匀,让40名学生逐一从中摸取一球,摸到红球的学生成为拉拉队成员.试问这两种选法是否都是抽签法?为什么?解:选法一满足抽签法的特征是抽签法,选法二不是抽签法,因为抽签法要求所有的号签编号互不相同,而选法二中39个白球无法相互区分.。

华南农业大学营销调研贾莉课件第九章 抽样调查技术

华南农业大学营销调研贾莉课件第九章  抽样调查技术



1936年正值大萧条的谷底。那些订得起杂志、 用得起电话、开得起汽车的人经济状况远好于 普通民众,并且这些“上层”公民多数是共和 党人 《文摘》杂志调查的绝大多数选民都是共和党 人,所用的抽样方法不能保证民主党人获得同 样被调整的机会


启示:任何调研都要有一个好的抽样方法 一旦用错了抽样方法,即使样本容量巨 大也无法得出正确的结论 当年样本容量不大的调研却准确预测 罗斯福的当选,如盖洛普公司
第九章 抽样调查技术
黄豆和绿豆的比例




梁老师在课堂上提了一袋豆子,里面有新鲜的黄豆和 绿豆。梁老师将同学们分为十组,要求各组在五分钟 以内求出袋子里的黄豆和绿豆之比。 大部分同学走上讲台用杯取豆子,有的直接取了满满 一杯;有的取了少半杯。五分钟之后,具有典型代表 的是第一组和第六组 第一组计算比例为1:0.91,取出一小把豆子计算得 出 第六组还没有结果,这组同学认真地数着杯子里的黄 豆和绿豆,十分钟后得出比例为:1:0.9
22
23 24 25 26 27 28 29 30 31 32
18
18 18 18 19 19 19 19 19 19 19
55
85 86 87 85 66 71 95 96 88 67
13
14 15 16 17 18 19 20 要求 :抽 取 8 个学
17
18 18 18 18 18 18 18







抽样框并不是总能够很好地反映总体 抽样框误差:抽样框不能反映整个总体的程度 例如:总体是新泽西所有的汽车经销商,调查人员以黄页电话号 码簿,并非所有的经销商都在黄页上 误差形成原因: (1)丢失目标总体单位“涵盖不足” (2)包含非目标单位“过涵盖” (3)丢失目标单位和非目标单位共存 (4)复合连接:抽样框单元与目标总体单元并不完全一一对应, 而是存在一对多、多对一或多对多现象 (5)不正确的辅助信息误差“内容上的偏差” (6)抽样框老化“抽样框过时”

9.1.1简单随机抽样方法

9.1.1简单随机抽样方法

本章知识结构框图如下: 实际问题
总体 普 查
总体数据
简单随机抽样、分层随机抽样
总体数据的特征 总体的取值规律
总体的百分位数
估计 估计
样本数据的特征 样本的取值规律
样本的百分位数
样本
总体的平均数、中位数 估计 样本的平均数、中位数
众数 总体的标准差、方差 估计 样本的标准差、方差
极差
极差
决策与建议
样本观测数据
二、本章学习任务与指导 三个任务的完成,就生成了一个统计问题完整解决的基本思路:首先要根据实际需求, 用适当的方法获取样本数据,选择适当的统计图表对样本数据进行整理和描述,在此 基础上用各种统计方法对样本数据进行分析,从样本数据中提取需要的信息,推断总 体的情况,进而解决相应的实际问题,获得结论,为人们制定决策提出建议
总体 ____调__查__对__象___的全体叫作总体
个体 组成总体的每一个_调__查__对__象__成为个体
抽样调查 根据一定目的,从总体中抽取_一__部__分___个__体__进行调查,并以此为依据对 总体的情况作出估计和推断的调查方法,成为抽样调查
样本 从总体中抽取的那部分___个__体___成为样本
二、本章学习任务与指导 从本章知识结构图中可以看出,本章有三大学习任务:面对实际问题的解决,为人们 的决策提供什么样的建议,始终是我们学习本章的第一任务,也是我们学好本章的目标 驱动任务,也就是教材9.3节内容 那么,要完成这一任务,需要我们用样本的数据特征及其分布的规律性来估计、推断 出总体的数据特征及其分布的规律,例如,总体的取值规律、百分数、集中趋势、离 散程度等等,这是学习本章的第二任务也就是教材9.2节内容 要完成第二大任务,即“用样本估计总体”,就需要我们抽取“好”的或“高质量”的 样本,这就存在一个如何抽取样本的问题,即抽样方法问题,这是学习本章的第三任务。 也就是教材9.1节内容

9.1.1简单随机抽样-【新教材】人教A版(2019)高中数学必修第二册课前检测(含解析)

9.1.1简单随机抽样-【新教材】人教A版(2019)高中数学必修第二册课前检测(含解析)

人教A版9.1.1简单随机抽样课前检测一、单选题1.对于简单随机抽样,每个个体每次被抽到的机会()A.相等B.不相等C.无法确定D.与抽取的次数有关2.天气预报说,在今后的三天中,每天下雨的概率都为60%.现采用随机模拟试验的方法估计这三天中恰有两天下雨的概率:用1,2,3,4,5,6表示下雨,从下列随机数表的第1行第3列的1开始读取,直到读取了10组数据,18 18 07 92 45 44 17 16 58 09 79 83 86 19 62 06 76 50 03 1055 23 64 05 05 26 62 38 97 75 34 16 07 44 99 83 11 46 32 24据此估计,这三天中恰有两天下雨的概率近似为()A.35B.25C.12D.7103.用简单随机抽样方法从含有10个个体的总体中, 抽取一个容量为3的样本, 其中个体甲被第三次抽到的可能性为().A.13B.19C.310D.1104.福利彩票“双色球”中红色球由编号为01,02,…,33的33个球组成,某彩民利用下面的随机数表选取6组数作为6个红色球的编号,选取方法是从随机数表(如下)第1行的第6列数字开始由左到右依次选取两个数字,则选出来的第6个红色球的编号为()A.23 B.09 C.02 D.175.总体由编号为01,02,,19,20的20个个体组成,利用下面的随机数表选取5个个体,选取方法是从随机数表第1行第6列的数字开始由左到右依次选取两个数字,则选出来的第5个个体的编号为( )A.12 B.07 C.15 D.166.某班有40位同学,座位号记为01,02,,40,用下面的随机数表选取5组数作为参加青年志愿者活动的5位同学的座位号.4954 4454 8217 3793 2378 8735 2096 4384 2634 91645724 5506 8877 0474 4767 2176 3350 2583 9212 0767 5086选取方法是从随机数表第一行的第11列和第12列数字开始,由左到右依次选取两个数字,则选出来的第5个志愿者的座位号是( )A.09 B.20 C.37 D.387.下列抽样方法是简单随机抽样的是( )A.坛子中有1个大球,4个小球,搅拌均匀后,从中随机摸出一个球B.在校园里随意选三名同学进行调查C.在剧院里抽取三名观众调查,将所有座号写在同样的纸片上,放入箱子搅匀后逐个抽取,共取三张D.买彩票时随手写几组号8.下列4个抽样中,简单随机抽样的个数是( )①一儿童从玩具箱的20件玩具中任意拿一件玩,玩后放回再拿一件,连续玩了5件;②仓库中有1万支奥运火炬,从中一次性抽取100支火炬进行质量检查;③某连队从200名党员官兵中,挑选出50名最优秀的官兵赶赴灾区开展救灾工作;④一彩民选号,从装有36个大小、形状都相同的号签的盒子中无放回地抽出6个号签. A.0 B.1 C.2 D.39.某班对一次实验成绩进行分析,利用随机数表法抽取样本时,先将50个同学按01,02.03,…50进行编号,然后从随机数表第9行第11列的数开始向右读,则选出的第6个个体是()(注:表为随机数表的第8行和第9行)63 01 63 78 59 16 95 55 67 19 98 10 50 71 75 12 86 73 58 07 44 39 52 38 7933 21 12 34 29 78 64 56 07 82 52 42 07 44 3815 51 00 13 42 99 66 02 79 54A.00 B.13 C.42 D.4410.下列抽样方法是简单随机抽样的是()A.从100个零件中一次性抽取5个做质量检验B.从50个零件中有放回地抽取5个做质量检验C.从实数集中逐个抽取10个做奇偶性分析D.运动员从8个跑道中随机选取一个跑道二、填空题11.一个总体数为60的个体编号为00,01,02,…,59,现需从中抽取一个容量为7的样本,请从随机数表的倒数第5行(下表为随机数表的最后5行)第7~8列的22开始,依次向下,到最后一行后,再从下两列的上边开始,继续向下读,直到取足样本,则抽取样本的号码是______.95 33 95 22 00 18 74 72 00 18 46 40 62 98 80 54 97 20 56 9538 79 58 69 32 81 76 80 26 92 15 74 80 08 32 16 46 70 50 8082 80 84 25 39 90 84 60 79 80 67 72 16 42 79 71 59 73 05 5024 36 59 87 38 82 07 53 89 35 08 22 23 71 77 91 01 93 20 4996 35 23 79 18 05 98 90 07 35 82 96 59 26 94 66 39 67 98 6012.某中学高二年级甲班的学生共有25名女生和35名男生,现以简单随机抽样的方法从甲班全班同学中推选5名学生代表甲班参加全校演讲比赛,则甲班中某女生被抽到的概率是________.13.2020年抗击新冠肺炎疫情期间,为不影响学生的学习生活,学校实行停课不停学.为督促学生按时学习,某校要求所有学生每天打卡,全校学生的总人数为1200人.某日随机抽查200人,发现因各种原因未及时打卡的学生数为12,估计该日这个学校未及时打卡的学生数为______.14.某工厂共有n名工人,为了调查工人的健康情况,从中随机抽取20名工人作为调查对象,若每位工人被抽到的可能性为15,则n ________.三、解答题15.已知总体是由编号为01,02,…,19,20的20个个体组成,利用下面的随机数表选取5个个体,选取方法是从随机数表第1行的第5个数字开始,由左到右依次选取两个数字,写出选取的5个个体编号.7816 6572 0802 6314 0702 4369 9728 0198 3204 9234 4935 8200 3623 4869 6938 748116.某单位拟从40名员工中选1人赠送电影票,可采用下面两种选法:选法一:将这40名员工按1~40进行编号,并相应地制作号码为1〜40的40个号签,把这40个号签放在一个暗箱中搅匀,最后随机地从中抽取1个号签,与这个号签编号一致的员工幸运入选;选法二:将39个白球与1个红球(球除颜色外,其他完全相同)混合放在一个暗箱中搅匀,让40名员工逐一从中摸取一个球,则摸到红球的员工幸运入选.试问:(1)这两种选法是否都是抽签法,为什么?(2)这两种选法中每名员工被选中的可能性是否相等?参考答案1.A【分析】根据简单随机抽样的概念,直接选出正确选项.【详解】根据简单随机抽样的概念可知,每个个体每次被抽到的机会相等,故选A.【点睛】本小题主要考查简单随机抽要的概念,属于基础题.2.B【分析】由题意知模拟三天恰有两天下雨的结果,观察经随机模拟产生的数据,用列举法找出表示三天中恰有两天下雨的数据,再由古典概型的概率公式即可求解.【详解】由题意知模拟三天恰有两天下雨的结果,观察经随机模拟产生的数据可得,表示三天中恰有两天下雨的数据有:4 17,3 86,19 6,2 06,共4组数据,所以这三天中恰有两天下雨的概率42 P105 ==.【点睛】本题主要考查模拟方法估计概率,属于基础题型.3.D【解析】分析:由随机抽样的特点可得,在抽样过程中每个个体在一次抽取中被抽中的概率是相等的,结合已知中的总体容量可得答案.详解:在抽样过程中,个体甲每一次被抽中的概率是相等的,由于总体容量为10,所以“个体甲被第三次抽到的可能性为110”.故选D.点睛:简单随机抽样的特点是等可能抽样,即在抽样过程中每个个体被抽到的概率是相等的,本题考查学生对抽样特点的理解和应用.4.C从随机数表第1行的第6列数字开始由左到右依次选取两个数字,如果在01和33之间就取出来,如果不在该区间,就不取,以此类推得到选出来的第6个红色球的编号.【详解】从随机数表第1行的第6列数字开始由左到右依次选取两个数字,除去大于33以及重复数字,则选出的6个红色球的编号依次为21,32,09,16,17,02,故选出的第6个红色球的编号为02.故答案为C.【点睛】本题主要考查随机数表,意在考查学生对该知识的掌握水平和分析推理能力.5.C【分析】根据随机数表的选数方法进行判断即可.【详解】按照随机数表法的方法取数为03,07,12,16,15,所以第5个个体的编号为15.故选:C【点睛】本题考查了随机数表的方法,属于基础题.6.B【分析】根据随机数表法的方法进行,每次选两个数字,选过的两个数字不要,即可选出正确答案. 【详解】解析:由题意结合随机数表可得由左到右依次选取的两个数字为17,37,23,35,20,故选出来的第5个志愿者的座位号是20.故选:B【点睛】本题考查了随机数表的作用方法,属于基础题.7.C【分析】根据简单随机抽样的定义直接判断即可.解析:A不是,因为球大小不同,造成不公平.B,D不是,因为“随意选”“随手写”并不说明对每个个体机会均等.C符合随机抽样的定义,是简单随机抽样.【点睛】本题考查了简单随机抽样的定义,属于基础题.8.B【分析】根据简单随机抽样的特点逐个判断即可.【详解】①:不是简单随机抽样.因为一儿童从玩具箱的20件玩具中任意拿一件玩,玩后放回再拿一件,连续玩了5件,它不是“逐个抽取”.②:不是简单随机抽样.虽然“一次性抽取”和“逐个抽取”不影响个体被抽到的可能性,但简单随机抽样要求的是“逐个抽取”③:不是简单随机抽样.因为50名官兵是从中挑出来的,是最优秀的,每个个体被抽到的可能性不同,不符合简单随机抽样中“等可能抽样”的要求.④:是简单随机抽样.因为总体中的个体数是有限的,并且是从总体中逐个进行抽取的、等可能的抽样.综上,只有④是简单随机抽样.故选:B【点睛】本题考查了简单抽样的定义,属于基础题.9.B【分析】根据随机数表抽取原则按序得到所抽取的个体即可得到结果.【详解】第9行第11列开始读取,依次得到的编号为:78(舍)、64(舍)、56(舍)、07、82(舍)、52(舍)、42、07(重复,舍)、44、38、15、51(舍)、00(舍)、13即第6个个体为13故选:B【点睛】本题考查简单随机抽样方法中的随机数表法,关键是明确随机数表抽取时,超出所给编号范围和重复抽取的编号需去除.10.D【分析】根据简单随机抽样的四个特征:①有限性;②逐个抽取;③不放回;④等可能性,进行判断. 【详解】解:选项A错在“一次性”抽取;选项B错在“有放回”抽取;选项C错在总体容量无限;选项D符合,故选:D.【点睛】本题考查简单随机抽样的特征,是基础题.11.22,25,00,32,39,38,18【分析】根据题目中的规则在编号范围内取数即可得解.【详解】先选取22,向下69不符合要求,下面选取25,向下87,79不符合要求,再从下两列的上边开始,继续向下读,00、32、39、38、18,因此,抽取的样本的号码是22,25,00,32,39,38,18.故答案为:22,25,00,32,39,38,18.【点睛】本题考查了随机数表法,属于基础题.12.1 12【分析】根据简单随机抽样的特点可直接选出答案.【详解】全班共有253560+=名学生,抽取5人,以简单随机抽样的方法,甲班中某女生被抽到的概率是51 6012=.故答案为:1 12【点睛】本题考查的是简单随机抽样,较简单. 13.72【分析】根据所占比例可得答案.【详解】由题意得12120072200⨯=,所以该日这个学校未及时打卡的学生数为72.故答案为:72.【点睛】本题考查由部分估计总体,属于基础题.14.100【分析】抽取人数除以总人数,即得每位工人被抽到的概率,结合已知,得到关于n的方程,求解即得.【详解】解:∵该工厂共有n名工人,随机抽取20名,∴每名工人被抽到的概率为20n,∴2015n=,解得100n=,故答案为:100.【点睛】本题考查简单随机抽样中事件的概率,等可能事件的概率问题,属基础题.15.08,02,14,07,01.【分析】根据随机数表,依次进行选择即可得到结论.【详解】解:从随机数表的第一行得第5列和第6列数字开始由左到右依次选取两个数字中小于20的编号依次选是08,02,14,07,,02,01等,其中02出现两次,所以依次选取的5个个体编号依次是08,02,14,07,01.【点睛】本题主要考查简单随机抽样的应用,正确理解随机数法是解决本题的关键,比较基础.16.(1)见解析;(2)这两种选法中每名员工被选中的可能性相等,均为1 40.【分析】(1)根据抽签法的特征判断即可得到结论;(2)每名员工被选中的可能性均为140,可知可能性相同.【详解】(1)选法一:满足抽签法的特征,是抽签法;选法二:不是抽签法抽签法要求所有的号签编号互不相同,而选法二中的39个白球无法相互区分(2)这两种选法中每名员工被选中的可能性相等,均为1 40【点睛】本题考查抽签法的判断与等可能事件的判断,属于基础题.。

随机抽样1简单随机抽样

随机抽样1简单随机抽样

2.简单随机抽样的分类 简单随机抽样抽 随签 机法 数法
3.随机数法的类型 随机数表法
随机数法随机数骰子 计算机产生的随机数
思考讨论 有同学认为:“随机数表只有一张,并且读数时只能按 照从左向右的顺序读取,否则产生的随机样本就不同了,对 总体的估计就不准确了”,你认为正确吗?
2.使用随机抽样方法抽取样本应注意的几个问题 (1)目标要准确. 必须清楚地知道要收集的数据是什么.例如,在食品质
量检验中,为了了解一批袋装牛奶(总体)的细菌超标情况, 从中随机抽取了 n 袋,并测出了每一袋的细菌含量 ai(i= 1,2,…,n),这里 ai(i=1,2,…,n)就是我们要收集的数据.
例 4 一个学生在一次竞赛中要回答的 8 道题是这样产 生的:从 15 道物理题中随机抽取 3 道;从 20 道化学题中随 机抽取 3 道;从 12 道生物题中随机抽取 2 道.请选用合适 的方法确定这个学生所要回答的三门学科的题的序号(物理 题的编号为 1~15,化学题的编号为 16~35,生物题的编号 为 36~47).
变式训练 2
某大学为了选拔世博会志愿者,现从报名的 18 名同学 中选取 6 人组成志愿小组,请用抽签法确定志愿小组成员.
[解] 第一步,将 18 名同学编号,号码是 01,02,…,18; 第二步,将号码分别写在一张纸条上,揉成团,制成号签; 第三步,将得到的号签放入一个不透明的袋子中,并充分搅匀; 第四步,从袋子中依次抽取 6 个号签,并记录上面的编号; 第五步,所得号码对应的同学就是志愿小组的成员.
[解法二] 随机数表法
第一步,将物理题的编号对应地改成 01,02,…,15, 其余两门学科的题的编号不变;
第二步,在随机数表中任选一个数作为开始,任选一个 方向作为读数方向,例如选出第 10 行第 2 列的数 7,向右读;

第1讲随机抽样

第1讲随机抽样

3.分层抽样 (1)定义:在抽样时,将总体分成互不交叉的层,然后按照 一定的比例,从各层独立地抽取一定数量的个体,将各层 取出的个体合在一起作为样本,这种抽样方法叫做分层抽 样. (2)分层抽样的应用范围: 当总体是由差异明显的几个部分组成时,往往选用分层抽 样.
4.分层抽样的步骤
(1)分层:将总体按某种特征分成若干部分; (2)确定比例:计算各层的个体数与总体的个体数的比; (3)确定各层应抽取的样本容量; (4)在每一层进行抽样(各层分别按简单随机抽样或系统抽样 的方法抽取),综合每层抽样,组成样本.
考向三
分层抽样
【例3】某市电视台在因特网上征集电视节目的现场参与观 众,报名的共有1 2000人,分别来自4个城区,其中东城区 2 400人,西城区4 600人,南城区3 800人,北城区1 200人, 从中抽取60人参加现场节目,应当如何抽取?
【反思与悟】 (1)一个抽样试验能否用抽签法,关键看两点: 一是抽签是否方便;二是号签是否易搅匀,一般地,当总 体容量和样本容量都较小时可用抽签法. (2)随机数表中共随机出现0,1,2,…,9十个数字,也就是说, 在表中的每个位置上出现各个数字的机会都是相等的.在 使用随机数表时,如遇到三位数或四位数时,可从选择的 随机数表中的某行某列的数字计起,每三个或每四个作为 一个单位,自左向右选取,有超过总体号码或出现重复号 码的数字舍去.
解 法一 (抽签法)将100件轴承编号为1,2,…,100,并 做好大小、形状相同的号签,分别写上这100个数,将这些 号签放在一起,进行均匀搅拌,接着连续抽取10个号签, 然后测量这10个号签对应的轴的直径. 法二 (随机数表法)将100件轴承编号为00,01,02,…,99, 在随机数表中选定一个起始位置,如取第21行(见随机数表) 第1个数开始,选取10个为68,34,30,13,70,55,74,30,77,40,这 10件即为所要抽取的样本.

新人教A版高中数学必修2第九章统计的第一节第一课时—简单随机抽样-经典教学设计

新人教A版高中数学必修2第九章统计的第一节第一课时—简单随机抽样-经典教学设计
引导学生得出结论:当总体规模较大,经费、时间上受限或调查有破坏性时,选择抽样调查。
(3)通过调查历城二中高一学生的平均身高来估计济南市高一学生的平均身高,请你写出此次调查的总体,个体样本和样本容量。
通过熟悉的生活情境引入普查、抽样调查的适用范围,回顾总体、样本、个体、样本容量的概念。
通过提问,从学生熟悉的具体问题入手,迅速吸引学生的注意力,体会到了抽样调查的必要性。
2.简单随机抽样的特点:
总体有限,逐个抽取,等概率抽样。
3.简单随机抽样的方法:
抽签法和随机数法
学生回顾本节课所学知识点。
小结本节课知识点,加深对知识点的记忆理解。总结提炼,理清脉络,有利于帮助学生建构知识体系,起到画龙点睛的作用。
6.课后作业
1.一个学生在一次竞赛中要回答的8道题是这样产生的:从15道物理题中随机抽3道;从20道化学题中随机抽3道;从12道生物题中随机抽2道.选用合适的方法确定这个学生所要回答的三门学科的题的序号(物理题的编号为1~15,化学题的编号为16~35,生物题的编号为36~47).
此处设计遵循由特殊到一般的认知规律,让学生在观察中归纳,在具体问题中进行总结,自然而然地形成简单随机抽样的概念,培养数学抽象的学科核心素养,最终实现突破难点的目的。
2.实践探究,形成概念
请小组在全班范围内交流,教师在学生回答基础上完善补充,得到下列结论:
(1)一般地,设一个总体含有N(N为正整数)个个体,从中逐个不放回地抽取n(1≤n<N)个个体作为样本,每次抽取时总体内未进入样本的各个个体被抽到的概率都相等,我们把这样的抽样方法叫做不放回简单随机抽样。如果抽取是放回的,且每次抽取时总体内的各个个体被抽到的概率都相等,我们把这样的抽样方法叫做放回简单抽样。

9.1.1简单随机抽样

9.1.1简单随机抽样
我们知道,在重复试验中,试验次数越多,频率接近概率的可能性越大 . 与此相似,用简单随机抽样的方法抽取样本,样本量越大,样本接近总体的可能性越大,样本的平均值接近总体的平均值的可能性越大 .
即对于样本的代表性,一般来说,样本量大的会好于样本量小的.
总体平均数和样本平均数
这里,居民为调查对象,而居民的性别、年龄、民族、受教育程度等是要调查的指标 .
由于不同调查对象的指标值往往不同,它是一个变化的量. 像人口普查这样 , 对每一个调查对象都进行调查的方法, 称为全面调查(又称普查) .
在一个调查中,我们把调查对象的全体称为总体,组成总体的每一个调查对象称为个体。
如果总体的N个变量值中,不同的值共有k(k≤N)个,不妨记为Y1,Y2,…,Yk,其中Yi出现的频数fi(i=1,2,…, k),则总体均值还可以写成加权平均数的形式
总体平均数和样本平均数
问题2 眼睛是心灵的窗口,保护好视力非常重要. 树人中学在“全国爱眼日”前,想通过简单随机抽样的方法,了解一下全校2174名学生中视力不低于5.0的学生所占的比例, 你觉得该怎样做?
第九章 统计
9.1.1 简单随机抽样
在现实生活中,我们经常会接触到各种统计数据,例如,人口总量、经济增长率、产品的合格率、商品的销售额、农作物的产量、人均水资源、居民人均收入、电视台节目的收视率、学生的平均身高等 . 要正确阅读并理解这些数据,需要具备一些统计学的知识.
统计学是通过收集数据和分析数据来认识未知现象的一门学科 . 面对一个统计问题,首先要根据实际需求,通过适当的方法获取数据,并选择适当的统计图表对数据进行整理和描述,在此基础上用各种统计方法对数据进行分析,从样本数据中提取需要的信息,推断总体的情况,进而解决相应的实际问题.

高考数学人教版(理科)一轮复习课件:第9章第1讲随机抽样课后作业2

高考数学人教版(理科)一轮复习课件:第9章第1讲随机抽样课后作业2
解析
2.(2018·河北衡水模拟)在高三某次数学测试中,40 名学生的成绩如图 所示.若将成绩由低到高编为 1~40 号,再用系统抽样的方法从中抽取 8 人, 则其中成绩在区间[123,134]上的学生人数为________.
答案 3
答案
解析 根据题中茎叶图,成绩在区间[123,134]上的数据有 15 个, 所以用系统抽样的方法从所有的 40 人中抽取 8 人, 成绩在区间[123,134]上的学生人数为 8×4105=3.
解析
8.某商场有四类食品,食品类别和种数见下表:
植物油 动物性食品
类别 粮食类


果蔬类
种类 40
10
30
20
现从中抽取一个容量为 20 的样本进行食品安全检测,若采用分层抽样
方法抽取样本,则抽取的植物油类与果蔬类食品种数之和为________.
答案 6
答案
解析 因为总体的个数为 40+10+30+20=100,所以根据分层抽样的 定义可知,抽取的植物油类食品种数为11000×20=2,抽取的果蔬类食品种数 为12000×20=4,所以抽取的植物油类与果蔬类食品种数之和为 2+4=6.
∴从初中生中抽取的男生人数是:50×15200000=12.
解析
6.某工厂生产甲、乙、丙三种型号的产品,产品数量之比为 3∶5∶7, 现用分层抽样的方法抽取容量为 n 的样本,其中甲种产品有 18 件,则样本 容量 n=________.
答案 90
答案
解析 依题意得3+35+7×n=18,解得 n=90,即样本容量为 90.
A.样本容量为 70 B.样本中三居室住户共抽取了 25 户 C.根据样本可估计对四居室满意的住 户有 70 户 D.样本中对三居室满意的有 15 户数量及样本容量,再根据分层抽样及题 图 2 确定样本中三居室户数及满意人数.

第1讲 随机抽样、用样本估计总体

第1讲 随机抽样、用样本估计总体

第1讲随机抽样、用样本估计总体一、知识梳理1.随机抽样(1)简单随机抽样①定义:一般地,设一个总体含有N 个个体,从中逐个不放回地抽取n 个个体作为样本(n ≤N ),且每次抽取时总体内的各个个体被抽到的机会都相等,就称这样的抽样方法为简单随机抽样.②常用方法:抽签法和随机数法.(2)分层抽样①定义:在抽样时,将总体分成互不交叉的层,然后按照一定的比例,从各层独立地抽取一定数量的个体,将各层取出的个体合在一起作为样本,这种抽样方法是一种分层抽样.②适用范围:适用于总体由差异比较明显的几个部分组成时.2.统计图表(1)频率分布直方图的画法步骤①求极差(即一组数据中最大值与最小值的差);②决定组距与组数;③将数据分组;④列频率分布表;⑤画频率分布直方图.(2)频率分布折线图和总体密度曲线①频率分布折线图:连接频率分布直方图中各小长方形上端的中点,就得到频率分布折线图;②总体密度曲线:随着样本容量的增加,作图时所分组数增加,组距减小,相应的频率折线图会越来越接近于一条光滑曲线,统计中称这条光滑曲线为总体密度曲线.3.样本的数字特征(1)众数:一组数据中出现次数最多的那个数据,叫做这组数据的众数.(2)中位数:把n 个数据按大小顺序排列,处于最中间位置的一个数据(或最中间两个数据的平均数)叫做这组数据的中位数.(3)平均数:把a 1+a 2+…+a n n称为a 1,a 2,…,a n 这n 个数的平均数. (4)标准差与方差:设一组数据x 1,x 2,x 3,…,x n 的平均数为x -,则这组数据的标准差和方差分别是s = 1n[(x 1-x -)2+(x 2-x -)2+…+(x n -x -)2], s 2=1n[(x 1-x -)2+(x 2-x -)2+…+(x n -x -)2].常用结论1.不论哪种抽样方法,总体中的每一个个体入样的概率是相同的.2.会用三个关系频率分布直方图与众数、中位数与平均数的关系(1)最高的小长方形底边中点的横坐标即是众数.(2)中位数左边和右边的小长方形的面积和是相等的.(3)平均数是频率分布直方图的“重心”,等于频率分布直方图中每个小长方形的面积乘以小长方形底边中点的横坐标之和.3.巧用四个有关的结论(1)若x 1,x 2,…,x n 的平均数为x -,那么mx 1+a ,mx 2+a ,…,mx n +a 的平均数为m x-+a ;(2)数据x 1,x 2,…,x n 与数据x ′1=x 1+a ,x ′2=x 2+a ,…,x ′n =x n +a 的方差相等,即数据经过平移后方差不变;(3)若x 1,x 2,…,x n 的方差为s 2,那么ax 1+b ,ax 2+b ,…,ax n +b 的方差为a 2s 2;(4)s 2=1n ∑n i =1 (x i -x -)2=1n ∑n i =1x 2i-x -2,即各数平方的平均数减去平均数的平方. 二、教材衍化1.某校为了解学生学习的情况,采用分层抽样的方法从高一2 400人、高二2 000人、高三n 人中,抽取90人进行问卷调查.已知高一被抽取的人数为36,那么高三被抽取的人数为________.解析:由分层抽样可得 2 4002 400+2 000+n×90=36,则n =1 600,所以高三被抽取的人数为 1 6002 400+2 000+1 600×90=24. 答案:242.已知一组数据6,7,8,8,9,10,则该组数据的方差是________.答案:533.某仪器厂从新生产的一批零件中随机抽取40个检测,如图是根据抽样检测后零件的质量(单位:克)绘制的频率分布直方图,样本数据分8组,分别为[80,82),[82,84),[84,86),[86,88),[88,90),[90,92),[92,94),[94,96],则样本的中位数在第________组.解析:由题图可得,前四组的频率为(0.037 5+0.062 5+0.075+0.1)×2=0.55,则其频数为40×0.55=22,且第四组的频数为40×0.1×2=8,故中位数落在第4组.答案:4一、思考辨析判断正误(正确的打“√”,错误的打“×”)(1)简单随机抽样是一种不放回抽样.()(2)在抽签法中,先抽的人抽中的可能性大.()(3)一组数据的方差越大,说明这组数据的波动越大.()(4)在频率分布直方图中,小矩形的面积越大,表示样本数据落在该区间内的频率越大.()(5)频率分布表和频率分布直方图是一组数据频率分布的两种形式,前者准确,后者直观.()(6)在频率分布直方图中,最高的小长方形底边中点的横坐标是众数的估计值.()答案:(1)√(2)×(3)√(4)√(5)√(6)√二、易错纠偏常见误区|(1)随机数表法的规则不熟出错;(2)频率分布直方图识图不清;1.假设要考察某公司生产的狂犬疫苗的剂量是否达标,现用随机数法从500支疫苗中抽取50支进行检验,利用随机数表抽取样本时,先将500支疫苗按000,001, (499)行编号,若从随机数表第7行第8列的数开始向右读,则抽取的第3支疫苗的编号为________.(下面摘取了随机数表的第7行至第9行)84 42 17 53 3157 24 55 06 8877 04 74 47 6721 76 33 50 2583 92 12 06 7663 01 63 78 5916 95 55 67 1998 10 50 71 7512 86 73 58 0744 39 52 38 7933 21 12 34 2978 64 56 07 8252 42 07 44 3815 51 00 13 4299 66 02 79 54解析:由题意得,从随机数表第7行第8列的数开始向右读,符合条件的前三个编号依次是331,455,068,故抽取的第3支疫苗的编号是068.答案:0682.我市某校组织学生参加英语测试,成绩的频率分布直方图如图,数据的分组依次为[20,40),[40,60),[60,80),[80,100],若低于60分的人数是15,则该班的学生人数是________.解析:依题意得,成绩低于60分的相应的频率等于(0.005+0.01)×20=0.3,所以该班的学生人数是15÷0.3=50.答案:50考点一随机抽样(基础型)复习指导| 1.理解随机抽样的必要性和重要性.2.学会用简单随机抽样的方法从总体中抽取样本.3.通过对实例的分析,了解分层抽样的方法.核心素养:数据分析1.(2020·重庆中山外国语学校模拟)如饼图,某学校共有教师120人,从中选出一个30人的样本,其中被选出的青年女教师的人数为()A.12B.6C.4D.3解析:选D .青年教师的人数为120×30%=36,所以青年女教师为12人,故青年女教师被选出的人数为12×30120=3.故选D . 2.(2020·武汉市武昌区调研考试)已知某射击运动员每次射击击中目标的概率都为80%.现采用随机模拟的方法估计该运动员4次射击至少3次击中目标的概率:先由计算器产生0到9之间取整数值的随机数,指定0,1表示没有击中目标,2,3,4,5,6,7,8,9表示击中目标;再以每4个随机数为一组,代表4次射击的结果.经随机模拟产生了如下20组随机数:7527 0293 7140 9857 0347 4373 8636 6947 1417 4698 0371 6233 2616 8045 6011 3661 9597 7424 7610 4281据此估计,该射击运动员4次射击至少3次击中目标的概率为________.解析:4次射击中有1次或2次击中目标的有:0371,6011,7610,1417,7140,所以所求概率P =1-520=1520=0.75. 答案:0.753.一支田径队有男运动员56人,女运动员m 人,用分层抽样抽出一个容量为n 的样本,在这个样本中随机取一个当队长的概率为128,且样本中的男队员比女队员多4人,则m =________.解析:由题意知n =28,设其中有男队员x 人,女队员有y 人.则⎩⎪⎨⎪⎧x +y =28,x -y =4,56m =x y .解得x =16,y =12,m =42.答案:42(1)抽签法与随机数法的适用情况①抽签法适用于总体中个体数较少的情况,随机数法适用于总体中个体数较多的情况.②一个抽样试验能否用抽签法,关键看两点:一是制签是否方便;二是号签是否易搅匀.一般地,当总体容量和样本容量都较小时可用抽签法.(2)分层抽样问题类型及解题思路①求某层应抽个体数量,根据该层所占总体的比例计算.②已知某层个体数量,求总体容量,根据分层抽样即按比例抽样,列比例式进行计算.③确定是否应用分层抽样:分层抽样适用于总体中个体差异较大的情况.考点二样本的数字特征(应用型)复习指导| 1.通过实例理解样本数据的标准差的意义和作用,学会计算数据的标准差.2.能根据实际问题的需求合理地选取样本,从样本数据中提取基本的数字特征(如平均数、标准差),并作出合理的解释.核心素养:数据分析、数学运算(1)在一次歌咏比赛中,七位裁判为一选手打出的分数如下:90,89,90,95,93,94,93.去掉一个最高分和一个最低分后,所剩数据的平均数与方差分别为( )A .92,2.8B .92,2C .93,2D .93,2.8(2)(2020·盐城模拟)已知一组数据x 1,x 2,x 3,x 4,x 5的方差是2,则数据2x 1,2x 2,2x 3,2x 4,2x 5的标准差为________.【解析】 (1)由题意得所剩数据:90,90,93,94,93.所以平均数x -=90+90+93+94+935=92. 方差s 2=15[(90-92)2+(90-92)2+(93-92)2+(93-92)2+(94-92)2]=2.8. (2)由s 2=1n i =1n (x i -x -)2=2,则数据2x 1,2x 2,2x 3,2x 4,2x 5的方差是8,标准差为2 2. 【答案】 (1)A (2)2 2【迁移探究】 (变条件)本例(2)增加条件“x 1,x 2,x 3,x 4,x 5的平均数为2”,求数据2x 1+3,2x 2+3,2x 3+3,2x 4+3,2x 5+3的平均数和方差.解:数据2x 1+3,2x 2+3,2x 3+3,2x 4+3,2x 5+3的平均数为2×2+3=7,方差为22×2=8.众数、中位数、平均数、方差的意义及常用结论(1)平均数与方差都是重要的数字特征,是对总体的一种简明的描述,它们所反映的情况有着重要的实际意义,平均数、中位数、众数描述其集中趋势,方差和标准差描述波动大小.(2)方差的简化计算公式:s2=1n[(x21+x22+…+x2n)-n x-2],或写成s2=1n(x21+x22+…+x2n)-x-2,即方差等于原数据平方的平均数减去平均数的平方.1.(2020·昆明市诊断测试)高铁、扫码支付、共享单车、网购被称为中国的“新四大发明”,为评估共享单车的使用情况,选了n座城市作试验基地.这n座城市共享单车的使用量(单位:人次/天)分别为x1,x2,…,x n,下面给出的指标中可以用来评估共享单车使用量的稳定程度的是()A .x 1,x 2,…,x n 的平均数B .x 1,x 2,…,x n 的标准差C .x 1,x 2,…,x n 的最大值D .x 1,x 2,…,x n 的中位数解析:选B .平均数、中位数可以反映一组数据的集中程度;方差、标准差可以反映一组数据的波动大小,同时也反映这组数据的稳定程度.故选B .2.(2020·甘肃、青海、宁夏联考)从某小学随机抽取100名同学,将他们的身高(单位:厘米)分布情况汇总如下:A .119.3B .119.7C .123.3D .126.7解析:选C .由题意知身高在(100,110],(110,120],(120,130]内的频率依次为0.05,0.35,0.3,前两组频率和为0.4,组距为10,设中位数为x ,则(x -120)×0.310=0.1,解得x ≈123.3.故选C .3.一组数据1,10,5,2,x ,2,且2<x <5,若该数据的众数是中位数的23倍,则该数据的方差为________.解析:根据题意知,该组数据的众数是2,则中位数是2÷23=3,把这组数据从小到大排列为1,2,2,x ,5,10,则2+x2=3,解得x =4,所以这组数据的平均数为 x -=16×(1+2+2+4+5+10)=4,方差为s 2=16×[(1-4)2+(2-4)2×2+(4-4)2+(5-4)2+(10-4)2]=9.答案:9考点三 频率分布直方图(应用型)复习指导| 1.通过实例体会分布的意义和作用,在表示样本数据的过程中,学会列频率分布表、画频率分布直方图、频率折线图,体会它们各自的特点.2.会用样本的频率分布估计总体分布,会用样本的基本数字特征估计总体的基本数字特征;初步体会样本频率分布和数字特征的随机性.核心素养:直观想象、数据分析角度一求样本的频率、频数(2020·福建五校第二次联考)某服装店对过去100天其实体店和网店的销售量(单位:件)进行了统计,制成频率分布直方图如下:(1)若将上述频率视为概率,已知该服装店过去100天的销售中,实体店和网店销售量都不低于50的概率为0.24,求过去100天的销售中,实体店和网店至少有一边销售量不低于50的天数;(2)若将上述频率视为概率,已知该服装店实体店每天的人工成本为500元,门市成本为1 200元,每售出一件利润为50元,求该实体店一天获利不低于800元的概率.【解】(1)由题意知,网店销售量不低于50共有(0.068+0.046+0.010+0.008)×5×100=66(天),实体店销售量不低于50共有(0.032+0.020+0.012×2)×5×100=38(天),实体店和网店销售量都不低于50的天数为100×0.24=24,故实体店和网店至少有一边销售量不低于50的天数为66+38-24=80.(2)由题意,设该实体店一天售出x件,则获利为(50x-1 700)元,50x-1 700≥800⇒x ≥50.记该实体店一天获利不低于800元为事件A,则P(A)=P(x≥50)=(0.032+0.020+0.012+0.012)×5=0.38.故该实体店一天获利不低于800元的概率为0.38.角度二求样本的数字特征(2019·高考全国卷Ⅲ)为了解甲、乙两种离子在小鼠体内的残留程度,进行如下试验:将200只小鼠随机分成A,B两组,每组100只,其中A组小鼠给服甲离子溶液,B组小鼠给服乙离子溶液.每只小鼠给服的溶液体积相同、摩尔浓度相同.经过一段时间后用某种科学方法测算出残留在小鼠体内离子的百分比.根据试验数据分别得到如下直方图:记C为事件:“乙离子残留在体内的百分比不低于5.5”,根据直方图得到P(C)的估计值为0.70.(1)求乙离子残留百分比直方图中a,b的值;(2)分别估计甲、乙离子残留百分比的平均值(同一组中的数据用该组区间的中点值为代表).【解】(1)由已知得0.70=a+0.20+0.15,故a=0.35.b=1-0.05-0.15-0.70=0.10.(2)甲离子残留百分比的平均值的估计值为2×0.15+3×0.20+4×0.30+5×0.20+6×0.10+7×0.05=4.05.乙离子残留百分比的平均值的估计值为3×0.05+4×0.10+5×0.15+6×0.35+7×0.20+8×0.15=6.00.(1)频率、频数、样本容量的计算方法①频率组距×组距=频率;②频数样本容量=频率,频数频率=样本容量,样本容量×频率=频数.(2)频率分布直方图中数字特征的计算①最高的小长方形底边中点的横坐标即是众数;②中位数左边和右边的小长方形的面积和是相等的;③平均数是频率分布直方图的“重心”,等于频率分布直方图中每个小长方形的面积乘以小长方形底边中点的横坐标之和.1.在样本频率分布直方图中,共有9个小长方形,若中间一个小长方形的面积等于其他8个长方形的面积和的25,且样本容量为140,则中间一组的频数为( )A .28B .40C .56D .60解析:选B .设中间一组的频数为x ,因为中间一个小长方形的面积等于其他8个长方形的面积和的25,所以其他8组的频数和为52x ,由x +52x =140,解得x =40.2.(2020·武昌区调研考试)对参加某次数学竞赛的1 000名选手的初赛成绩(满分:100分)作统计,得到如图所示的频率分布直方图.(1)根据直方图完成以下表格;(2)); (3)如果从参加初赛的选手中选取380人参加复赛,那么如何确定进入复赛选手的成绩? 解:(1)填表如下:(2)平均数为55×0.05+65×0.15+75×0.35+85×0.35+95×0.1=78, 方差s 2=(-23)2×0.05+(-13)2×0.15+(-3)2×0.35+72×0.35+172×0.1=101. (3)进入复赛选手的成绩为80+350-(380-100)350×10=82(分),所以初赛成绩为82分及其以上的选手均可进入复赛.(说明:回答82分以上,或82分及其以上均可)[基础题组练]1.某班有34位同学,座位号记为01,02,…,34,用下面的随机数表选取5组数作为参加青年志愿者活动的五位同学的座号.选取方法是从随机数表第一行的第6列数字开始,由左到右依次选取两个数字,则选出来的第4个志愿者的座号是( )49 54 43 54 82 17 37 93 23 78 87 35 20 96 43 84 26 34 91 64 57 24 55 06 88 77 04 74 47 67 21 76 33 50 25 83 92 12 06 A .23B .09C .02D .16解析:选D .从随机数表第一行的第6列数字3开始,由左到右依次选取两个数字,不超过34的依次为21,32,09,16,17,故第4个志愿者的座号为16.2.(2020·陕西汉中重点中学联考)某机构对青年观众是否喜欢跨年晚会进行了调查,人数如下表所示:若在“不喜欢的男性青年观众”中抽取了6人,则n =( )A .12B .16C .20D .24解析:选D .由题意得3030+10+30+50=30120=6n,解得n =24.故选D .3.(2019·高考全国卷Ⅱ)演讲比赛共有9位评委分别给出某选手的原始评分,评定该选手的成绩时,从9个原始评分中去掉1个最高分、1个最低分,得到7个有效评分.7个有效评分与9个原始评分相比,不变的数字特征是( )A .中位数B .平均数C .方差D .极差解析:选A .记9个原始评分分别为a ,b ,c ,d ,e ,f ,g ,h ,i (按从小到大的顺序排列),易知e 为7个有效评分与9个原始评分的中位数,故不变的数字特征是中位数,故选A .4.(多选)某学生5次考试的成绩(单位:分)分别为85,67,m ,80,93,其中m >0.若该学生在这5次考试中成绩的中位数为80,则得分的平均数可能为( )A .70B .75C .80D .85解析:选ABC .已知的四次成绩按照由小到大的顺序排列为67,80,85,93,该学生这5次考试成绩的中位数为80,则m ≤80,所以平均数85+67+m +80+935≤81,可知平均数可能为70,75,80,不可能为85.故选ABC .5.(多选)从某地区年龄在25~55岁的人员中,随机抽取100人,了解他们对今年两会热点问题的看法,绘制出频率分布直方图,如图所示,则下列说法正确的是( )A .抽取的100人中,年龄在40~45岁的人数大约为20B .抽取的100人中,年龄在35~45岁的人数大约为40C .抽取的100人中,年龄在40~50岁的人数大约为50D .抽取的100人中,年龄在35~50岁的人数大约为60解析:选AD .根据频率分布直方图的性质得(0.01+0.05+0.06+a +0.02+0.02)×5=1,解得a =0.04,所以抽取的100人中,年龄在40~45岁的大约为0.04×5×100=20,所以A 正确;年龄在35~45岁的人数大约为(0.06+0.04)×5×100=50,所以B 不正确;年龄在40~50岁的人数大约为(0.04+0.02)×5×100=30,所以C 不正确;年龄在35~50岁的人数大约为(0.06+0.04+0.02)×5×100=60,所以D 正确.故选AD .6.(2020·开封市定位考试)某工厂生产A ,B ,C 三种不同型号的产品,产品数量之比为k ∶5∶3,现用分层抽样的方法抽出一个容量为120的样本,已知A 种型号产品共抽取了24件,则C 种型号产品抽取的件数为________.解析:依题意得24120=k k +5+3,解得k =2,所以C 种型号产品抽取的件数为32+5+3×120=36.答案:367.甲、乙、丙、丁四人参加某运动会射击项目的选拔赛,四人的平均成绩和方差如下表所示:从这四个人中选择一人参加该运动会射击项目比赛,最佳人选是________.解析:由题表中数据可知,丙的平均环数最高,且方差最小,说明技术稳定,且成绩好.答案:丙8.对某市“四城同创”活动中800名志愿者的年龄抽样调查统计后得到频率分布直方图(如图),但是年龄组为[25,30)的数据不慎丢失,则依据此图可得:(1)[25,30)年龄组对应小矩形的高度为________;(2)据此估计该市“四城同创”活动中志愿者年龄在[25,35)的人数为________.解析:设[25,30)年龄组对应小矩形的高度为h,则5×(0.01+h+0.07+0.06+0.02)=1,解得h=0.04.则志愿者年龄在[25,35)年龄组的频率为5×(0.04+0.07)=0.55,故志愿者年龄在[25,35)年龄组的人数约为0.55×800=440.答案:(1)0.04(2)4409.某校1 200名高三年级学生参加了一次数学测验(满分为100分),为了分析这次数学测验的成绩,从这1 200人的数学成绩中随机抽取200人的成绩绘制成如下的统计表,请根据表中提供的信息解决下列问题:(1)求a、b、c(2)如果从这1 200名学生中随机抽取一人,试估计这名学生该次数学测验及格的概率P (注:60分及60分以上为及格);(3)试估计这次数学测验的年级平均分.解:(1)由题意可得,b =1-(0.015+0.125+0.5+0.31)=0.05,a =200×0.05=10,c =200×0.5=100.(2)根据已知,在抽出的200人的数学成绩中,及格的有162人.所以P =162200=0.81. (3)这次数学测验样本的平均分为x -=16×3+32.1×10+55×25+74×100+88×62200=73, 所以这次数学测验的年级平均分大约为73分.10.为了解甲、乙两个快递公司的工作状况,假设同一个公司快递员的工作状况基本相同,现从甲、乙两公司各随机抽取一名快递员,并从两人某月(30天)的快递件数记录结果中随机抽取10天的数据,制图如下:每名快递员完成一件货物投递可获得的劳务费情况如下:甲公司规定每件4.5元;乙公司规定每天35件以内(含35件)的部分每件4元,超出35件的部分每件7元.(1)根据图中数据写出甲公司员工A 在这10天投递的快递件数的平均数和众数;(2)根据图中数据估算两公司的每位员工在该月所得的劳务费.解:(1)甲公司员工A 在这10天投递的快递件数的平均数为36,众数为33.(2)根据题图中数据,可估算甲公司的每位员工该月所得劳务费为 4.5×36×30=4 860(元),易知乙公司员工B 每天所得劳务费X 的可能取值为136,147,154,189,203,所以乙公司的每位员工该月所得劳务费约为110×(136×1+147×3+154×2+189×3+203×1)×30=165.5×30=4 965(元). [综合题组练]1.(2020·安徽五校联盟第二次质检)数据a 1,a 2,a 3,…,a n 的方差为σ2,则数据2a 1,2a 2,2a 3,…,2a n 的方差为( )A .σ22B .σ2C .2σ2D .4σ2解析:选D .设a 1,a 2,a 3,…,a n 的平均数为a ,则2a 1,2a 2,2a 3,…,2a n 的平均数为2a ,σ2=(a 1-a )2+(a 2-a )2+(a 3-a )2+…+(a n -a )2n. 则2a 1,2a 2,2a 3,…,2a n 的方差为(2a 1-2a )2+(2a 2-2a )2+(2a 3-2a )2+…+(2a n -2a )2n=4×(a 1-a )2+(a 2-a )2+(a 3-a )2+…+(a n -a )2n=4σ2.故选D . 2.(多选)新闻出版业不断推进供给侧结构性改革,深入推动优化升级和融合发展,持续提高优质出版产品供给,实现了行业的良性发展.下面是2015年至2019年我国新闻出版业和数字出版业营收情况,则下列说法正确的是( )A .2015年至2019年我国新闻出版业和数字出版业营收均逐年增加B .2019年我国数字出版业营收超过2015年我国数字出版业营收的2倍C .2019年我国新闻出版业营收超过2015年我国新闻出版业营收的1.5倍D .2019年我国数字出版业营收占新闻出版业营收的比例未超过三分之一解析:选ABD .根据图示数据可知A 正确;1 935.5×2=3 871<5 720.9,故B 正确;16 635.3×1.5=24 952.95>23 595.8,故C 不正确;23 595.8×13≈7 865>5 720.9,故D 正确.故选ABD .3.甲、乙二人参加某体育项目训练,近期的五次测试成绩得分情况如图:(1)分别求出两人得分的平均数与方差;(2)根据图和上面算得的结果,对两人的训练成绩作出评价.解:(1)由题图可得甲、乙两人五次测试的成绩分别为甲:10分,13分,12分,14分,16分;乙:13分,14分,12分,12分,14分.x -甲=10+13+12+14+165=13; x -乙=13+14+12+12+145=13, s 2甲=15[(10-13)2+(13-13)2+(12-13)2+(14-13)2+(16-13)2]=4; s 2乙=15[(13-13)2+(14-13)2+(12-13)2+(12-13)2+(14-13)2]=0.8. (2)由s 2甲>s 2乙,可知乙的成绩较稳定. 从折线图看,甲的成绩基本呈上升状态,而乙的成绩上下波动,可知甲的成绩在不断提高,而乙的成绩则无明显提高.4.(2020·广州市调研测试)某蔬果经销商销售某种蔬果,售价为每千克25元,成本为每千克15元.销售宗旨是当天进货当天销售.如果当天卖不出去,未售出的全部降价以每千克10元处理完.根据以往的销售情况,按[0,100),[100,200),[200,300),[300,400),[400,500]进行分组,得到如图所示的频率分布直方图.(1)根据频率分布直方图计算该种蔬果日需求量的平均数x -(同一组中的数据用该组区间中点值代表);(2)该经销商某天购进了250千克该种蔬果,假设当天的需求量为x 千克(0≤x ≤500),利润为y 元.求y 关于x 的函数关系式,并结合频率分布直方图估计利润y 不小于1 750元的概率.解:(1)x -=50×0.001 0×100+150×0.002 0×100+250×0.003 0×100+350×0.0025×100+450×0.001 5×100=265.故该种蔬果日需求量的平均数为265千克.(2)当日需求量不低于250千克时,利润y =(25-15)×250=2 500(元),当日需求量低于250千克时,利润y =(25-15)x -(250-x )×5=15x -1 250(元),所以y =⎩⎨⎧15x -1 250,0≤x <2502 500,250≤x ≤500, 由y ≥1 750,得200≤x ≤500,所以P (y ≥1 750)=P (200≤x ≤500)=0.003 0×100+0.002 5×100+0.001 5×100=0.7. 故估计利润y 不小于1 750元的概率为0.7.。

9.1.2分层随机抽样课件(人教版)

9.1.2分层随机抽样课件(人教版)

学习目标
新课讲授
课堂总结
思考:对男生、女生分别进行简单随机抽样,样本量在男生、女生中应 如何分配?
男生人数 男生样本量=
×总样本量
全体学生人数
女生人数 女生样本量=
×总样本量
全体学生人数
无论是男生还是女生, 每个学生被抽到的可 能性相等.
n男=
326 50 23 712
n女=
386 50 27 712
i 1
Xi
Yi
i 1
MX
NY
M
X
N
Y
M N
MN MN MN
m
n
xi
i 1
i 1
yi
mx ny
m
x
n
y
mn
mn mn mn
学习目标
新课讲授
课堂总结
由于用第一层的样本平均数 x 可以估计第1层的总体平均数 X ,第二
层的样本平均数 y 可以估计第2层的总体平均数 Y ,
因此可以用 M
M N
问题2:如何计算总体平均数?
通过计算得出男生和女生身高的样本平均数分别为170.6,160.6.
总体平均数 170.6326 160.6386 165.2,
712
学习目标
新课讲授
课堂总结
一般地,按一个或多个变量把总体划分成若干个子总体,每个个体属于且 仅属于一个子总体,在每个子总体中独立地进行简单随机抽样,再把所有子总 体中抽取的样本合在一起作为总样本,这样的抽样方法称为分层随机抽样.
9.1.2 分层随机抽样
学习目标
新课讲授
课堂总结
1.了解分层随机抽样的特点、适用范围及必要性
2.掌握各层样本量比例分配的方法和分层随机抽样的样本 均值

第9讲 大学统计学课件-抽样调查

第9讲 大学统计学课件-抽样调查

总体方差(δ2)和总体标准差(δ)——测定全及总体标 志变异程度的指标
抽样指标 —— 根据抽样总体各个单位标志值计 算的综合 指标,与全及指标相对应
抽样平均数 (x)——抽样总体中某一变量 值(观测值)的算术平均数
抽样成数(p)——具有某种标志的单位数 在抽样总体 中所占的比重 样本方差 (s2) 和样本标准差 (s)—— 说明 抽样总体标志变异程度的指标
2.5 3.0 4.0 4.5 5.0
0.98760 0.99730 0.99940 0.99993 0.99999
例 6.3 某大学有 500 人进行高等数学统考,随机抽查 20% , 所得有关成绩数据如表。 试以95.45%的概率保证:
(1)估计全部学生的平均成绩;
(2)确定成绩在80分以上学生所占的比重和估计人数。
区间推断的可靠程度(置信度)
令 x t则 t x x
x
p
p

t 则 p t p
式中:t — 概率自由度(极限误差为平均误 差的倍数)
x t x X x t x
依据中心极限定律,当 n≥30,抽样平均指标近似服从 正态分布,全及指标所落范围就可以用曲线所围成的面积大 小来计算。
x
s n
x
p
s2 n (1 ) n N
p(1 p) n (1 ) n N
抽样成数 p 平均误差
p(1 p) n
应用条件
n 5% N
n 5% N
影响抽样误差的因素
全及总体标志变动程度 ——与抽样误差的大小成正比关系
样本单位数
——与抽样误差的大小成反比关系 抽样组织形式 ——抽样组织形式不同,抽样误差的大小不同

第九章 统计(知识点梳理及例题解析)

第九章   统计(知识点梳理及例题解析)

第九章统计9.1 随机抽样1. 全面调查与抽样调查( 1 )对每一个调查对象都进行调查的方法,称为全面调查,又称普查W .( 2 )在一个调查中,我们把调查对象的全体称为总体,组成总体的每一个调查对象称为个体W .( 3 )根据一定的目的,从总体中抽取一部分个体进行调查,并以此为依据对总体的情况作出估计和推断的调查方法,称为抽样调查W .( 4 )把从总体中抽取的那部分个体称为样本W .( 5 )样本中包含的个体数称为样本量W .( 6 )调查样本获得的变量值称为样本的观测数据,简称样本数据 .2. 简单随机抽样( 1 )有放回简单随机抽样一般地,设一个总体含有 N ( N 为正整数)个个体,从中逐个抽取 n (1 ≤ n < N )个个体作为样本,如果抽取是放回的,且每次抽取时总体内的各个个体被抽到的概率都相等,我们把这样的抽样方法叫做放回简单随机抽样 .( 2 )不放回简单随机抽样如果抽取是不放回的,且每次抽取时总体内未进入样本的各个个体被抽到的概率都相等,我们把这样的抽样方法叫做不放回简单随机抽样 .( 3 )简单随机抽样放回简单随机抽样和不放回简单随机抽样统称为简单随机抽样 .( 4 )简单随机样本通过简单随机抽样获得的样本称为简单随机样本 .( 5 )简单随机抽样的常用方法实现简单随机抽样的方法很多,抽签法和随机数法是比较常用的两种方法 .■名师点拨( 1 )从总体中,逐个不放回地随机抽取 n 个个体作为样本,一次性批量随机抽取 n 个个体作为样本,两种方法是等价的 .( 2 )简单随机抽样中各个个体被抽到的机会都相等,从而保证了抽样的公平性 .3. 总体平均数与样本平均数( 1 )总体平均数① 一般地,总体中有 N 个个体,它们的变量值分别为 Y 1 , Y 2 ,… , Y N ,则称== Y i 为总体均值,又称总体平均数 .② 如果总体的 N 个变量值中,不同的值共有 k (k ≤ N )个,不妨记为 Y 1 , Y2 ,… , Y k ,其中 Y i 出现的频数 f i ( i = 1 , 2 ,… , k ),则总体均值还可以写成加权平均数的形式= f i Y i W .( 2 )样本平均数如果从总体中抽取一个容量为 n 的样本,它们的变量值分别为 y 1 , y 2 ,… , yn ,则称== y i 为样本均值,又称样本平均数 . 在简单随机抽样中,我们常用样本平均数去估计总体平均数 .4. 分层随机抽样( 1 )分层随机抽样一般地,按一个或多个变量把总体划分成若干个子总体,每个个体属于且仅属于一个子总体,在每个子总体中独立地进行简单随机抽样,再把所有子总体中抽取的样本合在一起作为总样本,这样的抽样方法称为分层随机抽样,每一个子总体称为层W .( 2 )比例分配在分层随机抽样中,如果每层样本量都与层的大小成比例,那么称这种样本量的分配方式为比例分配 .5. 分层随机抽样中的总体平均数与样本平均数( 1 )在分层随机抽样中,如果层数分为 2 层,第 1 层和第 2 层包含的个体数分别为 M 和 N ,抽取的样本量分别为 m 和 n . 我们用 X 1 , X 2 ,… , X M 表示第 1 层各个个体的变量值,用 x 1 , x 2 ,… , x m 表示第 1 层样本的各个个体的变量值;用 Y 1 , Y 2 ,… , Y N 表示第 2 层各个个体的变量值,用 y 1 , y 2 ,… ,y n 表示第 2 层样本的各个个体的变量值,则:① 第 1 层的总体平均数和样本平均数分别为== X i ,== x i .② 第 2 层的总体平均数和样本平均数分别为==Y i ,== y i .③ 总体平均数和样本平均数分别为=,=W .( 2 )由于用第 1 层的样本平均数可以估计第 1 层的总体平均数,用第 2 层的样本平均数可以估计第 2 层的总体平均数 . 因此我们可以用=+估计总体平均数 .( 3 )在比例分配的分层随机抽样中,==,可得+=+= . 因此,在比例分配的分层随机抽样中,我们可以直接用样本平均数估计总体平均数 .6. 获取数据的途径获取数据的基本途径有:( 1 )通过调查获取数据;( 2 )通过试验获取数据;( 3 )通过观察获取数据;( 4 )通过查询获取数据典型应用 1总体、样本等概念辨析题为了调查参加运动会的 1 000 名运动员的平均年龄,从中抽取了 100 名运动员进行调查,下面说法正确的是()A.1 000 名运动员是总体B. 每个运动员是个体C. 抽取的 100 名运动员是样本D. 样本量是 100【解析】根据调查的目的可知,总体是这 1 000 名运动员的年龄,个体是每个运动员的年龄,样本是抽取的 100 名运动员的年龄,样本量为 100. 故答案为D.【答案】 D此类题目要正确理解总体与个体的概念,要弄明白概念的实质,并注意样本与样本容量的不同,其中样本量为数目,无单位 .典型应用 2简单随机抽样的概念下面的抽样方法是简单随机抽样吗?为什么?( 1 )从无数个个体中抽取 50 个个体作为样本;( 2 )仓库中有 1 万支奥运火炬,从中一次抽取 100 支火炬进行质量检查;( 3 )某连队从 200 名党员官兵中,挑选出 50 名最优秀的官兵赶赴灾区开展救灾工作 .【解】( 1 )不是简单随机抽样 . 因为简单随机抽样要求被抽取的样本总体的个数是有限的 . ( 2 )不是简单随机抽样 . 虽然“ 一次性抽取” 和“ 逐个抽取” 不影响个体被抽到的可能性,但简单随机抽样要求的是“ 逐个抽取” . ( 3 )不是简单随机抽样 . 因为这 50 名官兵是从中挑选出来的,是最优秀的,每个个体被抽到的可能性不同,不符合简单随机抽样中“ 等可能抽样” 的要求 .要判断所给的抽样方法是否为简单随机抽样,关键是看它们是否符合简单随机抽样的定义,即简单随机抽样的四个特点 .典型应用 3抽签法及随机数法的应用某班有 50 名学生,要从中随机地抽出 6 人参加一项活动,请分别写出利用抽签法和随机数法抽取该样本的过程 .【解】( 1 )利用抽签法步骤如下:第一步:将这 50 名学生编号,编号为 01 , 02 , 03 ,… , 50.第二步:将 50 个号码分别写在纸条上,并揉成团,制成号签 .第三步:将得到的号签放在一个不透明的容器中,搅拌均匀 .第四步:从容器中逐一抽取 6 个号签,并记录上面的号码 .对应上面 6 个号码的学生就是参加该项活动的学生 .( 2 )利用随机数法步骤如下:第一步:将这 50 名学生编号,编号为 1 , 2 , 3 ,… , 50.第二步:用随机数工具产生 1 ~ 50 范围内的整数随机数,把产生的随机数作为抽中的编号,使与编号对应的学生进入样本 .第三步:重复第二步的过程,直到抽足样本所需人数 .对应上面 6 个号码的学生就是参加该项活动的学生 .( 1 )利用抽签法抽取样本时应注意以下问题:① 编号时,如果已有编号(如学号、标号等)可不必重新编号 . (例如该题中 50 名同学,可以直接利用学号)② 号签要求大小、形状完全相同 .③ 号签要搅拌均匀 .④ 抽取号签时要逐一、不放回抽取 .( 2 )利用随机数法抽取样本时应注意的问题:如果生成的随机数有重复,即同一编号被多次抽到,应剔除重复的编号并重新产生随机数,直到产生的不同编号个数等于样本所需的人数 .典型应用 4分层随机抽样中的有关计算( 1 )某单位共有老、中、青年职工 430 人,其中有青年职工 160 人,中年职工人数是老年职工人数的 2 倍,为了解职工身体状况,现采用分层随机抽样方法进行调查,在抽取的样本中有青年职工 32 人,则该样本中的老年职工的人数为W .( 2 )某高中学校为了促进学生个体的全面发展,针对学生发展要求,开设了富有地方特色的“ 泥塑” 与“ 剪纸” 两个社团,已知报名参加这两个社团的学生共有800 人,按照要求每人只能参加一个社团,各年级参加社团的人数情况如下表:高一年级高二年级高三年级泥塑 a b c剪纸x y z其中 x ∶ y ∶ z = 5 ∶ 3 ∶ 2 ,且“ 泥塑” 社团的人数占两个社团总人数的,为了了解学生对两个社团活动的满意程度,从中抽取一个 50 人的样本进行调查,则从高二年级“ 剪纸” 社团的学生中应抽取人 .【解析】( 1 )设该单位老年职工人数为 x ,由题意得 3 x = 430 - 160 ,解得 x = 90. 则样本中的老年职工人数为 90 × = 18.( 2 )法一:因为“ 泥塑” 社团的人数占总人数的,故“ 剪纸” 社团的人数占总人数的,所以“ 剪纸” 社团的人数为 800 × = 320 ;因为“ 剪纸” 社团中高二年级人数比例为==,所以“ 剪纸” 社团中高二年级人数为 320 × = 96.由题意知,抽样比为=,所以从高二年级“ 剪纸” 社团中抽取的人数为 96 × = 6.法二:因为“ 泥塑” 社团的人数占总人数的,故“ 剪纸” 社团的人数占总人数的,所以抽取的 50 人的样本中,“ 剪纸” 社团中的人数为 50 × = 20.又“ 剪纸” 社团中高二年级人数比例为==,所以从高二年级“ 剪纸” 社团中抽取的人数为 20 × = 6.【答案】( 1 ) 18 ( 2 ) 6分层随机抽样中有关计算的方法( 1 )抽样比== .( 2 )总体中某两层的个体数之比=样本中这两层抽取的个体数之比 .对于分层抽样中求某层个体数,或某层要抽取的样本个体数,都可以通过上面两个等量关系求解 .典型应用 5样本平均数的求法( 1 )甲在本次飞镖游戏中的成绩为 8 , 6 , 7 , 7 , 8 , 10 , 9 , 8 ,7 , 8. 求甲在本次游戏中的平均成绩 .( 2 )在了解全校学生每年平均阅读多少本文学经典名著时,甲同学抽取了一个容量为 10 的样本,并算得样本的平均数为 5 ;乙同学抽取了一个容量为 8 的样本,并算得样本的平均数为 6. 已知甲、乙两同学抽取的样本合在一起组成一个容量为 18 的样本,求合在一起后的样本均值 .【解】( 1 )甲在本次游戏中的平均成绩为= 7.8. ( 2 )合在一起后的样本均值为== .在分层随机抽样中,如果第一层的样本量为 m ,平均值为 x ;第二层的样本量为n ,平均值为 y ,则样本的平均值为 .9 . 2 用样本估计总体1 .频率分布表、频率分布直方图的制作步骤及意义2 .百分位数(1) 定义:一般地,一组数据的第 p 百分位数是这样一个值,它使得这组数据中至少有 p % 的数据小于或等于这个值,且至少有 ( 100 - p ) % 的数据大于或等于这个值.(2) 计算步骤:计算一组 n 个数据的第 p 百分位数的步骤:第 1 步,按从小到大排列原始数据.第 2 步,计算 i = n × p % .第 3 步,若 i 不是整数,而大于 i 的比邻整数为 j ,则第 p 百分位数为第 j 项数据;若 i 是整数,则第 p 百分位数为第 i 项与第 ( i + 1) 项数据的平均数.典型应用 1频率分布表、频率分布直方图、频率分布折线图的绘制角度一频率分布表、频率分布直方图的绘制为考查某校高二男生的体重,随机抽取 44 名高二男生,实测体重数据( 单位: kg ) 如下:57 , 61 , 57 , 57 , 58 , 57 , 61 , 54 , 68 , 51 , 49 , 64 , 50 , 48 ,65 , 52 , 56 , 46 , 54 , 49 , 51 , 47 , 55 , 55 , 54 , 42 , 51 , 56 ,55 , 51 , 54 , 51 , 60 , 62 , 43 , 55 , 56 , 61 , 52 , 69 , 64 , 46 ,54 , 48将数据进行适当的分组,并画出相应的频率分布直方图和频率分布折线图.【解】以 4 为组距,列表如下:分组频率累计频数频率[41.5 , 45.5 ) 2 0.045 5[45.5 , 49.5 ) 7 0.159 1[49.5 , 53.5 ) 8 0.18 1 8[53.5 , 57.5 ) 16 0.363 6[57.5 , 61.5 ) 5 0.113 6[61.5 , 65.5 ) 4 0.090 9[65.5 , 69.5 ) 2 0.045 5频率分布直方图和频率分布折线图如图所示.(1) 在列频率分布表时,极差、组距、组数有如下关系:① 若为整数,则=组数;② 若不为整数,则的整数部分+ 1 =组数.(2) 组距和组数的确定没有固定的标准,将数据分组时,组数力求合适,纵使数据的分布规律能较清楚地呈现出来,组数太多或太少,都会影响我们了解数据的分布情况,若样本容量不超过 100 ,按照数据的多少常分为 5 ~ 12 组,一般样本量越大,所分组数越多.角度二频率分布直方图的应用为了了解高一年级学生的体能情况,某校抽取部分学生进行一分钟跳绳次数测试,将所得数据整理后,画出频率分布直方图 ( 如图所示 ) ,图中从左到右各小长方形面积之比为 2 ∶ 4 ∶ 17 ∶ 15 ∶ 9 ∶ 3 ,第二小组的频数为 12.(1) 第二小组的频率是多少?样本量是多少?(2) 若次数在 110 以上 ( 含 110 次 ) 为达标,则该校全体高一年级学生的达标率是多少?(3) 样本中不达标的学生人数是多少?(4) 第三组的频数是多少?【解】 (1) 频率分布直方图以面积的形式反映数据落在各小组内的频率大小,因此第二小组的频率为= 0.08.又因为第二小组的频率=,所以样本容量=== 150.(2) 由直方图可估计该校高一年级学生的达标率为 × 100% = 88 %.(3) 由 (1)(2) 知达标率为 88 % ,样本量为 150 ,不达标的学生频率为 1 - 0.88= 0.12.所以样本中不达标的学生人数为 150 × 0.12 = 18( 人 ) .(4) 第三小组的频率为= 0.34.又因为样本量为 150 ,所以第三组的频数为 150 × 0.34 = 51.频率分布直方图的应用中的计算问题(1) 小长方形的面积=组距 × =频率;(2) 各小长方形的面积之和等于 1 ;(3) =频率,此关系式的变形为=样本量,样本量 × 频率=频数.典型应用 2条形统计图为了丰富校园文化生活,某校计划在午间校园广播台播放“ 百家讲坛” 的部分内容.为了了解学生的喜好,抽取若干名学生进行问卷调查 ( 每人只选一项内容 ) ,整理调查结果,绘制统计图如图所示.请根据统计图提供的信息回答以下问题:(1) 求抽取的学生数;(2) 若该校有 3 000 名学生,估计喜欢收听易中天《品三国》的学生人数;(3) 估计该校喜欢收听刘心武评《红楼梦》的女学生人数约占全校学生人数的百分比.【解】 (1) 从统计图上可以看出,喜欢收听于丹析《庄子》的男生有 20 人,女生有 10 人;喜欢收听《故宫博物院》的男生有 30 人,女生有 15 人;喜欢收听于丹析《论语》的男生有 30 人,女生有 38 人;喜欢收听易中天《品三国》的男生有 64 人,女生有 42 人;喜欢收听刘心武评《红楼梦》的男生有 6 人,女生有 45 人.所以抽取的学生数为 20 + 10 + 30 + 15 + 30 + 38 + 64 + 42 + 6 + 45 =300( 人 ) .(2) 喜欢收听易中天《品三国》的男生有 64 人,女生有 42 人,共有 106 人,占所抽取总人数的比例为,由于该校有 3 000 名学生,因此可以估计喜欢收听易中天《品三国》的学生有× 3 000 = 1 060( 人 ) .(3) 该校喜欢收听刘心武评《红楼梦》的女学生人数约占全校学生人数的比例为× 100% = 15 %.(1) 绘制条形统计图时,第一步确定坐标系中横轴和纵轴上坐标的意义,第二步确定横轴上各部分的间距及位置,第三步根据统计结果绘制条形图.实际问题中,我们需根据需要进行分组,横轴上的分组越细,对数据的刻画(描述)就越精确.(2) 在条形统计图中,各个矩形图的宽度没有严格要求,但高度必须以数据为准,它直观反映了各部分在总体中所占比重的大小.典型应用 3折线统计图小明同学因发热而住院,下图是根据护士为他测量的体温所绘制的体温折线图.根据图中的信息,回答以下问题:(1) 护士每隔几小时给小明测量一次体温?( 2) 近三天来,小明的最高体温、最低体温分别是多少?(3) 从体温看,小明的病情是在恶化还是在好转?(4) 如果连续 36 小时体温不超过 37.2 摄氏度的话,可认为基本康复,那么小明最快什么出院?【解】 (1) 根据横轴表示的意义,可知护士每隔 6 小时给小明测量一次体温.(2) 从折线统计图中的最高点和最低点对应的纵轴意义,可知最高体温是 39.5 摄氏度,最低体温是 36.8 摄氏度.(3) 从图中可知小明的体温已经下降,并趋于稳定,因此病情在好转.(4)9 月 8 日 18 时小明的体温是 37 摄氏度.其后的体温未超过 37.2 摄氏度,自 9 月 8 日 18 时起计算,连续 36 小时后对应的时间为 9 月 10 日凌晨 6 时.因此小明最快可以在 9 月 10 凌晨 6 时出院.(1) 绘制折线统计图时,第一步,确定直角坐标系中横、纵坐标表示的意义;第二步,确定一个单位长度表示一定的数量,根据数量的多少描出各点;第三步,用直线段顺次连接即可.(2) 在折线统计图中,从折线的上升、下降可分析统计数量的增减变化情况,从陡峭程度上,可分析数据间相对增长、下降的幅度.典型应用 4扇形统计图下图是 A , B 两所学校艺术节期间收到的各类艺术作品的情况的统计图:(1) 从图中能否看出哪所学校收到的水粉画作品数量多?为什么?(2) 已知 A 学校收到的剪纸作品比 B 学校的多 20 件,收到的书法作品比 B 学校的少 100 件,请问这两所学校收到艺术作品的总数分别是多少件?【解】 (1) 不能.因为两所学校收到艺术作品的总数不知道.(2) 设 A 学校收到艺术作品的总数为 x 件, B 学校收到艺术作品的总数为 y 件,则解得即 A 学校收到艺术作品的总数为 500 件,B 学校收到艺术作品的总数为 600 件.(1) 绘制扇形统计图时,第一步计算各部分所占百分比以及对应圆心角的度数;第二步在圆中按照上述圆心角画出各个扇形并恰当标注.(2) 扇形统计图表示总体的各部分之间的百分比关系,但不同总量下的扇形统计图,其不同的百分比不可以作为比较的依据.典型应用 5百分位数的计算现有甲、乙两组数据如下表所示.序号1 2 3 4 5 6 7 8 9 11112131415161718192甲组1 2 2 2 2 3 3 3 5 5 6 6 8 8 9 11121313乙组0 0 0 0 1 1 2 3 4 5 6 6 7 7 11414141415试求甲、乙两组数的 25 % 分位数与 75 % 分位数.【解】因为数据个数为 20 ,而且 20 × 25 % = 5 , 20 × 75% = 15.因此,甲组数的 25 % 分位数为== 2.5 ;甲组数的 75 % 分位数为== 9.5.乙组数的 25 % 分位数为== 1 ,乙组的 75 % 分位数为== 12.求百分位数时,一定要将数据按照从小到大的顺序排列.9 . 3 统计案例公司员工的肥胖情况调查分析1 .平均数和中位数的特点(1) 样本平均数与每一个样本数据有关,样本中的任何一个数据的改变都会引起平均数的改变.(2) 中位数只利用了样本数据中间位置的一个或两个值,并未利用其他数据,所以不是任何一个样本数据的改变都会引起中位数的改变.(3) 与中位数相比较,平均数反映出样本数据中的更多信息,对样本中的极端值更加敏感.2 .中位数、平均数与频率分布直方图的关系一般来说,对一个单峰的频率分布直方图来说,如果直方图的形状是对称的 ( 图(1)) ,那么平均数和中位数应该大体上差不多;如果直方图在右边“ 拖尾” ( 图(2)) ,那么平均数大于中位数;如果直方图在左边“ 拖尾” ( 图 (3)) ,那么平均数小于中位数.也就是说,和中位数相比,平均数总是在“ 长尾巴” 那边.3 .众数的特点众数只利用了出现次数最多的那个值的信息.众数只能告诉我们它比其他值出现的次数多,但并未告诉我们它比别的数值多的程度.因此,众数只能传递数据中的信息的很少一部分,对极端值也不敏感.■名师点拨一般地,对数值型数据 ( 如用水量、身高、收入、产量等 ) 集中趋势的描述,可以用平均数、中位数;而对分类型数据 ( 如校服规格、性别、产品质量等级等 ) 集中趋势的描述,可以用众数.4 .总体方差与总体标准差如果总体中所有个体的变量值分别为 Y 1 , Y 2 ,… , Y N ,总体平均数为,则称 S 2 = __ ( Y i - ) 2 为总体方差, S =为总体标准差.与总体均值类似,总体方差也可以写成加权的形式.如果总体的 N 个变量值中,不同的值共有k ( k ≤ N ) 个,不妨记为 Y 1 , Y 2 ,… , Y k ,其中 Y i 出现的频数为 f i ( i = 1 , 2 ,… , k ) ,则总体方差为 S 2 = f i ( Y i - ) 2 .5 .样本方差与样本标准差如果一个样本中个体的变量值分别为 y 1 , y 2 ,… y n ,样本平均数为,则称 s 2 = ( y i - ) 2 为样本方差, s =为样本标准差.■名师点拨(1) 若 x 1 , x 2 , x 3 ,… , x n 的平均数为,方差为 s 2 那么 ax 1 + b ,ax 2 + b , ax 3 + b ,… , ax n + b 的平均数为′ = a + b ;方差s ′ 2 =a 2 s 2 .(2) 标准差刻画了数据的离散程度或波动幅度,标准差越大,数据的离散程度越大;标准差越小,数据的离散程度越小.显然,在刻画数据的分散程度上,方差和标准差是一样的.但在解决实际问题中,一般多采用标准差.典型应用 1众数、中位数、平均数的计算及应用某工厂人员及月工资构成如下:人员经理管理人员高级技工工人学徒合计月工资 ( 元 )22 000 2 500 2 200 2 000 1 000 29 700人数 1 6 5 10 1 23合计22 000 15 000 11 000 20 000 1 000 69 000(1) 指出这个表格中的众数、中位数、平均数;(2) 这个表格中,平均数能客观地反映该工厂的月工资水平吗?为什么?【解】 (1) 由表格可知,众数为 2 000 元.把 23 个数据按从小到大 ( 或从大到小 ) 的顺序排列,排在中间的数应是第 12 个数,其值为 2 200 ,故中位数为 2 200 元.平均数为 (22 000 + 15 000 + 11 000 + 20 000 + 1 000)÷23 = 69 000÷23 = 3 000( 元 ) .(2) 虽然平均数为 3 000 元 / 月,但由表格中所列出的数据可见,只有经理在平均数以上,其余的人都在平均数以下,故用平均数不能客观真实地反映该工厂的工资水平.(1) 如果样本平均数大于样本中位数,说明数据中存在较大的极端值.在实际应用中,如果同时知道样本中位数和样本平均数,可以使我们了解样本数据中的极端数据信息,帮助我们作出决策.(2) 众数、中位数、平均数三者比较,平均数更能体现每个数据的特征,它是各个数据的重心.典型应用 2利用频率分布直方图求众数、中位数、平均数从高三抽出 50 名学生参加数学竞赛,由成绩得到如下的频率分布直方图.由于一些数据丢失,试利用频率分布直方图求:(1) 这 50 名学生成绩的众数与中位数;(2) 这 50 名学生的平均成绩.【解】 (1) 由众数的概念可知,众数是出现次数最多的数.在直方图中高度最高的小长方形的底边中点的横坐标即为所求,所以众数应为 75.由于中位数是所有数据中的中间值,故在频率分布直方图中体现的是中位数的左右两边频数应相等,即频率也相等,从而就是小矩形的面积和相等.因此在频率分布直方图中将所有小矩形的面积一分为二的垂直于横轴的直线与横轴交点的横坐标所对应的成绩即为所求.因为 0.004 × 10 + 0.006 × 10 + 0.02 × 10= 0.04 + 0.06 + 0.2 = 0.3 ,所以前三个小矩形面积的和为 0.3. 而第四个小矩形面积为 0.03 × 10 = 0.3 , 0.3 +0.3 > 0.5 ,所以中位数应位于第四个小矩形内.设其底边为 x ,高为 0.03 ,所以令 0.03 x = 0.2 ,得x ≈ 6.7 ,故中位数应约为 70 + 6.7 = 76.7.(2) 样本平均值应是频率分布直方图的“ 重心” ,即所有数据的平均值,即每个小矩形底边的中点的横坐标乘以每个小矩形的面积求和即可.所以平均成绩为 45 × (0.004 × 10) + 55 × (0.006 × 10) + 65 × (0.02 × 10) + 75 × (0.03 × 10) + 85 × (0.024 × 10) + 95 × (0.016 × 10) = 76.2.频率分布直方图的数字特征(1) 众数:众数一般用频率分布表中频率最高的一组的组中值来显示,即在样本数据的频率分布直方图中,最高矩形的底边中点的横坐标;(2) 中位数:在频率分布直方图中,中位数左边和右边的直方图的面积应该相等;(3) 平均数:平均数在频率分布表中等于组中值与对应频率之积的和.典型应用 3标准差、方差的计算及应用甲、乙两机床同时加工直径为 100 cm 的零件,为检验质量,从中抽取 6件测量数据为:甲: 99 100 98 100 100 103乙: 99 100 102 99 100 100(1) 分别计算两组数据的平均数及方差;(2) 根据计算说明哪台机床加工零件的质量更稳定.【解】 (1) 甲= × (99 + 100 + 98 + 100 + 100 + 103) = 100 ,乙= × (99 + 100 + 102 + 99 + 100 + 100) = 100 ,s = × [(99 - 100) 2 + (100 - 100) 2 + (98 - 100) 2 + (100 - 100) 2 +(100 - 100) 2 + (103 - 100) 2 ] =,s = × [(99 - 100) 2 + (100 - 100) 2 + (102 - 100) 2 + (99 - 100) 2 +(100 - 100) 2 + (100 - 100) 2 ] = 1.(2) 由 (1) 知甲=乙,比较它们的方差,因为 s > s ,故乙机床加工零件的质量更稳定.用样本的标准差、方差估计总体的方法(1) 用样本估计总体时,样本的平均数、标准差只是总体的平均数、标准差的近似.实际应用中,当所得数据的平均数不相等时,需先分析平均水平,再计算标准差 ( 方差 ) 分析稳定情况.(2) 标准差、方差的取值范围是 [0 ,+∞ ) .(3) 因为标准差与原始数据的单位相同,且平方后可能夸大了偏差的程度,所以虽然方差与标准差在刻画样本数据的离散程度上是一样的,但在解决实际问题时,一般多采用标准差.。

  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

第九章统计与统计案例第1讲随机抽样[考纲解读] 1.理解随机抽样的必要性和重要性,会用简单随机抽样方法从总体中抽取样本.2.了解分层抽样与系统抽样的意义,能利用分层抽样与系统抽样解决实际问题.(重点)[考向预测]从近三年高考情况来看,本讲内容为高考中的冷考点.预测2021年高考对本讲将会以实际应用为背景命题考查分层抽样或系统抽样,同时也可能与统计相结合命题.试题以客观题的形式呈现,难度不大,以中、低档题目为主.1.简单随机抽样(1)定义:设一个总体含有N个个体,从中逐个□01不放回地抽取n个个体作为样本(n≤N),如果每次抽取时总体内的各个个体被抽到的机会都□02相等,就把这种抽样方法叫做简单随机抽样.(2)最常用的简单随机抽样的方法:□03抽签法和□04随机数表法.2.系统抽样(1)定义:当总体中的个体数目较多时,可将总体分成均衡的几个部分,然后按照事先定出的规则,从每一部分抽取一个个体得到所需要的样本,这种抽样方法叫做系统抽样.(2)系统抽样的操作步骤假设要从容量为N的总体中抽取容量为n的样本.①先将总体的N个个体编号;②确定□01分段间隔k,对编号进行分段,当Nn(n是样本容量)是整数时,取k=Nn;当Nn不是整数时,可随机地从总体中剔除余数x,取k=N-xn;③在第1段用□02简单随机抽样确定第一个个体编号l(l≤k);④按照一定的规则抽取样本,通常是将l加上间隔k得到第2个个体编号□03l+k,再加k得到第3个个体编号□04l+2k,依次进行下去,直到获取整个样本.3.分层抽样(1)定义:在抽样时,将总体分成□01互不交叉的层,然后按照一定的比例,从各层独立地抽取一定数量的个体,将各层取出的个体合在一起作为样本,这种抽样方法叫做分层抽样.(2)应用范围:当总体是由□02差异明显的几个部分组成时,往往选用分层抽样.注:三种抽样方法的比较类别共同点各自特点相互联系适用范围简单随机抽样是不放回抽样,抽样过程中,每个个体被抽到的机会(概率)相等从总体中逐个抽取—总体中的个数较少系统抽样将总体均分成几部分,按事先确定的规则,在各部分抽取在起始部分抽样时,采用简单随机抽样总体中的个数比较多分层抽样将总体分成几层,分层进行抽取各层抽样时,采用简单随机抽样或者系统抽样总体由差异明显的几部分组成1.概念辨析(1)简单随机抽样每个个体被抽到的机会不一样,与先后有关.()(2)系统抽样在起始部分抽样时采用简单随机抽样.()(3)在分层抽样的过程中,哪一层的样本越多,该层中个体抽取到的可能性越大.()(4)要从1002个学生中用系统抽样的方法选取一个容量为20的样本,需要剔除2个学生,这样对被剔除者不公平.()答案(1)×(2)√(3)×(4)×2.小题热身(1)在“世界读书日”前夕,为了了解某地5000名居民某天的阅读时间,从中抽取了200名居民的阅读时间进行统计分析,在这个问题中,5000名居民的阅读时间的全体是()A.总体B.个体C.样本容量D.从总体中抽取的一个样本答案 A解析从5000名居民某天的阅读时间中抽取200名居民的阅读时间,样本容量是200,抽取的200名居民的阅读时间是一个样本,每名居民的阅读时间就是一个个体,5000名居民的阅读时间的全体是总体.(2)对一个容量为N的总体抽取容量为n的样本,当选取简单随机抽样、系统抽样和分层抽样三种不同方法抽取样本时,总体中每个个体被抽中的概率分别为p1,p2,p3,则()A.p1=p2<p3B.p2=p3<p1C.p1=p3<p2D.p1=p2=p3答案 D解析因为采取简单随机抽样、系统抽样和分层抽样抽取样本时,总体中每个个体被抽中的概率相等.故选D.(3)某中学将参加期中测试的1200名学生编号为1,2,3,…,1200,现从中抽取一个容量为50的样本进行学习情况调查,按系统抽样的方法分为50组,如果第一组中抽出的学生编号为20,则第四组中抽取的学生编号为() A.68 B.92C.82 D.170答案 B解析第四组中抽取的学生编号为20+(1200÷50)×3=92.(4)某工厂生产甲、乙、丙、丁四种不同型号的产品,产量分别为200,400,300,100件.为检验产品的质量,现用分层抽样的方法从以上所有的产品中抽取60件进行检验,则应从丙种型号的产品中抽取________件.答案18解析由题意,知应从丙型产品中抽取60×300200+400+300+100=60×310=18(件).题型一简单随机抽样1.下列抽样检验中,适合用抽签法的是()A.从某厂生产的5000件产品中抽取600件进行质量检验B.从某厂生产的两箱(每箱18件)产品中抽取6件进行质量检验C.从甲、乙两厂生产的两箱(每箱18件)产品中抽取6件进行质量检验D.从某厂生产的5000件产品中抽取10件进行质量检验答案 B解析A,D中总体的个体数较多,不适宜用抽签法,C中,一般甲、乙两厂的产品质量有区别,也不适宜用抽签法.故选B.2.利用简单随机抽样,从n个个体中抽取一个容量为10的样本.若第二次抽取时,余下的每个个体被抽到的概率为13,则在整个抽样过程中,每个个体被抽到的概率为()A.14 B.13C.514 D.1027答案 C解析根据题意,9n-1=13,解得n=28.故在整个抽样过程中每个个体被抽到的概率为1028=5 14.3.(2019·衡水二模)某工厂利用随机数表对生产的600个零件进行抽样测试,先将600个零件进行编号,编号分别为001,002,…,599,600,从中抽取60个样本,如下提供是随机数表的第4行到第6行:32 21 18 34 29 78 64 54 07 32 52 42 06 44 38 12 23 43 56 77 35 78 90 56 4284 42 12 53 31 34 57 86 07 36 25 30 07 32 86 23 45 78 89 07 23 68 96 08 0432 56 78 08 43 67 89 53 55 77 34 89 94 83 75 22 53 55 78 32 45 77 89 23 45若从表中第6行第6列开始向右依次读取数据,则得到的第6个样本编号是________.答案578解析从第6行第6列的数开始,满足条件的6个编号依次为436,535,577,348,522,578,则第6个编号为578.1.简单随机抽样的特点(1)抽取的个体数较少.(2)是逐个抽取.(3)是不放回抽取.(4)是等可能抽取.只有四个特点都满足的抽样才是简单随机抽样.2.抽签法与随机数表法的适用情况(1)抽签法适用于总体中个体数较少的情况,随机数表法适用于总体中个体数较多的情况.(2)一个抽样试验能否用抽签法,关键看两点:一是抽签是否方便;二是号签是否易搅匀.1.下面的抽样方法是简单随机抽样的为()A.在某年明信片销售活动中,规定每100万张为一个开奖组,通过随机抽取的方式确定号码的后四位为2709的为三等奖B.某车间包装一种产品,在自动包装的传送带上,每隔30分钟抽一包产品,称其重量是否合格C.某学校分别从行政人员、教师、后勤人员中抽取2人、14人、4人了解对学校机构改革的意见D.用抽签方法从10件产品中选取3件进行质量检验答案 D解析A,B是系统抽样,C是分层抽样,D是简单随机抽样.2.总体由编号为01,02,…,19,20的20个个体组成.利用下面的随机数表选取5个个体,选取方法是从随机数表第1行的第5列数字开始由左到右依次选取两个数字,则选出来的第5个个体的编号为()7816 6572 0802 6314 0701 4369 9728 01983204 9234 4935 8200 3623 4869 6938 7481 A.08 B.07C.02 D.01答案 D解析选出的5个个体的编号依次是08,02,14,07,01.故选D.题型二系统抽样(2019·全国卷Ⅰ)某学校为了解1000名新生的身体素质,将这些学生编号为1,2,…,1000,从这些新生中用系统抽样方法等距抽取100名学生进行体质测验.若46号学生被抽到,则下面4名学生中被抽到的是()A.8号学生B.200号学生C.616号学生D.815号学生答案 C解析根据题意,系统抽样是等距抽样,所以抽样间隔为1000100=10.因为46除以10余6,所以抽到的号码都是除以10余6的数,结合选项知应为616.故选C.结论探究本例条件不变,则被抽到的学生的最小编号为________,最大编号为________.答案6996解析根据题意,可知此系统抽样的抽样间隔为1000100=10,共分100组,46号在第5组,故被抽到的最小编号在第一组,是46-10×4=6,最大编号在第100组,是46+10×95=996.系统抽样的注意点(1)系统抽样适用的条件是总体容量较大,样本容量也较大.(2)若不改变抽样规则,则所抽取的号码构成一个等差数列,其首项为第一组所抽取的号码,公差为样本间隔.故问题可转化为等差数列问题解决.(3)抽样规则改变,应注意每组抽取一个个体这一特性不变.(4)如果总体容量N不能被样本容量n整除,可随机地从总体中剔除余数,然后再按系统抽样的方法抽样,其中起始编号的确定应用简单随机抽样的方法.1.某校为了解1000名高一新生的身体生长状况,用系统抽样法(按等距的规则)抽取40名同学进行检查,将学生从1~1000进行编号,现已知第18组抽取的号码为443,则第一组用简单随机抽样抽取的号码为()A.16 B.17C.18 D.19答案 C解析∵从1000名学生中抽取一个容量为40的样本,∴系统抽样的分段间隔为100040=25.设第一组随机抽取一个号码为x,则第18组的抽取编号为x+17×25=443,∴x=18.2.(2019·安徽芜湖模拟)为了解高中生在寒假期间每天自主学习的时间,某校采用系统抽样的方法,从高三年级900名学生中抽取50名进行相关调查.先将这900名高中生从1到900进行编号,求得间隔数k=90050=18,即每18名高中生中抽取1名,若在编号为1~18的高中生中随机抽取1名,抽到的高中生的编号为6,则在编号为37~54的高中生中抽到的高中生的编号应该是________.答案42解析根据题意,采用系统抽样,且分段间隔为18,首组所取的号码为6,故后面的组抽取的号码为18n+6(1≤n≤49,n∈N),令37≤18n+6≤54,得n=2,故所抽取的号码为2×18+6=42.题型三分层抽样角度1求总体容量或样本容量1.交通管理部门为了解机动车驾驶员(简称驾驶员)对某新法规的知晓情况,对甲、乙、丙、丁四个社区做分层抽样调查.假设四个社区驾驶员的总人数为N,其中甲社区有驾驶员96人.若在甲、乙、丙、丁四个社区抽取驾驶员的人数分别为12,21,25,43,则这四个社区驾驶员的总人数N为()A.101 B.808C.1212 D.2012答案 B解析甲社区每个个体被抽到的概率为1296=18,样本容量为12+21+25+43=101,所以四个社区中驾驶员的总人数N=10118=808.2.(2019·安徽六校教育研究会联考)某工厂生产的A,B,C三种不同型号的产品的数量之比为2∶3∶5,为研究这三种产品的质量,现用分层抽样的方法从该工厂生产的A,B,C三种产品中抽出样本容量为n的样本,若样本中A型产品有10件,则n的值为()A.15 B.25C.50 D.60答案 C解析解法一:某工厂生产的A,B,C三种不同型号产品的数量之比为2∶3∶5,用分层抽样的方法抽取一个容量为n的样本,则A型产品被抽取的抽样比为22+3+5=15.因为A产品有10件,所以n=1015=50.故选C.解法二:由题意,得22+3+5=10n,解得n=50.故选C.角度2求每层中的样本数量3.分层抽样是将总体分成互不交叉的层,然后按照一定的比例,从各层独立地抽取一定数量的个体,组成一个样本的抽样方法.在《九章算术》第三章“衰分”中有如下问题:“今有甲持钱五百六十,乙持钱三百五十,丙持钱一百八十,凡三人俱出关,关税百钱,欲以钱多少衰出之,问各几何?”其译文为:今有甲持560钱,乙持350钱,丙持180钱,甲、乙、丙三人一起出关,关税共100钱,要按照各人带钱多少的比例进行交税,问三人各应付多少税?则下列说法错误的是()A.甲应付5141 109钱B.乙应付3224 109钱C.丙应付1656 109钱D.三者中甲付的钱最多,丙付的钱最少答案 B解析依题意由分层抽样可知,100÷(560+350+180)=10 109,则甲应付:10109×560=5141109(钱);乙应付:10109×350=3212109(钱);丙应付:10109×180=1656109(钱).分层抽样问题类型及解题思路(1)求某层应抽个体数量:按该层所占总体的比例计算.(2)已知某层个体数量,求总体容量或反之:根据分层抽样就是按比例抽样,列比例式进行计算.(3)分层抽样的计算应根据抽样比构造方程求解,其中“抽样比=样本容量总体容量=各层样本数量各层个体数量”.提醒:分层抽样时,每层抽取的个体可以不一样多,但必须满足抽取n i =n ·N iN (i =1,2,…,k )个个体(其中i 是层数,n 是抽取的样本容量,N i 是第i 层中个体的个数,N 是总体容量).1.一个总体分为A ,B ,C 三层,用分层抽样的方法从总体中抽取一个容量为50的样本,已知B 层中每个个体被抽到的概率都为112,则总体中个体的个数为( )A .150B .200C .500D .600答案 D解析 运用分层抽样的方法,在不同层中每个个体被抽到的概率相等,都等于样本容量总体容量.设总体中个体的个数为N ,则50N =112.解得N =600.故选D. 2.某校共有教师200人,男学生800人,女学生600人,现用分层抽样的方法从所有师生中抽取一个容量为n 的样本,已知从男学生中抽取的人数为100,那么n =( )A .200B .300C .400D .500 答案 A解析 每个个体被抽到的概率等于100800=18,应抽取的教师人数为200×18=25,应抽取的女学生人数为600×18=75,故样本容量n =25+75+100=200.3.(2019·河北一模)随着时代的发展,移动通讯技术的进步,各种智能手机不断更新换代,给人们的生活带来了巨大的便利,但与此同时,长时间低头看手机对人的身体如颈椎、眼睛等会造成一定的损害,“低头族”由此而来.为了解某群体中“低头族”的比例,现从该群体包含老、中、青三个年龄段的1500人中采用分层抽样的方法抽取50人进行调查,已知这50人里老、中、青三个年龄段所占的比例如图所示,则这个群体里老年人人数为()A.490 B.390C.1110 D.410答案 B解析由题图,知这50人里老、中、青三个年龄段所占的比例为26%,34%,40%,则这个群体里老年人人数为26%×1500=390.组基础关1.(1)某学校为了了解2019年高考数学学科的考试成绩,在高考后对1200名学生进行抽样调查,其中文科400名考生,理科600名考生,艺术和体育类考生共200名,从中抽取120名考生作为样本.(2)从30名家长中抽取5名参加座谈会.Ⅰ.简单随机抽样法'Ⅱ.系统抽样法'Ⅲ.分层抽样法问题与方法配对正确的是()A.(1)Ⅲ,(2)ⅠB.(1)Ⅰ,(2)ⅡC.(1)Ⅱ,(2)ⅢD.(1)Ⅲ,(2)Ⅱ答案 A解析(1)是分层抽样,(2)是简单随机抽样.2.(2020·北京西城区模拟)某校共有学生1000人,其中男生600人,女生400人,学校为检测学生的体质健康状况,统一从学生学籍档案管理库(简称“CIMS 系统”)中随机选取参加测试的学生,现采用分层抽样的方法从中抽取容量为30的样本进行检测,那么应抽取女生的人数为()A.12 B.15C.18 D.20答案 A解析某校共有学生1000人,其中男生600人,女生400人,采用分层抽样的方法从中抽取容量为30的样本进行检测,则应抽取女生的人数为30×4001000=12.3.(2019.唐山三模)为了调查某工厂生产的一种产品的尺寸是否合格,现从500件产品中抽出10件进行检验.先将500件产品编号为000,001,002, (499)在随机数表中任选一个数开始,例如选出第6行第8列的数4开始向右读(为了便于说明,下面摘取了随机数表,附表1的第6行至第8行),即第一个号码为439,则选出的第4个号码是()16 22 77 94 39 49 54 43 54 82 17 37 93 23 7884 42 17 53 31 57 24 55 06 88 77 04 74 47 6763 01 63 78 59 16 95 55 67 19 98 10 50 71 75A.548 B.443C.379 D.217答案 D解析从第6行第8列的数4开始向右读,则选出的前4个号码是:439,495,443,217,∴选出的第4个号码是217.4.某工厂甲、乙、丙、丁四个车间生产了同一种产品共计2800件,现要用分层抽样的方法从中抽取140件进行质量检测,且从甲、丙两个车间总共抽取的产品数量为60件,则乙、丁两车间生产的产品总共有()A.1000件B.1200件C.1400件D.1600件答案 D解析由已知条件得,抽样比为1402800=120,∵从甲、丙两个车间总共抽取的产品数量为60件,∴从乙、丁两个车间抽取的产品数量为140-60=80件,∴乙、丁两车间生产的产品总共有80120=1600件.5.(2019·保定二模)某工厂生产A,B,C三种不同型号的产品,其中某月生产的产品数量之比依次为m∶3∶2,现用分层抽样的方法抽取一个容量为120的样本,已知A种型号产品抽取了45件,则m=()A.1 B.2C.3 D.4答案 C解析设该工厂生产A型号的产品数量为mk,则生产B型号的产品数量为3k,生产C型号的产品数量为2k,则45mk=120mk+3k+2k,解得m=3.6.(2019·江西八校联考)从编号为001,002,…,500的500个产品中用系统抽样的方法抽取一个样本,已知样本中编号最小的两个编号分别为007,032,则样本中最大的编号应该为()A.480 B.481C.482 D.483答案 C解析根据系统抽样的定义,知样本的编号成等差数列,令a1=7,a2=32,则d=25,所以7+25(n-1)≤500,所以n≤51825,n的最大值为20,得最大的编号为7+25×19=482.7.用系统抽样法从160名学生中抽取容量为20的样本,将学生随机地从1~160编号,按编号顺序平均分成20组(1~8,9~16,…,153~160).若第16组得到的号码为126,则第1组中用抽签的方法确定的号码是________.答案 6解析设第1组抽出的号码为x,则第16组应抽出的号码是16020×15+x=126,∴x=6.8.某商场有四类食品,食品类别和种数见下表:类别粮食类植物油类动物性食品类果蔬类种类40103020取样本,则抽取的植物油类与果蔬类食品种数之和为________.答案 6解析因为总体的个数为40+10+30+20=100,所以根据分层抽样的定义可知,抽取的植物油类食品种数为10100×20=2,抽取的果蔬类食品种数为20100×20=4,所以抽取的植物油类与果蔬类食品种数之和为2+4=6.组能力关1.(2019·湖北荆州模拟)我国古代数学算经十书之一的《九章算术》有一衰分问题:今有北乡八千一百人,西乡九千人,南乡五千四百人,凡三乡,发役五百,意思是用分层抽样的方法从这三乡中共抽出500人服役,则西乡比南乡多抽出的人数为()A.20 B.60C.80 D.200答案 C解析北乡8100人,西乡9000人,南乡5400人,对应的人数比为8100∶9000∶5400=9∶10∶6,则西乡抽取的人数为109+10+6×500=200,南乡抽取人数为69+10+6×500=120,则西乡比南乡多200-120=80人.故选C.2.某市为最大限度的吸引“高精尖缺”人才,向全球“招贤纳士”,推进了人才引入落户政策.随着人口增多,对住房要求也随之而来,而选择购买商品房时,住户对商品房的户型结构越来越重视,因此某商品房调查机构随机抽取n名市民,针对其居住的户型结构和满意度进行了调查,如图1调查的所有市民中四居室共200户,所占比例为13,二居室住户占16.如图2是用分层抽样的方法从所有调查的市民的满意度问卷中,抽取10%的调查结果绘制成的统计图,则下列说法正确的是()A.样本容量为70B.样本中三居室住户共抽取了25户C.根据样本可估计对四居室满意的住户有70户D.样本中对三居室满意的有15户答案 D解析可先根据题图1求出总体数量及样本容量,再根据分层抽样及题图2确定样本中三居室户数及满意人数.选项正误原因A ×总体容量为600,样本容量为600×10%=60B ×样本中三居室住户共抽取300×10%=30(户)C ×对四居室满意的住户共有200×40%=80(户)D √样本中三居室住户有300×10%=30(户),对三居室满意的住户有30×50%=15(户)编为1~40号,再用系统抽样的方法从中抽取8人,则其中成绩在区间[123,134]上的学生人数为________.答案 3解析根据茎叶图,成绩在区间[123,134]上的数据有15个,所以用系统抽样的方法从所有的40人中抽取8人,=3.成绩在区间[123,134]上的学生人数为8×1540。

相关文档
最新文档