随机抽样用样本估计总体

合集下载
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

[答案] B
[解析] 因为可以用极差、方差或标准差来 描述数据的离散程度,所以要评估亩产量 稳定程度,应该用样本数据的极差、方差 或标准差.
故选B.
甲地的数据分布在26和31之间,且数据 波动较大,而乙地数据分布在28与32之间 ,且数据波动较小.
解析 因为 x 甲=26+28+259+31+31=29,x 乙=28+29+350+31+32 =30,所以 x 甲< x 乙,又 s2甲=9+1+05+4+4=158,s2乙=4+1+50+1+4=2, 所以 s 甲>s 乙。故可判断结论①④正确。故选 B。
(2)频率分布折线图和总体密度曲线。 ①频率分布折线图:连接频率分布直方图中各小长方形上端的_中__点_____,
就得频率分布折线图。 ②总体密度曲线:随着__样__本__容__量____的增加,作图时___所__分__的__组__数______
增加,_组__距_____减小,相应的频率分布折线图会越来越接近于一条光滑曲线,
体合在一起作为样本,这种抽样方法叫做分层抽样。
(2)分层抽样的应用范围: 当总体是由_差__异__明__显__的__几__个___部__分____组成时,往往选用分层抽样。
三种抽样方法的比较:
类别 简单随机抽样
分层抽样
系统抽样
共同点
①抽样过程中 每个个体被抽 取的概率是相 等的;②均属 于不放回抽样
即总体密度曲线。
(3)茎叶图。 茎是指__中__间____的一列数,叶是从茎的___旁__边___生长出来的数。
茎叶图的优缺点 由茎叶图可以清晰地看到数据的分布情况,这一点同频率分布直方图类 似。它优于频率分布直方图的第一点是从茎叶图中能看到原始数据,没有任 何信息损失,第二点是茎叶图便于记录和表示。其缺点是当样本容量较大时, 作图较烦琐。
B.某车间包装一种产品,在自动传送带上,每隔 5分钟抽一包产品,称其质量是否合格
C.某校分别从行政、教师、后勤人员中抽取2人、 14人、4人了解学校机构改革的意见
D.用抽签法从10件产品中选取3件进行质量检验
[答案] D
[解析] A,B不是简单随机抽样,因为抽 取的个体间的间隔是固定的;C也不是,因 为总体的个体有明显的层次;D是简单随机 抽样中的抽签法.故选D.
系统抽样又称等距抽样,所以抽取的号
码依次为一个等差数列,首项为第一组所 抽取样本的号码,公差为间隔数,根据等 差数列的通项公式就可以确定每一组内所 要抽取样本号码
3.分层抽样 (1) 定 义 : 在 抽 样 时 , 将 总 体 分 成 _互__不__交__叉_____ 的 层 , 然 后 按 照 _一__定__的__比__例_________,从各层独立地抽取一定数量的个体,将各层取出的个
2.用样本的数字特征估计总体的数字特征 (1)众数:一组数据中出现次数最多的数。 (2)中位数:将数据按大小顺序排列,若有奇数个数,则最中间的数是中 位数;若有偶数个数,则中间两数的平均数是中位数。
(3)平均数:-x =_x_1+__x_2_+_n_…__+__x_n___ ______,反映了Hale Waihona Puke Baidu组数据的平均水平。
A.101 B.808
C.1 212 D.2 012
2.[2017江苏卷]某工厂生产甲、乙、丙、 丁四种不同型号的产品,产量分别为 200,400,300,100件.为检验产品的质量,现 用分层抽样的方法从以上所有的产品中抽 取60件进行检验,则应从丙种型号的产品 中抽取________件.
考点四: 样本的数字特征的计算应用
[答案] D
[解析] 从第1行的第5列和第6列组成的数 65开始由左到右依次选出的数为 08,02,14,07,01,所以第5个个体的编号为01.
2.[2019福建模拟]下面的抽样方法是简单随机抽样 的是( )
A.在某年明信片的销售活动中,规定每100万张 为一个开奖组,通过随机抽取的方式确定号码的后 四位为2 709的为三等奖
4 中位数可能出现在所给数据中,也可能不在所给数据中, 当一组数据中的个别数据变动较大时,可用中位数描述其 集中趋势。
标准差与方差的异同
标准差,方差描述了一组数据围绕平均 数的波动的大小;数据的离散程度越大, 标准差方差越大;数据的离散程度越小, 标准差方差越小:
典例通关 考点一: 简单的随机抽样
数据,n 是样本容量, -x 是样本平均数 )。
众数,中位数与平均数的异同:
1 众数,中位数及平均数都是表示一组数据集中趋势的量 2 由于平均数与每一个样本数据有关,所以任何一个样本数
据的改变都会引起平均数的变化
3 众数考察数据出现的频率,其大小只与这组数据中的部分 数据有关,当一组数据中有不少数据多次重复出现时,其 众数往往更能反映问题
A.480 B.481
C.482 D.483
[答案] C
[解析] 根据系统抽样的定义可知,样本的 编号成等差数列,令a1=7,a2=32,d=25, 所以7+25(n-1)≤500,所以n≤20,最大编 号为7+25×19=482.
4.[2019山东临沂模拟]某班共有52人,现根
据学生的学号,用系统抽样的方法,抽取 一个容量为4的样本,已知3号、29号、42
(4)标准差:是样本数据到平均数的一种平均距离,
s=____1n_[_(_x1_-__-_x_)_2_+__(x_2_-__-_x_)_2_+__…__+__(_xn_-__-_x_)_2_] _______。
(5)方差: s2=__1n_[(_x_1_-__-x__)2_+__(_x_2-__-_x__)2_+__…__+__(_x_n-___-x__)2_]_ ______(xn 是样本
统计的基本思想方法是用样本估计总体 ,即用局部推断整体,这就要求样本应具 有很好的代表性,而样本良好客观的代表 性,完全依赖抽样方法.
知识梳理
一、 抽样方法(简单随机抽样,系 统抽样,分层抽样)
自|主|全|排|查
1.简单随机抽样 (1)定义:设一个总体含有 N 个个体,从中____逐__个__不__放__回__地_____抽取 n
(3)设中位数为 x 吨。 因为前 5 组的频率之和为 0.04+0.08+0.15+0.21+0.25=0.73>0.5, 而前 4 组的频率之和为 0.04+0.08+0.15+0.21=0.48<0.5,所以 2≤x<2.5。 由 0.50×(x-2)=0.5-0.48,解得 x=2.04。 故可估计居民月均用水量的中位数为 2.04 吨。
解 (1) 由 频率 分布 直方图 可知 ,月均 用水 量在 [0,0.5) 内的 频率 为 0.08×0.5=0.04,
同理,在[ 0.5,1),[ 1.5,2),[ 2,2.5),[ 3,3.5),[ 3.5,4),[ 4,4.5] 内的频率分 别为 0.08,0.21,0.25,0.06,0.04,0.02。
个个体作为样本(n≤N),如果每次抽取时总体内的各个个体被抽到的机会都 __相__等____,就把这种抽样方法叫做简单随机抽样。
(2)最常用的简单随机抽样的方法:_抽__签__法______和__随__机__数__法_____。
2.系统抽样的步骤 假设要从容量为 N 的总体中抽取容量为 n 的样本。 (1)先将总体的 N 个个体_编__号_______。
由 1-(0.04+0.08+0.21+0.25+0.06+0.04+0.02)=2a×0.5,解得 a= 0.30。
(2)由(1)知,该市 100 位居民中月均用水量不低于 3 吨的频率为 0.06+ 0.04+0.02=0.12。
由以上样本的频率分布,可以估计 30 万居民中月均用水量不低于 3 吨 的人数为 300 000×0.12=36 000。
随机抽样 用样本估计总体
考纲要求
1.会用简单随机抽样方法从总体中抽取样本,了解 分层抽样和系统抽样方法.
2.了解分布的意义和作用,会列频率分布表,会画 频率分布直方图、频率折线图、茎叶图,理解它们 各自的特点.
3.理解样本数据标准差的意义和作用,会计算数据 标准差,并能做出合理的解释
4.会用样本的频率分布估计总体分布,会用样本的 基本数字特征估计总体的基本数字特征,理解用样 本估计总体的思想.会用统计思想解决一些简单的 实际问题.
2.[2017全国卷Ⅰ]为评估一种农作物的种 植效果,选了n块地作试验田.这n块地的 亩产量(单位:kg)分别为x1,x2,…,xn,下 面给出的指标中可以用来评估这种农作物 亩产量稳定程度的是( )
A.x1,x2,…,xn的平均数 B.x1,x2,…,xn的标准差 C.x1,x2,…,xn的最大值 D.x1,x2,…,xn的中位数
考点二: 系统抽样
系统抽样又称等距抽样,所以抽取的号
码依次为一个等差数列,首项为第一组所 抽取样本的号码,公差为间隔数,根据等 差数列的通项公式就可以确定每一组内所 要抽取样本号码
2.从编号为001,002,…,500的500个产品 中用系统抽样的方法抽取一个样本,已知 样本中编号最小的两个编号分别为007,032, 则样本中最大的编号应该为( )
Ⅰ.随机数表的运用 1.总体由编号为01,02,…,19,20的20个个体组 成,利用下面的随机数表选取5个个体,选取方 法是从随机数表第1行的第5列和第6列数字开始 由左到右依次选取两个数字,则选出来的第5个 个体的编号为( )
A.08
B.07 C.02 D.01
7816 6572 0802 6314 0702 4369 9728 0198 3204 9234 4935 8200 3623 4869 6938 7481
自|主|全|排|查 1.用样本的频率分布估计总体分布 (1)作频率分布直方图的步骤。 ①求极差(即一组数据中_最__大__值_____与___最__小__值___的差)。 ②决定_组__距______与_组__数______。 ③将数据_分__组______。 ④列_频__率__分__布___表________。 ⑤画_频__率__分__布___直__方__图______。
答案 B
考点五: 频率分布直方图
考点一 用样本的频率分布估计总体分布 微点小专题 考向 1:频率分布直方图 【典例 1】 (2016·四川高考)我国是世界上严重缺水的国家,某市为了 制定合理的节水方案,对居民用水情况进行了调查。通过抽样,获得了某年 100 位居民每人的月均用水量(单位:吨)。将数据按照[0,0.5),[0.5,1),…, [4,4.5]分成 9 组,制成了如图所示的频率分布直方图。 (1)求直方图中 a 的值。 (2)设该市有 30 万居民,估计 全市居民中月均用水量不低于 3 吨 的人数,说明理由。 (3)估计居民月均用水量的中 位数。
(2)确定__分__段__间__隔__k_____,对编号进行_分__段_____,当Nn是整数时,取 k=Nn。 (3)在第 1 段用_简__单__随__机__抽__样_______确定第一个个体编号 l(l≤k)。 (4)按照一定的规则抽取样本,通常是将 l 加上间隔 k 得到第 2 个个体编号 (_l_+__k_) _____,再加 k 得到第 3 个个体编号(_l_+__2_k_)____,依次进行下去,直到 获取整个样本。
号同学在样本中,那么样本中还有一个同 学的学号是( )
A.10
B.11
C.12
D.16
[答案] D
[解析] 因为29号、42号的号码差为13,所 以3+13=16,即另外一个同学的学号是16.
考点三 分层抽样
1.交通管理部门为了解机动车驾驶员(简称 驾驶员)对某新法规的知晓情况,对甲、乙、 丙、丁四个社区做分层抽样调查.假设四个 社区驾驶员的总人数为N,其中甲社区有驾 驶员96人.若在甲、乙、丙、丁四个社区抽 取驾驶员的人数分别为12,21,25,43,则这四 个社区驾驶员的总人数N为( )
各自特点
从总体中逐个 抽取
将总体分成几 层进行抽取
将总体均分成 几部分,按事 先确定的规则 在各部分抽取
相互联 系
最基本 的抽样 方法
各层抽 样时采 用简单 随机抽

在起始 部分抽 样时采 用简单 随机抽

适用范 围
总体中 的个体 数较少
总体由 差异明 显的几 部分组

总体中 的个体 数较多
二、 用样本估计总体(1 用样本的频率分 布来估计总体分布 2 用样本数字特征估 计总体数字特征)
相关文档
最新文档