抽样调查-分层随机抽样课件
合集下载
随机抽样及随机分组ppt课件
• 解步骤:1 进入 试验设计模块
• 点击 试验设计---设计方案---完全随机分组
• 试验样本总例数: 30, • 处理组数:2 • 1组例数:15 • 2组例数:15---确定 • 2 进入结果模块 查看结果
• 点击 结果
•精品课件
•29
• 完全随机设计编号分组结果(总例数=20,处理组数=5 )
•精品课件
•11
㈠简单随机抽样 P10
• 简单随机抽样亦称单纯随机抽样要求每个观察对 象有同等概率被选入样本。
• 从有N个观察单位中抽取m个观察单位方法:
• 先将N个观察单位编号,并且每个赋一个随机数。 再将N个随机数排序,前m个随机数对应的观察单
位编号即为所抽取。
• 优缺点 简单随机抽样是最基本的抽样方法,优 点是均数(或率)及其标准误的计算简便,缺点是当 总体例数较多时,实施抽样比较困难。适用于小 型调查。
• 优缺点 ①抽样误差比较小;②先要将总体分层,层 内个体差异越小越好,层间个体差异越大越好,便 于对不同的层采用不同的抽样方法。
•精品课件
•21
CHISS的实现
• 例如,某校有3个不同专业的研究班,每班10个同学,现 要从每班各随机抽取3名同学参加比赛,如何抽取?
• CHISS实现步骤: • 1 编号建数据库 将30学生的学号及班级录入数据库
• 从同一总体中随机抽取一定数目的受试对 象,将受试对象随机地分配到每一个组中, 各组分别接受不同的处理。这样的设计分 组称为完全随机分组设计。
•精品课件
•27
• 例 现有20个动物试验,分别采用完全随机分为5组。
•精品课件
•28
CHISS软件实现
•精品课件
•34
分层抽样-PPT
②按照地区分类:大城市、中等城市、城镇、乡镇四个层次。
③按照学校分类:重点、非重点两个层次。
7
为了了解高一年级12000名学生的数学成绩,需要抽 取容量为120的样本,请用合适的方法抽取.
解:(1)对全体学生的数学成绩进行编号:1,2,3……,12000.
(2)分段:由于样本容量与总体容量的 比是1:100,我们 将总体平均分为100个部分,其中每一部分包含100个 个体.
数学必修3
分层抽样
1
数理统计是研究如何有效地收集,整理,分 析受随机影响的数据,并对所考虑的问题作出推断 或预测,直至为采取决策和行动提供依据和建议的 一门学科。它是一门应用性很强的学科,凡是有大 量数据出现的地方,都要用到数理统计。现在,数 理统计的内容已异常丰富,成为数学中最活跃的学 科之一。教科书选择了数理统计中最基本问题来介 绍这门学科的思想与方法。
由于分层抽样的要求不同,各层的抽样的样本容量也不相同, 所以,应当按照实际情况,合理地将样本容量分配到各个层, 以确保抽样的合理性,研究时可以根据不同的要求来分层抽样。
分层抽样适用于总体由差异明显的几部分组成的情况, 每一部分称为层,在每一层中实行简单随机抽样。这种方法较 充分地利用了总体己有信息,是一种实用、操作性强的方法。
(4)按照规则抽取样本:l;l+k;l+2k;……l+nk
系统抽样时,将总体中的个体均分后的每一段进 行抽样时,采用简单随机抽样;系统抽样每次抽样时, 总体中各个个体被抽取的概率也是相等的;如总体的个体 数不能被样本容量整除时,可以先用简单随机抽样从总 体中剔除几个个体,然后再按系统抽样进行。需要说明 的是整个抽样过程中每个个体被抽到的概率仍然相等。11
数理统计所要解决的问题是如何根据样本来推 断总体,第一个问题就是采集样本,然后才能作统 计推断。
③按照学校分类:重点、非重点两个层次。
7
为了了解高一年级12000名学生的数学成绩,需要抽 取容量为120的样本,请用合适的方法抽取.
解:(1)对全体学生的数学成绩进行编号:1,2,3……,12000.
(2)分段:由于样本容量与总体容量的 比是1:100,我们 将总体平均分为100个部分,其中每一部分包含100个 个体.
数学必修3
分层抽样
1
数理统计是研究如何有效地收集,整理,分 析受随机影响的数据,并对所考虑的问题作出推断 或预测,直至为采取决策和行动提供依据和建议的 一门学科。它是一门应用性很强的学科,凡是有大 量数据出现的地方,都要用到数理统计。现在,数 理统计的内容已异常丰富,成为数学中最活跃的学 科之一。教科书选择了数理统计中最基本问题来介 绍这门学科的思想与方法。
由于分层抽样的要求不同,各层的抽样的样本容量也不相同, 所以,应当按照实际情况,合理地将样本容量分配到各个层, 以确保抽样的合理性,研究时可以根据不同的要求来分层抽样。
分层抽样适用于总体由差异明显的几部分组成的情况, 每一部分称为层,在每一层中实行简单随机抽样。这种方法较 充分地利用了总体己有信息,是一种实用、操作性强的方法。
(4)按照规则抽取样本:l;l+k;l+2k;……l+nk
系统抽样时,将总体中的个体均分后的每一段进 行抽样时,采用简单随机抽样;系统抽样每次抽样时, 总体中各个个体被抽取的概率也是相等的;如总体的个体 数不能被样本容量整除时,可以先用简单随机抽样从总 体中剔除几个个体,然后再按系统抽样进行。需要说明 的是整个抽样过程中每个个体被抽到的概率仍然相等。11
数理统计所要解决的问题是如何根据样本来推 断总体,第一个问题就是采集样本,然后才能作统 计推断。
抽样调查课件第三章 分层随机抽样
4
2013-4-5
例题
例如,对全国范围汽车运输的抽样调查,调查目的不 仅要推算全国货运汽车完成的运量,还要推算不同经 济成分(国有、集体、个体)汽车完成的运量。 为组织的方便,首先将货运汽车总体按省分层,由 各省运输管理部门负责省内的调查工作。 各省再将省内拥有的汽车按经济成分分层。 为提高抽样效率,再对汽车按吨位分层。 例如,某高校对学生在宿舍使用电脑的情况进行调查, 根据经验,本科生和研究生拥有电脑的状况差异较大。 因此,在抽样前对学生按本科生和研究生进行分层 是有必要的。
p1q1 0.0169 n1 1 pq v p3 1 f3 3 3 0.0263 n3 1 v p1 1 f1
2013-4-5
16
性质6:对于分层随机抽样, 无偏估计为:
ˆ VY
的一个
1 fh 2 ˆ v Y N v y h N sh nh h 1 h 1
L L 2 h 2 h
2013-4-5
17
例3.1
调查某地区的居民奶制品年消费支出,以居民户为抽 样单元,根据经济及收入水平将居民户划分为4层,每 层按简单随机抽样抽取10户,调查获得如下数据(单 位:元),要估计该地区居民奶制品年消费总支出及 估计的标准差。
4
4
ˆ ˆ s Y v Y 23208
ˆ ˆ Y ts Y 209650 2 23208
2013-4-5
20
三、对总体比例的估计
总体比例P的估计为:pst Wh ph
h 1
L
估计量的性质
性质7:对于一般的分层抽样,如果 ph P 的无偏估计 是 h (h 1,2,, L ),则 pst 是 P的无偏估计。 的方差为: p
2013-4-5
例题
例如,对全国范围汽车运输的抽样调查,调查目的不 仅要推算全国货运汽车完成的运量,还要推算不同经 济成分(国有、集体、个体)汽车完成的运量。 为组织的方便,首先将货运汽车总体按省分层,由 各省运输管理部门负责省内的调查工作。 各省再将省内拥有的汽车按经济成分分层。 为提高抽样效率,再对汽车按吨位分层。 例如,某高校对学生在宿舍使用电脑的情况进行调查, 根据经验,本科生和研究生拥有电脑的状况差异较大。 因此,在抽样前对学生按本科生和研究生进行分层 是有必要的。
p1q1 0.0169 n1 1 pq v p3 1 f3 3 3 0.0263 n3 1 v p1 1 f1
2013-4-5
16
性质6:对于分层随机抽样, 无偏估计为:
ˆ VY
的一个
1 fh 2 ˆ v Y N v y h N sh nh h 1 h 1
L L 2 h 2 h
2013-4-5
17
例3.1
调查某地区的居民奶制品年消费支出,以居民户为抽 样单元,根据经济及收入水平将居民户划分为4层,每 层按简单随机抽样抽取10户,调查获得如下数据(单 位:元),要估计该地区居民奶制品年消费总支出及 估计的标准差。
4
4
ˆ ˆ s Y v Y 23208
ˆ ˆ Y ts Y 209650 2 23208
2013-4-5
20
三、对总体比例的估计
总体比例P的估计为:pst Wh ph
h 1
L
估计量的性质
性质7:对于一般的分层抽样,如果 ph P 的无偏估计 是 h (h 1,2,, L ),则 pst 是 P的无偏估计。 的方差为: p
分层抽样 课件
【思维·引】当总体由差异明显的几部分组成时,该样 本的抽取适合用分层抽样,结合题目中的四个选项及分 层抽样的特点可对题目作出判断.
【解析】1.选C.教师各部分之间有明显的差异,所以适 合分层抽样. 2.选B.A中总体中的个体无明显差异且个数较少,适合 用简单随机抽样;C和D中总体中的个体无明显差异且个 数较多,适合用系统抽样;B中总体中的个体差异明显, 适合用分层抽样.
分层抽样
1.分层抽样 一般地,在抽样时,将总体分成互不交叉的层,然后按照 一定的比例,从各层独立地抽取一定数量的个体,将各 层取出的个体合在一起作为样本,这种抽样的方法是一 种分层抽样.
【思考】 在什么情况下适用分层抽样? 提示:当总体是由差异明显的几部分组成时,往往选用 分层抽样的方法.
2.分层抽样的实施步骤 第一步,按某种特征将总体分成若干部分(层). 第二步,计算抽样比.抽样比= 样本容量 .
A.3
B.4
C.5
D.6
【思维·引】观察特征→确定抽样方法→求出比例→ 确定各层样本数→从各层中抽样→成样
【解析】选B.根据分层抽样的特点可知,抽样比例为
12 1 ,则应抽取的中型城市数为16× 1 =4.
48 4
4
【内化·悟】 设计分层抽样问题时,各层之间抽样方法有什么共同点? 各层抽样时方法必须一样吗?
类型一 分层抽样概念理解
【典例】1.某中学有老年教师20人,中年教师65人,青
年教师95人.为了调查他们的健康状况,需从他们中抽
取一个容量为36的样本,则合适的抽样方法是 ( )
A.抽签法
B.系统抽样
C.分层抽样
D.随机数法
2.下列问题中,最适合用分层抽样抽取样本的是( ) A.从10名同学中抽取3人参加座谈会 B.从参加模拟考试的1 200名高中生中随机抽取100人 分析试题作答情况 C.从1 000名工人中,抽取100名调查上班途中所用时间 D.从生产流水线上,抽取样本检查产品质量
9.1.2分层随机抽样课件(人教版)(1)
骤是什么?
分层——计算抽样比——定数——抽样——成样
分层:按照某一种或多种特征将总体分层;
样本容量
计算抽样比:抽样比=
;
总体容量
定数:按抽样比确定每层抽取个体数;
抽样:各层按简单随机抽样的方法抽取样本;
成样:综合各层样本,组成总样本.
二、探究本质得新知
问题5:为什么分层随机抽样能用样本平均数估计总体平均数?
在分层随机抽样中,不妨设层数为两层,第一层和第二层包含个体数
分别为M和N,抽取的样本量分别为m和n,我们用X1,X2,…,XM表示
第一层各个个体的变量值,用x1,x2,…,xm表示第一层样本的各个个
体的变量值;用Y1,Y2,…,YN表示第一层各个个体的变量值,用y1,
y2,…,yn表示第一层样本的各个个体的变量值,
第九章 统计
9.1.2 分层随机抽样
一、创设情境 引入新课
树人中学高一年级有学生1 800人,高二年级1 600人,高
三年级1 400人,为了了解该校学生的某项心理状况(此项
状况与学生所处年级有关),打算从树人中学学生中抽取
2%进行调查.该如何进行抽样呢?
二、探究本质得新知
探究一:分层抽样的有关概念
年级抽取人数为600×0.05=30.
四、学生练习,加深理解
3.某中学有老年教师20人,中年教师65人,青年教师95人,
为了调查他们的健康状况,需从他们中抽取一个容量为
分层抽样
36的样本,则合适的抽样方法是____________.
解析:由于老年人、中年人和青年人的身体情
况会有明显的差异,所以要用分层抽样.
收入的家庭280个,低收入的家庭95个,为了了解生活购
买力的某项指标,要从中抽取一个容量为100的样本;
分层——计算抽样比——定数——抽样——成样
分层:按照某一种或多种特征将总体分层;
样本容量
计算抽样比:抽样比=
;
总体容量
定数:按抽样比确定每层抽取个体数;
抽样:各层按简单随机抽样的方法抽取样本;
成样:综合各层样本,组成总样本.
二、探究本质得新知
问题5:为什么分层随机抽样能用样本平均数估计总体平均数?
在分层随机抽样中,不妨设层数为两层,第一层和第二层包含个体数
分别为M和N,抽取的样本量分别为m和n,我们用X1,X2,…,XM表示
第一层各个个体的变量值,用x1,x2,…,xm表示第一层样本的各个个
体的变量值;用Y1,Y2,…,YN表示第一层各个个体的变量值,用y1,
y2,…,yn表示第一层样本的各个个体的变量值,
第九章 统计
9.1.2 分层随机抽样
一、创设情境 引入新课
树人中学高一年级有学生1 800人,高二年级1 600人,高
三年级1 400人,为了了解该校学生的某项心理状况(此项
状况与学生所处年级有关),打算从树人中学学生中抽取
2%进行调查.该如何进行抽样呢?
二、探究本质得新知
探究一:分层抽样的有关概念
年级抽取人数为600×0.05=30.
四、学生练习,加深理解
3.某中学有老年教师20人,中年教师65人,青年教师95人,
为了调查他们的健康状况,需从他们中抽取一个容量为
分层抽样
36的样本,则合适的抽样方法是____________.
解析:由于老年人、中年人和青年人的身体情
况会有明显的差异,所以要用分层抽样.
收入的家庭280个,低收入的家庭95个,为了了解生活购
买力的某项指标,要从中抽取一个容量为100的样本;
分层随机抽样(课件)
i1 ;w i1
i1 .
M N
mn
• 探究 与考察简单随机抽样估计效果类似, 小明也想通过多次抽样考察一
•下分层随机抽样的估计效果. 他用比例分配的分层随机抽样, 从高一年级的学生中抽取 了10个样本量为50的样本, 计算出样本平均数如下表所示. 与上一节“探究”中相同样本量 的简单随机抽样的结果比较,小明有了一个重要的发现. 你是否也有所发现?
100
100
1.分层抽样
当已知总体由差异明显的几部分组 成时,为了使样本更充分地反映总体的 情况,常将总体分成几个部分,然后按 照各部分所占的比例进行抽样,这种抽 样叫做“分层抽样”,其中所分成的各 部分叫作“层”.
解:(1)男生应抽取 100 490 49人,女生应抽取 100 510 51人.
490 510
490 510
∴样本平均数为 49 70.2 51 160.8 165.4(cm).
100
100
(2) 应按(1)的方法进行改进更合理,即高二年级全体学生的平均身高估计为
49 170.2 51 160.8 165.4(cm).
9.1.2分层随机抽样
温故知新
1、简单随机抽样
简单随机抽样 :
设一个总体的个体数为 N。如果通过逐个抽取的方 法从中抽取一个样本,且每次抽取时各个个体被抽到 的概率相等,就称这样的抽样为简单随机抽样。
[注]简单随机抽样有以下特点: (1)它要求被抽取样本的总体的个体数是有限的; (2)它是从总体中逐个地进行抽取; (3)它是一种不放回的抽样; (4)它是一种等概率抽样。(为什么?)
抽样序号
1
2
3
4
5
6
7
8
9 10
分层随机抽样 PPT
[例 1] 一个单位共有职工 200 人,其中不超过 45 岁的有 120 人,超过 45 岁的有 80 人.为了调查职工的健康状况,用分层抽 样的方法从全体职工中抽取一个容量为 25 的样本,应抽取超过 45 岁的职工________人.
[思路点拨] 由分层抽样的概念,按比例抽取.
[解析] 抽样比为 25∶200=1∶8,而超过 45 岁的职工有 80 人,则从中应抽取的个体数为 80×18=10.
的层,然后按照所占比例,从各层独立地抽取 一定数量的个体,将各层取出的个体合在一起
作为样本,这种抽样的方法叫分层抽样。
【说明】分层抽样应遵循以下要求: (1)分层:将相似的个体归为一类,即分为一层,分
层要求每层的各个个体互不交叉,即遵循不重复、不遗 漏的原则。
(2)分层抽样为保证每个个体等可能入样,需遵循在 各层中进行简单随机抽样或系统抽样,每层样本数量与 每层个体数量的比与样本容量与总体容量的 比相等。
[练习 1] 某工厂生产 A,B,C 三种不同型号的产品,产品 数量之比依次为 2∶3∶5,现用分层抽样方法抽出一个容量为 n 的样本,样本中 A 种型号产品有 16 件,那么此样本的容量 n= ______.
答案:80 解析:因为 A 种产品在总体中占了2+23+5=15, 又因为每个个体被抽到的可能性都相等,故样本容量为 16÷15= 80.
思考:(4)三个年级同学有较大差别,应如何提 高样本的代表性? 应考虑他们在样本中所占的比例。
(5)如何确定各年级所要抽取的人数? 计算每一部分占总体个体数的比例,
在各年级中按比例分配样本,得各年级所
要抽取的个体数。
某校小学六年级、初中三年级和高中三年级分别
有1000,800和700名同学,为了了解全校毕业班学生 的视力情况,从以上三个年级中抽取容量为100的样本, 你认为应当怎样抽取样本较为合理?
分层抽样》课件
分层抽样的特点
提高样本代表性
分层抽样能够根据不同特征将总 体划分为不同的层,使得每个层 内部的差异较小,从而提高样本
的代表性。
降低抽样误差
分层抽样通过在每个层内进行随机 抽样,可以减少总体内部的变异, 从而降低抽样误差。
便于统计分析
分层抽样可以提供各层的样本数据 ,便于进行更细致的统计分析,以 了解不同特征对总体参数的影响。
SAS
SAS是一款高度可定制的统计分 析软件,同样支持分层抽样。它 提供了广泛的编程语言和函数库 ,适用于高级用户和开发人员。
软件实现分层抽样的基本流程
1. 确定分层变量 根据研究目的和数据特征,选择 适当的分层变量,通常是能够代 表研究对象的某些特征或属性的 变量。
4. 汇总结果 将各层抽取的样本汇总,形成最 终的分层抽样样本。
2. 确定各层的样本量 根据研究目标和资源限制,为每 个分层变量确定适当的样本量。
3. 随机抽取样本 在每个分层中,使用随机抽样的 方法抽取样本。可以使用软件提 供的随机数生成器或随机排序功 能来实现。
分层抽样软件的实际应用案例
市场调研
在市场调研中,分层抽样常用于了解不同消费群体的需求和 行为特征。例如,可以根据性别、年龄、收入等分层变量抽 取样本,以更准确地估计整体市场的需求和趋势。
提高样本利用率
便于数据分析和解读
分层抽样可以根据不同层的特点采用不同 的抽样方法和样本量,从而提高样本利用 率。
分层抽样所得数据具有更好的结构化和可 解释性,便于进行数据分析和解读。
分层抽样的局限性
层间差异过大致使样本代表性不足
01
如果各层之间的差异过大,会导致某些层中的样本无法代表整
个总体,从而影响样本的代表性。
抽样调查第3章分层随机抽样
•=
PPT文档演模板
抽样调查第3章分层随机抽样
•性质三 对于分层随机抽样, •的无偏估计为:
•=
•【• 例3.1】调查某地区的居民奶制品年消费支 出,以居民户为调查单元,根据经济及收入 水平将居民户划分为4层,每层按简单随机抽 样抽出10户,调查获得如下数据(单位:元) 估计该地区居民奶制品年消费总支出及估计 的标准差。
PPT文档演模板
抽样调查第3章分层随机抽样
•样本均值: •抽样比: •第L层样本方差:
PPT文档演模板
抽样调查第3章分层随机抽样
•§3.2 简单估计量及其性质
•一、总体均值的估计 •1.估计量的定义 •总体均值 •的估计:
•=
•如果得到的是分层随机样本,则总体均值 •的简单估计为:
PPT文档演模板
•因此
PPT文档演模板
抽样调查第3章分层随机抽样
•性质三 对于分层随机抽样, •的无偏估计为:
PPT文档演模板
抽样调查第3章分层随机抽样
•性质三的证明:对于分层随机抽样,各层独立进 行 •简单随机抽样,由第二章性质三,得
•因此,
•的一个无偏估计为:
PPT文档演模板
抽样调查第3章分层随机抽样
•二、总体总量的估计 •1.估计量的定义 总体总量 Y 的估计为:
PPT文档演模板
抽样调查第3章分层随机抽样
•各层样本均值及样本方差为: •同理有
PPT文档演模板
抽样调查第3章分层随机抽样
•因此,估计奶制品年消费总支出为: •估计量方差及标准差的样本估计
PPT文档演模板
抽样调查第3章分层随机抽样
•三、总体比例的估计 •1.估计量的定义 •总体比例 P 的估计为:
PPT文档演模板
抽样调查第3章分层随机抽样
•性质三 对于分层随机抽样, •的无偏估计为:
•=
•【• 例3.1】调查某地区的居民奶制品年消费支 出,以居民户为调查单元,根据经济及收入 水平将居民户划分为4层,每层按简单随机抽 样抽出10户,调查获得如下数据(单位:元) 估计该地区居民奶制品年消费总支出及估计 的标准差。
PPT文档演模板
抽样调查第3章分层随机抽样
•样本均值: •抽样比: •第L层样本方差:
PPT文档演模板
抽样调查第3章分层随机抽样
•§3.2 简单估计量及其性质
•一、总体均值的估计 •1.估计量的定义 •总体均值 •的估计:
•=
•如果得到的是分层随机样本,则总体均值 •的简单估计为:
PPT文档演模板
•因此
PPT文档演模板
抽样调查第3章分层随机抽样
•性质三 对于分层随机抽样, •的无偏估计为:
PPT文档演模板
抽样调查第3章分层随机抽样
•性质三的证明:对于分层随机抽样,各层独立进 行 •简单随机抽样,由第二章性质三,得
•因此,
•的一个无偏估计为:
PPT文档演模板
抽样调查第3章分层随机抽样
•二、总体总量的估计 •1.估计量的定义 总体总量 Y 的估计为:
PPT文档演模板
抽样调查第3章分层随机抽样
•各层样本均值及样本方差为: •同理有
PPT文档演模板
抽样调查第3章分层随机抽样
•因此,估计奶制品年消费总支出为: •估计量方差及标准差的样本估计
PPT文档演模板
抽样调查第3章分层随机抽样
•三、总体比例的估计 •1.估计量的定义 •总体比例 P 的估计为:
9.1.2 分层抽样课件(共32张PPT)
9.1.2 分层随机抽样 9.1.3 获取数据的途径
复习回顾
1、简单随机抽样的概念:
设一个总体含有有限个个体,并记其个体数为 N.如果通过逐个抽取的方法从中抽取一个样本, 且每次抽取时各个个体被抽到的机会相等,就称这 样的抽样为简单随机抽样.
2、简单随机抽样的特点:
①总体个数有限;②逐个进行抽取;③机会均等抽样.
8、某中学高一年级有学生600人,高二年级有
学生450人,高三年级有学生750人,若该校取一
个容量为n的样本,每个学生被抽到的可能性均
讲 课
为0.2,
则n=
360 .
人
:
邢
启 强
17
巩固练习
9、某单位有职工160人,其中业务员有104人,管 理人员32人,后勤24人,现用分层抽样从中抽取
一容量为20的样本,则抽取管理人员( B)人
人、60 人。 (3)将300人组到一起,即得到一个样本。
讲
课
人
:
邢
启 强
13
巩固练习
3.某公司共有1000名员工,下设若干部门, 现用分层抽样法,从全体员工中抽取一个容 量为80的样本,已知策划部被抽取4个员工,
求策划部的员工人数是多少? 50人.
4. 某中学有180名教职员工,其中教学人员 144人,管理人员12人,后勤服务人员24人, 设计一个抽样方案,从中选取15人去参观学习.
Mx Ny M N
M M N
x N M N
y
估计总体平均数 W
对各层样本平均数加权(层权)求和
M
N
xi yi
w i1
i1
m
x
n
y
M
x
复习回顾
1、简单随机抽样的概念:
设一个总体含有有限个个体,并记其个体数为 N.如果通过逐个抽取的方法从中抽取一个样本, 且每次抽取时各个个体被抽到的机会相等,就称这 样的抽样为简单随机抽样.
2、简单随机抽样的特点:
①总体个数有限;②逐个进行抽取;③机会均等抽样.
8、某中学高一年级有学生600人,高二年级有
学生450人,高三年级有学生750人,若该校取一
个容量为n的样本,每个学生被抽到的可能性均
讲 课
为0.2,
则n=
360 .
人
:
邢
启 强
17
巩固练习
9、某单位有职工160人,其中业务员有104人,管 理人员32人,后勤24人,现用分层抽样从中抽取
一容量为20的样本,则抽取管理人员( B)人
人、60 人。 (3)将300人组到一起,即得到一个样本。
讲
课
人
:
邢
启 强
13
巩固练习
3.某公司共有1000名员工,下设若干部门, 现用分层抽样法,从全体员工中抽取一个容 量为80的样本,已知策划部被抽取4个员工,
求策划部的员工人数是多少? 50人.
4. 某中学有180名教职员工,其中教学人员 144人,管理人员12人,后勤服务人员24人, 设计一个抽样方案,从中选取15人去参观学习.
Mx Ny M N
M M N
x N M N
y
估计总体平均数 W
对各层样本平均数加权(层权)求和
M
N
xi yi
w i1
i1
m
x
n
y
M
x
必修第二册9.1.2分层随机抽样课件(人教版)
1.分层随机抽样的定义.
2.分层随机抽样的步骤.
3.用分层随机抽样样本的平均数估计总体的平均数.
4.方法归纳:数据分析.
THANKS!
i 1
mn
i
新知讲授
如果总体分为 2 层,两层包含的个体数分别为 M,N,两层抽取的样
本量分别为 m,n,两层的样本平均数分别为 x ,y ,两层的总体平均数分
别为 X ,Y ,则
M
N
X+
Y
M+N
总体平均数为 W = M+N
样本平均数为 w =
m
n
x+
y
m+n
m+n
,
.
新知讲授
用分层随机抽样样本的平均数估计总体的平均数
9
10
新知讲授
从实验结果看,分层随机抽样的样本平均数环绕总体平均数波
动,与简单随机抽样的结果比较,分层随机抽样并没有明显优于简单
随机抽样。但相对而言,分层随机抽样的样本平均数波动幅度更均
匀,简单随机抽样中出现了一个偏离总体平均数的幅度比较大的样本
平均数,即出现了比较“极端”的样本,而分层随机抽样没有出现。
求总体平均数的方法有:
M
N
M
N
m
n
X+
Y ;(2)
x+
y ;(3)
x+
y.
(1)
M+N
M+N
M+N
M+N
m+n
m+n
例题讲授
例2:某校有初中、高中两个部门,其中初中有学生850人,高中有学生
650人,小军想要进行一个视力调查,对学校按部门进行分层随机抽样,
得到初中生、高中生平均视力分别为1.0,0.8,其中样本量为60,则在初
2.分层随机抽样的步骤.
3.用分层随机抽样样本的平均数估计总体的平均数.
4.方法归纳:数据分析.
THANKS!
i 1
mn
i
新知讲授
如果总体分为 2 层,两层包含的个体数分别为 M,N,两层抽取的样
本量分别为 m,n,两层的样本平均数分别为 x ,y ,两层的总体平均数分
别为 X ,Y ,则
M
N
X+
Y
M+N
总体平均数为 W = M+N
样本平均数为 w =
m
n
x+
y
m+n
m+n
,
.
新知讲授
用分层随机抽样样本的平均数估计总体的平均数
9
10
新知讲授
从实验结果看,分层随机抽样的样本平均数环绕总体平均数波
动,与简单随机抽样的结果比较,分层随机抽样并没有明显优于简单
随机抽样。但相对而言,分层随机抽样的样本平均数波动幅度更均
匀,简单随机抽样中出现了一个偏离总体平均数的幅度比较大的样本
平均数,即出现了比较“极端”的样本,而分层随机抽样没有出现。
求总体平均数的方法有:
M
N
M
N
m
n
X+
Y ;(2)
x+
y ;(3)
x+
y.
(1)
M+N
M+N
M+N
M+N
m+n
m+n
例题讲授
例2:某校有初中、高中两个部门,其中初中有学生850人,高中有学生
650人,小军想要进行一个视力调查,对学校按部门进行分层随机抽样,
得到初中生、高中生平均视力分别为1.0,0.8,其中样本量为60,则在初
9.1.2分层随机抽样-课件-2020-2021学年高中数学人教A版(2019)必修第二册
联系:(1)抽样过程中每个个体被抽到的可能性相等; (2)每次抽出个体后不再将它放回,即不放回抽样.
第九章 统计
1.某林场有树苗30 000棵,其中松树苗4 000棵.为调查树苗
的生长情况,采用分层随机抽样的方法抽取一个容量为150的
样本,则样本中松树苗的数量为( C )
A.30
B.25
C.20
D.15
M
N
Xi Yi
W
i1
i1
MN
,
m
n
xi yi
w
i1
i1
mn
,
第九章 统计
与考察简单随机抽样估计效果类似,小明也想通过多次抽样考察一 下分层随机抽样的估计效果.他用比例分配的分层随机抽样方法,从高 一年级的学生中抽取了10个样本量为50的样本,计算出样本平均数如下 表所示,与上一小节“探究”中相同样本量的简单随机抽样的结果比较, 小明有了一个重要的发现.你是否也有所发现?
2.某校高三年级有男生500人,女生400人,为了解该年级学
生的健康状况,从男生中Leabharlann 意抽取25人,从女生中任意抽取20
人进行调查.这种抽样方法是( D)
A.简单随机抽样
B.抽签法
C.随机数表法
D.分层随机抽样
第九章 统计
3. 某政府机关在编人员共100人,其中副处级以上干部10人,
一般干部70人,工人20人,上级部门为了了解该机关对政府机
我们可以利用性别和身高的这种关系,把高一年级学生分成男生 和女生两个身高有明显差异的群体,对两个群体分别进行简单随 机抽样,然后汇总作为总体的一个样本.由于在男生和女生两个 群体中都抽取了相应的个体,这样就能有效地避免“极端”样本.
第九章 统计
1.某林场有树苗30 000棵,其中松树苗4 000棵.为调查树苗
的生长情况,采用分层随机抽样的方法抽取一个容量为150的
样本,则样本中松树苗的数量为( C )
A.30
B.25
C.20
D.15
M
N
Xi Yi
W
i1
i1
MN
,
m
n
xi yi
w
i1
i1
mn
,
第九章 统计
与考察简单随机抽样估计效果类似,小明也想通过多次抽样考察一 下分层随机抽样的估计效果.他用比例分配的分层随机抽样方法,从高 一年级的学生中抽取了10个样本量为50的样本,计算出样本平均数如下 表所示,与上一小节“探究”中相同样本量的简单随机抽样的结果比较, 小明有了一个重要的发现.你是否也有所发现?
2.某校高三年级有男生500人,女生400人,为了解该年级学
生的健康状况,从男生中Leabharlann 意抽取25人,从女生中任意抽取20
人进行调查.这种抽样方法是( D)
A.简单随机抽样
B.抽签法
C.随机数表法
D.分层随机抽样
第九章 统计
3. 某政府机关在编人员共100人,其中副处级以上干部10人,
一般干部70人,工人20人,上级部门为了了解该机关对政府机
我们可以利用性别和身高的这种关系,把高一年级学生分成男生 和女生两个身高有明显差异的群体,对两个群体分别进行简单随 机抽样,然后汇总作为总体的一个样本.由于在男生和女生两个 群体中都抽取了相应的个体,这样就能有效地避免“极端”样本.
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
10 400
0.025
W3
N3 N
750 2850
0.26316,
f3
n3 N3
10 750
0.0133
W4
N4 N
1500 2850
0.52632,
f4
n4 N4
10 1500
0.0067
返回
各层样本均值及样本方差为:
1 n1
y1 n1 i1 y1i 39.5
s12
1 n1 1
n1 i 1
返回
单元权数:Wh
Nh N
总体均值:Y h
1 Nh
Nh
Yhi
i1
第L层总体方差:Sh2
N
1 h
1
Nh i1
(Yhi
Yh )2
返回
样本均值:
y h
1 nh
nh i1
yhi
抽样比:
fh
nh Nh
第L层样本方差:sh2
1 nh nh 1 i1 ( yhi
yh )2
返回
§3.2 简单估计量及其性质
性质三 对于分层随机抽样, V(pst) 的无偏估计为
v(
pst
)
L
Wh2v(
h1
ph
)
1 N2
L h1
N
2 h
(Nh nh ) Nh 1
phqh nh 1
L
Wh2 (1
h1
f
h
)
ph nh
qh 1
返回
【例3.2】 在例3.1的调查中,同时调查 了居民拥有家庭电脑的情况,获得如下数据 (单位:台),如表3.2。估计该地区居民拥 有家庭电脑的比例及估计的标准差。
h1
h1
性质二
对于分层随机抽样,
Y
的方差为:
V (Y )
L
Nh2V (Y h )
h1
=
L h1
N
h
2
1
fh nh
Sh2
返回
性质三 对于分层随机抽样,V (Y ) 的无偏估计为:
v(Y )
L
Nh2v(Y h )
h1
=
L h1
N
h
2
1
f nh
h
sh2
【例3.1】调查某地区的居民奶制品年消费支 出,以居民户为调查单元,根据经济及收入 水平将居民户划分为4层,每层按简单随机抽 样抽出10户,调查获得如下数据(单位:元) 估计该地区居民奶制品年消费总支出及估计 的标准差。
(i=1,2, …,N)
则对总体比例的估计类似对总体均值的估计,这时,
pst 与
y st
具有同样的性质。
返回
性质一 对于一般的分层随机抽样,如果 ph是Ph
的无偏估计(h=1,2, …,L),则 pst 是 P 的
无偏估计。pst 的方差为:
L
V ( pst ) Wh2V ( ph )
h1
性质二 对于分层随机抽样, pst是 P 的 无偏估计。
h1
h1
L
WhY h
h1
1 N
L
NhY h
h1
1 N
L
Yh
h1
Y N
Y
返回
性质二 对于分层简单随机抽样, yst 是 Y
的无偏估计, yst 的方差为:
V
( y st
)
L
Wh 2V
h1
(
yh
)
L
Wh2
h1
1 fh nh
Sh2
返回
性质二的证明:若各层独立进行简单随机抽样,
对每一层有
L
E( yh ) Y h , E( y st ) Y ,V ( y st ) Wh2V ( yh ) h1
另一种是对比率的分子、分母分别加权计算出分层 估计量,然后用对应的估计量来构造比估计,这样所得 的估计量称为联合比估计(combined ratioestimator).
返回
1.分别比率估计
总体均值 Y 总体总量Y 的分层比率估计为:
总体均值:
yRs
L
Wh
h1
y Rh
L
Wh
h1
yh xh
X
h
总体总量:
1.分层抽样的抽样效率较高,也就是说,分 层抽样的估计精度较高。
2.分层抽样不仅能对总体指标进行推算,而 且能对各层指标进行推算。
3.层内抽样方法可以不同,而且便于抽样工 作的组织。
返回
三、使用场合
在对分层进行具体划分时,通常考虑如下原则: 1.层内单元具有相同性质,通常按调查对象
的不同类型进行划分。 2.尽可能使层内单元的标志值相近,层间单
§3.1 引 言
一、定义 先将总体 N 个单元划分成 L 个互不重复的子
总体,每个子总体称为层,它们的大小分别为
N1, N2 ,, NL
L
(N Nh)
h1
然后,在每个层中独立地进行抽样, 称为分层抽样.
返回
二、作用
分层抽样在实际工作中应用的非常广泛, 主要是因为它具有其它抽样方法所没有的 特点:
1 N2
4 h1
Nh2v( ph )
1 28502
(2002
0.0169
4002
0.0173
7502
0.4
1500 2
0.0099)
0.005
返回
§3.3 比率估计量及其性质
将比率估计的思想和技术用于分层随机样本时,对 总体参数的估计有两种途径:
一种是对每层样本分别考虑比估计量,然后对各层 的比估计量进行加权平均,此时所得的估计量称为分别 估计(separate ratio estimator);
2Rh hS yhSxh )
V (Y Rs )
L h1
N
2 h
(1
nh
f
)
(
S
2 yh
Rh2
S
2 xh
2Rh hS yhSxh )
式中,
fh
nh Nh
;
S
2 yh
;
S
2 xh
;
h
分别为第 i层指标
Y,X的方差及相关系数.
分别比率估计量要求每一层的样本量 都比较大,否则,偏倚可能比较大.
返回
2.联合比率估计(combined ratio estimator)
证明:注意到
V ( ph )
Nh nh Nh 1
PhQh nh
及 Nh 1 Nh 因而 pst 的方差为:
返回
V
(
pst
)
L
Wh2V
h1
(
ph )
1 N2
L h1
N
2 h
(
N
h
nh
)
Nh 1
PhQh nh
L h1
1 N2
N
2 h
(Nh
Nh
nh )
PhQh nh
L
Wh2 (1
h1
f
h
)
PhQh nh
总体均值:
y Rc
y st x st
X
Rc
X
总体总量:
Y Rc
y st
X
Rc
X
x st
式中: yst 表示 Y
的无偏估计; 均方误差为:
xst 表示 X 的无偏估计.
MSE( y Rc ) V ( y Rc )
N
2 h
(1
N 2nh
f
)(
S
2 yh
R
2
S
2 xh
2RS yxh )
MSE(Y Rc ) V (Y Rc )
4 1500 50 35 15 0 20 30 25 10 30 25
返回
由上表,N=2850, nh 10, (h 1,2,3,4),
各层的层权及抽样比为:
W1
N1 N
200 2850
0.07018,
f1
n1 N1
10 200
0.05
W2
N2 N
400 2850
0.14035,
f2
n2 N2
估计。
Y
st
的方差为:
V( Y st
)=
L
Wh2V (Y h )
h1
值得注意的是:只要对各层估计是无偏的,则对
总体的估计也是无偏的。
因此,各层可以采用不同的抽样方法,只要相应 的估计量是无偏的,则对整体的推算也是无偏的。
返回
性质一的证明:由于对每一层有
E(Y h ) Y h
因此
L
L
E(Y st ) E( Wh Y h ) WhE(Y h )
Y N yst
2.估计量的性质
由于
Y
与
y st
只差一个常数,因此,Y 与 yst 具有
相同的性质。
返回
性质一 对于一般的分层随机抽样,如果 yst 是 Y
的无偏估计,
则
Y
是的无偏估计,Y 的方差为:
L
V (Y ) N 2V (Y st ) V (Y h )
h1
L
L
N 2 Wh2V (Y h ) Nh2V (Y h )
一、总体均值的估计
1.估计量的定义 总体均值 Y 的估计:
Y st =
L h1
Wh
Y h
1 N
L h1
Nh
Yh
如果得到的是分层随机样本,则总体均值 Y
的简单估计为:
y st
L
Wh yh
h1