第四章分层随机抽样(抽样理论与方法河南财政学院)

合集下载

9.1.2分层随机抽样课件(人教版)

9.1.2分层随机抽样课件(人教版)

新知探索
在实际抽样调查中,由于实际问题的复杂性,除了要考虑获得的样本的代表性
,还要考虑调查实施中人力、物力、时间等因素,因此通常会把多种抽样方法组合
起来使用.例如,在分层抽样中,不同的层内除了用简单随机抽样外,还可以用其他
的抽样方法,有时层内还需要再进行分层,等等.
思考2:如果想要了解某电视节目在你所在的地区(城市、乡镇或村庄)的收视率,
例3.随机抽样中,总体共分为2层,第1层的样本量为20,样本平均数为3,第2层
的样本量为30,样本平均数为8,则该样本的平均数为_____.
答案:6.
20
30

ഥ=
×3+
× 8 = 6.
20 + 30
20 + 30
练习
方法技巧:
进行分层随机抽样的相关计算时,常用到的3个关系
(1)
样本容量
该层抽取的个体数
答案:×,×,×.
)
新知探索
辨析2:某校高三一班有学生54人,二班有学生42人,现在要用分层随机抽样的
方法从两个班抽取16人参加军训表演,则一班和二班分别被抽取的人数是(
A.9,7
答案:A.
B.10,6
C.8,8
D.12,4
).
练习
题型一:分层随机抽样的概念
例1.下列问题中,最适合用分层随机抽样抽取样本的是(
可以计算出男生、女生中分别应抽取的人数为:
326
386
男 =
× 50 ≈ 23,女 =
× 50 ≈ 27.
712
712
我们按上述方法抽取了一个容量为50的样本,其观测数据(单位:)如下:
男生
173.0

第四章分层随机抽样

第四章分层随机抽样

第四章分层随机抽样第一节分层随机抽样概述分层抽样也叫做类型抽样,它是实际工作中最常用的抽样技术之一。

分层抽样是在抽样之前,先将总体按一定标志划分为若干个层(组),后在各层内分别独立地进行抽样。

由此所抽得的样本称之为分层样本。

各层所抽的样本也是互相独立的。

如果每层中的抽样都是简单随机的,则这种抽样就叫做分层随机抽样。

由此所得到的样本称做分层随机样本。

从以上概念可以看出,分层抽样的实质是在各层间作全面调查,而在各层内作抽样调查。

因此,分层抽样的误差只与各层内的差异有关,而同各层间的差异无关。

所以,为了能有效地降低抽样误差,提高抽样效果,在分层时应遵循“尽可能使层内差异小,而使层间差异大”的原则,同时要使分层的结果既无重复又无遗漏。

进行分层抽样时应注意:①层内抽样设计的选择;②分层变量的选择;③各层样本量的分配;④层数;⑤层的分界。

以前只重视③,近年来,④和⑤引起了越来越多的关注。

同简单随机抽样相比,分层抽样具有以下特点:①分层抽样能够充分地利用关于总体的各种已知信息进行分层,因此抽样的效果一般比简单随机抽样要好。

但当对总体缺乏较多的了解时,则无法分层或不能保证分层的效果。

②在分层抽样中,总体的方差一般可以分解为层间方差和层内方差两部分。

由于分层抽样的误差只与层内差异有关,而与层间差异无关,因此,分层抽样可以提高估计量的精度。

③由于分层抽样是在每层内独立地进行抽样,因此,使得分层样本能够比简单随机样本更加均匀地分布于总体之内,所以其代表性也更好些。

④分层抽样的随机性具体体现在层内各单元的抽取过程之中,也即在各层内部的每一个单元都有相同的机会被抽中,而在层与层之间则是相互独立的。

⑤分层抽样适合于调查标志在各单元的数量分布差异较大的总体。

因为对这样的总体进行合理的分层后可将其差异较多地转化为层间差异,从而使层内差异大大减弱。

⑥分层抽样中除了可以推断总体参数外,还可以推断各不同层的数量特征,并进一步作对比分析,从而满足不同方面的需要,也能帮助人们对总体作更全面、更深入的了解。

04-第四章_分层随机抽样

04-第四章_分层随机抽样

L
下面讨论估计量的期望与方差。 (1)对于一般分层抽样
ˆ )也 对于一般的分层抽样,若 Y h 是 Y h 的无偏估计量,则 Y st (或 Y st
是 Y (或 Y )的无偏估计:
Ù
Ù
E (Y st ) = å Wh E (Y h ) = Y
h =1
Ù
L
Ù
ˆst ) = NE (Y st ) = N Y = Y E (Y
L
2 L Sh S2 - å Wh2 h nh h =1 Nh

简便公式
2 L Wh2 Sh W S2 -å h h nh N h =1 h =1
V ( y st ) = V (å Wh y h )
h =1
L
= å Wh2V ( y h )
h =1 L
L
= å Wh2
h =1
Sh2 (1 - f h ) nh
åN
h =1
L
h
=N。
Wh =
Nh 称为层权,它也是已知的。 N
以 Yhi 表示第 h 层总体的第 i 个单元的指标值,以 yhi 表示第 h 层样本的 第 i 个单元的指标值。
Yh =
1 Nh 1 nh
åY
i =1 nh i =1
Nh
hi
表示第 h 层的总体均值,
yh =
åy
hi
表示第 h 层的样本均值(其中 nh 是第 h 层的样本量) ,
h =1 h =1 h =1 L L Ù L Ù Ù
Ù
3
(2)对于分层随机抽样
Ù
特别对于分层随机抽样,Y h 一般均取为简单估计:层样本均值 y h ,因 此 Y 的简单估计为:

【抽样调查】分层随机抽样

【抽样调查】分层随机抽样

【抽样调查】分层随机抽样第2部分:分层随机抽样⽬录概述分层随机抽样的思路:当N ,n 都较⼤,总体单元之间的差异也较⼤时,简单随机抽样会出现⾼成本、低精度情形,解决⽅法是将总体划分为若⼲个⼦总体、减少总体单元之间的差异。

假设在各个⼦总体内已经满⾜实施简单随机抽样的条件,则可以在各个⼦总体内独⽴地进⾏简单随机抽样,再将各个⼦总体参数的估计值进⾏加权,得到总体参数的估计。

分层抽样的概念:层:如果⼀个包含N 个单位的总体可以分成不重不漏的L 个⼦总体,即每个单元必定属于且仅属于⼀个⼦总体,则这样的⼦总体称为层。

有N 1+⋯+N L =N 。

分层抽样:在每⼀层中独⽴进⾏抽样,总的样本由各层样本组成,总体参数⼜按照各层样本参数的汇总作出估计。

有n 1+⋯+n L =n 。

分层随机抽样:每层的样本,都独⽴地按照简单随机抽样进⾏,这样的分层抽样称为分层随机抽样。

符号规定:h :层。

从⽽N h 代表第h 层的单位总数,n h 代表第h 层的样本数。

i :层内单位号。

从⽽Y hi 代表第h 层第i 个总体单元,y hi 代表第h 层第i 个样本单元。

W h :层权,即W h =N h N 。

f h :层内抽样⽐,即f h =n hN h 。

¯Yh,Y h,S 2h:层内总体参数(均值、总值与⽅差)。

¯y h ,y h ,s 2h:层内样本参数(样本均值、样本总值与样本⽅差)。

简单估计量分层抽样⾸先根据各层的样本,计算出各层均值¯Y h的适当估计值ˆ¯Y h ,然后再使⽤总体层权加权平均,得到总体均值¯Y 的估计,即ˆ¯Y st =L∑h =1W h ˆ¯Y h =1N L∑h =1N h ^¯Y h .对于分层随机抽样,每⼀层的ˆ¯Y h就是h 层的样本均值¯y h ,即ˆ¯Y st =L∑h =1W h ¯y h =1N L∑h =1N h ¯y h .注意这⾥的线性形式。

应用抽样技术课后习题答案

应用抽样技术课后习题答案
应用抽样技术答案
第二章 抽样技术基本概念
2.7(1)抽样分布: 3 3.67 4.33 5 5.67 6.33 7
1/10 1/10 2/10 2/10 2/10 1/10 1/10 (2)期望为5,方差为4/3 (3)抽样标准误1.155 (4)抽样极限误差2.263 (5)置信区间(3.407,7.933)
29、5、28,则客户打入电话的总数: YHH=(35/4)[8/2+29/8+5/1+28/7]=145.46875
(3) 估计量的方差估计 v(YHH)=[n(n—1)]-1Σi=1n(yi/zi—YHH)2 =[352/(4*3)][(8/2—4.15625)2+(29/8—4.15625)2 +(5/1—4.15625)2+(28/7—4.15625)2] =106.4697
(2)易知,N=1750,n=30, n1 8 t=1.96
p n1 8 0.267 n 30
1 f N n 1750 30 0.03389 n 1 (n 1)N 29 1750
pq p(1 p) 0.267 0.733 0.1957
(1 f ) pq 0.03389 0.1957 0.08144 n 1
P2= 0.05, Q2 = 1– P2 = 0.95;
V(p) = 0.05*0.05
PQ
(1) 由
n0
V ( p)
得:

n01
0.08 0.92 0.052
30
n02
0.05 0.95 0.052
19
(2 )
Q 由 n0 Cv2 ( p)P 得:
n01
0.92 0.052 0.08

抽样技术分层随机抽样

抽样技术分层随机抽样

抽样技术:分层随机抽样引言在数据分析中,抽样是一种常见的技术,用于从总体中选择一部分样本进行研究和分析。

抽样的目的是获得对总体的准确、可靠的估计,同时降低研究成本和时间。

然而,在实际应用中,总体往往是复杂多样的,包含不同属性或特征的子群体。

这时,分层随机抽样就是一种有效的抽样技术,可以提高抽样的精确性和代表性。

本文将介绍分层随机抽样的概念、步骤和应用。

什么是分层随机抽样?分层随机抽样是一种按照总体的分层结构进行抽样的方法。

总体根据某种特征或属性被划分为若干层,然后从每一层中随机选择一部分样本,构成最终的样本集。

这种抽样方法能够充分考虑总体内部的差异,保证样本对总体的代表性和准确性。

分层随机抽样的步骤分层随机抽样一般包括以下几个步骤:步骤1:总体划分层首先,需要根据某种特征或属性将总体划分为若干层。

层与层之间应具有较大的差异,而层内部的差异应尽可能小。

步骤2:确定每层的样本量和抽样比例根据抽样的目标和总体的特点,可以确定每一层的样本量。

通常情况下,样本量应当足够大,以获得准确的统计结果。

同时,需要确定每一层的抽样比例,比例应考虑到层内部的差异和样本数量。

步骤3:随机抽样在每一层内,根据抽样比例,从层内随机选择样本。

随机抽样可以保证样本的无偏性和代表性。

步骤4:组成样本集将每一层内抽取的样本进行组合,形成最终的样本集。

样本集应能够反映总体的属性和特征。

分层随机抽样的优点相比于简单随机抽样和系统抽样,分层随机抽样具有以下优点:提高估计的精确性分层随机抽样可以将总体划分为若干个层,然后分别从每一层抽取样本。

这样做有助于充分考虑总体内部的差异,提高估计的精确性。

降低误差由于分层随机抽样将样本分布在不同层中,可以降低抽样误差和估计误差,从而提高研究结论的可靠性。

保证样本的代表性分层随机抽样能够从每一层中抽取样本,使样本更具代表性。

这样可以在不损失总体属性和特征的情况下,降低样本的偏差。

分层随机抽样的应用分层随机抽样在社会调查、市场研究、医学研究等领域有着广泛的应用。

分层随机抽样.

分层随机抽样.

4
3 层的划分原则
1
• 层内单元具有相同性质,通常按调查对象的不同类型进行划 分。这时,分层抽样能够对每一类的目标量进行估计。
2
• 尽可能使层内单元的标志值相近,层间单元的差异尽可能大, 从而达到提高抽样估计精度的目的。
3
• 既按类型又按层内单元标志值相近的原则进行多重分层,同 时达到实现估计类值以及提高估计精度的目的。
18
19
4
• 为了抽样组织实施的方便,通常按现有的设置进行分层。
5
4 基本函数及表达式
6
4 基本函数及表达式
7
5 估计量的性质
8
5 估计量的性质
9
6 文献阅读——分层抽样中样本量的分配方法研究
10
6.1 本文的研究内容
本文立足于分层随机抽样的重要性以及样本容量分 配的重要意义,从分析影响样本容量的因素入手,讨论 实践中分层抽样样本量分配的方法体系并进行比较评 价,得出各种方法的适用性,期望对调查实践具有一定 的借鉴价值。
分层随机抽样
1
报告内容
1. 定义 2. 优缺点 3. 层的划分原则 4. 基本函数及表达式 5. 估计量的性质
6. 文献阅读—分层抽样中样本量的分配方法研究
2
1 定义
分层随机抽样(Stratified sampling)是随机抽样中的一种抽样方 法。 在抽样前先对母群体依某些特征分成若干层,再利用简单随机抽样,自 各层中抽取样本. 类型随机抽样,又称分层随机抽样,它是先将总体各单位按一定标准 分成各种类型(或层);然后根据各类型单位数与总体单位数的比例,确 定从各类型中抽取样本单位的数量;最后,按照随机原则从各类型中抽取 样本。
14
6.3.2 最优分配(optimum allocation)

初级1 -第四章分层随机抽样

初级1 -第四章分层随机抽样
2 L
抽样调查
原理与方法
第四章
分层随机抽样
二、特点 1. 提高估计精度
分层抽样如果实施的好,将可以提高整体估计的精度,即抽 样效率较高。这是因为分层抽样估计量的方差只和层内方差 有关,和层间方差无关。因此,人们可以通过对总体分层, 尽可能地降低层内差异,使层间差异尽可能大,从而提高估 计的精度。比如,不同年龄的人血压值通常存在很大差异, 因此在研究血压的时候,按照不同的年龄分类是很有意义的 。在研究地区农作物产量的时候,按照地形的不同分类也是 很有意义的,沼泽地里的农作物和森林里的农作物就有很大
抽样调查
原理与方法
3. 便于组织
分层抽样实施起来灵活方便,也便于组织。一方面,由于抽样在各层 独立进行,因而允许我们视层内的具体情况采用不同的抽样方 法。例如,在一个商业调查中,规模较大的公司可能采取邮寄 的方式调查,而小的公司可能采用入户调查或者电话调查的方 式。再比如,对于某些调查,针对城市和农村可能要采用不同 的调查方法。另一方面,分层抽样的数据处理比较简单,各层 的数据处理可以单独进行,而层间汇总方式又非常简单,对估 计量而言仅是对均值估计的加权平均或是对总量估计的简单相 加,相应的精度估计也不复杂。
如果得到的是分层随机样本,则总体总量 的简单估计为:
Y Nyst
抽样调查
原理与方法
2.估计量的性质
性质4:对于一般的分层抽样,如果 Y st ˆ 是 Y 的无偏估 是 Y 的无偏估计,则 Y ˆ 的方差为: 计。 Y
2 ˆ ˆ ˆ V Y N V Yst V Y h
2 L 2 h
抽样调查
原理与方法
第二节 估 计 量
一、对总体均值的估计 分层样本,总体均值 Y 的估计

分层随机抽样 PPT

分层随机抽样 PPT

[例 1] 一个单位共有职工 200 人,其中不超过 45 岁的有 120 人,超过 45 岁的有 80 人.为了调查职工的健康状况,用分层抽 样的方法从全体职工中抽取一个容量为 25 的样本,应抽取超过 45 岁的职工________人.
[思路点拨] 由分层抽样的概念,按比例抽取.
[解析] 抽样比为 25∶200=1∶8,而超过 45 岁的职工有 80 人,则从中应抽取的个体数为 80×18=10.
的层,然后按照所占比例,从各层独立地抽取 一定数量的个体,将各层取出的个体合在一起
作为样本,这种抽样的方法叫分层抽样。
【说明】分层抽样应遵循以下要求: (1)分层:将相似的个体归为一类,即分为一层,分
层要求每层的各个个体互不交叉,即遵循不重复、不遗 漏的原则。
(2)分层抽样为保证每个个体等可能入样,需遵循在 各层中进行简单随机抽样或系统抽样,每层样本数量与 每层个体数量的比与样本容量与总体容量的 比相等。
[练习 1] 某工厂生产 A,B,C 三种不同型号的产品,产品 数量之比依次为 2∶3∶5,现用分层抽样方法抽出一个容量为 n 的样本,样本中 A 种型号产品有 16 件,那么此样本的容量 n= ______.
答案:80 解析:因为 A 种产品在总体中占了2+23+5=15, 又因为每个个体被抽到的可能性都相等,故样本容量为 16÷15= 80.
思考:(4)三个年级同学有较大差别,应如何提 高样本的代表性? 应考虑他们在样本中所占的比例。
(5)如何确定各年级所要抽取的人数? 计算每一部分占总体个体数的比例,
在各年级中按比例分配样本,得各年级所
要抽取的个体数。
某校小学六年级、初中三年级和高中三年级分别
有1000,800和700名同学,为了了解全校毕业班学生 的视力情况,从以上三个年级中抽取容量为100的样本, 你认为应当怎样抽取样本较为合理?

抽样方案的类型分为哪些类别

抽样方案的类型分为哪些类别

抽样方案的类型分为哪些类别抽样方案的类型分为哪些类别摘要:抽样是研究和调查中常用的一种方法,而抽样方案的类型可以根据不同的特征和目的进行分类。

本文将根据抽样方案的特征,分为随机抽样、非随机抽样和混合抽样三个类别进行详细叙述,并分别介绍各类别的具体方法和适用场景。

1. 随机抽样随机抽样是指每个个体被选中的概率相等、独立且随机的抽样方法。

随机抽样可以确保样本的代表性,并且避免了主观偏差的引入。

随机抽样又可以分为简单随机抽样、整群随机抽样和分层随机抽样三种类型。

1.1 简单随机抽样简单随机抽样是最基本的一种抽样方法,每个个体有相等的机会被选入样本。

这种方法适用于总体分布均匀、个体之间相互独立的情况,例如投票调查等。

1.2 整群随机抽样整群随机抽样是将总体分为若干个群体,然后从这些群体中随机选择若干个群体作为样本。

这种方法适用于总体有一定的层次结构,且群体内个体相似的情况,例如地域调查、社区调查等。

1.3 分层随机抽样分层随机抽样是将总体分为若干个层次,然后从每个层次中随机抽取一部分个体作为样本。

这种方法适用于总体有多个特征指标,而且这些指标在不同层次上有较大差异的情况,例如教育调查、收入调查等。

2. 非随机抽样非随机抽样是根据研究者主观判断选择样本的抽样方法。

这种方法的优点在于可以根据研究目的和特点进行灵活选择,但容易引入主观偏差。

非随机抽样又可以分为方便抽样、判断抽样和配额抽样三种类型。

2.1 方便抽样方便抽样是指研究者根据自身方便和便捷性选择样本的方法。

这种方法适用于研究者对样本的选择没有明确的规则或约束,例如街头访谈、问卷发放等。

2.2 判断抽样判断抽样是研究者根据自己的判断和经验选择样本的方法。

这种方法适用于研究者对样本的选择有一定的理论依据和经验积累,例如专家访谈、案例研究等。

2.3 配额抽样配额抽样是将总体分为若干个类别,然后根据每个类别的重要性和数量确定样本的选择比例。

这种方法适用于总体的特征指标比较明确,但没有完整的名单和框架的情况,例如市场调查、消费者调查等。

市场调查与预测 第四章抽样方法与设计PPT课件

市场调查与预测  第四章抽样方法与设计PPT课件
到抽满样本数为止。
• 例如,某企业要调查消费者对某产品的需求量, 要从95户居民家庭中抽选10户居民抽选样本。
–第一步:将95户居民家庭编号,每一户家庭一个编号, 即01~95。(每户居民编号为2数)
–第二步:在上面的表中,随机确定抽样的起点和抽样 的顺序。假定从第1行,第6列开始抽,抽样顺序从左 往右抽。
• 分层比例抽样适用于各层的标准差大致相近的调查总体, 如果各层标准差过大,就不宜采用分层比例抽样,而应采 用分层最佳抽样。
2、分层最佳抽样:根据各层样本的标准差调整各层抽取
样本数目的方法。
• 计算公式:
ni n
NiSi NiSi
• 其中: Ni:第i层单位数目; n:样本总数; ni:第i层样 本数目。 ;Si为第i层的标准差
–第三步:依次抽出号码分别是:37、38、63、69、64、 73、66、14、69、96,98,16,共12个号码。
–由此产生10个样本单位为:37、38、63、69、64、73、 66、14、69、16。
乱数表Leabharlann 03 47 43 73 86 36 96 47 36 61 97 74 24 67 62 42 81 14 57 20 16 76 02 27 66 56 50 26 71 07 12 56 85 99 26 96 96 68 27 31 55 59 56 35 64 38 54 82 46 22 16 22 77 94 39 49 54 43 54 82
77 04 74 47 67 98 10 50 71 75 52 42 07 44 38 49 17 45 09 62 78 83 51 03 74 83 11 25 93 47
• 简单随机抽样在实际应用中的局限性:

抽样调查-分层随机抽样培训课件

抽样调查-分层随机抽样培训课件
当回归系数由样本估计时,如果各层的样 本量不太小,采用分别回归估计为宜. 否则, 采用联合回归估计为好!
【例4.6】(续例4.4)利用回归估计量估计该市港口
生产单位1997年完成的吞吐量。
解:样本回归系数:
h=1,非国有
1.07017
h=2,国有 0.856402
则按分别回归估计量估计:(见P85)
1.分别比率估计 总体均值 总体总量 的分层比率估计为: 总体均值:
总体总量:
层权 L: 层数
为 的比率估计,
为 比率估计
比率估计量的方差:
式中,
分别为第 i层指标
Y,X的方差及相关系数.
分别比率估计量要求每一层的样本量 都比较大,否则,偏倚可能比较大.
2.联合比率估计(combined ratio estimator) 总体均值:
户总

1 23 456 7 8
1 200
0 00 100 0 1
9 10
00
2 400 0 1 0 0 0 0 0 0 1 0
3 750 1 1 0 0 0 0 1 0 1 0
4 1500 1 0 0 0 0 0 0 0 0 0
解:由上表可得 该地区居民拥有家庭电脑比例的估计为:
估计量的方差为:
§3.3 比率估计量及其性质
1、比估计是有偏估计量,当各层样本量都较大时 两种比估计都近似无偏;当某些层的样本量不够大, 而总样本量较大时,联合比率估计近似无偏。
2、在回归估计中,若事先设定回归系数,其估计量 无偏;若用样本回归系数作为回归估计系数,其估计 量有偏,但在大样本情况下近似无偏。
3、当主要变量Y和辅助变量X高度相关时,比率估 计和回归估计都是有效的,且能大幅度地提高估计 精度。

9.1.2分层随机抽样课件(人教版)

9.1.2分层随机抽样课件(人教版)

学习目标
新课讲授
课堂总结
思考:对男生、女生分别进行简单随机抽样,样本量在男生、女生中应 如何分配?
男生人数 男生样本量=
×总样本量
全体学生人数
女生人数 女生样本量=
×总样本量
全体学生人数
无论是男生还是女生, 每个学生被抽到的可 能性相等.
n男=
326 50 23 712
n女=
386 50 27 712
i 1
Xi
Yi
i 1
MX
NY
M
X
N
Y
M N
MN MN MN
m
n
xi
i 1
i 1
yi
mx ny
m
x
n
y
mn
mn mn mn
学习目标
新课讲授
课堂总结
由于用第一层的样本平均数 x 可以估计第1层的总体平均数 X ,第二
层的样本平均数 y 可以估计第2层的总体平均数 Y ,
因此可以用 M
M N
问题2:如何计算总体平均数?
通过计算得出男生和女生身高的样本平均数分别为170.6,160.6.
总体平均数 170.6326 160.6386 165.2,
712
学习目标
新课讲授
课堂总结
一般地,按一个或多个变量把总体划分成若干个子总体,每个个体属于且 仅属于一个子总体,在每个子总体中独立地进行简单随机抽样,再把所有子总 体中抽取的样本合在一起作为总样本,这样的抽样方法称为分层随机抽样.
9.1.2 分层随机抽样
学习目标
新课讲授
课堂总结
1.了解分层随机抽样的特点、适用范围及必要性
2.掌握各层样本量比例分配的方法和分层随机抽样的样本 均值

分层取样操作规程

分层取样操作规程

分层取样操作规程分层取样是一种常用的调查方法,可以在保证抽样过程中样本的代表性的同时,提高调查结果的准确性。

下面我将为您介绍分层取样操作规程。

一、确定研究目标:首先需要明确研究的目标和问题,确定需要进行调查的变量和样本数量。

二、确定总体划分:根据研究目标和问题,将总体划分为不重叠的若干个层次。

划分的依据可以是总体特征、属性、性质等。

三、确定各层样本量:根据总体大小、层次的重要性和可接受的抽样误差,确定各层的样本量。

一般来说,总体越大,抽样误差越小,样本量应越大。

四、确定抽样单元:确定每个层次的抽样单元,即从每个层次中按一定方法选取参与调查的个体或单位。

五、确定抽样方法:根据情况选择合适的抽样方法,常用的有简单随机抽样、系统抽样、分层抽样等。

六、抽取样本:按照确定的抽样方法,从各层中按照一定的规则抽取样本。

抽样方法应保证每个抽样单元有被选中的机会,避免抽样偏差。

七、样本调查:对抽取的样本进行调查,可以采用问卷调查、访谈调查等方法,收集所需的数据。

八、数据分析:对收集的数据进行整理和分析,得出相应的结论。

可以采用统计学方法进行数据分析。

九、结果推广:根据样本的调查结果,进行总体的推广。

根据样本的代表性和抽样误差,对研究目标进行推断。

十、报告撰写:将调查结果进行整理和总结,撰写调查报告。

报告应包括研究目标、调查方法、样本分析和结论等内容。

通过以上十个步骤,可以进行一个完整的分层取样调查。

在进行分层取样操作时,需要注意以下几点:1. 合理划分层次:划分层次时,应遵循总体的自然分组原则,确保各层的特征不重叠,同时保证每个层都具有一定代表性。

2. 计算抽样误差:根据总体大小和可接受的抽样误差,计算每个层的样本量。

样本量不宜过小,以保证结果的准确性。

3. 随机抽样:在进行抽样时,应采用随机抽样的方法,确保每个抽样单元有公平的机会被选中。

可以使用随机数表、随机数生成器等工具进行随机抽取。

4. 数据收集和分析:在进行样本调查和数据分析时,应确保数据的准确性和可靠性。

课件6:9.1.2 分层随机抽样~9.1.3 获取数据的途径

课件6:9.1.2 分层随机抽样~9.1.3 获取数据的途径

本课结束

解析:三种型号的轿车共 9 200 辆,抽取样本为 46 辆, 则按9 42600=2100的比例抽样, 所以依次应抽取 1 200×2010=6(辆),6 000×2100=30(辆), 2 000×2100=10(辆).
课堂达标练经典
1.下列实验中最适合用分层随机抽样法抽样的是( D ) A.从一箱 3 000 个零件中抽取 5 个入样 B.从一箱 3 000 个零件中抽取 600 个入样 C.从一箱 30 个零件中抽取 5 个入样 D.从甲厂生产的 100 个零件和乙厂生产的 200 个零件中 抽取 6 个入样
|课堂小结| ——本课须掌握的三大问题
1.用分层随机抽样从个体为 N 的总体中抽取一个容量为 n 的样本时,在整个抽样过程中每个个体被抽到的机会相等. 2.分层随机抽样是建立在简单随机抽样基础上的,由于它充 分利用了已知信息,考虑了保持样本结构与总体结构的一致 性,因此它获得的样本更具代表性,在实用中更为广泛. 3.简单随机抽样是基础,分层随机抽样是补充和发展,二者 相辅相成,对立统一.
[答一答] 1.分层随机抽样适合于什么样的总体?分层随机抽样 有什么特点?
提示:当总体是由差异明显的几部分组成时,用分层随机
抽样.分层随机抽样仍具有逐个抽取、等可能性等特点. 2.分层随机抽样有什么优点? 提示:分层随机抽样使样本具有较强的代表性,而且在每个层 中进行抽样时,又可灵活地采用简单随机抽样或其他抽样方 法.
类型二 分层随机抽样的设计
[例 2] 某政府机关有在编人员 100 人,其中副处级以 上干部 10 人,一般干部 70 人,工人 20 人,上级机关 为了了解政府机构改革的意见,要从中抽取一个容量为 20 的样本,试确定用何种方法抽取,请具体实施操作.

第四章分层随机抽样(抽样理论与方法河南财政学院)

第四章分层随机抽样(抽样理论与方法河南财政学院)
三、进行分层抽样时,应注意的方面 层内抽样设计的选择。 分层变量的选择。 各层样本量的分配,样本总量的确定。 层数。 层的分界。
河南财经学院
4.2 简单估计量及其性质
对总体均值或总值的估计: 设总体分为L层,以h表示层的编号, h 1,2,,L
河南财经学院
总体第h层
Nh
Yh Yhi
nh
n
WhSh
L
,h 1,2,,L
WhSh
h1
在Neyman分配下
,
Yˆ 的方差达到最小值
Vmi(n y
):
st
Vmi(n yst)
1( n
h
WhSh)2
1 N
h
WhS h 2
例.在例3.2中,样本量仍为n=40,则按比例分配和Neyman 分配时,各层的样本量为多少?
河南财经学院
例. 在例3.3中,样本量仍为n=550。 城镇居民23560户,农村居民148420户。 城镇居民与农村居民的年收入的标准差分别为S1=3000
L h1
Chnh 2 )
河南财经学院
^
在最优分配中,Y的方差达到最小值 Vmin (yst ):
Vmin (yst )
L h1
Wh 2S h 2 nh
L h1
WhS h 2 N
L
L
( WhSh ch )( WhSh /
h1
h1
ch
)
L h1
WhS h 2 N
河南财经学院
特例:
Neyman分配: 指每层抽取一个单元费 用相同(ch c,h 1,,L)时的最优分配。
3
3
s
2 w
Whs
2 h

分层随机抽样(答案)

分层随机抽样(答案)

分层随机抽样一、单选题1、分层抽样设计效应满足(B )A 、1deff =B 、1deff <C 、1deff ≈D 、1deff > 2、分层抽样的特点是(A )A 、层内差异小,层间差异大B 、层间差异小,层内差异大C 、层间差异小D 、层内差异大3、下面的表达式中错误的是(D ) A 、∑=1hfB 、∑=n n hC 、∑=1h WD 、∑=1h N4、在给定费用下估计量的方差)(st y V 达到最小,或者对于给定的估计量方差V 使得总费用达到最小的样本量分配称为(C )A 、常数分配B 、比例分配C 、最优分配D 、奈曼分配5、最优分配(opt V )、比例分配(prop V )的分层随机抽样与相同样本量的简单随机抽样(srs V )的精度之间的关系式为(A )A 、srs prop opt V V V ≤≤B 、srs opt prop V V V ≤≤C 、srs opt prop V V V ≥≥D 、opt prop srs V V V ≤≤ 6、下面哪种样本量分配方式属于比例分配?( A)A 、N nN n h h = B 、hLh hhh h h h c S Nc S N nn ∑==1C 、∑==L h h h h h h S N S N n n 1D 、∑==L h hh h h h S W S W nn 17、下面哪种样本量分配属于一般最优分配?( B)A 、N nN n h h = B 、hLh hhh h h h c S Nc S N nn ∑==1C 、∑==L h h h h h h S N S N n n 1D 、∑==L h hh h h h S W S W nn 1二、多选题1.分层抽样又被称为( BC )A. 整群抽样B. 类型抽样C. 分类抽样D. 系统抽样E. 逆抽样 2.在分层随机抽样中,当存在可利用的辅助变量时,为了提高估计精度,可以采用( BCD ) A. 分层比估计 B. 联合比估计 C. 分别回归估计 D.联合回归估计 E. 分别简单估计 3.样本量在各层的分配方式有( ABCD )A. 常数分配B. 比例分配C. 最优分配D. 奈曼分配E. 等比分配 4.分层抽样的优点有( ABCDE )A. 在调查中可以对各个子总体进行参数估计B. 易于分工组织及逐级汇总C. 可以提高估计量的精度D. 实施方便E. 保证样本更具有代表性 5.关于分层数的确定,下面说法正确的有( CE )A. 层数多一些比较好B. 层数少一些比较好C. 层数一般以不超过6为宜D. 层数一般以4 层为最好E. 应该充分考虑费用和精度要求等因素来确定层数 6.下面哪种样本量分配方式属于奈曼分配? ( CD ) A.h h n nN N =B. 1/h h h h n nN S ==∑ C. 1k h h L h h h n N S n N S ==∑D.1h h h L h h h n W S n W S ==∑E. 1/h h h h nnW S ==∑ 7.事后分层的适用场合有(ABCD )A. 各层的抽样框无法得到B. 几个变量都适宜于分层,而要进行事先的多重交叉分层存在一定困难C. 一个单位到底属于哪一层要等到样本数据收集到以后才知道D. 总体规模太大,事先分层太费事E. 一般场合都可以适用 三、名次解释1. 分层随机抽样2. 自加权3. 最优分配 四、简答题1. 简述分层随机抽样相对于简单随机抽样的优点。

9.1.2分层随机抽样

9.1.2分层随机抽样

课标要求素养要求1.通过实例,了解分层随机抽样的特点和适用范围.2.了解分层随机抽样的必要性,掌握各层样本量比例分配的方法.3.结合具体实例,掌握分层随机抽样的样本均值.在分层随机抽样的实施过程中,掌握分层随机抽样的抽样步骤,发展学生数据分析素养.教材知识探究某市为调查中小学生的近视情况,在全市范围内对小学生、初中生、高中生三个群体抽样,进而了解中小学生的总体情况和三个群体近视情况的差异大小.问题 1.上述问题中总体有什么特征?2.采用抽签法合适吗?若不合适,应该用什么方法抽取样本?提示 1.该总体中,小学生、初中生、高中生三个群体在年龄、体质等方面存在着明显的差异.2.不合适,若用抽签法,抽取的样本可能集中于某一个群体,不具有代表性.应该用分层随机抽样抽取样本.1.分层随机抽样的相关概念分层随机抽样总体是由差异明显的各层组成的(1) 分层随机抽样的定义:一般地,按一个或多个变量把总体划分成若干个子总体,9.1.2分层随机抽样每个个体属于且仅属于一个子总体,在每个子总体中独立地进行简单随机抽样, 再把所有子总体中抽取的样本合在一起作为总样本,这样的抽样方法称为分层随 机抽样,每一个子总体称为层(2) 比例分配:在分层随机抽样中,如果每层样本量都与层的大小成比例,那么称 这种样本量的分配方式为比例分配 .2.样本平均数的计算公式在分层随机抽样中,如果层数分为 2层,第 1 层和第 2 层包含的个体数分别为 M 和 N ,抽取的样本量分别为 m 和 n ,第 1 层和第 2 层样本的平均数分别为 x 和 y ,- M - N - m +n x +m +n y__=M +N x +M +N y__. 教材拓展补遗[微判断] 1.在统计实践中选择哪种抽样方法关键是看总体的个体数的大小 .(×)2.分层随机抽样中,个体数量较少的层抽取的样本量较少,这是不公平的 .(× )3.从全班 50名同学中抽取 5 人调查作业完成情况适合用分层随机抽样 .(×) 提示 1.在统计实践中选择哪种抽样方法除看总体和样本量大小外,还要依据总 体的构成情况 .2.根据抽样的意义,对每个个体都是公平的 .3.适合用简单随机抽样 .[微训练]1.某校高三年级有男生 500 人,女生 400 人,为了解该年级学生的健康状况,从 男生中任意抽取 25人,从女生中任意抽取 20人进行调查 .这种抽样方法是 ( )A.简单随机抽样 B.抽签法 C.随机数法 D.分层随机抽样解析 从男生 500 人中抽取 25 人,从女生 400 人中抽取 20 人,抽取的比例相同, 因此用的是分层随机抽样 .答案 D2.某大学为了解在校本科生对参加某项社会实践活动的意向,拟采用分层随机抽 样的方法,从该校四个年级的本科生中抽取一个容量为 300 的样本进行调查,已 知该校一年级、二年级、三年级、四年级的本科生人数之比为 4∶5∶5∶6,则应则样本的平均数-m - n ω=m +n从一年级本科生中抽取名学生 .答案 60 [微思考]1. 分层随机抽样的总体具有什么特性?提示 分层随机抽样的总体按一个或多个变量划分成若干个子总体,并且每一个 个体属于且仅属于一个子总体 .2. 简单随机抽样和分层随机抽样有什么区别和联系?提示 (1)区别:简单随机抽样是从总体中逐个抽取样本;分层随机抽样则首先将 总体分成几层,在各层中按比例分别抽取样本 .(2)联系: ①抽样过程中每个个体被抽到的可能性相等;②每次抽出个体后不再将它放回,即不放回抽样 .题型一 对分层随机抽样概念的理解 是否适合用分层随机抽样,首先判断总体是否可以 “分层 ” 【例 1】 (1)某政府机关在编人员共 100人,其中副处级以上干部 10 人,一般干 部 70 人,工人 20 人,上级部门为了了解该机关对政府机构改革的意见,要从中 抽取 20 人,用下列哪种方法最合适 ( )A.抽签法 B.随机数 C.简单随机抽样 D.分层随机抽样(2) 分层随机抽样又称类型抽样,即将相似的个体归入一类 (层),然后每类抽取若 干个个体构成样本,所以分层随机抽样为保证每个个体被等可能抽取,必须进行 ()A.每层等可能抽样B. 每层可以不等可能抽样C. 所有层按同一抽样比等可能抽样D. 所有层抽取的个体数量相同解析 (1)总体由差异明显的三部分构成,应选用分层随机抽样 . (2)为了保证每个个体等可能的被抽取, 分层随机抽样时必须在所有层都按同一抽解析 根据题意,应从一年级本科生中抽取的人数为 4 4+5+5+6×300=60.样比等可能抽取.答案(1)D (2)C规律方法 1.使用分层随机抽样的前提分层随机抽样的总体按一个或多个变量划分成若干个子总体,并且每一个个体属于且仅属于一个子总体,而层内个体间差异较小.2. 使用分层随机抽样应遵循的原则(1)将相似的个体归入一类,即为一层,分层要求每层的各个个体互不交叉,即遵循不重复、不遗漏的原则;(2)分层随机抽样为保证每个个体等可能抽取,需遵循在各层中进行简单随机抽样,每层样本量与每层个体数量的比等于抽样比.【训练1】下列问题中,最适合用分层随机抽样抽取样本的是( )A.从10 名同学中抽取 3 人参加座谈会B. 某社区有500 个家庭,其中高收入的家庭125户,中等收入的家庭280户,低收入的家庭95 户,为了了解生活购买力的某项指标,要从中抽取一个容量为100 的样本C. 从1 000 名工人中,抽取100 人调查上班途中所用时间D.从生产流水线上,抽取样本检查产品质量解析 A 中总体所含个体无差异且个数较少,适合用简单随机抽样;C和 D 中总体所含个体无差异但个数较多,不适合用分层随机抽样; B 中总体所含个体差异明显,适合用分层随机抽样.答案B题型二分层随机抽样的应用抓住抽样比,即N n是解题的关键【例2】某学校有在职人员160人,其中行政人员有16 人,教师有112人,后勤人员有32 人.教育部门为了了解在职人员对学校机构改革的意见,要从中抽取一个容量为20 的样本,请利用分层随机抽样的方法抽取,写出抽样过程.解抽样过程如下:第一步,确定抽样比,样本量与总体的个体数的比为20=1. 160=8.11从教师中抽取112×8=14(人);从后勤人员中抽取32× 8=4(人).1第二步,确定分别从三类人员中抽取的人数,从行政人员中抽取16×18=2(人);第三步,采用简单随机抽样的方法,抽取行政人员2人,教师14人,后勤人员4人.第四步,把抽取的个体组合在一起构成所需样本.规律方法分层随机抽样的步骤【训练2】一个地区共有5个乡镇,人口3万人,其人口比例为3∶2∶5∶2∶3,从 3 万人中抽取一个300 人的样本,分析某种疾病的发病率,已知这种疾病与不同的地理位置及水土有关,问应采取什么样的方法?并写出具体过程.解因为疾病与地理位置和水土均有关系,所以不同乡镇的发病情况差异明显,因而采用分层随机抽样的方法.具体过程如下:第一步,将 3 万人分为 5 层,一个乡镇为一层. 第二步,按照抽样比求得各乡镇应抽取的人数分别为60,40,100,40,60.第三步,采用简单随机抽样的方法,按照各层抽取的人数抽取各乡镇的样本. 第四步,将300 人合到一起,即得到一个样本.题型三分层随机抽样中的计算问题【探究1】在分层随机抽样中,N为总样本量,n为样本量,如何确定各层的个体数?提示每层抽取的个体的个数为n i=N i×N n,其中N i 为第i(i=1,2,⋯,k)层的个体数,N n为抽样比.【探究2】在分层随机抽样中,总体的个体数、样本量、各层的个体数、各层抽取的样本数这四者之间有何关系?提示 设总体的个体数为 N ,样本量为 n ,第 i(i = 1,2,⋯ ,k)层的个体数为 N i , 各层抽取的样本量为 n i ,则 ni = n ,这四者中,已知其中三个可以求出另外一个 .N i N【探究 3】 (1) 交通管理部门为了解机动车驾驶员 (简称驾驶员 )对某新法规的知 晓情况,对甲、乙、丙、丁四个社区做分层随机抽样调查,假设四个社区驾驶员 的总人数为 N ,其中甲社区有驾驶员 96 人.若在甲、乙、丙、丁四个社区抽取驾 驶员的人数分别为 12,21,25,43,则这四个社区驾驶员的总人数 N 为() A. 101 B.808 C.1212 D.2012(2)将一个总体分为 A ,B ,C 三层,其个体数之比为 5∶ 3∶2.若用分层随机抽样 方法抽取容量为 100的样本,则应从 C 中抽取 ______ 个个体.(3) _________________________________________________________ 分层随机抽样中,总体共分为 2层,第 1 层的样本量为 20,样本平均数为 3, 第 2 层的样本量为 30,样本平均数为 8,则该样本的平均数为 _______________ .解析 (1)因为甲社区有驾驶员 96 人,并且在甲社区抽取的驾驶员的人数为 12,12 1所以抽取驾驶员的抽样比为 12=1, 96 81 所以驾驶员的总人数为 (12+21+25+43) ÷1=808.8(2)∵A ,B ,C 三层个体数之比为 5∶3∶2,又由总体中每个个体被抽到的概率相2等, ∴分层随机抽样应从 C 中抽取 100×120=20(个)个体. - 20 30(3)ω= × 3+ ×8=6.20+30 20+ 30答案 (1)B (2)20 (3)6规律方法 (1)进行分层随机抽样的相关计算时,常用到的两个关系①样本量 n =该层抽取的个体数 ;①总体的个数 N = 该层的个体数 ; ②总体中某两层的个体数之比等于样本中这两层抽取的个体数之比 . (2)样本的平均数和各层的样本平均数的关系为: - m- n - M - N - ω=m +n x +m +n y =M +N x +M +N y.【训练 3】 甲校有 3 600名学生,乙校有 5 400名学生,丙校有 1 800名学生,为统计三校学生某方面的情况,计划采用分层随机抽样法抽取一个容量为90 的样本,应在这三校分别抽取学生( )A.30 人,30人,30人B.30 人,45人,15 人C.20人,30人,40人D.30 人,50人,10 人n 90 1解析先求抽样比N n=3 600+594000+1 800=1120,再各层按抽样比分别抽取,甲111 校抽取 3 600×120=30(人),乙校抽取 5 400×120=45(人),丙校抽取 1 800×120 =15(人),故选 B.答案B1. 通过学习分层随机抽样的概念及实施步骤,重点培养学生数据分析的核心素养2. 对于分层随机抽样中的比值问题,常利用以下关系式求解:样本量n =该层抽取的个体数;(1) 总体的个体数N=该层的个体数;(2) 总体中各层容量之比=对应层抽取的样本数之比.3. 选择抽样方法的规律:(1)当总体的个体数和样本量都较小时,可采用抽签法.(2)当总体的个体数较大,样本量较小时,可采用随机数法.(3) 当总体按一个或多个变量可划分为若干个层时,采用分层随机抽样.二、素养训练1.某学校为了解三年级、六年级、九年级这三个年级之间的学生的课业负担情况,拟从这三个年级中按人数比例抽取部分学生进行调查,则最合理的抽样方法是()A.抽签法B.简单随机抽样C.分层随机抽样D.随机数法解析根据年级不同产生差异及按人数比例抽取易知应为分层随机抽样. 答案C 2.某林场有树苗30 000棵,其中松树苗 4 000棵.为调查树苗的生长情况,采用分层随机抽样的方法抽取一个容量为150 的样本,则样本中松树苗的数量为()A.30B.25C.20D.15150 1解析样本中松树苗为 4 000×301 50000=4 000×2010=20(棵). 答案C3. ________________________________________________________________ 某学院的A,B,C三个专业共有 1 200 名学生,为了调查这些学生勤工俭学的情况,拟采用分层随机抽样的方法抽取一个容量为120的样本.已知该学院的 A 专业有380名学生,B专业有420名学生,则在该学院的C专业应抽取_____ 名学生.解析 C 专业的学生有 1 200-380-420=400(名),由分层随机抽样原理,应抽取120× 1420000=40(名).答案404. 一批产品中有一级品100 个,二级品60 个,三级品40 个,从这批产品中抽取一个容量为20 的样本.请利用分层随机抽样的方法抽取,写出抽样过程.20 1解第一步,确定抽样比,因为100+60+40=200,所以抽样比为200=10,11第二步,确定各层抽取的样本量,一级品:100×110=10,二级品:60×110=6,1三级品:40×10=4. 第三步,采用简单随机抽样的方法,从各层分别抽取样本. 第四步,把抽取的个体组合在一起构成所需样本.基础达标一、选择题1.在100 个零件中,有一级品20 个,二级品30 个,三级品50 个,从中抽取20 个作为样本.方法1:采用简单随机抽样的方法,将零件编号00,01,02,⋯,99,用抽签法抽取20 个.方法2:采用分层随机抽样的方法,从一级品中随机抽取 4 个,从二级品中随机抽取 6 个,从三级品中随机抽取10 个.对于上述问题,下列说法正确的是 ( )1①不论采用哪种抽样方法,这 100 个零件中每一个零件被抽到的可能性都是 15; ②采用不同的方法,这 100 个零件中每一个零件被抽到的可能性各不相同; ③在上述两种抽样方法中,方法 2 抽到的样本比方法 1 抽到的样本更能反映总体 特征;④在上述抽样方法中,方法 1 抽到的样本比方法 2 抽到的样本更能反映总体的特 征.A. ①②B.①③C.①④D.②③解析 根据两种抽样的特点知,不论哪种抽样,总体中每个个体入样的可能性都 相等,都是 N n ,故①正确, ②错误 .由于总体中有差异较明显的三个层 (一级品、二 级品和三级品 ),故方法 2 抽到的样本更有代表性, ③正确, ④错误.故①③正确. 答案 B2.某校为了解高一学生的学习规划情况,在高一年级 6 个班级中任选两个班级, 并在所选的班级中按男女比例抽取样本,则应采用的抽样方法是 ( ) A.简单随机抽样B. 分层随机抽样C. 先用分层随机抽样,再用随机数法D. 先用抽签法,再用分层随机抽样解析 采用抽签法从 6 个班级中抽取两个班级,然后采用分层随机抽样的方法在 所选的班级中按男女比例抽取样本,故 D 项正确 .答案 D3. 某商场有四类食品,食品类别和种数见下表 .现从中抽取一个容量为 20 的样本进 行食品安全检测 .若采用分层随机抽样的方法抽取样本, 则抽取的植物油类与果蔬类食品种数之和是 ( )A.7 解析 由已知可得抽样比为: 20 =1, =,B.6C.5D.41∴抽取植物油类与果蔬类食品种数之和为(10+20)× 51= 6.答案B4. 当前,国家正分批修建经济适用房以解决低收入家庭住房紧张的问题.已知甲、乙、丙三个社区现分别有低收入家庭360 户、270 户、180 户.若第一批经济适用房中有90 套住房用于解决这三个社区中低收入家庭的住房问题,则应从甲社区中抽取低收入家庭的户数为( )A.40B.30C.20D.36解析由题意可知90×360+326700+180=40.答案A5. 在1 000个球中有红球50 个,从中抽取100个进行分析,如果用分层随机抽样的方法对球进行抽样,则应抽红球( )A.33 个B.20个C.5个D.10 个解析设应抽红球x 个,由1100000=5x0,则x=5.答案C二、填空题6. ________________ 一支田径队有男、女运动员98 人,其中男运动员有56 人.按男、女比例用分层随机抽样的方法,从全体运动员中抽出一个容量为28的样本,那么应抽取女运动员的人数是.28解析抽取女运动员的人数为98× (98-56)=12.答案127. ______ 某学校高一、高二、高三年级的学生人数之比为3∶3∶4,现用分层随机抽样的方法从该校高中三个年级的学生中抽取容量为50 的样本,则应从高二年级抽取_名学生.解析高二年级学生人数占总数的130,样本量为50,则50× 130=15.答案158. 某分层随机抽样中,有关数据如下:此样本的平均数为_______ .-45 35解析ω=454+535×4+453+535×8=5.75.答案 5.75三、解答题9. 一个单位有职工500人,其中不到35 岁的有125人,35 岁至49岁的有280人,50岁及50岁以上的有95 人.为了解这个单位职工与身体状态有关的某项指标,要从中抽取100 名职工作为样本,职工年龄与这项指标有关,应该怎样抽取?解用分层随机抽样来抽取样本,步骤如下:(1)分层.按年龄将500名职工分成三层:不到35岁的职工;35岁至49岁的职工;50 岁及50岁以上的职工.(2) 确定每层抽取个体的个数.抽样比为150000=51,则在不到35 岁的职工中抽取1125×5=25(人);1在35 岁至49 岁的职工中抽取280× 5=56(人);1在50 岁及50 岁以上的职工中抽取95×5=19(人).(3) 在各层分别用随机数法抽取样本.(4) 汇总每层所抽取的个体,组成样本.10. 某高级中学共有学生 3 000 名,各年级男、女生人数如下表:已知从全校学生中随机抽取 1 名学生,抽到高二年级女生的几率是0.18. (1)问高二年级有多少名女生?(2)现对各年级用分层随机抽样的方法从全校抽取300 名学生,问应从高三年级抽取多少名学生?x解(1)由3 0x00=0.18得x=540,所以高二年级有540名女生. (2)高三年级人数为:y+z=3 000-(487+513+540+560)=900.∴3 000×900=90,故应从高三年级抽取 90名学生 .能力提升11. 某中学有高中生 3 500 人,初中生 1 500 人,为了解学生的学习情况,用分层 随机抽样的方法从该校学生中抽取一个容量为 n 的样本,已知从高中生中抽取 70 人,则 n 为 ( )A.100B.150C.200D.250解析 法一 由题意可得 n -7070=2 31 550000,解得 n = 100.70 1法二 由题意,抽样比为 3 75000=510,总体的个体数为 3 500+1 500=5 000,故 n1=5 000× =100.50答案 A12. 某单位最近组织了一次健身活动, 活动分为登山组和游泳组, 且每个职工只能 参加其中一组 .在参加活动的职工中,青年人占 42.5%,中年人占 47.5%,老年人1占 10%;登山组的职工占参加活动总人数的 41 ,且该组中,青年人占 50%,中年 人占 40%,老年人占 10%.为了了解各组不同年龄层的职工对本次活动的满意程 度,现用分层随机抽样的方法从参加活动的全体职工中抽取容量为 200 的样本 . 试求:(1)游泳组中,青年人、中年人、老年人分别所占的比例;(2)游泳组中,青年人、中年人、老年人分别应抽取的人数 .解 (1) 设登山组人数为 x ,游泳组中,青年人、中年人、老年人各占比例分别为 a ,b ,c ,则有 x ·40%+3xb =47.5%,x ·10%+3xc =10%.解得 b =50%,c =10%.40%,50%,10%.32抽取的老年人人数为 200×4×10%=15.4x 4x故 a = 1- 50%-10%= 40%.即游泳组中,青年人、中年人、老年人各占的比例为(2)游泳组中,抽取的青年人人数为 200× 4× 40%=60;3抽取的中年人人数为 200×4×50%=75;创新猜想13. (多选题)某公司生产三种型号的轿车,产量分别为 1 200 辆,6 000 辆和 2 000 辆.为检验该公司的产品质量,公司质监部门要抽取 46 辆进行检验,则 ( ) A.应采用分层随机抽样抽取B. 应采用抽签法抽取C. 三种型号的轿车依次抽取 6 辆、30辆、10 辆D. 这三种型号的轿车,每一辆被抽到的概率都是相等的 解析 由于总体按型号分为三个子总体, 所以应采用分层随机抽样抽取, A 正确; 设三种型号的轿车依次抽取 x 辆,y 辆,z 辆,x = y = z ,x =6, 则有 1 200= 6 000=2 000,解得 y = 30,x +y +z =46, z =10.所以三种型号的轿车依次抽取 6辆、30 辆、 10辆,故 C 正确;由分层随机抽样 的意义可知 D 也正确 .答案 ACD14. (多填题 )高一和高二两个年级的同学参加了数学竞赛,高一年级有450 人,高 二年级有 350 人,通过分层随机抽样的方法抽取了 160个样本,得到两年级的竞 赛成绩的平均分分别为 80 分和 90 分,则(1)高一、高二抽取的样本量分别为 _______ ;(2)高一和高二数学竞赛的平均分约为 _______ .解析 (1) 由题意可得高一年级抽取的样本量为 4501+60350×450= 90,高二年级抽 160-90 70ω= ×80+ ×90=84.375(分 ).ω 90+ 70 90+ 70 答案 (1)90,70 (2)84.375 450+350×350=70. (2)高一和高二数学竞赛的平均分约为。

  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

Sh2
河南财经学院
例3.2 调查某地区的居民奶制品年消费支出,以居民 户为抽样单元,根据经济及收入水平将居民户分为4 层,每层按简单随机抽样抽取10户,调查数据如下, 估计该地区居民奶制品年消费总支出及估计的标准差。
样本户奶制品年消费支出
层 居民
户总 数
1
样本户奶制品年消费支出 2345678
9 10
L h1
Wh 2
1 fh nh
Nh Nh
1
PhQh
L h1
Wh 2
1 fh nh
PhQh (当Nh很大时)
河南财经学院
(3)
(4) P的置信度为1 的置信区间为:
1 200 10 40 0 110 15 10 40 80 90 0 2 400 50 130 60 80 100 55 160 85 160 170 3 750 180 260 110 0 140 60 200 180 300 220 4 1500 50 35 15 0 20 30 25 10 30 25
i1
1 Nh
Yh
Nh
Yhi
i1
Sh2
1 Nh 1
Nh
(Yhi
i1
Yh)2
第h层样本
nh
yh yhi
i1
1 nh
yh nh i1 yhi
s
2 h
1 nh 1
nh
(y hi
i1
y
)2
h
河南财经学院
例4.1 总体由1000人组成,按以往的收入情况将总体分成
两层:第一层(高收入层),20人;第二层(低收入
h1
h1
L
L
方差V(Yˆ ) V(Yˆ h) Nh2V(Yˆ h)
h1
h1
L
(2)Yˆ st
Yˆ h
h1
N
L Nh h1 N
Yˆ h
L
WhYˆ h
h1
L
方差V(Yˆ st) Wh2V(Yˆ h ) h1
河南财经学院
^
分层随机抽样 ,则 Yh 的简单估计为yh
^
L
^
L
^
1.Y的无偏简单估计 Yst 为:yst Wh Yh Wh yh , Yst 记为yst
河南财经学院
解:
y1 39.5
各层样本均值及方差为 :y2 105 y3 165
y4 24
s12 1624.722
s22 2166.667
s
2 3
8205.556
s
2 4
193.333
L
(1)Yˆ Nh yh h1
200 39.5 400105 750165 1500 24
209650 (2)Yˆ 的方差V(Yˆ )的估计:
v(Yˆ )
v(Nyst )
L h1
Nh2
1
fh nh
sh
2
5.39 108
s(Yˆ ) v(Yˆ ) 23208
河南财经学院
(3)该地区居民奶制品年消费总支出的置信度为95%的 置信区间为

u 1
s(Yˆ ),
2

u 1
2
s(
第四章 分层随机抽样
4.1 概述
一、分层抽样(stratified sampling)、分层随机抽样 (stratified random sampling)
分层抽样:将容量为N的总体分成L个不相重叠的子总 体,子总体的大小分别为N1、 N2、… NL,皆已知,且
L
Nh N
i1
则每个子总体就称为层。从每层中独立地进行抽样, 这样的抽样方法称为分层抽样。 分层随机抽样:在分层抽样中,如果每层中的抽样都 是简单随机抽样,则这样的分层抽样称为分层随机抽 样。
h1
h1
河南财经学院
Y的置信度为1 的置信区间为:
y st
u 1
s(y
st
2
), yst
u 1
s(
y
st
2
)
2.总体总和Y的估计:
L
L
^
L
Yˆ Yˆ h Nh Yh Nh yh
h1
h1
h1
方差V(Yˆ )
L h1
V(Yˆ h)
L
N h 2 V(y h)
h1
L
Nh2
h1
1 fh nh
河南财经学院
二、分层抽样的适用场合 不仅需要估计总体参数,也需要估计各层参数。 便于管理,按现成的地理分布或行政划分来分层。 希望样本中能包含各个部分,以增加代表性。 把一个内部差异很大的总体分成几个内部比较相似的
子总体(层)进行分层抽样,可以提高估计量的精度。 如果有极端值,也可以把它们分离出来形成一层。即 “层间方差大,层内方差小”。
Yˆ )
164162,255138
河南财经学院
例3.3:某市进行家庭收入调查,分城镇居民及农村居
民两部分抽样,在全部城镇居民23560户中随机抽取
300户,在全部农村居民148420户中随机抽取250户,
调查结果是城镇年平均户收入为15180元,标准差为
2972元;农村年平均户收入为9856元,标准差为
W2 y 2
20 1400 980 291.25 313.43
1000
1000
对比: y 1200 1600 220 360 513 10
河南财经学院
一、分层抽样中,
若对任一层,假设为第 h层,都有 Yh N Yh,
L
Y Yh
h1
L
L
(1)Yˆ Yˆ h NhYˆ h
层),980人。从第一层随机抽取2人,调查上月收入,
得数据(单位:元)1200及1600;从第二层随机抽取8人,
调查上月收入,得数据(单位:元)220、230、180、
320、400、340、280、360。估计这1000人上月平均收入。
解:

Yˆ 1 Yˆ 2 N
N1 y1
N2y2 N
W1 y1
Wh 2
1 fh nh
Sh2
L h1
Wh 2
1 fh nh
Nh Nh
1
PhQh
L h1
Wh 2
1 fh nh
PhQh (当Nh很大时)
估计的性质
(1)pst的性质:
L
P的简单估计为pst Whph
h1
且是p
的无偏估计。
st
(2)
L
pst的方差V(pst)
Wh
2
V(p

h
h1
三、进行分层抽样时,应注意的方面 层内抽样设计的选择。 分层变量的选择。 各层样本量的分配,样本总量的确定。 层数。 层的分界。
河南财经学院
4.2 简单估计量及其性质
对总体均值或总值的估计: 设总体分为L层,以h表示层的编号, h 1,2,,L
河南财经学院
总体第h层
Nh
Yh Yhi
2546元。求全市年平均户收入的置信度为90%的置信
区间。Βιβλιοθήκη 解: yst W1 y1 W2 y 2
23560 15180 148420 9856 10585.39
171980
171980
河南财经学院
3、分层随机抽样中,总体比例P的简单估计 设Ph的简单估计为 ph,则
河南财经学院
L h1
相关文档
最新文档