第四章分层随机抽样.pptx
9.1.2分层随机抽样课件(人教版)
新知探索
在实际抽样调查中,由于实际问题的复杂性,除了要考虑获得的样本的代表性
,还要考虑调查实施中人力、物力、时间等因素,因此通常会把多种抽样方法组合
起来使用.例如,在分层抽样中,不同的层内除了用简单随机抽样外,还可以用其他
的抽样方法,有时层内还需要再进行分层,等等.
思考2:如果想要了解某电视节目在你所在的地区(城市、乡镇或村庄)的收视率,
例3.随机抽样中,总体共分为2层,第1层的样本量为20,样本平均数为3,第2层
的样本量为30,样本平均数为8,则该样本的平均数为_____.
答案:6.
20
30
ഥ=
×3+
× 8 = 6.
20 + 30
20 + 30
练习
方法技巧:
进行分层随机抽样的相关计算时,常用到的3个关系
(1)
样本容量
该层抽取的个体数
答案:×,×,×.
)
新知探索
辨析2:某校高三一班有学生54人,二班有学生42人,现在要用分层随机抽样的
方法从两个班抽取16人参加军训表演,则一班和二班分别被抽取的人数是(
A.9,7
答案:A.
B.10,6
C.8,8
D.12,4
).
练习
题型一:分层随机抽样的概念
例1.下列问题中,最适合用分层随机抽样抽取样本的是(
可以计算出男生、女生中分别应抽取的人数为:
326
386
男 =
× 50 ≈ 23,女 =
× 50 ≈ 27.
712
712
我们按上述方法抽取了一个容量为50的样本,其观测数据(单位:)如下:
男生
173.0
第4章分层随机抽样-精品文档
ˆ ˆ ˆ ˆ Yu sY ( ), Yu sY ( ) 1 1 2 2
9
例4.2 调查某地区的居民奶制品年消费支出,以居民户为 抽样单元,根据经济及收入水平将居民户分为4层,每层 按简单随机抽样抽取 10 户,调查数据如下,估计该地区 居民奶制品年消费总支出及估计的标准差。 样本户奶制品年消费支出
5
例4.1 总体由1000人组成,按以往的收入情况将总体分成两 层:第一层(高收入层),20人;第二层(低收入层), 980人。从第一层随机抽取2人,调查上月收入,得数据 (单位:元)1200及1600;从第二层随机抽取8人,调查上 月收入,得数据(单位:元)220、230、180、320、400、 340、280、360。估计这1000人上月平均收入。 解: ˆ ˆ Ny Ny Y ˆ 1 Y 2 2 2 Y 11 W Wy 1y 1 2 2 N N 2 0 9 8 0 1 4 0 0 2 9 1 .2 53 1 3 .4 3 1 0 0 0 1 0 0 0
Y 的 置 信 度 为 1 的 置 信 区 间 为 : u s (y , y u s (y y s t s t) s t s t) 1 1 2 2
2 . 总 体 总 和的 Y 估 计 : ˆ Ny ˆ Y ˆ NY Y h h h h st
h 1 h 1 h 1 L L L
f 21 h 2 ˆ ˆ 方 差 V ( Y ) V ( Y ) N V ( y ) N S h s t h h n h 1 h 1 h 1 h
L L 2 h L
1 f 2 2 h ˆ ˆ 方 差 V ( Y ) 的 无 偏 估 计 : v ( Y ) N s h h n h 1 h Y 的 置 信 度 为 1 的 置 信 区 间 为 :
第四章分层随机抽样
第四章分层随机抽样第一节分层随机抽样概述分层抽样也叫做类型抽样,它是实际工作中最常用的抽样技术之一。
分层抽样是在抽样之前,先将总体按一定标志划分为若干个层(组),后在各层内分别独立地进行抽样。
由此所抽得的样本称之为分层样本。
各层所抽的样本也是互相独立的。
如果每层中的抽样都是简单随机的,则这种抽样就叫做分层随机抽样。
由此所得到的样本称做分层随机样本。
从以上概念可以看出,分层抽样的实质是在各层间作全面调查,而在各层内作抽样调查。
因此,分层抽样的误差只与各层内的差异有关,而同各层间的差异无关。
所以,为了能有效地降低抽样误差,提高抽样效果,在分层时应遵循“尽可能使层内差异小,而使层间差异大”的原则,同时要使分层的结果既无重复又无遗漏。
进行分层抽样时应注意:①层内抽样设计的选择;②分层变量的选择;③各层样本量的分配;④层数;⑤层的分界。
以前只重视③,近年来,④和⑤引起了越来越多的关注。
同简单随机抽样相比,分层抽样具有以下特点:①分层抽样能够充分地利用关于总体的各种已知信息进行分层,因此抽样的效果一般比简单随机抽样要好。
但当对总体缺乏较多的了解时,则无法分层或不能保证分层的效果。
②在分层抽样中,总体的方差一般可以分解为层间方差和层内方差两部分。
由于分层抽样的误差只与层内差异有关,而与层间差异无关,因此,分层抽样可以提高估计量的精度。
③由于分层抽样是在每层内独立地进行抽样,因此,使得分层样本能够比简单随机样本更加均匀地分布于总体之内,所以其代表性也更好些。
④分层抽样的随机性具体体现在层内各单元的抽取过程之中,也即在各层内部的每一个单元都有相同的机会被抽中,而在层与层之间则是相互独立的。
⑤分层抽样适合于调查标志在各单元的数量分布差异较大的总体。
因为对这样的总体进行合理的分层后可将其差异较多地转化为层间差异,从而使层内差异大大减弱。
⑥分层抽样中除了可以推断总体参数外,还可以推断各不同层的数量特征,并进一步作对比分析,从而满足不同方面的需要,也能帮助人们对总体作更全面、更深入的了解。
分层抽样 完整版课件PPT
知识探究(一):分层抽样的操作步骤
某单位有职工500人,其中35岁以下的 有125人,35岁~49岁的有280人,50岁 以上的有95人.为了调查职工的身体状 况,要从中抽取一个容量为100的样本.
思考1:该项调查应采用哪种抽样方法 进行?
思考2:按比例,三个年龄层次的职 工分别抽取多少人? 35岁以下25人,35岁~49岁56人, 50岁以上19人.
思考1:从5件产品中任意抽取一件,则 每一件产品被抽到的概率是多少?一般
地,从N个个体中任意抽取一个,则每一
个个体被抽到的概率是多少?
思考2:从6件产品中随机抽取一个容量 为3的样本,可以分三次进行,每次从中 随机抽取一件,抽取的产品不放回,这 叫做逐个不放回抽取.在这个抽样中,某 一件产品被抽到的概率是多少?
用简单随机抽样 抽取起始号码
总体中的个 体数较多
分层 抽样
将总体分成几层 ,按比例分层抽 取
用简单随机抽 样或系统抽样 对各层抽样
总体由差异 明显的几部 分组成
理论迁移
例1 某公司共有1000名员工,下设 若干部门,现用分层抽样法,从全体员 工中抽取一个容量为80的样本,已知策 划部被抽取4个员工,求策划部的员工人 数是多少?
思考3:在各年龄段具体如何抽样?怎 样获得所需样本?
思考4:一般地,分层抽样的操作步骤 如何? 分成互不交叉的层,按 比例确定各层要抽取的个体数.
第三步,用简单随机抽样或系统抽样在 各层中抽取相应数量的个体.
第四步,将各层抽取的个体合在一起 ,就得到所取样本.
第四步,按照一定的规则抽取样本.
2.设计科学、合理的抽样方法,其 核心问题是保证抽样公平,并且样本具 有好的代表性.如果要调查我校高一学 生的平均身高,由于男生一般比女生高 ,故用简单随机抽样或系统抽样,都可 能使样本不具有好的代表性.对于此类 抽样问题,我们需要一个更好的抽样方 法来解决.
04-第四章_分层随机抽样
思考:
y st =
1 L å nh y h 可以作为总体均值 Y 的无偏估计量吗? n h =1
而总体总量 Y 的估计直接采用各层总量估计的总和:
ˆ ˆ = åY Y st h
h =1
L
ˆ = N Y h ,则 如果每个 Y h h ˆ = åY ˆ = å N Y h = N å W Y h = N Y st Y st h h h
且由于各层的抽样是相互独立的,因此
Ù L Ù L Ù
Ù
V (Y st ) = V (å Wh Y h ) = å W V (Y h )
h =1 L h =1 2 h
ˆ ) = V (å Y ˆ ) = å V (Y ˆ) V (Y st h h
h =1 h =1
L
(2)对于分层随机抽样 对于分层随机抽样,由简单随机抽样简单估计量的性质,不难得到相 应简单估计的性质。 先给出结论:
过程如下:
ˆst ) = E ( N Y st ) = NE (Y st ) = NE ( y ) = N Y = Y E (Y st
Ù
Ù
6
ˆ ) = V ( N Y st ) V (Y st = N 2V (Y st ) = N 2V (å Wh y h )
h =1 L Ù
Ù
= N 2 å Wh2V ( y h )
h =1 L
L
= N 2 å Wh2
h =1
2 Sh n (1 - h ) nh Nh
2 L ˆ ) = N 2 å W 2 sh (1 - nh ) v(Y st h nh Nh h =1
注意到
1 nh s = ( yhi - y h )2 å nh - 1 i =1
必修课件分层抽样(详细分析:总体)共6张PPT
注:
(1)分层抽样适用于总体由差异明显的几部分组 成的情况,每一部分称为层,在每一层中实行简单 随机抽样。这种方法较充分地利用了总体己有信息, 是一种实用、操作性强的方法。而且更具代表性。
(2)分层抽样的一个重要问题是总体如何分层, 分多少层,这要视具体情况而定。总的原则是: 层内样本的差异要小,而层与层之间的差异尽可 能地大,否则将失去分层的意义。
例、一个单位的职工有500人,其中不到35岁的有125人,35~49 岁的有280人,50岁以上的有95人。为了了解该单位职工年龄与身 体状况的有关指标,从中抽取100名职工作为样本,应该怎样抽 取?
不 此 定的(每到 该分层职解一3总)工析5:层岁体运人:抽用数的;可这取简依比3以总人5单次例~分数体随是,4为与机具91在岁32职抽有5个工:每;样某层总2一5方80。些数0法个岁:由特的抽层以9比于征5取中上=是。抽,2实,15取它0:行把0的:可5简每65样:以0单一0本1分=随部9,为1成机分:然1几抽5称0后,0个样为,分则不。一所别各同在个以年各龄的层必年段部须,龄(分确因段层:) 解)((很(总很一例很(5各 ((2一各各由很 (解)(由由(例很(512122400))))):运24喜的喜个、喜层4个层层于喜2:运于于4、喜0岁岁分 分 分 分根) ) ) ) )0抽 用 爱 原 爱 电 一 爱 的电 的 的 抽 爱抽 用 抽 抽 一 爱以以层层层层据根按按根按取简则视个抽 视抽抽取取简取取个上上抽抽抽抽已据((据(333人单是台单取 台取取的人单的的单,,4样样样样)))有总总2中中中喜喜喜喜 喜数随:在位数 在数数样数随样样位把把适的的的0信体体确确确0爱爱爱爱 爱与机层因的之 因之之本与机本本的每每用一一一息中中定定定职抽内特职和 特和和为职抽为为职一一于个个个,的的的的的将工样样网工应 网应应工样工111部部总重重重个个0003一一一一 一数数数总总方本上有等 上等等总方有分分0008体要要要体 体般般般般般,,,0目目目体数法的就于就于于数法55称称由问问问0数数00所所所在在在分的抽差观样 观样样的抽为为00差题题题NN以以以人人各各各成比取异众本 众本本比取一一异是是是与与不不不不 不必必必,,层层层互1是。要对容 对容容是。个个明总总总样样6喜喜喜喜 喜须须须其其中中中不0小其量 其量量11层层显体体体本本000爱爱爱爱 爱确确确中中随随随相,某。 某。。,,00的如如如容容定定定:不:不机机机交而一一因因几何何何量量每每每5到5到抽抽抽的层节节此此部分分分00nn一一一33取取取层00确确与目目该该分层层层55==层层层个个个;岁岁定定层的的总总组,,,11分分分的的的体体体的的抽抽::之喜喜体体成多 多 多比比比,,,有有样样55间爱爱合合合可可的,,少少少例例例11比比的程程在在在以以情22则则层层层,,,::55差度度一一一分分kk况各人各人,,,==在在在异进进起起起为为,年,年,这这这每每每尽行行得得得33每龄3龄3要要要一一一个个可调调55到到到一段段视视视~~个个个层层能查查容容容部((具具具44层层层。。地,,量量量99分层层体体体岁岁中中中大参参为为为称))情情情的的实实实,加加nnn为的的况况况的的的有有行行行否调调层职职而而而样样样22简简简则查查88,工工定定定本本本单单单00将的的在人人人人。。。...随随随失总总每,,数数机机机去人人一55依依抽抽抽00分数数层岁岁次次样样样层为为中以以是是。。。的11实上上1122意2200行的的5500义::简00有有人人。22单9988,,5500随人人::其其机。。99中中抽55持持==样各各22。55种种::态态5566度度::的的1199人人,,数数然然如如后后下下分分所所别别示示在在::各各年年龄龄段段((层层
分层随机抽样 PPT
[例 1] 一个单位共有职工 200 人,其中不超过 45 岁的有 120 人,超过 45 岁的有 80 人.为了调查职工的健康状况,用分层抽 样的方法从全体职工中抽取一个容量为 25 的样本,应抽取超过 45 岁的职工________人.
[思路点拨] 由分层抽样的概念,按比例抽取.
[解析] 抽样比为 25∶200=1∶8,而超过 45 岁的职工有 80 人,则从中应抽取的个体数为 80×18=10.
的层,然后按照所占比例,从各层独立地抽取 一定数量的个体,将各层取出的个体合在一起
作为样本,这种抽样的方法叫分层抽样。
【说明】分层抽样应遵循以下要求: (1)分层:将相似的个体归为一类,即分为一层,分
层要求每层的各个个体互不交叉,即遵循不重复、不遗 漏的原则。
(2)分层抽样为保证每个个体等可能入样,需遵循在 各层中进行简单随机抽样或系统抽样,每层样本数量与 每层个体数量的比与样本容量与总体容量的 比相等。
[练习 1] 某工厂生产 A,B,C 三种不同型号的产品,产品 数量之比依次为 2∶3∶5,现用分层抽样方法抽出一个容量为 n 的样本,样本中 A 种型号产品有 16 件,那么此样本的容量 n= ______.
答案:80 解析:因为 A 种产品在总体中占了2+23+5=15, 又因为每个个体被抽到的可能性都相等,故样本容量为 16÷15= 80.
思考:(4)三个年级同学有较大差别,应如何提 高样本的代表性? 应考虑他们在样本中所占的比例。
(5)如何确定各年级所要抽取的人数? 计算每一部分占总体个体数的比例,
在各年级中按比例分配样本,得各年级所
要抽取的个体数。
某校小学六年级、初中三年级和高中三年级分别
有1000,800和700名同学,为了了解全校毕业班学生 的视力情况,从以上三个年级中抽取容量为100的样本, 你认为应当怎样抽取样本较为合理?
分层随机抽样(教学课件)高一数学(人教A版2019必修第二册)
体数之比等于样本容量与总体容量之比.
课堂检测
1.一个工厂生产某种产品27000件,它们来自于甲、乙、丙
三条生产线,现采取分层抽样的方法对此批产品进行检测,
已知从甲、乙、丙三条生产线依次抽取的个数恰成等差数列,
则乙生产线共生产了(
A.300
B.13500
件数恰好组成一个等差数列,
设3个车间的产品数分别为 、 、 ,
则 + + = = ,
∴ = ,
故选: .
变式训练
某校高中共有900名学生,其中高一年级400人,高二
年级200人,高三年级300人,现采用分层抽样抽取容
量为45的样本,那么高一、高二、高三年级抽取的人
C.系统抽样
D.分层抽样
)
【解答】解:所述问题的总体中的个体具有明显差异,即出现了
3个阶层,
∴适宜用分层抽样法获取样本.
故选:D .
解题技巧
分层抽样的依据
(1)适用于总体由差异明显的几部分组成的情况.
(2)样本能更充分地反映总体的情况.
(3)等可能抽样,每个个体被抽到的可能性都相等.
典例分析
题型二 分层抽样中各层样本容量的计算
范围
少
几部分组成
共同点
多
①抽样过程中每个个体被抽到的可能性相等;
②每次抽出个体后不再放回,即不放回抽样
分层随机抽样的平均数
1.在简单随机抽样中如何估计总体平均数?
2.那么在分层随机抽样中如何估计总体平均数呢?
是否也可以直接用样本平均数进行估计?
概念解析
分层随机抽样中的总体平均数与样本平均数
人教版高一数学课件-分层随机抽样
問題1:為什麼樣本平均數大幅度地偏離了總體平均數?
樣本中的個體中 “極端”樣本 估計出現
有大量的矮個子
較大誤差
問題2:為什麼運用簡單隨機抽樣獲取的樣本中, 會出現“極端”樣本?
(1)高一年級學生的身高差異較大; (2)樣本抽取的隨機性.
簡單隨機抽樣存在不足
問題3:在樣本量相同且樣本量不大時,你認為總體中 個體差異的大小對估計效果有什麼影響?
包含的 各個個體 抽取的 樣本的各個 個體數 的變數值 樣本量 個體變數值
第1層 M X1, X2 , , XM m
第2層
N
Y1, Y2 , ,YN
n
x1, x2, , xm y1, y2, , ym
第1層的樣本平均數
x
=
x1
+
x2
+ m
第2層的樣本平均數
y=
y1
+
y2
+ n
+ xm + yn
=
1 m
總體由差異明顯的幾部分組成 分層隨機抽樣
例題
例2 為了調查教師對統計軟體的瞭解程度,某市採用
分層隨機抽樣的方法,從A、B、C三所學校抽取60名 教師進行調查,已知A、B、C三所學校分別有180、 270、90名教師,如果樣本按比例分配,求A、B、C學 校分別應抽取的教師人數.
各層樣本量= 总该体层的个个体体数数× 总样本量
C學校抽取的教師人數為:56400 ×90 = 10 .
教師人數 樣本量
A學校 180 20
B學校 C學校 A:B:C
270
90 2:3:1
30
10 2:3:1
各層抽取的樣本量之比 = 總體中各層個體數之比
分层抽样的方法.完整版PPT资料
当总体的个数较多时,采用简单随机抽样太麻烦,这时将总体分成 均衡的部分,然后按照预先定出的规则,在每一部分中抽取1个个体得 到所需要的样本,这种抽样称为系统抽样。
知识讲解:
1、 分层抽样概念: • 一般地,在抽样时,将总体分成互不交叉的层,然后按照一定 的比例,从各层独立地抽取一定数量的个体,将各层取出的个 体合在一起作为样本,这种抽样的方法叫分层抽样。
说明:
1、总体个体差异明显,每层的差别比较大,而层内个体间的差别较小.
2、每层可以抽取多少样本,要根据它在总体中占的比例来抽取.
3、在每层中抽取样本时,采用简单随机抽样或系统抽样.
(4)对于不能取整的数,求其近似值。 (1)每个个体被抽取的可能性是相同的;
掌握分2、层抽分样层的抽方样法的和抽步取骤步,骤学:会利用分层抽样抽取样本,掌握简单随机抽样、系 统(例岁抽11以):样 上确一、的定个(分有总单1层9)体位5抽抽人确与有样.定取样5的0为总本0比区了名体容别了职与例量总 样 。解工样抽这,本体 本 取个其容的个 容 单中量比位不抽数 量 例职到取。工3的5与岁比身的例体有。状12况5人有,关3的5岁某~项49指岁标的,有如28何0人从,中5抽0 取一个容(量2为)1由00分的层样情本况? ,确定各层抽取的样本数。
(3)若在按比例计算所得的个体数不是整数,可作适当的近似 处理. (1)每个个体被抽取的可能性是相同的;
例1:一个单位有500名职工,其中不到35岁的有125人,35岁~49岁的有280 人,50岁以上的有95人.为了了解这个单位职工与身体状况有关的某项指标, 如何从中抽取一个容量为100的样本?
三Байду номын сангаас抽样方法的比较
3.课堂练习 一个电视台在因特网上就观众对其某一节目的喜爱程度
分层抽样 PPT
服务特 权
共享文档下载特权
VIP用户有效期内可使用共享文档下载特权下载任意下载券标价的文档(不含付费文档和VIP专享文档),每下载一篇共享文
档消耗一个共享文档下载特权。
年VIP
月VIP
连续包月VIP
享受100次共享文档下载特权,一次 发放,全年内有效
赠每的送次VI的发P类共放型的享决特文定权档。有下效载期特为权1自个V月IP,生发效放起数每量月由发您放购一买次,赠 V不 我I送 清 的P生每 零 设效月 。 置起1自 随5每动 时次月续 取共发费 消享放, 。文一前档次往买的VIP时长期间,下载特权不清零。
100W优质文档免费下 载
VIP有效期内的用户可以免费下载VIP免费文档,不消耗下载特权,非会员用户需要消耗下载券/积分获取。
Hale Waihona Puke 部分付费文档八折起 VIP用户在购买精选付费文档时可享受8折优惠,省上加省;参与折扣的付费文档均会在阅读页标识出折扣价格。
很喜爱 喜爱 一般 不喜爱
2400 4200 3800 1600
打算从中抽取60人进行详细调查,如何抽取?
三种抽样方法的比较
特权福利
特权说明
VIP用户有效期内可使用VIP专享文档下载特权下载或阅读完成VIP专享文档(部分VIP专享文档由于上传者设置不可下载只能 阅读全文),每下载/读完一篇VIP专享文档消耗一个VIP专享文档下载特权。
0下载券文档一键搜索 VIP用户可在搜索时使用专有高级功能:一键搜索0下载券文档,下载券不够用不再有压力!
内容特 无限次复制特权 权 文档格式转换
VIP有效期内可以无限次复制文档内容,不用下载即可获取文档内容 VIP有效期内可以将PDF文档转换成word或ppt格式,一键转换,轻松编辑!
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
例4.3:某市进行家庭收入调查,分城镇居民及农村居 民两部分抽样,在全部城镇居民23560户中随机抽取 300户,在全部农村居民148420户中随机抽取250户, 调查结果是城镇年平均户收入为15180元,标准差为 2972元;农村年平均户收入为9856元,标准差为 2546元。求全市年平均户收入的置信度为90%的置信 区间。
pst
u1 2
v(
pst
),
pst
u 1
2
18.33%,27.39%
v( pst )
4.3 各层样本量的分配
在分层随机抽样中,假设样本量n固定
Yˆ的方差:
V ( yst )
L
Wh 2
h1
•1 fh nh
Sh2
L Wh2Sh2 L WhSh2
n h1
h
h1 N
考虑简单线性费用函数,则总费用为:
sh2
1 nh 1
nh
(yhi
i 1
yh)2
一、分层抽样中
若对任一层,假设为第h层,都有Yˆh NYˆh,
L
Y Yh
h1
(1)Yˆ L Yˆh L NhYˆh
h1
h1
方差V(Yˆ)
L
V(Yˆh)
L
N h 2V(Yˆh)
h1
h1
L
(2)Yˆst
Yˆh
h1
N
L h1
Nh N
Yˆh
Байду номын сангаасPh
Qh
(当N
很大时)
h
(4)P的置信度为1 的置信区间为:
pst
u 1
s
(
pst
),
2
pst
u 1
2
s(
pst
)
例:在某行业技术人员中,按年龄分层,调查会使用计算机者所占 的比例。数据如下:
层
人数
入样人数
30岁以下
7781
71
30~35岁
7497
68
36~40岁
9779
89
41~45岁
L
Wh 2
h1
•1 fh nh
PhQh
(当N
很大时)
h
估计的性质
(1) pst的性质:
L
P的简单估计为pst Wh ph h1
且是pst的无偏估计。
(2)
L
pst的方差V(pst) Wh2V(ph) h 1
L
Wh 2
h 1
•1 fh nh
•
Nh Nh
1
PhQh
L
Wh 2
h 1
•1 fh nh
即“层间方差大,层内方差小”。
4.2 简单估计量及其性质
对总体均值或总值的估计:
设总体分为L层,以h表示层的编号,h 1,2,,L
总体第h层
Nh
Yh Yhi
i 1
1 Nh
Yh
Nh
Yhi
i 1
S
2 h
1 Nh 1
Nh
(Yhi
i 1
Yh)2
第h层样本
nh
yh yhi
i 1
1 nh
yh nh i1 yhi
解:
y1 39.5
各层样本均值及方差为:y2 105 y3 165
y4 24
s12 1624.722 s22 2166.667 s32 8205.556 s42 193.333
L
(1)Yˆ Nh yh h 1
200 39.5 400 105 750 165 1500 24
209650
(2)Yˆ的方差V (Yˆ)的估计:
v(Yˆ )
v(Nyst )
L h 1
Nh2
•
1
f nh
h
sh
2
5.39 108
s(Yˆ) v(Yˆ) 23208
(3)该地区居民奶制品年消费总支出的置信度为95%的置信区间为
Yˆ
u1 2
s(Yˆ ), Yˆ
u1 2
s(Yˆ )
164162,255138
4627
42
45岁以上
5366
50
总计
35050
320
试估计总体中会计算机者占的比例。
样本中会使 用计算机的
人数
24 12
22
11
4
解:
5
(1) pst Wh ph 0.2286
h1
(2)v( pst )
5
Wh2 (1
h1
fh)
ph (1 ph ) nh 1
0.000534
(3)P置信度为95%的置信区间为:
u1 2
s
(
y
st
)
2.总体总和Y的估计:
Yˆ
L
Yˆh
L
NhYˆh L
Nh yh
h1
h1
h1
方差V(Yˆ)
L
V(Yˆh)
h1
L h1
N h 2V(yh)
L h1
Nh2
1 fh nh
Sh2
例4.2:调查某地区的居民奶制品年消费支出,以居民户为抽样单元, 根据经济及收入水平将居民户分为4层,每层按简单随机抽样抽 取10户,调查数据如下,估计该地区居民奶制品年消费总支出 及估计的标准差。表:样本户奶制品年消费支出
解: yst W1 y1 W2 y2
23560 15180 148420 9856 10585.39
171980
171980
3、分层随机抽样中,总体比例P的简单估计 设Ph的简单估计为ph,则
L
Wh 2
h1
•1 fh nh
Sh2
L
Wh 2
h1
•1 fh nh
•
Nh Nh 1
PhQh
第四章 分层随机抽样
4.1 概述
4.1.1分层抽样(stratified sampling)、分层随机抽样(stratified random sampling):
分层抽样:将容量为N的总体分成L个不相重叠的子总体,子总体的
大小分别为N1、 N2、… NL,皆已知,且 L
Nh N
h 1
每个子总体就称为层。从每层中独立地进行抽样,这样的抽样方 法称为分层抽样。 分层随机抽样:在分层抽样中,如果每层中的抽样都是简单随机抽 样,则这样的分层抽样称为分层随机抽样。
L WhYˆh
h1
方差V(Yˆst) L Wh2V (Yˆh ) h1
分层随机抽样, 则Yˆh的简单估计为yh
1.Y的无偏简单估计Yˆst为:yst L WhYˆh L Wh yh ,Yˆst记为yst
h1
h1
Y 的置信度为1 的置信区间为:
yst
u1 s( yst ), 2
yst
10
层 居民
户总 数
1
样本户奶制品年消费支出 23456789
1 200 10 40 0 110 15 10 40 80 90 0 2 400 50 130 60 80 100 55 160 85 160 170 3 750 180 260 110 0 140 60 200 180 300 220 4 1500 50 35 15 0 20 30 25 10 30 25
4.1.2分层抽样的适用场合: (1)不仅需要估计总体参数,也需要估计各层
参数。 (2)便于管理,按现成的地理分布或行政划分
来分层。 (3)希望样本中能包含各个部分,以增加代表
性。 (4)把一个内部差异很大的总体分成几个内部
比较相似的子总体(层)进行分层抽样,可以 提高估计量的精度。如果有极端值,也可以把 它们分离出来形成一层。