抽样技术-第三章

合集下载

第三章抽样的原理及类型

第三章抽样的原理及类型

五、抽样设计得原则
1、目得性原则 2、可行性原则 3、高效性原则
第三节 样本规模与抽样误差
一、 样本规模及其计算
1所、含定元义素:样得本多规少模。又确称定样样本本容规量模,就指是得每就一是项样具本体中 得社会调查所必须解决得问题之一。
不能少于100个元素
2、简单随机抽样中样本规模计算公式: a,推论总体平均数
4、 实际抽取样本
实际抽取样本得工作就就是在上述几个步 骤得基础上,严格按照所选定得抽样方法,从抽样 框中抽取一个个得抽样单位,构成样本。依据抽 样方法得不同,以及依据抽样框就是否可以事先 得到等因素,实际得抽样工作既可能在研究者到 达实地之前就完成,也可能需要到达实地后才能 完成。即既可能先抽好样本,再下去直接对预先 抽好得对象进行调查或研究;也可能一边抽取样 本一边就开始调查或研究。
继续保持安静
置信区间
指在一定得置信度下,样本统计值与总体 参数值之间得误差范围。反映得就是抽样得 精确性程度。
二、抽样得作用
向人们提供一种实现“由部分认识整 体”这一目标得途径和手段。
日常生活中得抽样
第二节 抽样得类型与抽样程序
一、抽样得类型 从大得方面看,各种抽样都可以归为概率
抽样与非概率抽样两大类,这就是两种有 着本质区别得抽样类型。
抽样
从组成某个整体得所有元素得集合中,按 一定得方式选择或抽取一部分元素得过程。
比如,从1000户家庭构成得总体中,按一定 得方式抽取一个由100户家庭构成得样本得 过程。
抽样单位
抽样单位就就是一次直接得抽样所使用得 基本单位。抽样单位与构成总体得元素有时 就是相同得,有时又就是不同得。
如从32万名大学生抽取1000大学生,单个 大学生既就是元素,又就是抽样单位;但就是,抽 取40个班级(假定正好就是1000名)时,抽样单位 与构成总体得元素就不一样了。

统计学 第三章抽样与抽样分布

统计学 第三章抽样与抽样分布

=10
= 50 X
总体分布
n= 4
x 5
n =16
x 2.5
x 50
X
抽样分布
从非正态总体中抽样
结论:
从非正态中体中抽样,所形成 的抽样分布最终也是趋近于正态分 布的。只是样本容量需要更大些。
总结:中心极限定理
设从均值为,方差为 2的一个任意总体中抽 取容量为n的样本,当n充分大时(超过30),样本 均值的抽样分布近似服从均值为μ、方差为σ2/n的
总体
样本
参数
统计量
总体与样本的指标表示法
总体参数
样本统计量
(Parameter) (Sample Statistic)
容量 平均数 比例 方差 标准差
N
n
X
x
p
2
s2
s
小练习
某药品制造商感兴趣的是用该公司开发的某 种新药能控制高血压人群血压的比例。进行了一 项包含5000个高血压病人个体的研究。他发现用 这种药后80%的个体,他们的高血压能够被控制。 假定这5000个个体在高血压人群中具有代表性的 话,回答下列问题: 1、总体是什么? 2、样本是什么? 3、识别所关心的参数 4、识别此统计量并给出它的值 5、我们知道这个参数的值么?
正态分布
一个任意分 布的总体
x
n
当样本容量足够 大时(n 30) , 样本均值的抽样 分布逐渐趋于正 态分布
x
X
总体分布
正态分布
非正态分布
大样本 小样本 大样本 小样本
正态分布
正态分布
非正态分布
三 中心极限定理的应用
中心极限定理(Central Limit theorem) 不论总体服从何种分布,从中抽取

初级1 -第三章简单随机抽样

初级1 -第三章简单随机抽样
n
n
n 1 N 1 n N
n 1 N 1
二、实施方法 • 抽签 制作N个同质的签,充分混合。从中一次抽出n个签, 或者先抽出一个签但不放回,再抽下一个签直到抽 满n个签为止。抽出的这n个签对应的单元入选样本, 这是不放回简单随机抽样;若从充分混合的N个签 中抽取一个,记录后放回,再抽取下一个,如此进 行,直到抽满n个为止,则是放回简单随机抽样。 抽签法的实施起来比较麻烦,尤其是当总体单元数 N较大时,所以该方法的使用场合为当总体单元数 N比较小,签的制作比较方便时。
第三章 简单随机抽样

第一节
基本问题
一、什么是简单随机抽样
从 N个单元的总体中抽取 n个单元组成的样本。总体单元数为 N,
样本量为 n。 若抽样是放回的,每次都是从 个总体单元中随机抽取1个单元,独 立重复抽取n次,得到 个单元组成的样本,叫做放回简单随机抽样。 若抽样是不放回的,每次都是从剩下的总体单元中随机抽取1个单 元,相继依次抽取n次,得到n个单元组成的样本,叫做不放回简单 随机抽样。
精度margin of error
对精度的要求通常以允许最大绝对误差
差限)或允许最大相对误差 (相对误差限)来表 示。
r
d(绝对误
d 1 P
P r 1


样本量足够大时,可用正态分布近似
ˆ tS ˆ d t V
2
第三章 基本概念
N n N 1
N n N
为 修正系数
2
为 S 修正系数
n f ,称抽样比, N
2

N n 1 f 有限总体调整系数 故, N 2
S V ( y ) (1 f ) n

抽样技术课件 第三章(分层抽样)

抽样技术课件 第三章(分层抽样)

估计量方差的证明
在一般分层抽样下
L L L L ˆ V W Y ˆ W 2V Y ˆ 2 ˆ ,Y ˆ VY W W Cov Y st h h h h h k h k h 1 k h h1 h1 L ˆ ˆ V Y W 2V Y


L 2 h L L 2 h
1 2 N
2 L Nh ( N h nh ) PhQh PhQh 2 Wh (1 f h ) Nh nh nh h 1 h 1
性质二的证明:
ph qh v( pst ) W v( ph ) W (1 f h ) nh 1 h 1 h 1
ˆ 2 2 1 fh 2 V (Yst ) V ( yst ) Wh V ( yh ) Wh Sh nh h 1 h 1
L L
1 fh 2 v( yst ) W v( yh ) W sh nh h 1 h 1
L 2 h L 2 h
无偏性的证明
在一般分层抽样下
ˆ Y EY h h
30
200
25
180
10
300
30
220
25
N1 200 N 2850 W1 0.07018 N 2850 n1 10 f1 0.05 nh 10 N1 200 n1 n1 1 2 2 1 y1i y1 1624.722 y1 y1i 39.5 s1 n1 1 i 1 n i 1
L L ˆ E W Y ˆ W EY ˆ EY st h h h h h1 h1
L



1 L 1 L Y WhYh N hYh Yh Y N h1 N h1 N h 1

抽样技术第三章_分层随机抽样

抽样技术第三章_分层随机抽样

4

4
4
ˆ v Y ˆ 23208 s Y
ˆ 209650 2 23208 ˆ ts Y Y

2015/11/6
23
三、对总体比例的估计

总体比例P的估计为:pst Wh ph
h 1
L

估计量的性质
对于一般的分层抽样,如果 ph是 P h 的无偏估计 (h 1,2,, L ),则 pst 是 P的无偏估计。 p 的方差为:
W 2V Y V Y h h st
h1

L


只要对各层估计无偏,则总体估计也无偏。

各层可以采用不同的抽样方法,只要相应的估计量是无 偏的,则对总体的推算也是无偏的。
11
2015/11/6
证明性质1
由于对每一层有
ˆ Y EY h h

L L ˆ ˆ ˆ E Y E W Y W E Y st h h h h 因此, h1 h1

L
L
N Y hh
h 1
L
分层随机样本,总体均值 Y 的简单估计
1 y st Wh y h N h 1
N
h 1
L
h
yh
10
2015/11/6
估计量的性质

是 Yh 的无 性质1&2:对于一般的分层抽样,如果 Y h 偏估计( h 1,2, , L ),则 Y 是Y 的无偏估计。 st Yst 的方差为:
7
三、符号
所有总体参数的估计量都采用下标“st”以示区别:
记 号 代表的含义
h
下标
i

第三章分层随机抽样作业答案

第三章分层随机抽样作业答案

P111 3.6 样本量应该满足:
在Nh-1≈Nh的条件下,
而其中每层的吃年夜饭的样本比例的方差的估计值为: p 1 p 1 f N n h hn h h hh v p p 1 p h h h n 1 N n 1 hn h h h
则样本比例的方差的估计值为:
6 2 h 6 2 h
p 1 p h h v p W v p W 1 f s t h h n 1 h 1 h 1 h
把相应的数值代入计算可得方差的估计值为v(pst)=3.9601×10-4,
从而可以得到该估计值的标准差为:s(pst)=0.0199。
(2)样本容量的确定
n2 = 0.2028 × 2568 = 520.7904 ≈ 521
n3 = 0.1625 × 2568 = 417.3000 ≈ 417 n4 = 0.1184 × 2568 = 304.0512 ≈ 304 n5 = 0.1544 × 2568 = 396.4992 ≈ 396 n6 = 0.1529 × 2568 = 392.6472 ≈ 393
P110 3.4 ∵ n0/N=2568/1650000=0.00156<0.05 ∴ 不需要修正 按内曼分配,样本量 n = 2568
w h
W 1 ph ) hp h(
w1= 0.0540/0.2584 = 0.2090
W p (1 p )
h1 h h h
k
w2= 0.0524/0.2584 = 0.2028
P110 3.5 解:总体总共分为10个层,每个层中的样本均值已经知道, 层权也得到,从而可以计算得到该开发区居民购买冷冻 食品的平均支出的估计值为: y st

第3章抽样技术 市场调查与预测(第二版) 邓剑平

第3章抽样技术 市场调查与预测(第二版) 邓剑平

3.1 抽样调查概述
3.1.1 市场抽样调查的涵义 3.1.2 抽样调查的特点 3.1.3 抽样调查的作用 3.1.4 市场抽样调查的程序
3.1.1 市场抽样调查的涵义
市场抽样调查有广义和狭义之分。广义的抽样 调查包括随机抽样和非随机抽样;狭义的抽样调查 只包括随机抽样。下面市场抽样调查的涵义是狭义 的。 所谓抽样调查,就是按某种规则从调查对象总 体中选取一定数目的单位,作为代表总体样本,运 用样本单位的调查,结果推断总体一般情况的一种 调查方式。
3.1.2 抽样调查的特点
抽样调查是市场调查中应用最多的方法, 它具有一下明显的特点(见图3-1)。
图3-1 抽样调查的特点
3.1.3 抽样调查的作用
在市场调查中,调查的内容很多(见图3-2)。
图3-2 抽样调查所使用的范围
市场抽样调查,特别是随机抽样,有比较严格 的程序,只有按一定程序进行调查,才能保证调查 顺利完成,取得应有的效果。抽样调查一般分为以 下几个步骤(见图3-3)。
分层抽样必须注意以下问题(见图3-4)。
图3-4 分层抽样必须注意的问题
3.2.2 分层随机抽样技术及其应用
分层抽样的步骤包括(图3-5)。
图3-5 分层抽样的步骤
3.2.2 分层随机抽样技术及其应用
分层抽样的具体做法有以下两种(见图3-6)。
图3-6 分层抽样的具体做法
上海市民出行状况调查报告
上海市民出行状况调查报告
2.逾六成受访者上下班出行选择公共交通 公交与轨道交通成为市民上下班的主要交通工具。调查显示,有 26.9%的受访者选择乘坐公交,17.2%选择乘坐轨道交通,21.4%选择乘 坐公交加轨道交通,合计为65.5%;另有12%上下班出行使用助动车, 13.%使用私家车,9.3%使用自行车或其他。这表明,逾六成受访者上 下班出行选择公共交通,这与目前上海公共交通方便快捷、花费少有 着重要关系。 分区域看,居住在内环的受访者选择公共交通出行的占66.8%,居 住在内中环间的受访者选择公共交通出行的占70.1%,居住在中外环间 的占71.9%,居住在外环外的占56.9%。这表明,在公共交通较为便捷 的区域,市民更倾向于选择公共交通出行。 3.受访者上下班交通单程平均时间为50.4分钟 有9.3%的受访者上下班单程耗时在15分钟以内,16.4%耗时在1530分钟,18.7%耗时在30-45分钟,24.2%耗时在45-60分钟,22.4%耗时 在60-90分钟,9%耗时在90分钟以上。经加权平均计算,受访者上下班 单程平均时间为50.4分钟。按居住地到单位距离的分组来看,距离越 长,相对耗时越多。

第三章 抽样设计

第三章  抽样设计

一、方便抽样
又称任意抽样。一般由调研人员从工作的 方便出发,在调研对象的范围内随意抽取 一定数量的样本进行调查。
最常用的两种方法是“街头拦截法” 最常用的两种方法是“街头拦截法”和 “空间抽样法” 空间抽样法” 特点: 节约费用和时间,但样本的信息不 适用于总体参数的推断。
注意:
方便抽样一般用于非正式的探索性调查, 只有在调查总体各单位之间的差异不大时, 抽取的样本才有较高的代表性。
抽取样本的数量
允许误差 % 1 2 3 4 5 6 7 可信程度(把握程度)% 95 99 9600 16589 2400 4147 1067 1849 600 1037 384 663 267 461 196 339
一、简单随机抽样
适用范围:调查总体中各个体之间差异程 度较小的情况下,或者调研对象不明,难 以分组、分类的情况。 常用方法: 1、抽签法 2、随机数表法
二、系统抽样
又称等距抽样,就是先将调查总体的各个 体按照一定的标志排列起来,然后按照固 定的顺序和一定间隔来抽取样本个体。
排队的标志有两种: 1、按调查项目有关的标志排队 2、按调查项目无关的标志排队
(独立控制配额)按年龄分组: 独立控制配额)按年龄分组:
按年龄分组 18-29岁 18-29岁 30-40岁 30-40岁 41-55岁 41-55岁 56岁 56岁 合计 人数 40 60 70 30 200
按性别分组
性别 人数 100 100 200


合计
相互控制配额抽样
合计 40 60 70 30 收入 性别 年龄 18-29岁 18-29岁 30-40岁 30-40岁 41-55岁 41-55岁 56岁以上 56岁以上 合计 高 男 3 6 6 3 18 女 4 5 6 3 18 中 男 7 11 13 6 37 女 8 11 13 5 37 低 男 9 13 16 7 45 女 9 14 16 6 45

(抽样检验)第三章抽样检验最全版

(抽样检验)第三章抽样检验最全版

(抽样检验)第三章抽样检验第三章抽样检验大纲要求和内容提要壹、基本概念1、掌握抽样检验、计数检验、计量检验、单位产品、(检验)批、不合格、不合格品、批质量、过程平均、接收质量限及极限质量的概念1.1抽样检验(p130)——按照规定的抽样方案,随机从壹批或壹个过程中抽取少量个体(作为样本)进行的检查,根据样本检验结果判定壹批产品或壹个过程是否能够被接收。

1.2计数检验(pp.130-131)——包括计件和计点抽样检验。

计件抽样检验——根据被检样本中的不合格产品数,推断整批产品的接收和否。

计点抽样检验——根据被检样本中的产品包含的不合格数,推断整批产品的接收和否。

1.3计量检验(p131)——通过被检样本中的产品质量特性的具体数值且和标准进行比较,进而推断整批产品的接收和否。

1.4单位产品(p131)——为实施抽样检验需要而划分的基本产品单位。

……在抽样标准中定义为可单独描述和考察的事物。

……1.5(检验)批(p131)——提交检验的壹批产品,亦为检验对象而汇集的壹批产品。

——它应由同型号、同等级和同种类(尺寸、特性、成分等),且生产条件和生产时间基本相同的单位产品组成。

——又分为孤立批和连续批:孤立批——指脱离已生产或汇集的批而不属于当前检验批系列的批;连批批——指待检批可利用最近已检批所提供质量信息的连续提交检验批。

1.6批量(p131)——检验批中单位产品的数量,常用N表示。

1.7不合格(p132)——单位产品的任壹质量特性不满足规范要求。

常据不合格的严重程度必要时将其由重到轻分类为A、B、C类不合格。

1.8不合格品(p132)——具有壹个或壹个之上不合格的单位产品。

对应于不合格分类而为A、B、C类不合格品。

1.9批质量(p132)——单个提交检验批产品的质量。

由于质量特性值——计数值、计量值的属性不同而对之表示方法有别。

a.计数值有:i)批不合格品率(计件)——批的不合格品数D除以批量N:P=D/N,ii)批不合格品百分数(计件)100piii)批每百单位产品不合格数(计点):批的不合格数D除以批量N:u=D/N b.计量值有:i)批中所有单位产品的某个特性的平均值;ii)批中所有单位产品的某个特性的标准差或变异系数等。

第三章 抽样检验(3)抽样检验

第三章  抽样检验(3)抽样检验

第三章抽样检验第三章 抽样检验oc曲线的性质(1)抽样特性曲线和抽样方案是一一对应关系,也就是说有一个抽样方案就有对应的一条oc曲线;相反,有一条抽样特性曲线,就有与之对应的一个抽检方案。

(2)oc曲线是一条通过(0,1)和(1,0)两点的连续曲线。

(3)oc曲线是一条严格单调下降的函数曲线,即对于p1l(p2)。

既然改变参数,方案对应的oc曲线就随之改变,其检查效果也就不同,那么什么样的方案检查效果好,其oc曲线应具有什么形状呢?下面就来讨论这一问题。

(1)理想方案的特性曲线(1)理想方案的特性曲线在进行产品质量检查时,总是首先对产品批不合格品率规定一个值p0来作为判断标准,即当批不合格品率。

其抽样特性曲线为两段水平线,如下图所示: 错检或漏检的,所以,理想方案只是理论上存在的。

(2)线性抽检方案的OC曲线(2)线性抽检方案的oc曲线 所谓线性方案就是(1|0)方案,因为oc曲线是一条直线而得名的,如下图所示,由上图可见,线性抽检方案是从产品批中随机地抽取1个产品进行检查,若这个产品不合格,则判产品为批不合格品。

这个方案的抽样特性函数为:因为它和理想方案的差距太大,所以,这种方案的检查效果是很差的。

理想方案虽然不存在,理想方案虽然不存在,但这并不妨碍把它作为评价抽检方案优劣的依据,一个抽检方案的oc曲线和理想方案的oc曲线接近程度就是评价方案检查效果的准则。

为了衡量这种接近程度,通常是首先规定两个参数p0和p1(p0<p1),p0是接收上限,即希望对p≤p0的产品批以尽可能高的概率接收;p1是拒收下限,即希望对p≥p1的产品批以尽可能高的概率拒收。

若记α=1-l(p0),β=l(p1),则可以通过这四个参数反映一个抽检方案和理想方案的接近程度,当固定p0,p1时,α、β越小的方案就越好;同理若对固定的α、β值,则p0和p1越接近越好;当α和β→0,p0→p1时,则抽检方案就趋于理想方案。

03第三章 简单随机抽样

03第三章  简单随机抽样

首先,在理论上最符合随机原则.对此可有二 种理解:一种是总体中各个单位被抽中的机会 相等.设总体有N个单位,各单位被抽中的概 1 率均为 N.另一种是总体中各个样本被抽中的 概率相等.我们知道,一个总体N中可以抽取 许多个容量为n 的样本,通常情况下按组合形 n C N个样本,那么,在一次抽样中,某个样 式有 1 本被抽中的概率为C ,这个概率对每个可能的 样本都相等.简单随机抽样遵循这种等可能性 原则,为进行抽样估计,计算抽样误差,提供 了重要前提条件.
Y3 + Y4 2
可见,样本均值 y 是 Y 的一个无偏估计量,因为
1 Yi + Y j 1 3 4 E ( y ) = ∑∑ ( ) = ∑∑ (Yi + Y j ) 2 12 i =1 j i i =1 j i 6
3 4
而每个单元均可能在三个样本内出现,故
1 4 E ( y ) = ∑ 3Yi = Y 12 i =1
颜色 蓝 绿 红 白 黄 合计
人的编号 1 14 28 15 25 18 2 26 21 12 23 18 3 20 15 20 20 25 4 12 21 22 19 26
期望 数字 20 20 20 20 20 100
100 100 100 100
可见四个人都对颜色存在偏好,如第一个人偏爱绿色, 第二个人偏爱蓝色等.这种由于对颜色偏好所引起的偏估 类型,可称之为颜色偏误. 结论:随意抽样≠随机抽样
n N
其次,它是设计其他更复杂抽样形式的基础. 例如,设计分层抽样,将总体划分为若干层, 然后对各个层实施简单随机抽样.对一个非常 大的总体,需要分若干个阶段进行抽样.例如, 进行全国性抽样调查,第一阶段可以由全国抽 取若干个省份,第二阶段再由抽中的省份抽取 若干个县(市);第三阶段再由抽中的县(市)抽 取若干个乡(街道);第四阶段再由抽中的乡 (街道)抽取若干个村(居委会)等等.在这种多 阶段抽样中,每个阶段中抽取样本单位均可采 用简单随机抽样方法.

03第三章 简单随机抽样(SRS)

03第三章 简单随机抽样(SRS)


总体均值的比估计 总体总值的比估计 总体均值的回归估计
ˆ y RX ˆ YR R
ˆ ˆ ˆ YR RX NRX


ˆ Ylr y ( X x )

总体总值的回归估计
ˆ Ylr y ( X x) N y ( X x )

抽样可以是放回的,也可以是不放回的。如果 抽样比非常小,则放回抽样与不放回抽样实际 上是差不多的。一般情况下,不放回抽样的结 果更精确,实际操作也更方便些。在本课程中, 除非特别指明,抽样都是指不放回的。

简单随机抽样一般有抽签法和随机数法 两种实施方法。
7
简单随机抽样的抽样规则:



1)按随机原则取样,在取样时排除任何主 观因素选择抽样单元,避免任何先入为主 的倾向性,防止出现系统误差。 2)每个抽样单元被抽中的概率都是已知或 事先确定的,或者事先可以计算出来。 3)每个抽样单元的概率都相等,即简单随 机抽样属于一种等概率随机抽样。


所有概率抽样的出发点和理论基础都是简单随 机抽样。简单随机抽样是一种一步抽样法,它 保证样本量为n的每个可能的样本都有相同的 被抽中的概率p=n/N。 简单随机抽样有三个相互等价的定义:

4



定义1: 从总体的N个单元中,一次整批抽取n个单元 ,使任何一个单元被抽中的概率都相等,任何n个不同 单元组成的组合被抽中的概率也都相等,这种抽样称 为简单随机抽样。 定义2:从总体中的N个单元中,逐个不放回地抽取单 元,每次抽取到尚未入样的任何一个单元的概率都相 等,直到抽足n个单元为止,这样所得的n个单元组成 一个简单随机样本。 定义3:按照从总体的N个单元中抽取n个单元的所有 n n C N个样本,从C N 个样 可能不同的组合构造所有可能的 本随机抽取1个样本,使每个样本被抽到的概率都等于 n 1/C N ,这种抽样称为简单随机抽样

第三章抽样1

第三章抽样1

• 第三:评价样本
• (1)计算总体偏差率 )计算总体偏差率——样本的偏差率就是对总 样本的偏差率就是对总 体偏差率的最佳估计,但必须考虑抽样风险。 体偏差率的最佳估计,但必须考虑抽样风险。 • 考虑抽样风险: 考虑抽样风险: • 使用统计公式——总体偏差率上限=风险 总体偏差率上限= ①使用统计公式 总体偏差率上限 系数÷ 系数÷样本量 • ②使用样本结果评价表 (P40---43) • (2)分析偏差的性质和原因 )分析偏差的性质和原因——注册会计师应对 注册会计师应对 偏差性质和原因进行分析。 偏差性质和原因进行分析。 • (3)得出总体结论 )
• (三)审计抽样的适用范围 • 1.当控制的运行留下轨迹时,可考虑使用审 计抽样实施控制测试。对未留下运行轨迹 的哦,不涉及审计抽样。 • 2.实质性程序包括对各类交易、账户余额、 列报的细节测试,以及实质性分析程序, 对细节的测试可以使用审计抽样,在实施 分析程序时不宜使用审计抽样。
(四) 审计抽样的种类
• ②非统计抽样:非抽样风险无法直接计量, 通常将样本偏差率与可容忍偏差率相比较, 以判断总体是否可以接受。 如样本偏差率大于可容忍偏差率,则总 体不能接受。 如样本偏差率低于可容忍偏差率,如果 大大低于,则可以接受;不是大大低于, 不可以接受。
(2)细节测试中样本结果的评价
细节测试:对实质性程序进行分类中的一种(实质性程序分为细节测试 和实质性分析程序),细节测试是对各类交易、账户余额、列报的具 体细节进行测试。
• 2.形成审计结论:(考虑抽样风险) (1)控制测试中的样本结果评价: • ①统计抽样 注册会计师确定的依赖过度风险条件下可能发 生的偏差率上限的估计值。 • 偏差率上限估计值=总体偏差率+抽样风险允许限 度

第三章 简单随机抽样

第三章 简单随机抽样

(三)简单估计量 三 简单估计量
1− f 2 V( y) = S n
y 的方差
式中, 式中, 证明: 证明:
f=
n N
抽样比; 为有限总体校正系数。 抽样比;1− f 为有限总体校正系数。
1 2 2 = 1 E[ ( yi −Y )]2 V( y) = E( y −Y ) = E( yi −Y ) n n i=1 i=1
8
(三)不放回与放回简单随机抽样的比较 三 不放回与放回简单随机抽样的比较
1、每次抽取样本单位面对的总体结构不同。这是二者 、每次抽取样本单位面对的总体结构不同。 的主要不同之处。 的主要不同之处。这一点使得前者的数学处理相对 简单。 简单。 2、样本提供的信息量不同。显然,在样本量一定的条 、样本提供的信息量不同。显然, 件下,由于后者提供的信息量大于前者, 件下,由于后者提供的信息量大于前者,其抽样效 率更高。 率更高。 在实践中, 在实践中,一般多采用不考虑顺序的不放回简单 随机抽,所以以下讨论如无特别说明, 随机抽样,所以以下讨论如无特别说明,都指这一 类简单随机抽样。 类简单随机抽样。
13
用此种方法, 的最高位数较小, 用此种方法,当 N的最高位数较小,比如 小于5, 小于 ,且不小 n时,由于读到的随机数被舍 弃不用的比例较大,抽选效率较差。此时采 弃不用的比例较大,抽选效率较差。 用下面的方法。在随机数表中随机抽取3列 用下面的方法。在随机数表中随机抽取 列, 顺序往下,如果得到的随机数大于247,小于 顺序往下,如果得到的随机数大于 , 989(因为 倍为988,因此000及989到 (因为247的4倍为 ,因此 的 倍为 及 到 999的数字应舍弃),则用这个数除以 的数字应舍弃),则用这个数除以247, 的数字应舍弃),则用这个数除以 , 得到的余数入样,显然这种方法效率要高得 得到的余数入样, 多。随机数表的起始页和起始点都应用随机 数产生。 数产生。

第3章抽样与抽样调查

第3章抽样与抽样调查

第三章抽样与抽样调查抽样调查作为一种现代调查技术,在社会调查研究中有特殊的地位。

抽样调查不仅有其他非全面调查省时刻与经费的优势,同时又有普查能够了解整体的优势。

因此,抽样调查被公以为是一种最完善、最有科学依照的调查方式,在现代社会调查中被愈来愈普遍地应用。

抽样调查的涵义及原理一、抽样与抽样调查抽样调查为科学研究方式中重要的技术之一,是指依照科学的原理和计算从所要研究的现象的全数分析单位中按随机原那么,抽取部份单位进行调查,取得资料后,再依照样本的实际数据对整体的数量特点作出具有必然靠得住程度的估量和判定的方式。

抽样调查旨在以样本的资料来推断调查对象整体的相关统计数据。

抽样调查的特点之一:抽取样本时要遵循“随机原那么”,即产生样本时,调查对象整体中的所有单位都有一样被抽中的机遇。

抽样调查的特点之二:大数规律起作用的条件是样本容量足够大,如此样本对整体才有充分的代表性。

抽样调查的特点之三:抽样误差能够事前通过计算而操纵在必然范围内,而且能采取必然的组织方法来操纵那个误差。

二、抽样的术语●抽样单位。

在社会调查研究中,分析单位是咱们进行信息搜集和分析的大体单位。

而当咱们确信采纳抽样调查进行社会调查时,适应于把分析单位称为抽样单位。

●整体。

整体确实是抽样调查中所有调查对象的集合体,也称母体。

整体中含有的分析单位的数量,叫整体规模或整体单位数(一样用英文字母N表示)。

●样本。

样本是指从整体中抽掏出来的那一部份进行调查的分析单位的集合体。

样本中含有的分析单位的数量,叫样本容量(一样用英文字母n表示),也称样本大小。

如上例中,500确实是样本容量。

●抽样。

抽样特指从整体中抽取部份单位(即从整体中取得样本)的进程。

●抽样框。

抽样框确实是抽样单位的具体化的实际名单。

●随机原那么。

随机原那么是指抽样时,在完全排除主观上人为选择的前提下,使整体中每一个单位有相同的被抽中的机遇。

所谓随机原那么,也叫机遇均等原那么(或等概率原那么)。

抽样检验-第三章概率、概率分布与抽样分布2 精品

抽样检验-第三章概率、概率分布与抽样分布2 精品
概率抽样也叫随机抽样,是指按照随机原则 抽取样本。
概率抽样最基本的组织方式有:简单随机抽 样、分层抽样、系统抽样和整群抽样。
特点
能有效避免主观选样带来的倾向性误差(系统偏 差),使得样本资料能够用于估计和推断总体的 数量特征,而且使这种估计和推断得以建立在概 率论和数理统计的科学理论之上,可以计算和控 制抽样误差,能够说明估计结果的可靠程度。
优点: 抽样时只需群的抽样框,可简化工作量;
调查的地点相对集中,节省调查费用,方 便调查的实施;
当群为总体的一个缩影时,抽样估计误差 小,否则误差较大。
五、多阶段抽样
又称多级抽样。前 4种抽样方法均为一次性直接从总体 中抽出样本,称为单阶段抽样。
多阶段抽样则是将抽样过程分为几个阶段,结合使用上 述方法中的两种或数种。例如,先用整群抽样法从北京 市某中等学校中抽出样本学校,再用整群抽样法从样本 学校抽选样本班级,最后用系统或纯随机抽样从样本班 级的学生中抽出样本学生。
灯泡的使用寿命可以看做是一个随机变量X,如 果能知道X的分布函数F(x),那么F(1000)就是次品率。 但对每只灯泡测试寿命是行不通的。
我们往往会从总体中随机抽取一部分个体,比如 100只灯泡,进行测试,求得分布函数,次品率,并 由此对总体进行推断。
3.4 抽样分布
一、抽样分布的概念
总体与样本
一、简单随机抽样 (simple random sampling)
从总体N个单位中随机地抽取n个单位作为样 本,使得总体中每一个元素都有相同的机会 (概率)被抽中;
抽取元素的具体方法有重复抽样和不重复抽样; 常用方法:抽签法。
特点
简单、直观,在抽样框完整时,可直接从 中抽取样本;
用样本统计量对目标量进行估计比较方便。 局限性

《抽样技术》第三章-分层随机抽样

《抽样技术》第三章-分层随机抽样
记 ran ——简单随机抽样; prop ——按比例分配的分层随机抽样; opt ——最优分配的分层随机抽样。 均值估计量的方差分别用Vran,Vprop,Vopt表示。 从Vopt的定义必定有Vprop≥Vopt。nh (h=1,2, ⋯,L)不取 整时,使用公式

V prop
L
1 f n
则它是Y 的无偏估计。可计算出 1 f 1 2 7 2 2 2 V yst S1 S2 S3 n 10 30 3
2 S12 , S2 , S32 S 2 ,故 由经验知,应有
1 f V yst n 1 f n
1 2 7 2 2 2 S S S 30 3 10 S2 V y
2 h 2 h
1 L 1 L 2 2 2 Wh Sh Wh Sh Wh Sh n h1 N h1 h 1
L 2 h L 2
L
Vopt
W S Wh S 1 1 L 2 Wh Sh Wh Sh nh N n h1 N h1 h 1 h 1 V prop Vopt
2 L L 1 2 Wh Sh Wh Sh n h1 h1 2 1 L Wh Sh S n h1
其中S Wh Sh是Sh的加权平均值。
h 1
L

这是因为
n V prop Vopt Wh S Wh Sh h 1 h1

采用分层技术的主要理由
1.需要有总体的某些分类数据,且要具有规定的精 确度; 2.为便于行政管理而要求分层; 3.总体的各个不同部分的抽样问题可能显著地不同 ,即采用各自不同的抽样方法; 4.分层可能提高整个总体指标估计值的精确度。它 可以将一个内部差异很大的总体分成一些内部比较 相似的子总体。

第三章 抽样检验(5)孤立批计数抽样检验

第三章  抽样检验(5)孤立批计数抽样检验

第三章 3.4孤立批计数抽样检验及GB/T2828.2的使用3.4孤立批计数抽样检验及的使用学习目标要求:1、熟悉孤立批抽样标准的含义及适用情况2、了解的主要使用程序典型考题:典型考题:1、下列适宜使用孤立批抽样方案进行验收的是()。

a.大量稳定生产的产品 b.新试制的一批产品c.临时采购的一小批产品 d.成批稳定投产的产品e.质量波动大的产品批解答:bce。

一、GB/T2828.2的特点一、gb/t2828.2的特点1、适用于对孤立批的检验孤立批是相对于连续批而方的,可以是脱离已生产或汇集连续批系列,不属于当前检验批系列的批。

在生产实际中,孤立通常是指生产不稳定的情况下生产出来的产品批,或者对生产过程质量不太了解的产品批,包括新产品试制或过程调试中的试生产批及从连续稳定生产的供应商处采购的一批或少数批产品。

此时抽样方案的设计往往从使用方的利益出发,着眼于更好的保护使用方的利益。

2、以极限质量LQ为质量指标2、以极限质量lq为质量指标对一个产品批来说,是否被接收,关键取决于生产方或使用方验收时对检验批的质量要求,在中规定了极限质量它是与较低的接收概率相对应的质量水平,是使用方所不希望的质量水平。

在孤立批抽样方案中确保当产品批的质量水平接近极限质量时,批被接收的概率很小。

因此孤立批的抽样方案是通过控制使用方风险来实现对批的质量保证的。

3、根据产品的来源不同将检验分成两种模式由于产品批的来源不同,孤立批抽样方案提供了两种抽样模式。

模式a是在生产方和使用方均认为孤立批的情形下使用,如单件小批生产、质量不稳定产品批、新产品试制的产品批的验收;模式b针对来自于稳定的生产过程的少数几批产品的验收,即对生产方是连续批,而使用方由于对平种产品采购的产品批数较少,对它而言应视为孤立批。

二、GB/T2828.2的使用程序(1)规定单位产品需检验的质量特性,并规定不合格的分类;(2)根据产品批的来源选择合适的抽检模式;(3)规定检索方案所城的要素,检索抽检方案。

  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
2017/7/10 5
三、符号
所有总体参数的估计量都采用下标“st”以示区别:
记 号 代表的含义
h
下标
i
下标
Nh
nh
Yhi
yhi
第 h 层的 第 h 层的 第 h 层第 i 个 第 h 层第 i 个
" 第 h 层" " 层内单位号" 单位总数 样本数 总体单元的取值 样本单元取值


Wh
Nh N
第 h 层的 层权
1
同理,求得:
y2 105
2 s2 2166.667
y3 165
y4 24
2017/7/10
2 s3 8205.556
2 s4 193.333
h 1
2 2 2 1 fh 2 ˆ v Y N Wh v yh N h sh 5.93 108 nh h 1 h 1
h
2 h
1 fh 2 v y st W v y h W sh nh h 1 h 1
L L 2 h
2017/7/10 14
V yst 的一个无偏估计为: 因此,
nh
h
二、对总体总量的估计

总体总量 Y 的估计为:
ˆ ˆ ˆ Y NYst Y h

2017/7/10
25
分别比估计

定义3.4 总体均值 Y 和总体总量 Y的分别 比估计为:
yRS yh Wh yRh Wh Xh xh h 1 h 1
L L yh yh ˆ Nh X h X h Y Rh x x h 1 h 1 h h 1 h L
L

2017/7/10
17

性质3:对于分层随机抽样, 无偏估计为:
ˆ VY
的一个
1 f h 2 ˆ v Y N v y h N sh nh h 1 h 1
L 2 h L 2 h

2017/7/10
18
例3.1

调查某地区的居民奶制品年消费支出,以居民户为抽 样单元,根据经济及收入水平将居民户划分为4层,每 层按简单随机抽样抽取 10户,调查获得如下数据(单 位:元),要估计该地区居民奶制品年消费总支出及 其95%的置信区间。
L
L
2 Nh N h nh Ph Qh Nh 1 nh h1 L
2 1 N h N h nh Ph Qh 2 Nh nh h 1 N
Wh2 1 f h
2017/7/10
h 1
L
Ph Qh nh
23
V pst 的一个无偏估计为: 性质3:对于分层随机抽样,
i 1
2
2 ( y y ) hi h i 1
Nh 1
第 h 层的 总体方差
nh 1
第 h 层的 样本方差
代表的含义
第 h 层的 总体总量
第 h 层的 样本总量
2017/7/10
7
第二节
简单估计量及其性质
一、对总体均值的估计 分层样本,总体均值 Y 的估计
1 Yst Wh Yh N h 1
L
2017/7/10 27
证明

根据比估计量的性质,当 nh 比较大时,有
E( yRh ) Yh
(1 f h ) 2 2 2 ( S yh Rh S xh 2 Rh h S yh S xh ) nh
L h 1
MSE( yRh ) V ( yRh )
L h 1
E ( yRS ) Wh E ( yRh ) WhYh Y
MSE ( yRS ) MSE (Wh yRh ) W MSE ( yRh ) Wh2V ( yRh )
h 1 L
L
V ( yRS )
2017/7/10

W (1 f h ) 2 2 2 (S yh Rh S xh 2Rh h S yh S xh ) nh h 1
Y 因此,由性质1,有 E y st L
h 1
对于分层随机抽样,各层独立进行简单随机抽样, 对每一层有
E y h Yh
V y st Wh2V y h
1 fh 2 Sh 由第二章性质2,得 V y h nh L L 2 2 1 fh 2 Sh 因此 V yst Wh V yh Wh nh h1 h1
N 1 f h 2 1 v pst W v ph 2 sh N h1 nh h 1
L 2 h L 2 h
p h qh W 1 f h nh 1 h 1
2 h
L
2017/7/10
24
第三节 比率估计量及其性质

先“比”后“加权”,此时所得的估计量称为 分别比估计(separate ratio estimator) 先 “加权”后“比”,这样所得的估计量称为 联合比估计(combined ratio estimator)
2017/7/10

12

性质4:对于分层随机抽样, V yst 的一个 无偏估计为:
L 2 h L 2 h
1 fh 2 v y st W v y h W sh nh h 1 h 1
2017/7/10
13
证明性质4:
对于分层随机抽样,各层独立进行简单随 机抽样,由第二章性质3,得 V yh 的无偏 估计为: v y 1 f h s 2
第三章 分层随机抽样
3.1 3.2 3.3 3.4 3.5 3.6 3.7 概述 简单估计量及其性质 比率估计量及其性质 回归估计量及其性质 各层样本量的分配 总样本量的确定 分层抽样的其他方面
2017/7/10
1
第一节
概述
2017/7/10
2
2017/7/10
3
定 义 3.3 分 层 随 机 抽 样 ( stratified random

L
L
N Y hh
h 1
L
分层随机样本,总体均值 Y 的简单估计
1 y st Wh y h N h 1
N
h 1
L
h
yh
8
2017/7/10
估计量的性质

是 Yh 的无 性质1&2:对于一般的分层抽样,如果 Y h 偏估计( h 1,2, , L ),则 Y 是Y 的无偏估计。 st Yst 的方差为:
V pst Wh2V ph
h 1
2017/7/10 22
L
性质2:对于分层随机抽样, pst 是P 的无偏估计,
V ph N h nh Ph Qh N h 1 nh
Nh 1 Nh
因而 pst的方差为:
1 V pst Wh2V ph 2 N h1
2 L 2 h


L
2 ˆ ˆ N W V Yh N h V Yh h1 h1

hL 1


16
2017/7/10

ˆ 的方差为: 性质2:对于分层随机抽样,Y
1 f 2 h ˆ V Y N V yh N Sh nh h1 h1
L 2 h L 2 h
L


1 L 1 L Y WhYh N hYh Yh Y N h1 N h1 N h 1 估计量的方差 L L L L 2 ˆ ˆ ˆ ˆ ,Y ˆ V Yst V WhYh Wh V Yh 2WhWk Cov Y h k h 1 k h h1 h1 由于各层是独立抽取的,因此上式第二项中的协方差全 L ˆ W 2V Y ˆ 为0,从而有 V Y
4

4
4
ˆ v Y ˆ 23208 s Y

ˆ ts Y
2017/7/10

ˆ 209650 2 23208 Y
21
三、对总体比例的估计

总体比例P的估计为:pst Wh ph
h 1
L

估计量的性质
性质1:对于一般的分层抽样,如果 ph是 Ph 的无偏估计 pst 的方差为: (h 1,2,, L ),则 pst 是 P的无偏估计。

L
如果得到的是分层随机样本,则总体总 量的简单估计为:
h 1
Ny Y st
2017/7/10 15
2.估计量的性质
性质1:对于一般的分层抽样,如果 ˆ 是 Y 的无偏估 Yst 是 Y 的无偏估计,则 Y ˆ 的方差为: 计。Y

2 ˆ ˆ ˆ V Y N V Yst V Y h
sampling ):如果每层中的抽样都是独立地按照简
单随机抽样进行的,那么这样的分层抽样称为分层
随机抽样,所得的样本称为分层随机样本
(stratified random sample)。
2017/7/10
4
二、作用



由于每层都进行抽样,这就可使样本在总体中分布 更加均匀,从而具有更好的代表性。 由于抽样在每一层中独立进行,所以一者允许各层 选择不同的适合本层的抽样方法,二则可同时对各 子总体(层)进行参数估计,而不单是对整个总体 的参数进行估计。 由于各层的总体方差因单元之间差异小而肯定小于 整个总体的方差,而抽样精度与此成正比,所以分 层抽样可以提高参数估计的精度。
层 居民户 总数
200 400 750 1500
样本户奶制品年消费支出
1 10 50 180 50 2 40 130 260 35 3 0 60 110 15 4 110 80 0 0 5 15 100 140 20 6 10 55 60 30 7 40 160 200 25 8 80 85 180 10 9 90 160 300 30 10 0 170 220 25
相关文档
最新文档