第三章 抽样设计

合集下载

第三章抽样调查设计习题

第三章抽样调查设计习题

第三章抽样调查设计习题班级学号姓名一.单项选择题:(从下列备选答案中选出1个正确答案,将标号写在题后的括号里)1.我国统计调查方法体系中是以必要的周期性普查为基础,以经常性的()为主体。

A. 重点调查B. 全面报表C. 抽样调查D. 科学推算2.在抽样调查时,对总体不作任何处理,按随机原则抽取调查单位的组织形式称为()。

A.纯随机抽样 B.系统抽样 C.整群抽样 D.分层随机抽样3.在购买力调查中,按收人多少由低至高排列,也可用与调查项目无关的标志为依据,如按户口册、姓名笔划多少排列,然后每隔相等距离抽样,这种抽样方法是()。

A.纯随机抽样 B.系统抽样 C.整群抽样 D.分层随机抽样4.把调查总体分为若干个群体,然后用纯随机抽样法,对抽中群的单位进行全面调查的技术是()。

A.纯随机抽样 B.系统抽样 C.整群抽样 D.分层随机抽样5.把调查总体按其属性不同分为若干层次(或类型),然后在各层(或类型)中随机抽取样本的技术是()。

A.纯随机抽样 B.系统抽样 C.整群抽样 D.分层随机抽样6.如果抽样调查的目的是为了推断总体数值,在抽取样本单位时必须遵守()。

A.随机原则 B.非随机原则 C.系统性原则 D.及时性原则7.在进行概率抽样时,其前提条件是要具备()。

A.较多的调查人员 B.充足的经费 C.固定的样本数 D.抽样框8.调研人员从工作方便出发,在调查对象范围内随意抽选一定数量的样本进行调查,这种抽样方法是()。

A.任意抽样 B.判断抽样 C.配额抽样 D.整群抽样9.抽签法一般用于()方法中。

A.纯随机抽样B. 判断抽样C. 配额抽样D.滚雪球抽样10.抽样调查的主要目的在于()。

A.了解总体的基本情况 B.用样本指标推断总体指标C.对样本进行全面调查 D.了解样本的基本情况二.多项选择题:(在备选答案中选出2~5个正确答案,将标号在题后的括号里)1.下列关于抽样调查正确说法有()。

A、它是一种非全面调查B、按照随机原则选取调查单位C、会存在着抽样误差D、目的在于取得样本指标E、是一种全面调查2.概率抽样的类型主要有()。

第三章-简单随机抽样

第三章-简单随机抽样
不放回也称不重复抽样,每次从总体中随机抽取 一个样本单位,经调查观测后,不再将该单位放 回总体参加下一次抽样,然后再在剩下的总体单 位中随机抽取下一个样本单位进行调查观测,直 到抽够n个样本单位为止。
N!
考虑顺序可能的样本为 N n !
每个样本被抽中的概率为 ( N n)! N!


s2 1358.41, v( y) (1 f )s2 / n 37.6444, se( y) 6.1355
对该校大学生某月电信消费人均支出额的估计为 53.64元,在置信度95%下,临界值1.96,可以说以 95%的把握说明该校大学生该月的人均支出在 [53.64+(-)1.96*6.1355],即41.61~65.67元。
n 1
2n
正态近似产生的误差 主要与nP有关,特别 当nP比较小时,产生 的误差甚大,在95% 置信度下,P<0.5时正 态分布需要的最小nP 值与n值如下表。
P
nP
0.5
0.4
0.3
0.2
0.1
0.05
0
n
15
30
20
50
24
80
40 200
60 600
70 1400
80 无穷
试以95%的置信度估计上例大学生月电信消费超 过80元的人数及其比例。
N n S2 N n
nN
为调查某校大学生的电信消费水平,在全 校N=15230名学生用简单随机抽样抽取 n=36名学生,调查上月电信支出数据。试 以95%的置信度估计该校大学生该月电信 消费的平均支出额。
样本序号 消费元/月 样本序号 消费
样本序号 消费
1
45
13

第三章抽样调查

第三章抽样调查

分层比例抽样计算公式:ni =〔Ni /N〕 × n
ni :第i层应抽取的样本数
Ni :第i层样本总数
N
N :调查母体的样本总数
ቤተ መጻሕፍቲ ባይዱ
n :设定的样本数
分层比例抽样法适用于各层具有清楚差异,各
层外部具有较好分歧性,各层在母体中所占比例不 过火悬殊的市场母体的调查之中。
【例题1】某地域有百货商店10 000户,其中大型、 中型与小型百货商店区分为1000、2000、7000户,当 抽样数为200户时,假定用分层比例抽样法应从各层中 各抽多少个样本?
2、可以依据需求对各层的特性加以比拟;
3、从管理和实施上看,比复杂随机抽样便利得多。
二、分群随机抽样
分群随机抽样是将市场调查母体划分为假定干 个群体,然后将假定干群体作为抽样样本,采用单 纯随机抽样方法确定并对选定群体内的全体样本停 止普遍调查的一种方法。
分群随机抽样与分层随机抽样的区别在于:分 层随机抽样要求层间异质,层内同质;而分群随机 抽样正好相反,它要求群间同质,群内异质。
常用的非随机抽样法主要有:恣意抽样法、 判别抽样法、配额抽样法、系统抽样法。
一、恣意抽样法〔Convenient Sampling〕
恣意抽样法也称便利抽样法,是一种恣意选取 样本的方法。街头拦人法和方便选择法是恣意抽样 法的两种最罕见的方式。 优点:〔1〕无须精心选取样本
〔2〕能及时取得所需的信息 〔3〕省时、省力,浪费调查支出
〔3〕运用范围普遍,特别适用于研讨市场现象的数量 表现;
第二节 抽样调查的基本顺序
抽样调查,特别是随机抽样,有比拟严厉的设计 顺序,只要按一定步骤,才干保证调查的顺利完成, 取得应有的效果。抽样调查普通分为以下几个步骤: 一、确定调查总体和抽样单元 二、确定置信度和最大允许误差 三、确定样本数量 四、选择抽样方式停止抽样 五、搜集样本资料计算样本目的 六、用样本目的推断调查总体目的

初级1 -第三章简单随机抽样

初级1 -第三章简单随机抽样
n
n
n 1 N 1 n N
n 1 N 1
二、实施方法 • 抽签 制作N个同质的签,充分混合。从中一次抽出n个签, 或者先抽出一个签但不放回,再抽下一个签直到抽 满n个签为止。抽出的这n个签对应的单元入选样本, 这是不放回简单随机抽样;若从充分混合的N个签 中抽取一个,记录后放回,再抽取下一个,如此进 行,直到抽满n个为止,则是放回简单随机抽样。 抽签法的实施起来比较麻烦,尤其是当总体单元数 N较大时,所以该方法的使用场合为当总体单元数 N比较小,签的制作比较方便时。
第三章 简单随机抽样

第一节
基本问题
一、什么是简单随机抽样
从 N个单元的总体中抽取 n个单元组成的样本。总体单元数为 N,
样本量为 n。 若抽样是放回的,每次都是从 个总体单元中随机抽取1个单元,独 立重复抽取n次,得到 个单元组成的样本,叫做放回简单随机抽样。 若抽样是不放回的,每次都是从剩下的总体单元中随机抽取1个单 元,相继依次抽取n次,得到n个单元组成的样本,叫做不放回简单 随机抽样。
精度margin of error
对精度的要求通常以允许最大绝对误差
差限)或允许最大相对误差 (相对误差限)来表 示。
r
d(绝对误
d 1 P
P r 1


样本量足够大时,可用正态分布近似
ˆ tS ˆ d t V
2
第三章 基本概念
N n N 1
N n N
为 修正系数
2
为 S 修正系数
n f ,称抽样比, N
2

N n 1 f 有限总体调整系数 故, N 2
S V ( y ) (1 f ) n

抽样调查:不等概率抽样

抽样调查:不等概率抽样
——Sampling with Probability Proportional to Size
总体单元 Yi 规模测度 Mi 0. 在抽取样本单元时,各单元被抽取的概率正比于Mi .
有放回PPS 抽样是常见的一种不等概率抽样方案。每次抽取,第i
单 元Yi 被 抽 中 的 概 率p i



M
响,只有 Mi m时它才入样,因此第 i 个单元入样的概率与
Mi的大小成正比,此时 Zi Mi M0
二、估 值 法
PPS抽样法的估值法的理论依据
定理3.1.1 在有放回PPS抽样下,
是总体总数Y
N
Yi
Yˆ PPS
的无偏估计.
பைடு நூலகம்
1 n
n
i 1
yi pi
i 1
( pi为第i个样本单元yi时的抽取概率,而不是总体中第i单元对应的抽取概率.)
i j ij
j
) yi
yj
,
v2 ( YˆHT
)
Nn
( i
j
ij
i1 ji
ij
) (
yi
i
yj
j
)2 .
注:两估计量均有可能取负值,通过模拟比较,v2较稳定且
较少取负值。
§3.3 Rao-Hartley-Cochran随机分群抽样
拉奥-哈特利-科克伦(1962)
设总体个体单元总数N nM k( 0 k n ) 1. 将总体随机分成n个群 其中k个群有M 1个个体单元,n k个群有M个个体单元; 2. 在每一个群中,以正比于规模测度的概率抽取一个单元 作为样本单元。
估计的均方偏差为:
V(Yˆ PPS
)

第三章建筑结构的检测抽样方法

第三章建筑结构的检测抽样方法
(6)计量抽样检测批的判定,当设计要求相应数值 小于或等于推定上限值时,可判定为符合设计要求;当 设计要求相应数值大于推定上限值时,可判定为低于 设计要求。
28
正态分布概率密度曲线
29
3.3 检验批中异常数据的判断处理
检验批中异常数据的判断处理
1 .依据标准 《正态样本异常值的判断和处理》GB4883
500 1250 2000
281-500 20
50
80
-
-
-
-
检验批的容量和检测类别分为A、B、C 类 A 类:一般施工质量的检测 B 类:结构质量和性能的检测 C 类:结构质量和性能的严格检测。
明显不合格的个体可不纳入检验批,但必须进行处 理,使其满足有关专业验收规范的规定,对处理的情 况应予以记录并重新验收。
2
3.0 基本术语
错判概率:合格批被判为不合格批的概率,即合格批 被拒收的概率,用α 表示。
漏判概率:不合格批被判为合格批的概率,即不合格 批被误收的概率,用 β 表示。
一次抽样检验:只需抽取样本一次,就可以作出是否 接收一批产品的判断。
二次抽样检验:先抽第一样本,若能作出是否接收的 判定,则检验工作终止,否则再抽取第二样本,然 后作出判定。
(1)2-6
0
1
(1)-50 (2)-100
3 9
6 10
(1)-5
0
2
(1)-80
5
9
(2)-10
1
2
(2)-160
12
13
(1)-8
0
2
(1)-125
7
11
(2)-16
1
2
(2)-250
18

第三章 抽样设计

第三章  抽样设计

一、方便抽样
又称任意抽样。一般由调研人员从工作的 方便出发,在调研对象的范围内随意抽取 一定数量的样本进行调查。
最常用的两种方法是“街头拦截法” 最常用的两种方法是“街头拦截法”和 “空间抽样法” 空间抽样法” 特点: 节约费用和时间,但样本的信息不 适用于总体参数的推断。
注意:
方便抽样一般用于非正式的探索性调查, 只有在调查总体各单位之间的差异不大时, 抽取的样本才有较高的代表性。
抽取样本的数量
允许误差 % 1 2 3 4 5 6 7 可信程度(把握程度)% 95 99 9600 16589 2400 4147 1067 1849 600 1037 384 663 267 461 196 339
一、简单随机抽样
适用范围:调查总体中各个体之间差异程 度较小的情况下,或者调研对象不明,难 以分组、分类的情况。 常用方法: 1、抽签法 2、随机数表法
二、系统抽样
又称等距抽样,就是先将调查总体的各个 体按照一定的标志排列起来,然后按照固 定的顺序和一定间隔来抽取样本个体。
排队的标志有两种: 1、按调查项目有关的标志排队 2、按调查项目无关的标志排队
(独立控制配额)按年龄分组: 独立控制配额)按年龄分组:
按年龄分组 18-29岁 18-29岁 30-40岁 30-40岁 41-55岁 41-55岁 56岁 56岁 合计 人数 40 60 70 30 200
按性别分组
性别 人数 100 100 200


合计
相互控制配额抽样
合计 40 60 70 30 收入 性别 年龄 18-29岁 18-29岁 30-40岁 30-40岁 41-55岁 41-55岁 56岁以上 56岁以上 合计 高 男 3 6 6 3 18 女 4 5 6 3 18 中 男 7 11 13 6 37 女 8 11 13 5 37 低 男 9 13 16 7 45 女 9 14 16 6 45

市场抽样调查

市场抽样调查

第三章市场抽样调查要点第一节市场抽样调查的特点一、市场抽样调查的涵义市场抽样调查有广义和狭义之分。

广义的抽样调查包括随机抽样和非随机抽样;狭义的抽样调查只包括随机抽样。

随机抽样调查:是从研究对象的总体中,按照随机原则抽取一部分单位作为样本进行调查,并用对样本调查的结果来推断总体。

随机原则:是指调查总体的每个单位都有同等被抽中或不被抽中的概率,即样本的抽取完全是客观的,而不能主观地、有意识地选择样本。

二、抽样调查的特点1、抽取样本的客观性2、抽样调查可以比较准确地推断总体3、抽样调查是一种比较节省的调查方法4、抽样调查的应用范围广泛,特别适用于研究市场现象的数量表现三、市场抽样调查的程序1、确定调查总体2、设计和抽取样本3、收集样本资料,计算样本指标4、用样本指标推断调查总体指标第二节随机抽样方式一、单纯随机抽样单纯随机抽样:又称纯随机抽样,是指在抽样之前对总体单位不进行任何分组、排列等处理,完全按随机原则从总体中抽取样本的抽样方法。

单纯随机抽样的具体方法有:直接抽取法、抽签法、随机数表法单纯随机抽样的优点:1)完全符合随机原则2)应用简单易行单纯随机抽样的缺点:1)在总体很大的情况下使用,编号工作繁重2)当总体单位差异程度较大时,必须使样本容量充分大才能保证样本推断总体的可靠程度和准确程度3)所抽取的样本在总体中的分布或是过于集中,或是过于分散,很不均匀,给实际调查带来困难二、等距随机抽样等距随机抽样:又称机械随机抽样或系统随机抽样,是先将总体各单位按某一标志顺序排列,编上序号;然后用总体单位数除以样本单位数求得抽样间隔,并在第一个抽样间隔内随机抽取一个单位作为组成样本的单位;最后按计算的抽样距离作等距抽样,直到抽満n 个单位。

等距随机抽样的优点:1)能使样本在总体中的颁比较均匀2)能够减小抽样误差等距随机抽样方法在应用时,要特别注意:抽样间隔与现象本身规律不可重叠等距随机抽样方法最适用于:同质性较高的总体三、类型随机抽样类型随机抽样:又称分层随机抽样,是先将总体按一定标志分成各种类型(或称层);然后,根据各类单位数占总体单位数比重,确定从各类型中抽取样本单位的数量;最后,按单纯随机抽样或等距随机抽样从各类型中抽取样本的各单位,最终组成调查总体的样本。

第三章调查设计备课

第三章调查设计备课
况、过程和特征进行客观、准确的描述,即描述社会 现象是什么,它是如何发展的,它的特点和性质是什 么。这种描述通常是要发现总体在某些特征上的分布 状况。
焦 点
描述性调查(descriptive surveys)所关注的焦点
通常不在于为什么会存在这样的分布,而在于回答这
种分布是怎样的。
也可以说,描述性调查的主要目的是收集资料, 发现情况,提供信息,特别是从杂乱的现象中,描述 出主要的规律和特征。
2.分析单位的类型
(1).个人 个人是社会调查研究中最常用的 分析单位,大部分社会研究都要通过分 析个人特征来解释和说明各种社会现象
Eg:某城市就业问题的调查。
以个人作为分析单位的描述性研究一般旨在描述由那
些个人所组成的总体。而那些以个人为分析单位的解释
性研究则是为了发现存在于总体中的社会动力。
Eg:不同年收入家庭的房产拥有率
(3).组织--企业、学校、医院、机关
各种正式的社会组织(有意识建构,完成特定目标) 也可以成为社会研究中的分析单位。社会组织是社会
的基本构成单位,它是社会研究的重要对象。社会研 究一般要分析某一组织在社会系统中的位置和功能, 它与其他部门的联系以及组织内部的结构与人际关系 等。Eg:工科与文科高校就业率比较
三、设计抽样方案
1.调查对象、研究对象和抽样对象
研究对象就是社会调查中的分析单位, 它是社会调查中所要描述和分析的对象。 Eg:当前大学生的择业倾向是什么
调查对象即回答者,指的是我们在调查
中 (通过自填问卷或结构访问的方式)
所询问的对象。所有的调查对象都是且
只能是社会中各种类型的个人。
抽样对象也称为抽样单位,指的是一次直接 抽样时所采用的对象或单位。

03第三章 简单随机抽样

03第三章  简单随机抽样

首先,在理论上最符合随机原则.对此可有二 种理解:一种是总体中各个单位被抽中的机会 相等.设总体有N个单位,各单位被抽中的概 1 率均为 N.另一种是总体中各个样本被抽中的 概率相等.我们知道,一个总体N中可以抽取 许多个容量为n 的样本,通常情况下按组合形 n C N个样本,那么,在一次抽样中,某个样 式有 1 本被抽中的概率为C ,这个概率对每个可能的 样本都相等.简单随机抽样遵循这种等可能性 原则,为进行抽样估计,计算抽样误差,提供 了重要前提条件.
Y3 + Y4 2
可见,样本均值 y 是 Y 的一个无偏估计量,因为
1 Yi + Y j 1 3 4 E ( y ) = ∑∑ ( ) = ∑∑ (Yi + Y j ) 2 12 i =1 j i i =1 j i 6
3 4
而每个单元均可能在三个样本内出现,故
1 4 E ( y ) = ∑ 3Yi = Y 12 i =1
颜色 蓝 绿 红 白 黄 合计
人的编号 1 14 28 15 25 18 2 26 21 12 23 18 3 20 15 20 20 25 4 12 21 22 19 26
期望 数字 20 20 20 20 20 100
100 100 100 100
可见四个人都对颜色存在偏好,如第一个人偏爱绿色, 第二个人偏爱蓝色等.这种由于对颜色偏好所引起的偏估 类型,可称之为颜色偏误. 结论:随意抽样≠随机抽样
n N
其次,它是设计其他更复杂抽样形式的基础. 例如,设计分层抽样,将总体划分为若干层, 然后对各个层实施简单随机抽样.对一个非常 大的总体,需要分若干个阶段进行抽样.例如, 进行全国性抽样调查,第一阶段可以由全国抽 取若干个省份,第二阶段再由抽中的省份抽取 若干个县(市);第三阶段再由抽中的县(市)抽 取若干个乡(街道);第四阶段再由抽中的乡 (街道)抽取若干个村(居委会)等等.在这种多 阶段抽样中,每个阶段中抽取样本单位均可采 用简单随机抽样方法.

03第三章 简单随机抽样(SRS)

03第三章 简单随机抽样(SRS)


总体均值的比估计 总体总值的比估计 总体均值的回归估计
ˆ y RX ˆ YR R
ˆ ˆ ˆ YR RX NRX


ˆ Ylr y ( X x )

总体总值的回归估计
ˆ Ylr y ( X x) N y ( X x )

抽样可以是放回的,也可以是不放回的。如果 抽样比非常小,则放回抽样与不放回抽样实际 上是差不多的。一般情况下,不放回抽样的结 果更精确,实际操作也更方便些。在本课程中, 除非特别指明,抽样都是指不放回的。

简单随机抽样一般有抽签法和随机数法 两种实施方法。
7
简单随机抽样的抽样规则:



1)按随机原则取样,在取样时排除任何主 观因素选择抽样单元,避免任何先入为主 的倾向性,防止出现系统误差。 2)每个抽样单元被抽中的概率都是已知或 事先确定的,或者事先可以计算出来。 3)每个抽样单元的概率都相等,即简单随 机抽样属于一种等概率随机抽样。


所有概率抽样的出发点和理论基础都是简单随 机抽样。简单随机抽样是一种一步抽样法,它 保证样本量为n的每个可能的样本都有相同的 被抽中的概率p=n/N。 简单随机抽样有三个相互等价的定义:

4



定义1: 从总体的N个单元中,一次整批抽取n个单元 ,使任何一个单元被抽中的概率都相等,任何n个不同 单元组成的组合被抽中的概率也都相等,这种抽样称 为简单随机抽样。 定义2:从总体中的N个单元中,逐个不放回地抽取单 元,每次抽取到尚未入样的任何一个单元的概率都相 等,直到抽足n个单元为止,这样所得的n个单元组成 一个简单随机样本。 定义3:按照从总体的N个单元中抽取n个单元的所有 n n C N个样本,从C N 个样 可能不同的组合构造所有可能的 本随机抽取1个样本,使每个样本被抽到的概率都等于 n 1/C N ,这种抽样称为简单随机抽样

第三章抽样1

第三章抽样1

• 第三:评价样本
• (1)计算总体偏差率 )计算总体偏差率——样本的偏差率就是对总 样本的偏差率就是对总 体偏差率的最佳估计,但必须考虑抽样风险。 体偏差率的最佳估计,但必须考虑抽样风险。 • 考虑抽样风险: 考虑抽样风险: • 使用统计公式——总体偏差率上限=风险 总体偏差率上限= ①使用统计公式 总体偏差率上限 系数÷ 系数÷样本量 • ②使用样本结果评价表 (P40---43) • (2)分析偏差的性质和原因 )分析偏差的性质和原因——注册会计师应对 注册会计师应对 偏差性质和原因进行分析。 偏差性质和原因进行分析。 • (3)得出总体结论 )
• (三)审计抽样的适用范围 • 1.当控制的运行留下轨迹时,可考虑使用审 计抽样实施控制测试。对未留下运行轨迹 的哦,不涉及审计抽样。 • 2.实质性程序包括对各类交易、账户余额、 列报的细节测试,以及实质性分析程序, 对细节的测试可以使用审计抽样,在实施 分析程序时不宜使用审计抽样。
(四) 审计抽样的种类
• ②非统计抽样:非抽样风险无法直接计量, 通常将样本偏差率与可容忍偏差率相比较, 以判断总体是否可以接受。 如样本偏差率大于可容忍偏差率,则总 体不能接受。 如样本偏差率低于可容忍偏差率,如果 大大低于,则可以接受;不是大大低于, 不可以接受。
(2)细节测试中样本结果的评价
细节测试:对实质性程序进行分类中的一种(实质性程序分为细节测试 和实质性分析程序),细节测试是对各类交易、账户余额、列报的具 体细节进行测试。
• 2.形成审计结论:(考虑抽样风险) (1)控制测试中的样本结果评价: • ①统计抽样 注册会计师确定的依赖过度风险条件下可能发 生的偏差率上限的估计值。 • 偏差率上限估计值=总体偏差率+抽样风险允许限 度

第三章简单随机抽样(抽样调查理论与方法-北京商学院,

第三章简单随机抽样(抽样调查理论与方法-北京商学院,

100,95,92,88,83,75,71,62,60,50
平均分为77.6。先从中任选3个为一组样本,其选法共有120种
每种选法都有概率1/120。以4组样本为例(100,95,92),(100,83,
50),(88,83,62),(62,60,50)它们的样本平均数分别为95.67,
77.67,77.67,57.33。 从抽样调查的角度来看,我们希望抽到第二或第三组样
(3.6)
N 1 n
Nn
对随机有放回抽样,由于各次抽取是相互独立的,由概率论 的知识可以求得,此时:
2
Var( y) n
1 S2 (或 (1 ) ) (3.7)
Nn
比较(3.6)式与(3.7)式,发现同样用样本平均数来估计总体平 均数,它们都是无偏估计,但随机无放回时的方差小于随机
有放回时的方差。 y 的方差表示新盒子的离散程度,也就是 表示了 y 取值范围的大小,方差小表明 y 取值远离中心Y 的 可能性较小,这样随机的一组样本得到 y 的实现值距Y 很近
相当小,此时(3.6)式告诉我们 y 的方差将随着 n 的减少而增 大,此时 1-f 在 1 附近,对Var( y)的影响不大。事实上,
抽取样本越少,抽样误差越大。
可见实际抽样调查中用 y 估计Y 所产生的随机误差,也 即 y 的方差,主要受到样本容量 n 的影响,因子1-f 的影响
几乎可以忽略。
当然,影响 y 的方差的另一个重要因素是 2或 S 2。设
通常取决于总体单元个数N,满足10m1 N 10m。记m个 骰子按约定颜色而确定的顺序读得随机数R0,若R0 N,则 此 R0即为一次合格的随机数;否则予以放弃,重新摇取,直
到取到n个合格的随机数为止。 ③利用计算机产生随机数:不少现成的统计软件都可提供此 类服务。但必须指出,这样产生的随机数一般不能保证其随 机性,称为“伪随机数”。因此,提倡前述方法产生随机数。

数理统计第3章 随机抽样与抽样分布

数理统计第3章 随机抽样与抽样分布

E ( X i ) = E ( X ) = µ , D( X i ) = D( X ) = σ 2 , i = 1,2,L , n
1 n 1 n 所以 E ( X ) = E ( ∑ X i ) = ∑ E ( X i ) = µ , n i =1 n i =1
1 1 . D ( X ) = D( ∑ X i ) = 2 ∑ D( X i ) = n n i =1 n i =1
11
它反映了总体 二、样本数字特征 均值的信息 它反映了总体 1 n 样本均值 X = ∑Xi 方差的信息 n i=1 1 n 1 n 2 2 2 2 样本方差 S = ∑( Xi − X) = n −1 ∑Xi − nX n −1 i=1 i =1
推导: 推导:
( Xi − X)2 = ∑( Xi2 − 2Xi X + X 2 ) ∑
因此, 应视为一组随机变量, 因此,抽样值 ( x1 , x2 ,L, xn ) 应视为一组随机变量,我们把 的一个样本 子样), 样本( ),其中 称为该样本的容量 容量。 它称为总体 X 的一个样本(或子样),其中 n 称为该样本的容量。
7
二、简单随机抽样
由于抽样的目的是为了对总体的分布进行统 计推断, 计推断,为了使抽取的样本能很好地反映总体的 信息,必须考虑抽样方法 信息,必须考虑抽样方法. 最常用的一种抽样方法叫作“ 最常用的一种抽样方法叫作“简单随机抽 它要求抽取的样本满足下面两点: 样”,它要求抽取的样本满足下面两点: 1. 代表性: X1,X2,…,Xn中每一个与所考察的总体 代表性: 有相同的分布. 有相同的分布 2. 独立性: X1,X2,…,Xn是相互独立的随机变量 独立性: 是相互独立的随机变量. 由简单随机抽样得到的样本称为简单随机样本 简单随机样本, 由简单随机抽样得到的样本称为简单随机样本, 今后如不加声明,均指简单随机样本。 今后如不加声明,均指简单随机样本。

第3章抽样与抽样调查

第3章抽样与抽样调查

第三章抽样与抽样调查抽样调查作为一种现代调查技术,在社会调查研究中有特殊的地位。

抽样调查不仅有其他非全面调查省时刻与经费的优势,同时又有普查能够了解整体的优势。

因此,抽样调查被公以为是一种最完善、最有科学依照的调查方式,在现代社会调查中被愈来愈普遍地应用。

抽样调查的涵义及原理一、抽样与抽样调查抽样调查为科学研究方式中重要的技术之一,是指依照科学的原理和计算从所要研究的现象的全数分析单位中按随机原那么,抽取部份单位进行调查,取得资料后,再依照样本的实际数据对整体的数量特点作出具有必然靠得住程度的估量和判定的方式。

抽样调查旨在以样本的资料来推断调查对象整体的相关统计数据。

抽样调查的特点之一:抽取样本时要遵循“随机原那么”,即产生样本时,调查对象整体中的所有单位都有一样被抽中的机遇。

抽样调查的特点之二:大数规律起作用的条件是样本容量足够大,如此样本对整体才有充分的代表性。

抽样调查的特点之三:抽样误差能够事前通过计算而操纵在必然范围内,而且能采取必然的组织方法来操纵那个误差。

二、抽样的术语●抽样单位。

在社会调查研究中,分析单位是咱们进行信息搜集和分析的大体单位。

而当咱们确信采纳抽样调查进行社会调查时,适应于把分析单位称为抽样单位。

●整体。

整体确实是抽样调查中所有调查对象的集合体,也称母体。

整体中含有的分析单位的数量,叫整体规模或整体单位数(一样用英文字母N表示)。

●样本。

样本是指从整体中抽掏出来的那一部份进行调查的分析单位的集合体。

样本中含有的分析单位的数量,叫样本容量(一样用英文字母n表示),也称样本大小。

如上例中,500确实是样本容量。

●抽样。

抽样特指从整体中抽取部份单位(即从整体中取得样本)的进程。

●抽样框。

抽样框确实是抽样单位的具体化的实际名单。

●随机原那么。

随机原那么是指抽样时,在完全排除主观上人为选择的前提下,使整体中每一个单位有相同的被抽中的机遇。

所谓随机原那么,也叫机遇均等原那么(或等概率原那么)。

第三章_审计抽样..

第三章_审计抽样..


(3) 抽样结果评价
① 分 析 样 本 误 差
② 推 断 总 体 误 差
③ 重 估 抽 样 风 险
④ 形 成 审 计 结 论
4、控制测试中的审计抽样
控制测试中的审计抽样,通常被称作属性抽样。属性抽 样用于检查内部控制制度情况。它是通过对样本检查的结 果,推断总体中某些特征或属性发生的频率或次数,借以 评价客户的内部控制是否值得信赖并为实质性程序提供依 据。 所谓属性,是指审计对象总体的质量特征,即被审业务 或内部控制是否遵循了既定的标准以及存在差错水平。 属性抽样主要有固定样本量抽样、停一走抽样、发现抽 样三种方法。
• • 是否遵守或符合内部控制的要求,即只有在将验收报告与进货发票核 对相符后,才核准支付采购货款。审计人员按以下步骤进行抽查: ① 确定审计目标。 由于购货发票内部控制的要求是只有将验收报告与进货发票核对相 符后,才核准支付货款,则审计人员只会对该程序操作的准确性以及 进货发票与验收报告相核对的控制程序是否正常运行感兴趣。 ② 确定审计对象总体与抽样单元。 假定公司对每笔采购业务均采用连续编号的凭单,在每张凭单的后 面应附有验收报告与发票。因此,抽样单元是个别的凭单。如果测试 是年终进行的,则审计对象总体为本年度12个月内的所有购货凭单。
② 系统选样
• 系统选样也称等距选样,是指首先计算选样间隔,确定随 机起点,然后按照间隔,顺序选取样本的方法。 选样间隔=总体规模÷样本规模
• 【案例分析】审计人员拟采用系统抽样从2 000张销货发票中选取200 张作为样本,则选样间隔为10。假定审计人员把第101号发票作为随 机起点,每隔10张凭证选取一个样本,则所选取的样本号码依此为: 101、111、121、131、141、151……

简单随机抽样

简单随机抽样
25
对于简单随机抽样,总体均值的估计量为:
yi ˆ Y y i 1 n
n
其中,n是样本量,yi是样本中第i个单元的值, 对应某特定样本的值即是估计值。也就是说,将样 本中所有yi的值加起来再除以样本量就得到了总体 平均数的估计值。
26
在简单随机抽样中,y 既是总体均值的一致 估计,也是总体均值 Y 的无偏估计。
29
ˆ 2 的 选 取 , 我 们通 常 使用 样 本 方 对 于估 计 量 S 2 n 差s 。 ( yi y ) 2 可以证明: 2 i
s
N i

n 1
是总体方差 S 2
2 ( y Y ) i
N 1
的无偏估计量。
30
三、其他估计量 当总体为正态分布时,用 Me(中位数)来估 计Y 。 可以证明:
第三章 简单随机抽样(SRS)
第一节 概述
第二节
第三节
估计量及其误差
样本量的确定
1
第一节
一、定义
概述
二、抽取方法
三、方法评估 四、两个试验
2
一、定义
所有概率抽样的出发点和理论基础都是简单 随机抽样。简单随机抽样是一种一步抽样法,它 保证样本量为n的每个可能的样本都有相同的被抽 中的概率p=n/N。
24
如果一个估计量对于所有可能样本计算的估 计值的平均数等于参数的真值,称这个估计量是 无偏的。 另一个所需要的估计量的性质是它的抽样分 布应与其平均数尽可能地靠拢。对这种性质的一 个度量指标是抽样方差。 我们通常希望估计量具有一些好的性质:其 中的一个性质就是估计量应是无偏的或近似无偏 的,另一个是抽样方差较小的估计量被认为是精 确的:抽样方差越小,估计的精度越高。
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

第三章 抽样设计
22
高 男 18-29 3 女 4 男 7
中 女 8 男 9
低 合计 女 9 40 (20%)
30-40 41-55
56以上 小计 合计
6 6
3 18
5 6
3 18
11 13
6 37
11 13
5 37
13 16
7 45
14 16
6 45
60 (30%) 70 (35%)
30 (15%) 200
第三章 抽样设计 40
系统抽样与简单随机抽样相比,可使中 选个体比较均匀地分布在调研总体中, 尤其当被研究现象的标志变异程度较大, 而在实际工作中又不可能抽选更多的样 本个体时,这种方式更为有效,因此系 统抽样是市场调研中广泛应用的一种抽 样方式。
第三章 抽样设计
41
系统抽样也有一定的局限性,表现在: 运用系统抽样的前提是要有调研总体每 个个体的有关材料,特别是按有关标志 排队时,往往需要有较为详细、具体的 相关资料,这是一项很复杂和细致的工 作。
第三章 抽样设计
16
(1)独立控制配额抽样。独立控制配额 抽样是根据调研,总体的不同特性,对 具有某个特性的调查样本分别规定单独 分配数额,而不规定必须同时具有两种 或两种以上特性的样本数额。因此,调 查者就有比较大的自由去选择总体中的 样本。
第三章 抽样设计
17
例如,在某项调查中,确定样本总数为 180个,可单独选择消费者收人、年龄、 性别三个标准中的一个进行抽样。按独 立控制配额抽样,其各个标准样本配额 比例及配额数如表所示。
第三章 抽样设计
27
第三节 概率抽样
概率抽样又称为随机抽样,是对总体中 每一个体都给予平等的抽取机会的抽样。 在概率抽样的条件下,每个个体抽中或 抽不中完全凭机遇,排除了人的主观因 素的影响。概率抽样主要有四种:
第三章 抽样设计
28
1、简单随机抽样 简单随机抽样是概率抽样技术中最简单 的一种,它对调研总体不经过任何分组、 排队,完全凭着偶然的机会从中抽取个 体加以调查。
36 (18% )
74 (37%)
第三章 抽样设计
90(45%)
23
从表可以看出,相互控制配额抽样对每 一个控制特性所需分配的样本数都做了 具体规定,调查者必须按规定在总体中 抽取调查个体,由于调查面较广,从而 克服了独立控制配额抽样的缺点,提高 了样本的代表性。
第三章 抽样设计
24
4、滚雪球抽样 滚雪球抽样的主要目标是分析调研总体 的稀有特征。
第三章 抽样设计
32
抽样选择时,在随机数表中任意选定一行 或一列的数字作为开始数,接着可从上而 下、或从左至右,或以一定间隔(隔行或 隔列)顺序取数,凡编号范围内的数字号 码即为被抽取的样本。如果不是重复抽样, 碰上重复数字应舍掉,直到抽足预定样本 数目为止。在顺序抽取的过程中,遇到比 编号大的数字,应该舍去。
第三章 抽样设计
42
当抽选间隔和被调查对象本身的节奏性 (或循环周期)相重合时,就会影响调 查的精度。
第三章 抽样设计
43
ห้องสมุดไป่ตู้
3、分层随机抽样 分层随机抽样在市场调查中较多地被采 用,它是先将调查总体的所有个体按某 一重要标志进行分类(组),然后在各 类(组)中采用简单随机抽样或系统抽 样方式抽取样本个体的一种抽样方式。
第三章 抽样设计
44
分层抽样的方式一般有等比例抽样与非 等比例抽样两种。 (1)等比例分层抽样。等比例分层抽样 是按各层(或各类型)中的个体数量占 总体数量的比例分配各层的样本数量。
第三章 抽样设计
45
例如,某地共有居民20000户,按收人高 低进行分类,其中,高收入居民为4000 户,占总体的20%;中等收人为12000户 ,占总体的60%;低收入为4000户,占 总体的20%。从中抽选200户进行购买力 调查,则各类型应抽取的样本个体数为 :
第三章 抽样设计
25
在滚雪球抽样技术中,通常采用随机方式选 择一组调查对象或个体,在对他们进行调查 后,根据他们所提供的信息或由他们推荐选 择下一组调查对象或个体。这样,通过上一 组选择下一组,像滚雪球一样一波一波地继 续下去,直到调查结束。
第三章 抽样设计
26
滚雪球抽样技术的主要目的是分析调研 总体中的稀有特征。例如,在劳务市场 调查有关保姆问题时先访问了七名保姆, 然后请她们再提供其他保姆名单,逐步扩 大到近百名通过对这些保姆的调查对保 姆的源地、从事工作的性质经济状况等 有了比较全面的掌握。
13
3、配额抽样 配额抽样是按照一定标准,分配样本数 额,然后在规定数额内由调查人员任意 抽选样本的一种抽样方法。
第三章 抽样设计
14
配额抽样是非概率抽样中最流行的一种 。运用配额抽样技术进行抽样,要按照 一定标准分配样本数额,并在规定数额 内由调查人员任意抽选样本。
第三章 抽样设计
15
按照配额的要求不同,配额抽样可分为 独立控制配额抽样和相互控制配额抽样 两大类。
第三章 抽样设计 33
例如,现在要从80户居民中抽取10户进 行收入调查,先将80户居民从1到80进行 编号,然后假设从随机数表中第一行的 第五列开始自左向右、自上而下取样, 那么顺序取得的样本号为: 74、 13、 45、 2、 67、42、 15、 57、 80、04。 由于92 和90大于80, 20出现重复,只能用一次, 故92、90、第二个20舍弃不用。
第三章 抽样设计 10
1、任意抽样 任意抽样又称为便利抽样法。它是调查 人员按工作的方便,随意抽选样本的一 种抽样方法。运用任意抽样技术进行抽 样,一般由调研人员从工作方便出发, 在调研对象范围内随意抽选一定数量的 样本进行调查。“街头拦人法”和“空 间抽样法”是任意抽样的两种最常见的 方法。
第三章 抽样设计 11
(一)抽样方案设计的基本内容 1、确定抽样调查的目的; 2、确定调查对象(总体)的范围的抽样单位; 3、确定抽取样本的方法; 4、确定必要的样本量; 5、对主要抽样指标的精度提出要求; 6、确定总体目标量的估算方法; 7、制订实施总体方案的办法和步骤。
第三章 抽样设计 6
(二)抽样方案设计的主要程序
第三章 抽样设计
38
在排队的基础上,还要计算抽选距离(间 隔),计算公式为: 抽选距离=N/n 确定抽选距离之后,可以采用简单随机抽样 方式,从第一段距离中抽取第一个个体,为 简化工作并防止出现某种系统性偏差,也可 以从距离的1/2处抽取第一个个体,并按抽选 距离继续抽选余下的个体,直到抽够为止。
第三章 抽样设计
3
抽样调查分为概率抽样和非概率抽样两 类,通常我们所说的抽样调查,如果未 加限定,大多指概率抽样调查。
第三章 抽样设计
4
二、抽样调查的特点
抽样调查方法的特点具体表现在如下几 个方面: 第一、时间短、收效快。 第二、质量高、可信程度好。 第三、费用省、易推广。
第三章 抽样设计
5
三、抽样方案设计
第三章 抽样设计 34
简单随机抽样的优点是方法简单,当调 研总体名单完整时,可直接从中随机抽 取样本,由于抽取概率相同,计算抽样 误差及对总体指标加以推断比较方便。 尽管简单随机抽样在理论上是最符合随 机原则的,但在实际应用中则有一定的 局限性,表现在:
第三章 抽样设计
35
采用简单随机抽样,一般必须对总体各个体加 以编号,而实际所需调查的总体往往是十分庞 大的,个体非常多,逐一编号几乎是不可能的。 对于某些事物无法适用简单随机抽样,例如, 对连续不断生产的大量产品进行质量检验,就 不能对全部产品进行编号抽样。 当调研总体的标志变异程度较大时,简单随机 抽样的代表性就不如经过分组后再抽样的代表 性高。
2、判断抽样 判断抽样又称为目的抽样法。这是一种 根据调查人员的经验或某些有见解的专 家选定样本的抽样方法。
第三章 抽样设计
12
判断抽样方法是凭调查人员的主观意愿 、经验和知识,从总体中选择具有典型 代表性的样本作为调查对象的一种抽样 方法。这种方法在我国市场调研中得到 了广泛的运用。
第三章 抽样设计
建立抽样框 确定调查总体 选择调查样 本 实施调查
测算结果
第三章 抽样设计
7
确定调查总体,即明确调查的全部对象 及其范围。 抽样框是指供抽样所用的所有被调查对 象的详细名单。 抽样框确定之后,还要确定具体的抽样 方法,例如,是选择纯随机抽样、分层 抽样,系统抽样还是整群抽样等等。
第三章 抽样设计 8
第三章 抽样设计
18
年龄
人数
性别 男 女
人数 100 100
收入 高 中 低
人数 36 74 90 200
18-29
30-40 41-55 56以上 合计
40
60 70 30 200
合计
200
合计
第三章 抽样设计
19
从表可以看出,对年龄、性别、收人三个 控制特性分别规定了样本数额,而没有规 定三者之间的关系。 因此,在调查人员具体抽样时,抽选不同 收入段消费者,并不需要顾及年龄和性别 标准。同样,在抽选不同年龄或性别的消 费者时,也不必顾及其他两个控制特性。
第三章 抽样设计
第一节 抽样调查的基本思想 第二节 非概率抽样 第三节 概率抽样 第四节 抽样误差及其测定 第五节 抽样数目的确定与总体资料的推 算
第三章 抽样设计
1
第一节 抽样调查的基本思想
抽样调查的概念 抽样调查的特点 抽样方案设计
第三章 抽样设计
2
一、抽样调查的概念
抽样调查也称样本调查。它是按照随机 原则,从研究总体的所有单位中,抽取 部分单位作为样本,然后以样本的观测 或调查结果对总体的数量特征作出具有 一定可靠程度和精确度的估计或推断的 一种调查方法。
相关文档
最新文档