第六章抽样调查资料

合集下载

自考-市场调查与预测-第6章-抽样方法

自考-市场调查与预测-第6章-抽样方法

1 定义总体 确定调查对象全体:从抽样元素、抽样 单位、抽样范围、抽样时间角度考虑 例如…

2 确定抽样框架 抽样总体中,抽样元素的表现形式。总体中 的每一个元素都在抽样框架中出现一次,且 仅出现一次。如户籍簿。 适用性、完整性。 3 确定抽样单位 容纳总体的基本单位,大于等于样本元素。 取决于抽样框架和调查方法。 电话调查——电话号码 邮寄调查——地址或姓名

B 平均值估计 C 百分比估计样本容量

根据允许误差大小估计样本量
不同抽样方法样本容量的确定 影响因素: 调查目的;总体大小;总体构成;抽样方式 计算公式:见表6-4

其它调查方法介绍
2、自愿样本
被调查者自愿参加,成为样本中的一分子,向
调查人员提供有关信息

例如,参与报刊上和互联网上刊登的调查问
第6章 抽样方法
普查与抽样调查 抽样程序
常用抽样方法
样本容量的确定
6.1普查与抽样调查
抽样设计的重要性 案例6-1 普查的相关概念和案例 P159 抽样调查的概念 抽样是通过抽取总体中的部分单位,收集 这些单位的信息,从而对总体进行推断的 一种手段。 抽样调查的含义 P163 抽样调查的适用范围
第一节 抽样方法

6.3 常用抽样方法
1 简单随机抽样 2 分层随机抽样 3 分群随机抽样 4 等距随机抽样 5 任意抽样 6 判断抽样 7 配额抽样 8 滚雪球抽样

1 简单随机抽样 1、抽样方法 根据研究目的选定总体,首先对总体中所 有的观察单位编号,遵循随机原则,采用不放 回抽取方法,从总体中随机抽取一定数量观察 单位组成样本。 2、具体方法 ①抽签法

市场调查-第六章抽样技术

市场调查-第六章抽样技术

N = 721, n = 10, 721/10≈72
K =
用随机数表法,如果第一个确定的数字为102,则 各样本单元编号依次为:102,174,246,318, 390,462,534,606,678,29。其中最后一个编 号应为678 + 72 = 750。因大于N,故减去721,实 际编号取为750- 721 = 29。
多级随机抽样是先把总体划分为 若干一级单元,再把各个一级单 元划分为若干个二级单元,直至 不再划分的个体单元。在抽样时, 先用简单随机抽样方法抽取部分 一级单元,再在抽中的一级单元 中抽取部分二级单元,依次操作, 直到抽得个体单元为止。
多级随机抽样——demo
我国城市住户调查采用的就是多 级抽样,先从全国各城市中抽取 若干城市,再在城市中抽选街道, 然后在各街道中抽选居民会,最 后在各居委会中抽选居民户。
低收入 20%
高收入 20%
中收入 60%
高收入 中收入 低收入
分层比例抽样法
高收入层抽取的样本单元数为: 200×20%=40(户) 中收入层抽取的样本单元数为: 200×60%=120(户) 低收入层抽取的样本单元数为: 200×20%=40(户)
在各层抽样时,只需采 用简单随机抽样法即可。
2、分层最佳抽样法
二、分层随机抽样
分层随机抽样是先将总体所有单位按 某一重要标志进行分层(类),然后在 各层(类)中采用简单随机抽样方式抽 取样本单位的一种抽样技术形式。在 划分层次时应注意,各层次内部保持 确定的同质性,而各层次之间又应有 明显的异质性。
分层比例抽样法 分层最佳抽样法
1、分层比例抽样法
分层比例抽样法,指各层 抽取的样本单元数是按各 层单元数占总体单元数的 比例加以确定。

统计学原理-第六章 抽样调查(复旦大学第六版)

统计学原理-第六章  抽样调查(复旦大学第六版)
全体。其单位数用N来表示。
2.样本总体:简称样本,是从全及总体中随机
抽取出来,代表全及总体部分单 位的集合体。单位数用n表示。
5
二.全及指标和抽样指标
(一)全及指标
X 总体平均数: X N 总体成数:P
2
XF 或X F Q=
2 2
N1 N N
(X-X) 总体方差: = 总体标准差:= (X-X)
(一)考虑顺序的不重复抽样数目
N! A N ( N 1)(N 2) ( N n 1) ( N n)! 4 3 2 1 2 例如A4 12 2 1
n N
(二)考虑顺序的重复抽样数目
B N
n N 2 4
n 2
例如 B 4 16
10
(三)不考虑顺序的不重复抽样数目
Ex X
28

2、一致性 当抽样单位数充分大时,抽样指标和未知 的总体指标之间的绝对离差为任意小的可能性 也趋于必然性。
x X 任意小
3、有效性
即用抽样指标估计总体指标,要求作为优良估 计量方差应该比其他估计量的方差小。

2
x X f
2
f

2
x X f
x
x E ( x)
2
18
说明:根据数理统计理论,在重复抽样条件下, 抽样平均误差与全及总体的标准差成正比例关系。 与抽样总体单位平方根成反比关系。
19
在不重复抽样情况下,抽样平均误差计算公式如下:
x x

N n 250 4-2 ( )= ( ) =9.13(件) n N 1 2 4-1
2
N
X X F 或 F X X F 或 F

统计学第六章 抽样法

统计学第六章  抽样法
31
第六章 抽样法
序号
1 2 3 4
5 6 7 8
9 10 11 12
13 14 15 16 合计
样本变量x
40、40 40、50 40、70 40、80
50、40 50、50 50、70 50、80
70、40 70、50 70、70 70、80
80、40 80、50 80、70 80、80

x
x E(x)
总体
研究如何利用 样本数据来 推断总体特 征。
内容包括:参 数估计和假 设检验。
目的:对总体
特征作出推
样 本
断。
这是推断统计学研 究的问题
5
第六章 抽样法
描述统计与推断统计的关系
反映客观 现象的数

概率论
(包括分布理论、大 数定律和中心极限定
理等)
样本数
描述统计
推断统计

总体数 据
(统计数据的搜集 、整理、显示和分
13
第六章 抽样法
第二节 有关抽样的基本概念(2)
(二)抽样总体
也称子样,样本或样本总体,它是从全 及总体中随机抽取出来的,代表全及总体的 那部分单位的集合体。抽样总体的单位数称 为样本容量,用n表示,对于N来说,n是很 小的。
总体
样 本
14
第六章 抽样法
第二节 有关抽样的基本概念(3)
• 二 全及指标和抽样指标p.249 (一) 全及指标
研究总体中 的品质标志
总体成数 P N1
N
总体成数标准差 P
P1 P
17
第六章 抽样法
第二节 有关抽样的基本概念(5)
(二)抽样指标
抽样指标是由样本总体各单位标志值 或标志特征计算的综合指标,也称统计量。 与全及指标相对应有:样本平均数,样本 标准差;样本成数,样本成数的标准差。

06第六章 整群抽样

06第六章  整群抽样
i 1 i 1 j 1
n
n
M

N M 1 S ( yij Y ) 2 为总体方差; NM 1 i 1 j 1 2
n M 1 s ( yij y ) 2 nM 1 i 1 j 1 2
2 b

为样本方差; 为总体群间方差;

M N 1 N 2 S (Yi Y ) N 1 (Yi Y ) 2 N 1 i 1 i 1
第一节 第二节 第三节 第四节

整群抽样概述 等概率整群抽样的情形 不等概率整群抽样的情形 设计效应和样本容量的确定
第一节 整群抽样概述




一、整群抽样的概念 整群抽样是先将总体各单元划分成若干群(组),然后以 群为单位,从中随机抽取一部分群,对中选群内的所有单 元进行全面调查。确切地说,这种抽样组织形式应称为单 级整群抽样。 如果总体中的单元可以分成多级,则可以对前几级单元采 用多阶抽样(详见下章),而在最后一阶中对该阶抽样单 元所包含的全部个体(最基本单元)进行调查,这种抽样 称作多级整群抽样。本章只讨论单级整群抽样。 设总体被划分为N群,第i群含有Mi个次级单元,全部总 体次级抽样单元数记为M 0,即 M 0 M i 。当诸Mi都相等 时,称为等群;否则,称为不等群。
M n 1 n 2 (Yi y ) (Yi y ) 2 s n 1 i 1 n 1 i 1
2 b
为样本群间方差;

N M 1 S ( yij Yi ) 2 N ( M 1) i 1 j 1 2
为总体平均群内方差; 为样本平均群内方差;



二、分群的原则 尽量扩大群内差异,而缩小群间差异。 三、整群抽样的特点 1.在大规模抽样调查中,常常没有或很难编制出包括总 体所有次级单元在内的抽样框,而整群抽样则不需要编制 庞大的抽样框。 2.在样本单元数相同的条件下,整群抽样与简单随机抽 样相比,样本单元的分布相对较集中,虽然样本的代表性 较差,但调查组织实施过程更加便利,同时还可以大大地 节省调查费用。因此,实际工作中,在权衡费用和精度之 后,有时宁可适当增加一些样本单元数,也采用整群抽样 方法。 3.整群抽样的随机性体现在群与群间不重叠,也无遗漏, 群的抽选按概率确定。

第6章 抽样调查

第6章 抽样调查

第二节 抽样调查的组织形式
通常有以下四种组织形式: 通常有以下四种组织形式:
抽样方式
概率抽样 非概率抽样
简单随机抽样 整群抽样 多阶段抽样
分层抽样 系统抽样
方便抽样 自愿样本 配额抽样
判断抽样 滚雪球抽样
简单随机抽样(纯随机抽样) 一、简单随机抽样(纯随机抽样)
即从总体单位中不加任何分组、排队, 即从总体单位中不加任何分组、排队, 完全随机地抽取调查单位。 完全随机地抽取调查单位。
统计应用
“抓阄”征兵计划
然而结果是, 73个较小的号码被分配给了 然而结果是 , 有 73 个较小的号码被分配给了 前半年的日子,同时有110 110个较小的号码被分配给 前半年的日子,同时有110个较小的号码被分配给 了后半年的日子。 换句话说, 了后半年的日子 。 换句话说 , 如果你生于后半年 的某一天, 那么, 的某一天 , 那么 , 你因为被分配给一个较小号码 而去服兵役的机会要大于生于前半年的人 在这种情况下, 在这种情况下 , 两个数字之间只应该有随机 误差, 73和110之间的差别超出了随机性所能解 误差,而73和110之间的差别超出了随机性所能解 释的范围。 释的范围 。 这种非随机性是由于乒乓球在被抽取 之前没有被充分搅拌造成的。 在第二年, 之前没有被充分搅拌造成的 。 在第二年 , 主管这 件事的部门在抓阄之前去咨询了统计学家( 件事的部门在抓阄之前去咨询了统计学家(这可能 使生于后半年的人感觉稍微舒服些) 使生于后半年的人感觉稍微舒服些)
分层抽样的好处是: 分层抽样的好处是: 样本代表性高、抽样误差小、抽样调查 本代表性高、抽样误差小、
成本较低。如果抽样误差的要求相同的话则 成本较低。 抽样数目可以减少。 抽样数目可以减少。

第六章 抽样调查

第六章 抽样调查

第六章抽样调查第一节抽样调查的意义及全然概念一、抽样调查的意义抽样调查(随机抽样):按照随机原那么从总体中抽取一局部单位进行瞧瞧,并运用数理统计的原理,以被抽取的那局部单位的数量特征为代表,对总体作出数量上的推断分析。

二、抽样调查的适用范围抽样调查方法是市场经济国家在调查方法上的必定选择,和普查相比,它具有正确度高、本钞票低、速度快、应用面广等优点。

一般适用于以下范围:1.实际工作不可能进行全面调查瞧瞧,而又需要了解其全面资料的事物;2.虽可进行全面调查瞧瞧,但比立困难或并不必要;3.对普查或全面调查统计资料的质量进行检查和修正;4.抽样方法适用于对大量现象的瞧瞧,即组成事物总体的单位数量较多的情况;5.利用抽样推断的方法,能够关于某种总体的假设进行检验,判定这种假设的真伪,以决定取舍。

三、抽样调查的全然概念(一)全及总体和抽样总体(总体和样本)全及总体:所要调查瞧瞧的全部事物。

总体单位数用N表示。

抽样总体:抽取出来调查瞧瞧的单位。

抽样总体的单位数用n表示。

n≥30大样本n<30小样本(二)全及指标和抽样指标(总体指标和样本指标)全及指标:全及总体的那些指标。

抽样指标:抽样总体的那些指标。

第二节抽样调查的组织形式通常有以下四种组织形式:一、简单随机抽样(纯随机抽样)即从总体单位中不加任何分组、排队,完全随机地抽取调查单位。

随机抽选可有各种不同的具体做法,如:1.直截了当抽选法;2.抽签法;3.随机数码表法;二、类型抽样(分类抽样)先对总体各单位按一定标志加以分类(层),然后再从各类(层)中按随机原那么抽取样本,组成一个总的样本。

类型的划分:一是必须有清楚的划类界限;二是必须明白各类中的单位数目和比例;三是分类型的数目不宜太多。

类型抽样的好处是:样本代表性高、抽样误差小、抽样调查本钞票较低。

要是抽样误差的要求相同的话那么抽样数目能够减少。

两种类型:1.等比例类型抽样(类型比例抽样);2.不等比例类型抽样(类型适宜抽样)。

《社会调查研究方法》 第六章 抽样

《社会调查研究方法》 第六章 抽样

《社会调查研究方法》第六章抽样在社会研究中,最常见的总体是由社会中的某些个人组成的,这些个人便是构成总体的元素,比如,当我们对某省大学生的择业倾向进行研究和探讨时,该省所有在校大学生的集合就是我们研究的总体,而每一个在校大学生便是构成总体的元素。

又比如,我们打算研究某城市居民的家庭生活质量,那么,该市所有的居民家庭就构成我们研究的总体,而其中的每一户家庭都是这个总体中的一个元素。

样本(sample)就是从总体中按一定方式抽取出的一部分元素的集合。

或者说,一个样本就是总体的一个子集。

比如,从某省总数为12.8万人的大学生总体中,按一定方式抽取出1 000名大学生进行调查,这1 000名大学生就构成该总体的一个样本(当然,从一个总体中可以抽取出若干个不同的样本)。

在社会研究中,资料的收集工作往往是在样本中完成的。

明白了总体和样本的概念,再来理解抽样的概念就十分容易了。

比如,从3 000名工人所构成的总体中,按一定方式抽取200名工人的过程;或者从1 000户家庭构成的总体中,按一定方式抽取一个由100户家庭构成的样本的过程,都叫做抽样。

比如,上面所举的例子中,单个的大学生既是构成某省12.8万名大学生这一总体的元素,又是我们从总体中一次直接抽取出1000名大学生的样本时所用的抽样单位;但是,当我们从这一总体中一次直接抽取出40个班级,而以这40个班级中的全部学生(假定正好1000名)作为我们的样本时,抽样单位(班级)与构成总体的元素(学生)就不是一样的了。

比如,从一所中学的全体学生中,直接抽取200名学生作为样本,那么,这所中学全体学生的名单就是这次抽样的抽样框;如果是从这所中学的所有班级中抽取部分班级的学生作为调查的样本,那么,此时的抽样框就不再是全校学生的名单,而是全校所有班级的名单了。

因为此时的抽样单位已不再是单个的学生,而是单个的班级了。

在统计中最常见的总体值是某一变量的平均值,比如,某市待业青年的平均年龄、某厂工人的平均收入等等,它们分别是关于某市待业青年这一总体在年龄这一变量上的综合描述,以及某厂工人这一总体在收入这一变量上的综合描述。

2013年第6章 抽样调查

2013年第6章 抽样调查

2.优缺点及适用范围
优点: 与简单随机抽样比,省去了一个个抽样的时间。 能使样本均匀分散在调查总体中,不会集中于某 个层次,样本代表性增强了 缺点:进行排列时需要总体各个单位的详细资 料;总体单位差异较大或排列有规律时,调查 精确度有影响 商场抽每天销售量 适用范围:同质性较高的总体
2.经验法
经验法确定抽样数目的范围 -非随机抽样用
总体 规模 100 以下 100~ 1000 1 000~ 5000 5000~ 10000 10000~ 100000 100000 以上
抽样数 占总体 比重(%)
50以上
50~20
30~10
15~3
5~ 1
1以下
6.3 抽样调查方式
抽样调查方式
2.样本单位是从总体中抽选出来进行调查观察的 单位样本单位数n
(三)指标和标志 指标是总体的数量特征 数量指标,反映总体总规模或总水平,如人口 数,产量,耕地面积。 质量指标,反映总体内在质量,如产品合格率, 劳动生产率等。 标志反映的是总体单位的特征。 品质标志,如人的性别,籍贯等 数量标志,人的年龄,身高,职工工资等
(4)简单随机抽样法的优缺点及适用范围 优点 完全按照随机的原则进行抽样,简单直观 缺点 抽月收入 要有完整样本框 高的 如需编号,总体量大面广则难度较大; 有可能 全被抽到 总体单位差异较大时,样本代表性差; 适用范围 适用于总体单位数不多且差异较小的
(二)等距抽样
1.定义 等距抽样又称机械抽样或系统抽样,它是先将总体 各单位按某一标志排队,并给总体中所有个体编号,然后 抽取一个编号,并按照相同的间隔距离来抽取其他样本单 位。 编号 并根据总体单位数和样本单位数计算出抽样距离(即相 同的间隔),然后按相等的距离或等间隔来抽取样本单位。 L=N/n 标志采取方法可以选择与调查主题相关的或者不相关的 举例:某地区有零售店110户,采用等距抽样抽取11户 如何抽?

第六章抽样

第六章抽样

册和登记表(抽样框)就可进行。
• 其局限是,只适用于总体单位数量不多,且分布
较均匀的调查总体,即单位间差异性不大的研究
对象,否则将无法保证样本的代表性。
• 练习 请利用随机数表,从N=60总体中抽取15个样本。
系统抽样
• 系统抽样(等轴抽样、等距抽样、机械抽样): 把总体的单位进行编号排序,在计算出某中间隔, 然后按这个固定的间隔抽取个体的号码来组成样 本的方法。 • 基本和简单随机抽样一样,计算公式也一样。 • 需要完整的样本框,直接从总体中抽取个体。
• 获得完全正确的样本框几乎是不可能的。 • 制定抽样框是抽样的关键步骤之一。 • 当抽样是分段进行时,在几个不同的抽样层次上 进行时,则要分别建立起几个不同的样本框。 • 比如:研究某市小学生的学习情况。从500所小 学中抽取10所小学,再从这10所小学,每个小学 抽取3个班级,被抽中的班级中再抽取10名同学。 所以要有三个样本框: 全市学校名单 每所抽中学校班级名单 每个被抽中班级学生的名单
抽样的概念
• 统计值(样本值):样本中某一个变量的综合描 述。 • 是从样本中计算出来的。 • 是作为总体值的估计值。
2 抽样的作用
• 用十分有限的人力、财力、时间去了解庞杂、广 阔、纷繁、多变的社会现象。 • 比如:民意测验,要求迅速、准确。往往调查对 象不到2000人。
3.抽样的类型
• 概论抽样 • 非概率抽样
决定抽样方案
• 对于具有不同研究目的、不同范围、不同对象和 不同客观条件的社会研究,所使用的抽样方法是 不一样的。 • 依据研究的目的的要求、依据各种抽样的特点, 以及其他有关因素来觉得具体采用哪种抽样方法。 • 同时确定样本规模以及主要的精确程度。
实际抽取样本

市场调研与预测第六章 抽样

市场调研与预测第六章 抽样

分层随机抽样技术及其应用
注意:分层时要注意各层之间要有明显的差异, 不致发生混淆;要知道各层中的单位数目和比 例;分层的数目不宜太多,每个层次内每个个 体应保持一致性等。 分层抽样具体形式:等比例分层抽样、非比例 分层抽样
分群随机抽样技术及其应用
运用分群抽样技术抽取样本,先把调查总体区分 为若干个群体,然后用单纯随机抽样法,从中抽 取某些群体进行全面抽查。 如果不是对所抽取的群体进行全面抽查,而是进 一步划分为若干个小群体,再按随机原则抽取一 个或一部分小群体来调查,称为多段分群抽样。 运用分群抽样技术抽取样本,抽选工作比较简易 方便,抽中的单位比较集中,但是由于样本单位 集中在某些群体,而不能均匀分布在总体中的单 位,若群与群的差异较大,抽样误差会增大。
随机抽样
随机抽样又称为概率抽样,是对总体中每一个 体给予平等的抽取机会的抽样技术。 随机抽样的类别: 随机抽样的类别: (1)简单随机抽样:是在总体单位中不进行 任何有目的的选择,按随机原则,纯粹偶然的 方法抽取样本的技术。 (2)分层随机抽样:把调查总体按其属性不 同分为若干层次,然后在各层中随机抽取样本 的技术。
随机抽样的类别
(3)分群随机抽样:是把调查总体区分为若 干个群体,然后用单纯随机抽样法,从中抽取 某些群体进行全面调查的技术 (4)系统随机抽样:在总体中先按一定标志 顺序排列,并根据总体单位数量和样本单位数 计算出抽样距离,然后按相同的距离或间隔抽 选样本单位的技术
随机抽样的优点和不足
优点: 优点: 1.调查范围和工作量比较小,又排除了认为的干扰, 能省时、省力、省费用。 2.随机抽样能够计算调查结果的可靠程度。 不足: 不足: 1.对所有调查样本都给予平等看待,难以体现重点。 2.抽样范围广,所需时间长,参加调查的人员和费 用多。 3.需要具有一定专业技术的专业人员进行抽样和资 料分析。

自考“社会调查原理与方法”复习资料第六章

自考“社会调查原理与方法”复习资料第六章

第六章抽样 第⼀节抽样与抽样调查 ⼀、含义: 1.抽样是⼀种选择调查对象的程序和⽅法,即总体中选取⼀部分代表的过程。

2.抽样调查,即从研究对象的总体中选择⼀部分代表加以调查研究,然后⽤所得的结果推论和说明总体特征;始于1891年的⼈⼝调查,关键在于<1>如何判断⼀个样本误差的⼤⼩;<2>怎样才抽到⼀个所要求的精度的样本。

3.选取样本的⽅法包括:<1>依据研究任务的要求和对调查对象的分析,主观地有意识地在研究对象的总体中进⾏选择,即⾮概率抽样;<2>依据概率理论,按照随机原则选择调查对象的程序和⽅法,即概率抽样。

⼆、抽样调查优点: <1>调查费⽤较低;<2>速度快;<3>应⽤范围⼴;<4>可获得内容丰富的资料,抽样调查因调查对象的数⽬远较普查少,因此可以设置较多和较复杂的调查项⽬,并能集中时间和精⼒作详细的分析。

<5>准确性⾼。

2.抽样调查的优点成⽴的依据是:<1>部分含于整体之中;<2>部分与整体有同样的特征;<3>部分能够为研究者提供⼀个有关群体的⽣活、群体态度的更为清晰的脉络。

第⼆节抽样的术语与程序 ⼀、抽样的术语 1.个体与抽样单位:<1>个体是收集信息的基本单位,即分析单位,⼜称为调查对象;<2>信息单位是⼀次抽样当中抽取的单位。

<3>个体与抽样单位在有些研究中是相同的,在进⾏实际抽样时,抽样单位往往是多层次的。

2.研究总体与调查总体:<1>研究总体是在理论上明确界定的个体的集合体。

<2>调查总体是研究者实际抽取样本的个体的集合体。

<3>样本只能推论调查总体⽽不是研究总体——判断P168 3.抽样框——概率抽样需要,⼜称为抽样范畴,是抽取样本的所有抽样单位的名单。

第六章 抽样

第六章    抽样
有不同级别的抽样单位。
例:以某高校6000名在校大学生为总体:
抽样1:按一定方式抽取300名大学生作样本;
抽样2:按一定方式抽取10个班作样本;
分析:两种抽样方式下的抽样单位和抽样框
(四)抽样框sample frame
一次直接抽样时总体中所有元素的名单。 抽样框是抽样操作依据的名单,是和调查的总体相 对应的
究总体的操作化界定,规定了调查对象选择的具体指标。
• 目标总体和调查总体吻合度越高,调查的代表性就越好;否则会
产生覆盖误差。
(二)制定抽样框
1.抽样框是对研究总体的进一步操作。
2.抽样框的意义
(1)抽样框与研究/调查总体之间可能不匹配,可能包含研 究总体之外的某些人,或可能遗漏其中的某些人. (2) 根据样本所得到的结果,只能代表组成抽样框的各个 要素的集合 (3) 样本的大小(规模)与其能否正确代表总体比较起 来,是一项不太重要的因素。
(五)参数值——又称总体值,是关于总体中某一变量的 的综合描述,或者说是总体中所有元素的某种特征的综 合数量表现。 –参数值只有对总体中每一个元素都进行调查或测量才 能得到。 (六)统计值——又称样本值,是关于样本中某一变量的 综合描述,或者说是样本中所有元素的某种特征的综合 数量表现。 –统计值是从样本中计算出来的,它是相应的参数值的 估计量。
一、简单随机抽样
(一)定义
又称纯随机抽样,是概率抽样的最基 本形式。 它是按等概率原则,直接从含有N个 元素的总体中随机抽取n个元素组成样本 (N>n)。
(二)选取样本的两种办法
1.抽签方式 (1)将总体名单从1到N编号,形成抽样框; (2)准备N张卡片,每张卡片上的号码与总体 名单编号对应,将卡片放在盒子里,混合均匀; (3)根据抽样设计的样本规模,从盒内n次取 出n张卡片; (4)根据取出的卡片上的号码,找到总体名单 上对应的元素,构成样本。

统计基础第六章

统计基础第六章

(一)全及总体和样本总体
1.全及总体:简称总体或母体, 指所要调查研究对象的全体。
2.样本总体:简称样本或子样,指在 全及总体中按随机原则抽取的那部分 单位所构成的集合体。
(二)全及指标和样本指标
1.全及指标:也称母体参数,反 映总体某种属性的综合指标。
总体 N
2.样本指标:也称样本统计量 或抽样指标,反映抽样总体综合指标。
一、样本容量的影响因素
1
总体各单位之间
9 % 0 2 .6 % 8 P 9 % 0 2 .6 % 8
( 9 % 0 2 .6 % 8 1)0 0 N 0 ( P 9 % 0 0 2 0 .6 % 8 1)000
该地有两台以上彩电8 的7用3 户2N0 数P 在9287638200户到92680户之间 。
第四节 样本容量的确定
组成总体的各研究对象称之为总体单位。用N表示
样本总体
样本总体又称子样,简称样本它是由从总体 中按一定程序抽选出来的那部分总体单位所 作成的集合。
n3,0称为大 ;n样 3,0称 本为小 . 样本
全及总体是唯一确定的,而样本总体是随机的。
(二)全及指标和样本指标 1.全及指标。全及指标是根据全及总体各单位
第六章 抽样调查
本章相关内容
第一节 抽样调查的意义和作用 第二节 抽样误差 第三节 抽样推断 第四节 必要抽样数目的确定
目标要求
能力(技能)目标
知识目标
熟练运用抽样估计的一 般原理推断全及总体的
掌握随机抽样的涵义;
指标;
掌握抽样调查方法;
熟练运用抽样估计原理 进行区间估计;
掌握抽样平均误差的计算 方法;
如何衡量总体指标落在误差范围内的概率大小呢?

抽样调查第6章 整群抽样与系统抽样知识讲解

抽样调查第6章 整群抽样与系统抽样知识讲解
j 1
Y K
2
N0N
K i 1
Yi Y
2
由这个思路无法给出其均方偏差的估计量
系统抽样的效率
与简单随机抽样的比较
(N 1)S 2 N0 (K 1)S外2 (N0 1)KS内2 V (YˆSE ) N(K 1)S 2
V (YˆSYS) N0N(K 1)S外2 N (N 1)S 2 N (N K )S内2 V (YˆSYS) V (YˆSE ) N(N K)(S 2 S内2 )
K 2 1 k 1 K k K K 1 i1
N0 j 1
Yij Y
2 (K, N较大时)
Deff
V (YˆCSE V (Yˆ)
)
1 (N0 1)C
C较大,N0较大时,整群抽样精度差得多
对第一级为简单随机抽样的二阶抽样有
Deff 1 C (n0 1)
整群抽样的设计效应
实际当各群容量不等时,常用 1
V (YˆCSE )
K2 k
1
k K
1 K 1
K i 1
Ni
Yij
j 1
Y K
2
(3)V (YˆCSE )的一个无偏估计量为
v(YˆCSE )
K2 k
1
k K
1 k 1
k i 1
Ni
Yi j
j 1
YˆCSE K
2
目标量的估计
定理6.2 对有放回PPS整群抽样,总体总数Y的估计有
(Ni 1) (Yij Y )2
i 1
j 1
若群内各单元指标均相等,则C达最大值1
群内相关系数是衡量群内单元同质性的一个指标
整群抽样的设计效应
Ni N0 (i 1,2, , K)时

6抽样调查

6抽样调查

p(1 p) n 0.04 0.96 1 1 1 n 200 20 N
1.35%
P t p 1.961.35%, 2.65% p p P p p ,4% 2.65% 4% 2.65% 1.35% P 6.65%
x 2
n

n
, 为总体标准差
b.在简单随机不重复抽样条件下
x 2 N n
,为总体标准差 n N 1
当N很大时,
x 2
n 1 ,为总体标准差 n N
12
(2)样本成数的抽样平均误差 a.在简单随机重复抽样条件下
P(1 P) p ,P为总体成数 n
27


五、抽样估计方法 1. 点估计

直接用样本指标值作为相应总体指标的估计值, 也称为定值估计。 总体平均数估计值: X x 总体成数估计值: P p


28

总体方差估计值:
2 ( x x ) i
总体平均数方差
s
2 2
n 1
(当 n小于30时)
2 ( x x ) i
b.在简单随机不重复抽样条件下
P
P(1 P) N n ,P为总体成数 n N 1
当N很大时,
P(1 P) n P 1 ,P为总体成数 n N
13
总体标准差、总体成数的数据来源 计算抽样平均误差时,必须具备总体标准差和 总体成数的信息,但是这是不可能的!(为什么?)


2
二、抽样调查的特点
1.非全面调查
2.遵循随机原则抽取调查单位
3.根据样本指标数值推断总体指标数值 4.抽样误差可以事先计算并加以控制

抽样调查-第6章整群抽样

抽样调查-第6章整群抽样

(1 n
f
)Sb2
下面我们看一个整群抽样的例题
返回
【例4.11】 在一次对某中学在校生零花钱的调查
中,以宿舍作为群进行整群抽样,每个宿舍都有M=6 名学生。用简单随机抽样在全部N=315间宿舍中抽取
n=8间宿舍。全部48个学生上周每人的零花钱 yij 及
相关计算数据如下表。试估计该学校学生平均每周
sb2
1 0.0254 86
926 .63 18.81
s( y) v( y ) 18.81 4.34
于是置信度为95%的置信区间为98.17±1.96×4.34, 也即[89.66元,106.68元】
返回
2、整群抽样效率分析
在整群抽样中,由于
V (y) 1 f nM
而样本群内方差为:
sw2
1 n(M 1)
n i 1
M
( yij yi )2
j 1

1 n
n i 1
1 M 1
M
( yij
j 1

yi )2

1 n
n i 1
si2

220.79
返回
由相关系数的估计式有



sb2
sb2 sw2 (M 1)sw2


y

1 n
n i 1
yi

75 89 93.33 8

98.17
sb2

M n 1
n i 1
(yi

y)
6 [(75 98.17)2 (93.33 98.17)2 926.63 8 1
返回
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
• 全及指标:反映总体数量特征的指标。 其数值是唯一的、确定的。
• 抽样指标:根据样本分布计算的指标。 是随机变量。
全及指标和抽样指标
总体

☺ ☺
☺ ☺
☺☺☺
样本
☺☺ ☺
全及指标
X
、2
P
抽样指标
平均数
x
标准差、方差 S、 S2
成数
p
变量总体和属性总体
• 变量总体各单位标志值可用数量表示
X X N
代表性误差
偏差
随机误差
实际误差 抽样平均误差
抽样误差即指随机误差,这种误差是 抽样调查固有的误差,是无法避免的。
实际误差指样本指标和总体指标之间数 量上的差别,即 x X 、p P 。
二、抽样平均误差
抽样平均误差实际上是样本指标的标准 差。通常用μ表示。在N中抽出n样本,从 排列组合中可以有各种各样的样本组。
• 总体成数P是指具有某种特征的单位在总体中 的比重。成数是一种结构相对数,设总体单 位总数目是N,总体中有该特征的单位数是N1。 设x是0、1变量,则有:
P N1 N
样本成数
• 现从总体中抽出n个单位,如果其中有相应特 征的单位数是n1,则样本成数是:
p n1 n
• P也是一个随机变量,利用样本平均数的分布
第六章 抽样调查
第一节 抽样调查的意义 第二节 抽样调查的基本概念 第三节 抽样平均误差 第四节 全及指标的推断 第五节 抽样方案设计 第六节 必要抽样单位数的确定 第七节 假设检验
第一节 抽样调查的意义
一、抽样调查的概念
抽样调查是按随机原则,从全部研究 对象中抽取一部分单位进行观察,并根 据样本的实际数据,对总体的数量特征 做出具有一定可靠程度的估计和判断其 中心问题是如何根据已知的部分资料来 推断未知的总体情况。
二、抽样调查的特点
1.抽样调查是非全面调查。 2.抽样调查是用样本的指标数值去推算总 体的指标数值。 3.抽样调查是按随机原则抽选调查单位。 4.抽样调查中产生的抽样误差,可以事先 计算并加以控制。
第二节 抽样调查的基本概念
一、全及总体和抽样总体 二、抽样方法
1.重复抽样分布 2.不重复抽样分布
样本
34,34 34,38 34,42 34,46 34,50 38,34 38,38 38,42 38,46 38,50 42,34 42,38 42,42 42,46 42,50
样本平 均数 x
34 36 38 40 42 36 38 40 42 44 38 40 42 44 46
样本
46,34 46,38 46,42 46,46 46,50 50,34 50,38 50,42 50,46 50,50
E
A B EC D
B
AC BC
C
D
E
D
D
D
E
E
E
• 不考虑顺序时:样本个数
CNn
N! (N - n)!n!
E
三、大数定理
1
lim
n
p
n
n
xi X
i 1
1
当样本容量n 充分大时,可以用 样本平均估计总体平均。
lim
n
p
m n
Байду номын сангаас
p
1
当试验次数n充分大时,可以用 频率代替概率。
大数定理的意义:个别现象受偶然因素影响,但是,对总体 的大量观察后进行平均,就能使偶然因素的影响相互抵消, 从而使总体平均数稳定下来,反映出事物变化的一般规律。
样本平 均数 x
40 42 44 46 48 42 44 46 48 50
重置抽样分布--样本平均数的分布
样本平均数 x
34 36 38 40 42 44 46 48 50 合计
频数
1 2 3 4 5 4 3 2 1
25
E(x)
xf f
42(元)
2(
x)
(
x
X f
)2
f
16(元2)
• 验证了以下两个结论:
– 考虑顺序时:样本个数=Nn=52=25
– 不考虑顺序时:样本个数=
CNn
n
-
1
(N n-1)! (N -1)!n!
不重复抽样
• 例如从A、B、C、D、E五个字母中随机抽取两个作为样本。N=5,n=2
A
A
B
B
AC D
BC D
C D

E
考虑顺序时:样本个数
E
PNn
N! E
(N - n)!
A B DC
E(x) X 2(x) 2
n
• 抽样平均数的标准差 反映所有的样本平均 数与总体平均数的平 均误差,称为抽样平 均误差,用 表示。
x
x
n
取得σ的途径有:
1. 用过去全面调查或抽样调查的资料,若同时 有n个σ的资料,应选用数值较大的那个;
2. 用样本标准差S代替全及标准差σ; 3. 在大规模调查前,先搞个小规模的试验性的

1 ,1 ,1 ,
5000 5000 5000
不重复抽样:又称不放回抽样。

1 ,1 ,1 ,
5000 4999 4998
重复抽样
• 例如从A、B、C、D、E五个字母中随机
抽取两个作为样本。N=5,n=2
A B AC D E
A B BC D E
A B CC D E
A B DC D E
A B EC D E
中心极限定理
中心极限定理:
1.独立同分布中心极限定理:
2
x~ NX,
n
2.德莫福-拉普拉斯中心极限定理:
X ~ N np,npq
大样本的平均数近似服从正态分布。
第三节 抽样平均误差
一、抽样误差的概念及其影响程度
在统计调查中,调查资料与实际情况不 一致,两者的偏离称为统计误差。
登记误差
统计误差
三、大数定理与中心极限定理
一、全及总体和抽样总体
全及总体:即总体,所要调查观察的全 部事物。总体单位数用N表示。
抽样总体:即样本,抽取出来调查观察的 单位。抽样总体的单位数用n表示。
n ≥ 30 大样本 n < 30 小样本
注 总体是唯一的、确定的,而样本是不确定的、 可变的、随机的
全及指标和抽样指标
性质结论,即有:
E( p) p
p
np 1 p
n-1
样本容量与样本个数
• 样本容量:一个样本中所包含的单位数, 用n表示。
• 样本个数:又称样本可能数目,指从一 个总体中所可能抽取的样本的个数。对 于有限总体,样本个数可以计算出来。 样本个数的多少与抽样方法有关。
二、抽样方法
重复抽样:又称有放回抽样。
注 抽样误差是由于抽样的随机性而产生的样本指
标与总体指标之间的平均离差。
按照定义:
x
( x X )2 K
重复抽样分布--样本平均数的分布
• 某班组5个工人的日工 资为34、38、42、46、 50元。
• = 42
• 2 = 32
• 现用重复抽样的方法 从5人中随机抽2个构 成样本。共有52=25个 样本。如右图。
相关文档
最新文档