第六章抽样估计
统计学第6章统计量及其抽样分布
整理ppt
16
2. T统计量
设X1,X2,…,Xn是来自正态总体N~ (μ,σ2 )
n
的一个样本,
X
1 n
n i 1
Xi
(Xi X )2 s 2 i1
n 1
则 T(X) ~t(n1)
S/ n
称为T统计量,它服从自由度为(n-1)的t分布。
整理ppt
17
F分布
定义:设随机变量Y与Z相互独立,且Y和Z分别服 从自由度为m和n的c2分布,随机变量X有如下表达式:
整理ppt
8
中心极限定理
设从均值为,方差为2的一个任意总 体中抽取容量为n的样本,当n充分大时, 样本均值的抽样分布近似服从均值为μ、 方差为σ2/n的正态分布。
当样本容量足够大时
(n≥30),样本均值的抽样
分布逐渐趋于正态分布
整理ppt
9
标准误差
标准误差:样本统计量与总体参数之间的平均差异
1. 所有可能的样本均值的标准差,测度所有样本 均值的离散程度
因此,估计这100名患者治愈成功的比 例在85%至95%的概率为90.5%
整理ppt
22
6.5 两个样本平均值之差的分布
设
X
1
是独立地抽自总体
X1 ~N(1,12)
的一个容量
为n1的样本的均值。 X 2 是独立地抽自总体
X2 ~N(2,22)的一个容量为n2的样本的均值,则有
E (X 1X 2)E (X 1) E (X 2)12
2. 样本均值的标准误差小于总体标准差
3. 计算公式为
x
n
整理ppt
10
【例】设从一个均值μ=8、标准差σ=0.7的总 体中随机抽取容量为n=49的样本。要求:
统计学第六章抽样推断
尖山一委…
尖山二委
居民一组
居民二
组
…
第六章 抽样推断
某外国公司在##进行 微波炉市场调查:
STAT
在商场的大门口
在微波炉柜台前
在市区街道旁边
在某个住宅小区
时间表抽样框
第六章 抽样推断
连续出产的产品总体 可以编制抽样框:均STAT 匀的出产时间、可以 预见到的产品总量.
连续到加油站加油的 汽车总体无法编制抽 样框:时间不定、总 量也无法确定.
抽样估计的特点
第六章 抽样推断
按随机原则抽取样本单位
目的是推断总体的数量特征
抽样推断的结果具有一定的可靠程度, 抽样误差可以事先计算并控制
抽样估计的应用
第六章 抽样推断
不可能进行全面调查时 不必要进行全面调查时 来不及进行全面调查时 对全面调查资料进行补充修正时
抽样调查研究
Sampling Study
P N nN N NN n
共n个
⒉ 不重复抽样的可能样本数目:
C N n N N 1 N n 1
第六章 抽样推断
第六章 抽样推断
STAT
★§1.1 抽样方案的设计 ★§1.2 简单随机抽样的抽样误差的测定
§1.3 简单随机抽样的抽样估计
第六章 抽样推断
§1.2 简单随机抽样的抽样误差的测定 STAT
n1 1{i n1E(xiX)2nn(E xX)2} 由E(于 xX)2D (x)D (i1 nxi)n 1 2i n1D (xi)n2
E(sn21)n11{n2nn2}
2
⒋ 样本成数:
pn1,qn0 1p nn
⒌ 样本单位是非标志的标准差:
第六章 抽样推断
市场调查分析师考试《调查概论(中级)》章节题库-第六章 抽样估计【圣才出品】
第六章抽样估计一、单项选择题1.评介估计量的标准之一是一致性,它是指()。
A.估计量和总体参数之间完全一致B.随着样本量的无限增大,样本的估计量就等于总体参数C.要求估计量的数学期望等于总体参数D.估计量的方差尽可能小【答案】B【解析】所谓一致性是指随着样本的无限增大,样本的估计量就等于待估的总体参数。
2.估计量的无偏性是指()。
A.估计量和总体参数之间完全一致B.随着样本量的无限增大,样本的估计量就等于总体参数C.要求估计量的数学期望等于总体参数D.估计量的方差尽可能小【答案】C【解析】无偏性的直观含义是指某个具体的估计值,由于随机的原因,对总体参数进行估计时可能出现偏高或偏低,但要求如果把所有的样本都抽出来,将估计值进行平均就应该等于总体参数。
即估计量的数学期望等于总体参数。
3.估计量的有效性是指()。
A.估计量和总体参数之间完全一致B.随着样本量的无限增大,样本的估计量就等于总体参数C.要求估计量的数学期望等于总体参数D.估计量的方差尽可能小【答案】D【解析】有效性是指对同一总体参数的两个无偏估计量,有更小方差的估计量更有效。
4.抽样分布是指()。
A.估计量的分布B.样本观察值的分布C.总体参数的分布D.总体观察值的分布【答案】A【解析】估计量是一个随机变量,它的具体估计值是随着不同的样本单元而变化的,因而就有一定的分布,这个分布就叫做抽样分布。
5.抽样调查所关心的误差是()。
A.抽样误差B.非抽样误差C.抽样误差和非抽样误差D.由无回答产生的偏差【答案】C【解析】在抽样调查中,传统的参数估计主要是考察抽样误差,而抽样调查除了考察抽样误差外,还要注意非抽样误差。
6.用样本估计值对总体参数进行点估计的理论基础是()。
A.大数定律B.中心极限定理C.正态分布的原理D.无偏估计的原理【答案】A【解析】大数定律是用样本估计总体的理论基础。
其直观含义是随机事件的规律性是在大量观察中才能显露出来,虽然在每次试验中不可避免地出现随机误差,但随着观察次数的增加,随机影响将相互抵消而使规律具有稳定的性质。
统计学第六章 抽样法
第六章 抽样法
序号
1 2 3 4
5 6 7 8
9 10 11 12
13 14 15 16 合计
样本变量x
40、40 40、50 40、70 40、80
50、40 50、50 50、70 50、80
70、40 70、50 70、70 70、80
80、40 80、50 80、70 80、80
-
x
x E(x)
总体
研究如何利用 样本数据来 推断总体特 征。
内容包括:参 数估计和假 设检验。
目的:对总体
特征作出推
样 本
断。
这是推断统计学研 究的问题
5
第六章 抽样法
描述统计与推断统计的关系
反映客观 现象的数
据
概率论
(包括分布理论、大 数定律和中心极限定
理等)
样本数
描述统计
推断统计
据
总体数 据
(统计数据的搜集 、整理、显示和分
13
第六章 抽样法
第二节 有关抽样的基本概念(2)
(二)抽样总体
也称子样,样本或样本总体,它是从全 及总体中随机抽取出来的,代表全及总体的 那部分单位的集合体。抽样总体的单位数称 为样本容量,用n表示,对于N来说,n是很 小的。
总体
样 本
14
第六章 抽样法
第二节 有关抽样的基本概念(3)
• 二 全及指标和抽样指标p.249 (一) 全及指标
研究总体中 的品质标志
总体成数 P N1
N
总体成数标准差 P
P1 P
17
第六章 抽样法
第二节 有关抽样的基本概念(5)
(二)抽样指标
抽样指标是由样本总体各单位标志值 或标志特征计算的综合指标,也称统计量。 与全及指标相对应有:样本平均数,样本 标准差;样本成数,样本成数的标准差。
06第六章 整群抽样
n
n
M
N M 1 S ( yij Y ) 2 为总体方差; NM 1 i 1 j 1 2
n M 1 s ( yij y ) 2 nM 1 i 1 j 1 2
2 b
为样本方差; 为总体群间方差;
M N 1 N 2 S (Yi Y ) N 1 (Yi Y ) 2 N 1 i 1 i 1
第一节 第二节 第三节 第四节
整群抽样概述 等概率整群抽样的情形 不等概率整群抽样的情形 设计效应和样本容量的确定
第一节 整群抽样概述
一、整群抽样的概念 整群抽样是先将总体各单元划分成若干群(组),然后以 群为单位,从中随机抽取一部分群,对中选群内的所有单 元进行全面调查。确切地说,这种抽样组织形式应称为单 级整群抽样。 如果总体中的单元可以分成多级,则可以对前几级单元采 用多阶抽样(详见下章),而在最后一阶中对该阶抽样单 元所包含的全部个体(最基本单元)进行调查,这种抽样 称作多级整群抽样。本章只讨论单级整群抽样。 设总体被划分为N群,第i群含有Mi个次级单元,全部总 体次级抽样单元数记为M 0,即 M 0 M i 。当诸Mi都相等 时,称为等群;否则,称为不等群。
M n 1 n 2 (Yi y ) (Yi y ) 2 s n 1 i 1 n 1 i 1
2 b
为样本群间方差;
N M 1 S ( yij Yi ) 2 N ( M 1) i 1 j 1 2
为总体平均群内方差; 为样本平均群内方差;
二、分群的原则 尽量扩大群内差异,而缩小群间差异。 三、整群抽样的特点 1.在大规模抽样调查中,常常没有或很难编制出包括总 体所有次级单元在内的抽样框,而整群抽样则不需要编制 庞大的抽样框。 2.在样本单元数相同的条件下,整群抽样与简单随机抽 样相比,样本单元的分布相对较集中,虽然样本的代表性 较差,但调查组织实施过程更加便利,同时还可以大大地 节省调查费用。因此,实际工作中,在权衡费用和精度之 后,有时宁可适当增加一些样本单元数,也采用整群抽样 方法。 3.整群抽样的随机性体现在群与群间不重叠,也无遗漏, 群的抽选按概率确定。
第6章--抽样推断PPT优秀课件
不考虑顺序
(N n 1)! n!(N 1)!
不重复抽样:又称不回置抽样。
考虑顺序 N !
( N n )!
可能组成的样本数目
不考虑ห้องสมุดไป่ตู้序
N! ( N n )! n!
7
标号为A、B、C、D的四个圆球从中随机抽取两个 可能样本个数
考虑顺序 N n
AA、AB、AC、AD BA 、BB、BC、BD
CA、CB、CC、CD
p
p1p0.9 8 0.0 20.8(0% 8 )
n
300
p p1np1N n 0.938 0 0.0021630000 00 0.80(6 %
计算结果表明:不重复抽样的平均误差小于重复抽样, 但是“N”的数值越大,则两种方法计算 的抽样平均误差就越接近。
24
四、抽样极限误差
含义:
抽样极限误差指在进行抽样估计时,根据研究对象的变 异程度和分析任务的要求所确定的样本指标与总体指标 之间可允许的最大误差范围。
例题二解 已知: N 20 ,n 040,0 x 0 48 ,0 3000
则:
x
n
3001(5小)时 400
x
2 1 n 3020140013.42(小时 )
n N 400 2000
计算结果表明:
根据部分产品推断全部产品的平均使用寿命时,采用
不重复抽样比重复抽样的平均误差要小。
21
抽样成数平均误差的计算公式
例题二:
某厂生产一种新型灯泡共2000只,随机抽出 400只作耐用时间试验,测试结果平均使用寿 命为4800小时,样本标准差为300小时,求抽 样推断的平均误差?
17
下面求 Y 的无偏估计 y 的方差 V ( y )
统计学第六章抽样和抽样分布
2021/3/4
统计学第六章抽样和抽样分布
4
一、总体与样本
▪ 把握两个问题: ▪ 1、总体和总体参数; ▪ 2、样本和样本统计量。
2021/3/4
统计学第六章抽样和抽样分布
5
1、总体与总体参数
(1)总体:指根据研究目的确定的所 要研究的同类事物的全体,是所要说 明其数量特征的研究对象。按所研究 标志性质不同,分为变量总体和属性 总体,分别研究总体的数量特征和品 质特征。 构成总体的个别事物(基本单元 )就是总体单位,也称个体。总体单 位的总数称为总体容量,记作N。
缺点:受主观影响易产生倾向性误差; 不能计算、控制误差,无法说明调查结果 的可靠程度。
抽样一般都是指概率抽样。
2021/3/4
统计学第六章抽样和抽样分布
15
2、重复抽样和非重复抽样
(1)重复抽样:又称重置抽样,是指从总体 中抽出一个样本单位,记录其标志值后,又将 其放回总体中继续参加下一轮单位的抽取。特 点是:第一,n个单位的样本是由n次试验的结 果构成的。第二,每次试验是独立的,即其试 验的结果与前次、后次的结果无关。第三,每 次试验是在相同条件下进行的,每个单位在多 次试验中选中的机会(概率)是相同的。在重复 试验中,样本可能的个数是 N n ,N为总体单位 数,n为样本容量。
2021/3/4
统计学第六章抽样和抽样分布
16
2、重复抽样和非重复抽样
(2)非重复抽样:又称为不重置抽样,即每次从
总体抽取一个单位,登记后不放回原总体,不参加下
一轮抽样。下一次继续从总体中余下的单位抽取样本
。特点是:第一,n个单位的样本由 n 次试验结果构成
统计学第六章抽样和抽样分 布
第六章 抽样与抽样分布
第六章抽样与参数估计
(1)验证 E(x) X
(2)计算重复抽样及不重复抽样的抽样平均误差。 24
第2节 参数估计的基本方法
参数估计——以实际观察的样本数据所计算的统计量作为未 知总体参数的估计值。
一、点估计(Point estimate) 点估计也称定值估计,就是直接以样本统计量作为总体参数
29
大样本(n≥30)下总体均值的区间估计
区间估计就是根据样本求出总体未知参数的估计区间,并使其 可靠程度达到预定要求。
(1) 总体方差σ 2已知时
由于 α ,有
z
x
/
n
N(0,1) ,所以对于给定的置信度1-
P {z 2
x/nz2}1
即
Px z/2
7
抽样法的特点:随机原则 部分估计总体 存在误差并可以控制
抽样法的应用:对某些不可能进行全面调查 而又需要了解其 全面情况的社会经济现象, 必须应用抽样法。(破坏性试验、总体过大、 单位过于分散,实际调查不可能的)
8
第1节 抽样与抽样分布
一、有关抽样的基本概念
总体(母体)(Population) 样本(子样)(Sample) 总体指标(总体参数)(Population parameter) 样本指标(样本统计量)(Sample statistic)
2、某工厂共生产新型聚光灯2000只,随机抽选400只进行耐 用时间调查,结果平均寿命为4800小时,标准差为300小时。 求抽样误差。
3、从某校学生中随机抽选400名,发现戴眼镜的有80人。计 算求抽样误差。
经济应用统计学-第六章抽样推断
非参数检验优缺点总结
• 易于理解和实现:非参数检验方法通常基于直观和易于理解的思想,计算和实现相对简单。
非参数检验优缺点总结
检验效能较低
与参数检验方法相比,非参数检 验方法的检验效能通常较低,即 当原假设为真时,非参数检验方 法更容易犯第二类错误(接受原 假设)。
对数据信息的利用不 充分
非参数检验方法通常只利用数据 的部分信息(如排序信息),而 忽略了数据的其他有用信息(如 数值大小),因此可能无法充分 利用数据信息。
两配对样本非参数检验
包括Wilcoxon 符号秩次检验、McNemar 检验 等方法,用于比较同一总体内两个配对样本的差 异是否显著。
两独立样本非参数检验
包括Mann-Whitney U 检验、Kruskal-Wallis H 检验等方法,用于比较两个独立样本所来自的 总体的分布位置或分布形状是否存在差异。
考虑样本量大小
在选择置信水平时,应充分考虑样本量的大小。当样本量较小时,应选择较低的置信水平以避免过大的估计误差;当 样本量较大时,可以选择较高的置信水平以获得更精确的估计结果。
参考相关文献或行业标准
在选择置信水平时,可以参考相关领域的文献或行业标准,了解通常采用的置信水平及其依据。这有助 于确保研究结果的可比性和可靠性。
04
假设检验原理与步骤
假设检验基本概念阐述
原假设与备择假设
原假设通常是研究者想要推翻的 假设,而备择假设则是研究者希 望证实的假设。
检验统计量与拒绝域
检验统计量是根据样本数据计算出 的用于检验原假设的统计量,而拒 绝域则是根据显著性水平和检验统 计量的分布确定的,当检验统计量 落入拒绝域时,我们拒绝原假设。
单侧检验
当研究者对备择假设的方向有明确预期时,即备择假设只可能大于或小于原假设时,应选择单侧检验 。例如,在比较两种药物疗效的研究中,如果研究者预期新药疗效优于旧药,则应选择单侧检验。
统计学课件第六章抽样调查PPT课件
特点
每个样本被选中的机会都 相等,样本的代表性相对 较好。
分层抽样
定义
先将总体按一定标准分成 若干层次或群,然后从各 层或群中按随机原则抽取 样本。
方法
分类抽样、比例抽样、类 型抽样。
特点
能够提高样本的代表性, 降低误差,减少资源浪费。
系统抽样
定义
先将总体中的所有个体按某种顺序排列,然后按 照固定的间隔或系统选取样本。
改进抽样方法
采用更科学的抽样方法和技术,如分层抽样、系统抽样等,以提 高样本的代表性。
提高样本代表性
在抽样过程中尽量减少非随机误差,如无回答、不完整数据等, 以提高样本对总体的代表性。
05 抽样调查的组织与实施
抽样调查的设计
确定调查目的
明确调查的目标和意图,为后 续的抽样设计提供指导。
确定调查对象
合理安排问题的顺序、布局和格式,以提高 问卷的易用性和回答率。
确定调查方式
选择合适的调查方式,如自填式、面访式等, 并确定数据收集的途径。
测试与修正
对问卷进行测试和修正,确保问卷的准确性 和可靠性。
调查的实施与质量控制
培训调查员
对调查员进行培训,确保他们了解调 查目的、问卷内容、调查方法等。
现场实施
将总体分成若干个群集或组,然后从每个 群集或组中抽取一定数量的样本,也称为 簇抽样或组抽样。
抽样调查的应用场景
01
02
03
04
市场调查
通过对目标市场的部分消费者 进行调查,了解市场需求、消 费者行为和产品反馈等信息。
社会调查
通过对一定范围内的社会成员 进行调查,了解社会现象、人 口状况和社会问题等信息。
统计学课件第六章抽样调查ppt课 件
第六章抽样理论与参数估计作业案例
样本均值的分布与总体分布的比 较 (例题分析)(重复抽样)
总体分布
.3 P(X)
抽样分布
.3 .2 .1 0
.2 .1 0
1
2
3
4
1.0 1.5 2.0 2.5 3.0 3.5 4.0
X
= 2.5
σ2 =1.25
1.25 0.625 2
2 X
X 2 .5
样本均值的抽样分布
• 简单随机抽样法的局限是:当样本 规模小时,样本的代表性较差。
简单随机取样有两种基本方式:
• 抽签法(drawing lots) • 随机数字表法(random number table)
2.等距抽样
• 等距抽样(interval sampling)也称为 机械抽样或系统抽样。实施时,先把 总体中的所有个体按一定顺序编号,
样本均值的抽样分布
3 2.0 2.5 均值X的取值 4 2.5 3.0 均值X的个数
3.0 2
3.5 2
取值的概率P(X ) 2/12 2/12 4/12 2/12 2/12
样本均值的抽样分布
(例题分析)(不重复抽样)
总体分布
.3 .2
.1 .3 .2 P(X)
抽样分布
.1 0
0
1
2
3
4
1.0 1.5 2.0 2.5 3.0 3.5 4.0
然后依固定的间隔取样。
• 等距抽样可以保证样本的成分与总体
一致,但随机性不如单纯随机抽样法。
应用中可将两种方法结合使用。
3.分层随机抽样
• 分层随机取样简称分层抽样 (stratified sampling 或
hierarchical sampling),是进行
市场调查分析师考试《调查概论(中级)》教材讲义-第六章 抽样估计【圣才出品】
第六章抽样估计第一节抽样估计的基本原理一、抽样估计是统计学中参数估计的具体应用抽样估计是根据对样本的观察结果来估计推断总体的某些特征的。
在抽样调查的抽样估计中它与传统的统计学中的参数估计的区别:1.在传统的统计学中往往假设被研究的总体是个无限总体,建立在可实验观察的基础上,是可以无限进行的。
而抽样调查在现实中通常是有限总体,而且大都是社会经济现象,无法重复进行。
2.在传统的统计学中,假定样本观察值是独立同分布的,而抽样调查的观察值通常是在有限总体中不重复抽样,因而观察值之间是不独立的,使得一些抽样方差的计算比较复杂。
3.参数估计的理论中通常假定总体分布的形态是已知的,从而在理论上比较侧重于讨论小样本的精确分布。
而抽样调查中研究对象的总体分布是未知的,使用比较多的是大样本情况下估计量的近似分布,即正态分布。
4.参数估计中讨论的样本,通常是等概率的随机抽样,而抽样调查中往往由于抽样单元的大小不同或分层抽样等原因而实施不等概率抽样和多种方式的抽样。
最后,传统的参数估计主要是考察抽样误差,而抽样调查除了考察抽样误差外,还要注意非抽样误差。
二、抽样分布在抽样估计中,要得到总体参数的估计是从样本出发,对样本数据进行必要的加工处理和计算,所得到的结果称为统计量或估计量,用相应的估计量来估计总体参数。
然而,估计量是一个随机变量,它的具体估计值是随着不同的样本单元而变化的,因而就有一定的分布,这个分布就叫做抽样分布。
抽样调查主要是根据估计量的抽样分布来对总体进行区间估计。
三、大数定律和中心极限定理大数定律是用样本估计总体的理论基础。
其直观含义是随机事件的规律性是在大量观察中才能显露出来,虽然在每次试验中不可避免地出现随机误差,但随着观察次数的增加,随机影响将相互抵消而使规律具有稳定的性质。
中心极限定理则奠定了样本估计量对总体参数进行区间估计的理论基础。
其直观含义是不论总体服从什么分布,只要方差有限,在观察值足够多时,许多估计量的分布,就趋向正态分布。
抽样估计
人生得意须尽欢,莫使金樽空对月。0 1:45:29 01:45:2 901:45 11/17/2 020 1:45:29 AM
做一枚螺丝钉,那里需要那里上。20. 11.1701 :45:290 1:45No v-2017 -Nov-2 0
日复一日的努力只为成就美好的明天 。01:45:2901:4 5:2901:45Tues day , November 17, 2020
2
x ( R r ),
x r R 1
2
P(Rr) P r R 1
2
2 x
(xi x)
R
,
2 P
(
pi
R
p)2
注:整群抽样是对中选 群进行全面调查,所以 只存在群间抽样误差不 存在群内抽样误差
抽样方案的检查:
主要有(1)准确性检查(以方案所要求的 允许误差范围为标准)
(2)代表性检查(方案中的样本指
二、抽样推断的内容
(一)参数估计。特点是不知道总体的数 量特征,依据所获得的样本观察资料,对所研究 现象总体的水平、规模等数量特征进行估计
(二)假设检验。特点是对总体的变化情 况不了解,不妨对总体的状况作某种假设,然后 再根据抽样推断的原理,根据样本观察资料对所 作假设进行检验,来判断着种假设的 真伪,以决 定行动的取舍。
l估计值
x x
l估计值的误差范围
t
x
x
注意:t=1 F(t)-68.27%
t=2 F(t)=95.45% t=3 F(t)=99.73% 需要熟记
区间估计:
x x X x x
p p P p p
区间估计的步骤:
(x
t ) X
(p
t ) p
第六章 抽样推断
第六章 抽样推断一、本章学习要点(一)总体参数,也称总量指标,是由总体各单位标志值计算而来的,样本统计量则由样本各单位标志值计算而来的指标。
通常有平均数、标准差、成数等。
重复抽样与不重复抽样的样本统计量分布是不同的。
如果样本的n 个个体完全来自于某一正态总体N (X ,2σ),则当方差已知时,样本均值服从正态分布;如果总体方差未知,则样本均值服从t (n-1)分布,且对于大样本,样本均值趋于正态分布。
即使总体分布未知,根据中心极限定理,大样本下的样本均值近似服从正态分布。
对于大样本,样本成数同样趋于服从正态分布。
(二)抽样估计就是利用样本指标值来估计相应总体指标的数值,又称参数估计,它有点估计和区间估计两种。
点估计就是用样本指标的实际值直接作为相应总体参数的估计值,如X =x ,区间估计就是根据给定的概率保证度,利用实际资料计算出总体参数的估计区间(上限和下限),并以这一区间作为总体参数的估计值。
优良估计量应该满足无偏性、一致性、有效性。
抽样误差有几种不同的形式。
实际抽样误差是指样本统计量所得的抽样统计值与总体参数真值之间的绝对离差;抽样平均误差(抽样标准误差)是样本统计量抽样分布的标准差。
通常有用x μ、p μ或者σ(x )、σ(p )表示;抽样极限误差是指以样本统计量统计总体参数时所允许的最大误差范围。
通常用 x ∆或 p ∆ 表示。
影响抽样误差的因素有:总体内在差异程度、样本容量、抽样方法、抽样组织形式。
抽样极限误差Δ与抽样标准误差μ 所得的相对数称抽样误差的概率度,用t 表示。
xx t μ∆= 或pp t μ∆= ,它是测定抽样估计可靠程度的一个参数。
(三)不同抽样组织形成的含义、要求、效果及估计方法是不同的,具体表现为点估计值、抽样标准误差及样本容量的计算公式不同。
其中最基本的是简单随机抽样,下表给出了二、本章思考题及练习题(一) 填空题1.抽样推断是按照,从总体中抽取样本,然后以样本的观察结果来估计总体的数量特征。
第六章 抽样分布及总体平均数的估计
• 对总体参数的一种看法 总体参数包括总体均值、比例、方差等 分析之前必需陈述
三 假设检验的基本原理
2、什么是假设检验?
1)概念 事先对总体参数或分布形式作出某种假设, 然后利用样本 信息来判断原假设是否成立。 2) 类型 参数假设检验 非参数假设检验 3)特点 采用逻辑上的反证法 依据统计上的小概率原理
二 总体平均数的估计
(3)区间估计(interval estimation)
根据估计量以一定可靠程度推断总体参数所在的区间 范围,用数轴上一段距离表示未知参数可能落入的范围, 虽不具体指出总体参数等于什么,但能指出未知总体参数 落入某一区间的概率有多大。
(4)置信区间(confidence interval)
一 抽样分布与平均数抽样分布
3、样本平均数与总体平均数离差的形态
(2)总体方差未知 总体正态,样本平均数与总体平均数的离差统 计量呈 t 分布; 总体非正态,但满足n>30这一条件,样本平均 数与总体平均数的离差统计量 近似t 分布。
t分布
t 分布(t-distribution)是统计分析中应用较多 的一种随机变量函数的分布,是统计学者高赛特 1908年以笔名“Student”发表的论文中推导出来 的一种分布,又叫学生氏分布。这种分布是一种 左右对称,峰态比较高狭,分布形状随样本容量 n-1的变化而变化的一组分布。
二 总体平均数的估计
4 总体方差σ2未知时,总体平均数μ的估计 用样本的无偏方差作为总体方差的估计值,样本 平均数的分布为t分布,应查t值表,包括以下两 种情况:
(1)总体的分布为正态时,可不管n值大小。 (2)总体分布为非正态,只有n>30,才能用概率对其样本 分布进行解释。
第六章 抽样
例:以某高校6000名在校大学生为总体:
抽样1:按一定方式抽取300名大学生作样本;
抽样2:按一定方式抽取10个班作样本;
分析:两种抽样方式下的抽样单位和抽样框
(四)抽样框sample frame
一次直接抽样时总体中所有元素的名单。 抽样框是抽样操作依据的名单,是和调查的总体相 对应的
究总体的操作化界定,规定了调查对象选择的具体指标。
• 目标总体和调查总体吻合度越高,调查的代表性就越好;否则会
产生覆盖误差。
(二)制定抽样框
1.抽样框是对研究总体的进一步操作。
2.抽样框的意义
(1)抽样框与研究/调查总体之间可能不匹配,可能包含研 究总体之外的某些人,或可能遗漏其中的某些人. (2) 根据样本所得到的结果,只能代表组成抽样框的各个 要素的集合 (3) 样本的大小(规模)与其能否正确代表总体比较起 来,是一项不太重要的因素。
(五)参数值——又称总体值,是关于总体中某一变量的 的综合描述,或者说是总体中所有元素的某种特征的综 合数量表现。 –参数值只有对总体中每一个元素都进行调查或测量才 能得到。 (六)统计值——又称样本值,是关于样本中某一变量的 综合描述,或者说是样本中所有元素的某种特征的综合 数量表现。 –统计值是从样本中计算出来的,它是相应的参数值的 估计量。
一、简单随机抽样
(一)定义
又称纯随机抽样,是概率抽样的最基 本形式。 它是按等概率原则,直接从含有N个 元素的总体中随机抽取n个元素组成样本 (N>n)。
(二)选取样本的两种办法
1.抽签方式 (1)将总体名单从1到N编号,形成抽样框; (2)准备N张卡片,每张卡片上的号码与总体 名单编号对应,将卡片放在盒子里,混合均匀; (3)根据抽样设计的样本规模,从盒内n次取 出n张卡片; (4)根据取出的卡片上的号码,找到总体名单 上对应的元素,构成样本。
统计学 抽样估计习题
第六章抽样估计题一、单项选择题1、抽样推断的基本内容是:A.参数估计B.假设检验C.参数估计和假设检验两方面D.数据的收集2、抽样平均误差的实质是A. 总体标准差B. 抽样总体的标准差C. 抽样总体方差D. 样本平均数(成数〉的标准差3、不重复抽样平均误差:A. 总是大于重复抽样平均误差B. 总是小于重复抽样平均误差C. 总是等于重复抽样平均误差D. 上情况都可能发生4、在其它条件不变的情况下,抽样单位数增加一半,抽样平差A. 缩小为原来的81.6%B. 缩小为原来的50%C. 缩小为原来的25%D.扩大为原来的四倍5、样本的形成是:A.随机的B.随意的C. 非随机的D.确定的6、抽样误差之所以产生是由于:A. 破坏了随机抽样的原则。
B. 抽样总体的结构不足以代表总体的结构。
C. 破坏了抽样的系统。
D.调查人员的素质。
7、抽样误差指的是:A. 代表性随机误差B. 非抽样误差C. 代表性误差D. 随机性误差8、抽样误差大小A. 可以事先计算,但不能控制B. 不可事先计算,但能控制C. 能够控制和消灭D.能够控制,但不能消灭9、随机抽出100个工人,占全体工人1%,工龄不到一年的比重为10%。
在概率为0.9545时,计算工龄不到一年的工人比重的极限抽样误差。
A.0.6%B. 6%C. 0.9%D. 3%10、根据抽样调查25个工厂(抽取2%)资料,采购阶段流动资金平均周转时间为52天,方差100,在概率为0.954时,计算流动资金平均周转时间的极限抽样误差。
A.0.8B.3.96C.4D.22611、根据某城市抽样调查225户,计算出户均储蓄额30000元,抽样平均误差800元,试问概率为90%,户均储蓄余额极限误差是多少?A.53.3B.1.65C.720D.132012、根据某市公共电话网100次通话情形抽样调查,知道每次通话平均持续时间为4分钟,均方差为2分钟。
在概率为0.9545时,计算每次通话平均持续时间的极限抽样误差。
统计学第六章 抽样估计
(2)通过试访问进行估计 通过试访问的方法,先获得少数一部分样 本的误差数据,然后根据这些数据去计算最终 所需要的样本量,然后再将所需要的样本量完 成。
(3)序贯抽样方法 所谓序贯抽样,是指依次抽取样本,每抽 取一次,进行一次误差计算,直至达到所需要 的精度。
一般做序贯抽样时,会有一张图,如黑板 上图所示。
案例:
假定欲估计喜欢某产品的居民比例在95% 置信度水平下,要求绝对误差小于5%,求样 本量。
本题解法:
但是,如果是相对误差,已知P
五、其他抽样组织形式
1、分层抽样(Stratified Sampling) 2、整群抽样(Cluster Sampling) 3、多阶段抽样(Multi-stage Sampling) 4、设计效应(deff)
序贯抽样的方式操作比较简单,但不适用 于经济调查,一般运用于质量检验中。
(4)成数估计时,使用最大值判断 绝对误差与相对误差 有时候绝对误差很小,但相对误差会很大。
对于绝对误差: 当成数是P时,其标准差为 在成数估计的条件下,方差的最大值为 0.25,因此可以使用最大的方差作为推断最大 样本量的基础。
1、样本平均数的分布
从一个总体中抽出一部分单位,构成一个 样本,可计算出一个样本平均数。
无数次抽选的结果,将会产生无数个样本 平均数,这些样本平均数具有自己的分布形式。
根据大数定理,当样本量超过30时,样本 平均数的分布为正态分布。
2、分布特征
在有放回条件下,简单随机抽样的误差计 算公式如下:
3、多阶段抽样(Multi-stage Sampling)
多阶段抽样的误差计算取决于各阶段的 抽样方式,以最简单的二阶段抽样为例,如 果每一阶段的抽选都是简单随机抽样,一阶 单位的规模相同,则有下列公式:
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
抽样估计中的基本概念
(一)总体和样本 (二)总体指标和样本指标 (三)重复抽样和不重复抽样
总体和样本
总体:研究现象的全体,由所研究范围
内具有某种相同性质的全体单位所组成 的整体。通常用N表示。
属性总体 品质标志
总 体
变量总体 数量标志
样本(子样):从总体中随机抽取出来,
代表总体的那部分单位的集合。 样本单位数,又称样本容量,通常用n表 示。
业名录、电话本、花名册、俱 乐部名录、黄页簿、工商局企 业登记库、行业年鉴等都是市 场调查中常用的抽样框。
1.抽样估计的概述
概念:
在抽样调查的基础上,用样本的实际资料计算样 本指标,并据此估计和推断总体相应数量特征的 一种统计推断方法。
特点:
随机原则抽取; 部分单位推断总体; 误差可算可控; 基于概率的一种统计推断方法。
N
i i 1
k
i
类型抽样确定各组样本的方法:
N1
总体N
n1 n2
n3
比例抽样
n1
Ni n N
N2
N3
适宜抽样
n1
Ni i n N i i
例:某项粮食播种面积20000亩,其中有平原和山区两种地形。以类型 抽样的方法了解平均粮食产量。
地形 平原 山区 合计 全部面积(Ni) 14000 6000 20000 样本面积(ni)
适用范围: 总体规模不大,内部差异较小。
例:一个班组有A、B、C、D、E 5个工人,随机抽取2个工人的日 工资数作为了解整个班组平均工资水平的样本。 可能的结果是
样本号 A A B C D E B C D E
有放回抽样:25个样本 不放回抽样:20个样本
2. 等距抽样(机械抽样或系统抽样)
将总体按某一标志值顺序排列,然后相等距离或相等间隔抽取样本 单位。
x
2 ( x X )
M
P
2 ( p P )
M
(例题分析)
【例】设一个总体,含有4个元素(个体) ,即总体单位 数N=4。4 个个体分别为x1=1、x2=2、x3=3 、x4=4 。总 体的均值、方差及分布如下 总体分布
.3
均值和方差
x
i 1
N
i
.2 .1 0
1 2 3 4
理论基础:
大数法则、中心极限定理 大数法则:关于大量的随机现象具有稳定性质的 法则。它论证了抽样平均数趋近于总体平均数的 趋势,为抽样估计提供了重要的依据。 中心极限定理:研究变量和分布序列的极限定理。 如果总体变量存在有限的平均数和方差,那么不 论这个总体变量分布如何,随着抽样单位数n的增 加,抽样平均数的分布将趋近于正态分布。
因 此:理论上讲,抽样误差一般指随机误差, 而不包括登记性误差和系统性偏差。
影响抽样误差的因素
总体各单位的差异程度:
标准差越大,抽样误差越大;
样本单位数的多少:
n 越大,抽样误差越小; 抽样方法:不重复抽样比重复抽样小; 抽样组织方式:简单随机抽样最大。
抽样误差的侧度
(一)抽样实际误差 (二)抽样平均误差 (三)抽样极限误差
样本 从总体中抽出的部分单位 统计量 样本容量 样本平均数 样本比率 样本方差 样本标准差
n x p s2 s
总体 研究对象的全部单位 参数 总体容量 总体平均数 总体比率 总体方差 总体标准差
N
P
符号
2
随机抽样设计
1. 纯随机抽样(简单随机抽样)
对总体不做任何分类或排序,完全按随机原则抽样。
总体指标的数值也是唯一确定的
推断和估计
总体指标(未知)
总体指标:参
数(未知量)
统计推断
样本总体指标:统
计量(已知量)
注意
总体是唯一确定 的,样本总体不唯一
对于变量总体,常用的总体指标有总体 平均数 、总体标准差
设总体变量X为:X1,X2,X3…,XN,则有:
或
或
X
m i 1
i m
X fi
4. 整群抽样
将总体按某个标志分为多个群,按纯随机抽样方式或等距抽样方式, 抽取若干群,然后对所抽中的各群中的全部单位一一进行调查。
适宜范围:不适合单个抽样的场合,就可采用整群抽样方式。 优缺点:调查方便,但抽样误差较大。
总群数 R =13 A B C F D G H K I J C G D K n=nc+nd+ng+nk 样本数 r =4 样本容量
E
L
M
例:从某县100个村中抽出10个村,进行全面调查,就可以大致了 解农村家庭副业发展情况。
5. 多阶段抽样
总体包含的单位很多,分布很广,要通过一次抽样抽选样本很困 难,此时,可以将其分成若干阶段,然后逐阶段进行抽样,以完成 整个抽样过程。 特点:多个阶段、多种方法综合抽样,优点是降低抽样成本。
N1 P N
,
N 0 N N1 Q 1 P N N
样本指标:根据样本各单位标志值或标志
属性计算的综合指标,也称统计量,它是 来估计和推断总体参数的。 与总体指标相对应,有样本平均数、样本 成数及样本标准差等。
设样本变量x的观察值为:x1,x2,…,xn,则:
样本平均数:
x x n
Байду номын сангаас
3
4
1
2 3 4
1,1
2,1 3,1 4,1
1,2
2,2 3,2 4,2
1,3
2,3 3,3 4,3
1,4
2,4 3,4 4,4
(例题分析)
计算出各样本的均值,如下表。并给出样本均 值的抽样分布
16个样本的均值(x)
.3
P (X )
nk n1 n2 n N1 N 2 Nk N
类型适宜抽样:考虑各类型标志变动程度 i 不同,变动程度大的组
要多抽样,变动程度小的类型组可少抽样,使得各类型组的变动程度 Ni n i 在所有类型变动程度之和 N 中的比例相同,等同于 或 N
k i i i 1
n
ni n
N i i
量又较大。
优点:比简单纯随机抽样更精确,能以较少的抽样单位数得到较准确的
推断结果。特别是当总体各单位变量值大小悬殊、各组标志变动程度很 大时,划分类型能保证各组都有选中的机会。
• 类型抽样分类
类型比例抽样:按统一的比例来确定各类型组应抽选的样本单位数,
即各类型中抽取的样本单位数 ni 占各类型组所有单位数 Ni 的比例 是相等的,等同于样本单位总数 n 占总体单位数 N 的比例
同一总体单位有可能被重复抽中, 而且每次抽取都是独立进行
不重复抽样
抽出 个体 特点
又被称作不重置抽样、不 放回抽样 登记 特征 继续 抽取
同一总体中每个单位被抽中的机会并 不均等,在连续抽取时,每次抽取都 不是独立进行。
是最常用的抽样方法,用于无限总体和许多 有限总体样本单位的抽样。
名称 定义 特征
第六章 抽样估计
主要内容
1.抽样估计概述 2.抽样误差 3.抽样估计的方法 4.样本容量的确定
抽样调查的程序
定 义 总 体 及 样 本 确 定 样 本 容 量 进 入 调 查 阶 段
设 计 抽 样 方 案
选 择 抽 样 框
选 择 抽 样 方 法
选择抽样框
抽样框就是所有总体单位的集合, 是总体的数据目录或全部总体单位 的名单。 根据抽样框可以重新界定总体。如 抽样框是电话簿,则家庭成员总体 可以被重新界定为列入电话簿中的 那部分家庭的成员。
2
fi
i 1
对于属性总体,最常用的指标是成数。
总体成数表示总体中具有某种性质的单位数 在总体全部单位数中所占的比重,以P表示;总
体中不具有某种性质的单位数在总体全部单位数 中所占的比重则以Q表示。 设总体N个单位中,有N1个单位具有某种性质, N0个单位不具有某种性质,N1+ N0=N,则有:
样本均值的抽样分布
(例题分析)
总体分布
.3 P(X)
抽样分布
.3 .2 .1 0
.2 .1 0
1
2
3
4
1.0 1.5 2.0 2.5 3.0 3.5 4.0
X
= 2.5
σ2 =1.25
X 2.5 2 X 0.625
在实际抽样调查中,总体单位 数N常常很大,样本单位数n一般也 不小于30,由此产生的所有样本数 目是极大的,不可能抽完所有可能 的样本;同时,在开展抽样调查之 前,总体指标是未知的。因此,实 际工作中,定义式缺乏可操作性。
例:对某山区的林采蓄积量作抽样调查。将总体50块面积相等的地 划为10个区,每个区包括5个地块。采用两阶段抽样,先从10个区 选中30%,再从选中的区域中抽取60%的地块组成样本进行调查。
2.抽样误差
抽样误差地概念 抽样误差的侧度
抽样误差
----指所选取的样本的结果不能
完全代表总体而导致的误差。
排序标志
无关标志
有关标志
间隔距离:
N k n
N:总体单位数 n:需要抽取的样本单位数
例:从某企业5000名职工中抽取100人进行家庭收入水平调查。 样本的距离=
5000 50 100
起点的选择:按姓氏排序,在第一个间隔中随机选取。