第八章 抽样推断
第八章抽样推断
设Δx与Δp分别表示样本平均数与 样本成数的抽样极限误差,则 有:|x-X|≤Δx,|p-P|≤Δp
上述不等式也可表示成 :
x-Δx≤X≤x+Δx,
p-Δp≤P≤p+Δp
例如,根据样本计算得某产品耐用的平均 时数为6000小时,抽样极限差为600小时, 则相对误差限
Δx 600 Δx'=──=──=0.1
4.抽样的组织形式。选择不同的抽样组织形式,也 会有不同的抽样误差。
二、抽样平均误差
(一)样本平均数的平均误差
以μ x表示样本平均数的平均误差,σ表示总体 的标准差。
1.当抽样方式为重复抽样时
μx=σ/√n
它说明在重复抽样的条件下,抽样平均 误差与总体标准差成正比,与样本容量 的平方根成反比。
(二)样本成数的平均误差。
二、抽样误差大小的影响因素
1.总体各单位标志值的变异程度。在其他条件不变 的情况下,总体各单位标志值的变异程度愈大, 抽样误差也愈大,反之则愈小。
2.样本单位数的多少。在其他条件不变的情况下, 样本单位数愈多,抽样误差就愈小,反之则愈 大。
3.抽样方法。抽样方法不同,抽样误差也不同。一 般说来,重复抽样的误差比不重复抽样的误差 要大。
2.在不重复抽样条件下,估计量P的误差 限为: 当N很大时,有:△p=tμp
三、样本容量的确定
•
样本容量的确定,可根据抽样极限误差的计算公
八抽样推断考试习题
单项选择題
1. 抽样调查的主要目的在于(
A. 计算和控制误差
B. 了解总体单位情况C .用样本来推断总体 D.对调查单位作深入的研究
2. 抽样调查所必须遵循的基本原则是( 人 A.
随意原则 B. 可比性原则
C .准确性原则 D. 随机氐则
3. 无偏性是指( A.
抽样指标等于总体指标
B. 样本平均数的平均数等于总体平均数
C .样本平均数等于总体平均数
D.样本成数等于总协成数
4. 一致性是指当样本的单位数充分大时,抽样指标( )。
A.小于总体指标
B.等于总体指标
C .大于总体指标D.充分靠近总体指标
5. 有效性是指作为优良估计量的方差与其他估计量的方差相比,有( )
A.前者小于后者
B.
前者大于后者
C.两者相等
D.
两者不等
6. 能够事先加以计算和控制的误差是( A.抽样误差 B.
登记误差
C .代表性误差 D. 系统性误差
7. 对两个工厂工人平均工资进行不重复的随机抽样调查,
抽查的工人人数一样, 但第二个厂工人数比第一个厂工人数整整多一倍。抽样平均误差( 人
A.第一工厂大
B. 第二个工厂大
C .两工厂一样大 D.无法做出结论
8. 在同样情况下,不重复抽样的抽样平均误差与重复抽样的抽样平均误差相比, 是( )。
A.
两者相等B.两者不等
C .前者小于后者 D.前者大于后者。
9. 反映抽样指标与总体指标之间抽样的可能范围的指标是(
第八章 抽样推断
两工厂工人工资方差相同,
A.抽样平均误差
B. 抽样误差系数
C.概率度
D. 抽样极限逞差.
10. 在进行纯随机重复抽样时,为使抽样平均误差减少25%则抽样单位数应()。
抽样推断
抽样推断
第一节
抽样推断概述
一、抽样推断的概念及特点 • ☆抽样推断的概念: 按随机原则从总体中抽取一部分单位(称为样 本),根据样本的信息对总体的数量特征进行科学 估计与推断的方法称为抽样推断。 • ☆抽样推断的主要特点: 第一、按随机原则抽取调查单位 第二、根据部分推断总体 第三、抽样误差可以估计和控制,推断结果 具有一定的可靠性和准确性。
• ☆检验问题:H0:m =m0 , H1:m m0 (m0为
已知常数) 拒绝域为:
• ☆检验问题:H0:m ≤m0 , H1:m m0 (m0为 已知常数) 拒绝域为:
t t( ) n 1
• ☆检验问题:H0:m ≥m0 , H1:m m0 (m0为
已知常数) 拒绝域为:
t t( ) n 1
t t( ) n 1
三、总体成数的检验 • ☆检验问题:H0:P = P0 ,H1: P≠P0 p p0 大样本时的统计量为 z p0 (1 p0 ) / n 拒绝域为:
| Z | Z / 2
四、假设检验与区间估计的关系 • ☆置信区间与假设检验的关系为: 若置信区间包括m0在内,则接受H0 ; 若置信区间不包括m0在内,则要拒绝H0 , 接受H1 。
N n ) N 1
2、总体方差s2未知时,对总体均值的区间估计 • ☆总体均值m的置信度为100(1-)%的置信 区间为: 重复抽样: 不重复抽样:
统计学原理简答题答案
统计学原理简答题答案
《统计学原理》简答题答案
第一章总论
1.统计一词有几种含义?它们之间的关系?
答:三种。统计工作、统计资料、统计学。
(1)统计工作:即统计实践活动,是指从事统计业务的机关、单位利用科学的统计方法,搜集、整理分析和提供有关客观现象的数据资料、研究数据的内在特征,并预测事物的发展方向等一系列工作过程的总称。
(2)统计资料:是统计实践过程的取得的各项数据资料以及与它相联系的其他资料的总称。(3)统计学:统计工作与统计资料的关系是统计活动即过程与统计成果的关系,统计工作与统计学的关系是统计实践与统计理论的关系
2.社会经济统计的特点有哪些?
答:社会经济统计是社会现象的一种调查分析活动,它具有以下特点:
a)数量性b)总体性c)变异性d)社会性
3.什么是统计总体、统计单位、标志、变异、变量和变量值?并举例说明。
答:(1)统计总体,简称总体,是指客观存在的在同一性质基础上结合起来的许多个别事物的整体。例如,研究某班学生的情况时,该班全体学生就是一个统计总体。
(2)统计单位,是指构成统计总体的个别事物。例如,以我国全部普通高等院校为总体,每一个普通高等院校就是总体单位。
(3)标志,是指总体单位所共同具有的某种属性或特征。例如,工人作为总体单位,他们都具备性别、工种、文化程度、工会、工资等属性或特征。
(4)变异是变动的标志,具体表现在各个单位的差异,包括量(数值)的变异和质(性质、属性)的变异。如:性别表现为男、女,
这是属性变异;年龄表现为18岁、25岁、28岁等这是数值上的变异。
(5)变量,就是可变的数量标志。例如,商业企业的职工人数、商品流转额、流动资金占用额等数量标志,在各个商业企业的具体表现都是不尽相同的,是一个变动的量,这些变动的数量标志就称作变量。
第八章抽样推断作业
第八章抽样推断作业
1.某广告公司为了估计某地区收看某一新电视节目的居民人数所占比例,要设计一个简单随机样本的抽样方案。该公司希望有90%的信心视所估计的比例只有2个百分点左右的误差。为了节约调查费用,样本将尽可能小。试问样本量应该为多大?
2.某地区对居民用于某类消费品的年支出额进行了一次抽样调查,抽取了400户居民,调查得到的平均每户支出数额为350元,标准差为47元,支出额在600元以上的只有40户。试以95%的置信度估计:(1)平均每户支出额的区间;(2)支出额在600元以上的户数所占比例的区间。
3.某地区有1000家商店,按大、中、小分为三类,其商店数分别为N 1 =200, N 2=300, N 3 =500.今按比例分配抽取一个容量为n=100的分层随机样本,平均年营业额(单位:万元)分别为1201=y , ,752=y ,403=y 各层的样本方差分别为S 12 =44, S 22 =18, S 32 =5.试求该地区平均每家年营业额的置信度为95%的置信区间。
4.质量监督部门从某厂生产的500箱同类产品中随机抽取了10箱,并对这10箱进行全面检验。这10箱产品的合格率分别为:85%,90%,90%,92%,92%,96%,96%,95%,95%,95%。试求该厂这批产品不合格率的置信度为95%的置信区间。
第八章抽样推断第章抽样推断
PPT文档演模板
第八章抽样推断第章抽样推断
¡ 我们所讲的抽样误差就是指这种偶然性代表性误差。 即按随机原则抽样时,在没有登记性误差和系统性 误差的条件下单纯由于不同的随机样本得出不同估 计量而产生的误差。抽样误差是抽样调查所固有的, 是无法避免与消除的,但可以运用数学方法计算其 数量界限,并通过抽样设计程序控制其范围,所以 这种抽样误差也称为可控制误差。
PPT文档演模板
第八章抽样推断第章抽样推断
¡ 根据计算极限误差的基本公式
第一节 抽样推断的一般问题
一、抽样推断的意义 抽样推断是按照随机原则,从全部研究 总体中抽取一部分单位进行调查,并依 据所获得的数据对总体的某一数量特征 做出具有一定可靠程度的估计与推断的 一种统计方法。抽样推断的全过程,就 是抽样调查。
PPT文档演模板
第八章抽样推断第章抽样推断
▪抽样推断基本特点
PPT文档演模板
第八章抽样推断第章抽样推断
抽样调查实践中用来计算抽样平均误差的基 本公式是根据定义公式推导出来的。数理统 计证明,在重复抽样条件下,抽样平均误差 与总体标准差成正比,与样本单位数的算术 平方根成反比。即:
PPT文档演模板
统计学(第八章抽样推断)
统计学(第⼋章抽样推断)
第⼋章抽样推断
【教学⽬的】
抽样推断是统计研究中⼀种重要的分析⽅法。通过本章的学习,要求掌握利⽤样本统计资料来推断总体数量特征的原理及⽅法;深刻理解抽样推断的概念及特点;了解抽样误差产⽣的原因,并对抽样误差、抽样平均误差、抽样极限误差加以区别,掌握抽样平均误差、抽样极限误差的计算;掌握点估计和区间估计的⽅法;掌握必要样本单位数的确定⽅法。
第⼀节抽样推断概述
⼀、抽样推断的概念及特点(⼀)概念
按随机原则从总体中抽取部分单位,根据这部分单位的信息对总体的数量特征进⾏科学估计与推断的⽅法。
包括抽样调查和统计推断
抽样调查:⼀种⾮全⾯调查,按随机原则从总体中抽取部分单位进⾏调查以获得相关资料,以推断总体
统计推断:根据抽样调查所获得的信息,对总体的数量特征作出具有⼀定程度的估计和推断。(⼆)特点
1.按随机原则(等可能性原则)抽取调查单位.随机抽样的⽬的是为了排除⼈的主观影响,使每个样本都有系统的可能性被抽中,使样本对总体具有充分的代表性。随机性原则是保证抽样推断正确性的⼀个重要前提条件。随机抽样不是随便抽样。
2.根据部分推断总体的数量特征
3.抽样推断的结果具有⼀定的可靠性和准确性,抽样误差可以事先计算和控制其他特点有经济性、时效性、准确性、灵活性等(三)抽样推断的应⽤ 1.不可能进⾏全⾯调查时 2.不必要进⾏全⾯调查时 3.检查⽣产过程正常与否
4.对全⾯调查资料进⾏补充修正时⼆、抽样的⼏个基本概念 1.样本容量与样本个数
(1)样本容量:样本是从总体中抽出的部分单位的集合,这个集合的⼤⼩称为样本容量,⼀般⽤n 表⽰,它表明⼀个样本中所包含的单位数。⼀般地,样本单位数⼤于30个的样本称为⼤样本,不超过30个的样本称为⼩样本。
统计学 第八章 抽样调查
X
n
修正因子
(
N 1
)
n
(1
N
)
30
二、不重复(置)抽样分布
(二)抽样成数的分布
E ( p) P
XP P
P(1 P) N n ( ) P ( ) E pp n N 1 P(1 P) n (1 ) n N
31
例8-7:要估计某地区10000名适龄儿童的入学率,
用不重复抽样的方法抽取400名儿童,检查结果有
320名入学,计算样本入学率的抽样平均误差。 由上可知,P=320/400=80% 1、在重复抽样下,入学率的抽样平均误差:
P(1 P) 0.8 0.2 p 2% n 400
2、在不重复抽样下,入学率的抽样平均误差:
p
P(1 P) n 0.8 0.2 400 (1 ) (1 ) 1.96% n N 400 10000
4
二、抽样调查的特点
• 调查单位的确定是按随机原则从全部总体单位 中抽取的。 • 用部分单位的指标数值去推断和估计总体指标 数值。 • 抽样调查中的抽样误差是不可避免的,但在事 先是可以计算并加以控制的。 • 抽样推断是运用概率估计的方法。
5
三、抽样调查的作用
有些现象是无法进行全面调查的,为了测算全面资料,必须采 用抽样调查的方法。
统计学第八章 抽样推断
1.点估计法 P230 点估计又称定值估计,它是直接用样本指标代替全及指
标的一种方法。x X 或 p p
2.区间估计法 P163
区间估计法是指根据样本指标和要求的把握程度对总体 指标估计出一个可能的区间。其计算公式为:
XxΔ x
M NX N x Δ x
P p Δp
(五)多阶段抽样(P177)
1、概念
多阶段抽样是将整个抽样程序分成若干个阶段,然后逐
阶段进行抽样,以完成整个抽样过程的一种方式。
2、特点:
将整群抽样和单个抽样结合运用
3、优点(作用)
(1)当总体范围特别大、无法进行直接样本时,宜采
用多阶段抽样
(2)可以相对节约人力物力
(3)可以利用现成的行政区划、组织系统作为划分各
总体
样 本
1、全及指标(参数)
根据全及总体各单位的数量标志值或属性计算所得的指 标,称为全及指标。全及指标通常包括:
统计指标 全及平均数 全及成数 全及平均数的标准差 全及成数的标准差 全及平均数的方差
全及成数的方差
未分组资料
分组资料
X X N
P N1 N
σX
XX 2
N
X XF F
σX
X
2
X
F
F
σP P(1 P)
2
2
第八章 抽样调查与推断
第8章抽样调查与推断
【教学内容】
本章主要阐述:抽样调查的概念、特点、作用和几个基本概念;影响抽样误差的主要因素;抽样调查几种主要组织方式及其抽样平均误差的计算;抽样估计推断;点估计和区间估计;必要抽样数目的确定。
【教学目标】
1、理解抽样误差的影响因素;
2、掌握抽样调查的概念、特点和作用;
3、掌握抽样平均误差的计算方法、抽样估计推断和必要抽样数目的确定原理及方法;
4、初步具备在实际工作中正确运用抽样方法搜集资料并据以做出准确推断的能力。
【教学重点、难点】
1、抽样调查的特点和作用;
2、抽样调查的组织方式和方法;
3、抽样误差的概念与计算;
4、抽样推断方法;
5、必要抽样数目的确定方法。
第一节抽样调查的一般问题
一、抽样调查的概念、特点与作用
(一)抽样调查的概念与特点
概念:抽样调查又称抽样推断或抽样估计,它是从总体中按随机原则抽取一部分单位进行观测,并根据这部分单位的资料推断总体数量特征的一种方法。
特点:(1)按随机原则抽取调查单位。(2)由部分推断全体。(3)抽样误差可以事先计算并加以控制。
(二)抽样调查的作用
1、用于不可能进行全面调查的无限总体。
2、用于不可能进行全面调查而又需要了解全面情况的现象。
3、用于不必要进行全面调查的现象。
4、用于对全面调查的资料进行评价与修正。
5、用于工业生产过程的质量控制。
二、抽样调查中的几个基本概念
(一)全及总体和抽样总体
1.全及总体
全及总体简称总体或母体,它是指所要调查研究对象的全体。
2.抽样总体
抽样总体也称样本或子样,它是指在全及总体中按随机原则抽取的那部分单位所构成的集合体。
第八章抽样推断【思考练习】题与答案
【思考练习】
一、判断题
1.抽样平均误差总是小于抽样极限误差。( ) 2.所有可能的样本平均数的平均数等于总体平均数。( )
3.类型抽样应尽量缩小组间标志值变异,增大组内标志值变异,从而降低影响抽样误差的总方差。( )
4.计算抽样平均误差,而缺少总体方差资料时,可以用样本方差代替。( ) 5.整群抽样为了降低抽样平均误差,在总体分群时注意增大群内方差缩小群间方差。( ) 6.抽样估计的置信度就是表明抽样指标和总体指标的误差不超过一定范围的概率保证程度。( )
7.在抽样推断中,作为推断对象的总体和作为观察对象的样本都是确定的、唯一的。( ) 答案:1.×、2.√、3.×、4.×、5.√、6.√、7.×。 二、单项选择题
1.抽样调查的主要目的是( )。
A.用样本指标来推算总体指标
B.对调查单位作深入研究
C.计算和控制抽样误差
D.广泛运用数学方法 2.抽样调查所必须遵循的基本原则是( )。 A.准确性原则 B.随机性原则
C.可靠性原则
D.灵活性原则
3.反映抽样指标与总体指标之间的抽样误差的可能范围的指标是( )。 A.抽样平均误差 B.抽样误差系数 C.概率度 D.抽样极限误差
4.抽样平均误差反映了样本指标与总体指标之间的( )。 A.实际误差 B.实际误差的绝对值 C.平均误差程度 D.可能误差范围 5.抽样误差是指( )。
A.调查中所产生的登记性误差
B.调查中所产生的系统性误差
C.随机抽样而产生的代表性误差
D.由于违反了随机抽样原则而产生的误差
6.事先将总体各单位按某一标志排列,然后依排列顺序和按相同的间隔来抽选调查单位的抽样称为( )。
心理统计学--参数估计
三、总体平均数的估计
区间估计的方法和步骤
情况3:总体σ未知,总体分布未知,但样本为大容量, n>30。 注意:此时不论总体分布是否为正态,只要样本容量为 大容量,就可以用情况1的方法近似估计。但是严格说来, 此时样本抽样分布服从的是自由度为n-1的t分布。 例题P205例题7-4
三、总体平均数的估计
一、抽样分布的基本概念和理论
抽样分布从内容来看,包括样本平均数分布、 样本标准差分布、样本相关系数分布等。 抽样分布类型——正态分布、t分布、F分布、 χ2分布等都是常见的抽样分布类型,也是相 应的假设检验的理论依据。P182
一、抽样分布的基本概念和理论
中心极限定理
教材上在介绍正态分布时谈到了这个定理的内容, 但是没有专门阐述 是推断统计中最基本的理论与方法,它是用极限 的方法所求的随机变量分布的一系列定理,其内 容主要反映在三个方面。
严格随机抽样的原则 尽可能地采用大样本(数量因具体情况而定) 只对样本进行描述统计,省略对总体的推断
在各种媒体中抽样调查的报道是很常见的, 就是这样来处理。这在比较严谨的科学研究 中也是屡见不鲜。
第八章 参数估计
对心理学研究来说,恰恰相反,绝大多数场 合必须使用抽样推断。 我不了解心理学的专业研究能不能采用上述 的对抽样推断的替代处理。但是坦率来说, 对于那些统计学得比较差的同学来说,与其 运用错误的抽样推断,还不如直接用上面的 替代方法。
210编号统计第八章习题
第八章抽样推断
计算题
1.一批商品(10000件)运抵仓库,随机抽取100件检验其质量,发现有10件不合格。试按重复与不重复抽样分别计算合格率抽样平均误差。
2.某厂生产彩色电视机,按不重复抽样方法从一批出厂产品中抽取1%的产品进行质量检验,取得如下资料:
正常工作时间(千小时)电视机(台)
6—815
8—1030
10—1250
12—1440
14—169
合计144
试计算抽样平均误差。
3.假设某班期末统计学考试成绩服从正态分布,平均成绩为70分,标准差为12分,要求计算:(1)随机抽取1人,该同学成绩在82分以上的概率;(2)随机抽取9人,其平均成绩在82分以上的概率。
4.某手表厂在某段时间内生产100万个某种零件,用纯随机抽样方式不重复抽取1000个零件进行检验,测得废品为20件。如以99.73%概率保证,试对该厂这种零件的废品率作定值估计和区间估计。
5.利用第1题的资料,以95.45%的概率保证程度对该批商品的合格率作出区间估计。6.根据第2题的资料,对该厂生产的这批彩色电视机的正常工作时间作出区间估计。如果规定彩色电视机的正常工作时间在12 000小时以上为一级品,试对该厂这批出厂产品的一级品率作出区间估计。(F(t)=95%)
7.对某型号电子元件10000只进行耐用性能检查。根据以往抽样测定,求得耐用时数的标准差为600小时。试求在重复抽样条件下:(1)概率保证程度为68.27%,元件平均耐用时数的误差范围不超过150小时,要抽取多少元件做检查?(2)根据以往抽样检验知道,元件合格率为95%,合格率的标准差为21.8%,要求在99.73%的概率保证下,允许误差不超过4%,试确定重复抽样所需抽取的元件数目是多少?如果其他条件均保持不变,采用不重复抽样应抽取多少元件做检查?
电子课件 [统计学原理与实务(第3版)][曹印革][电子教案和习题解答] 第八章 抽样推断分析
(2)根据已给定的置信度,求抽样极限误差。具体步 骤是: 1.抽取样本,计算抽样指标,作为总体指标的估计值, 并计算样本标准差以推算抽样平均误差。 2.根据给定的置信度,查正态分布概率表求得概率度 值。 3.根据概率度和抽样平均误差推算抽样极限误差,并 根据抽样极限误差求出被估计总体指标的上、下限。
x X
x
x
Pp p Pp
由于总体指标是未知的,它要用实测的样本来估 计,因而极限抽样误差的实际意义是希望总体平均数 和总体成数落在根据抽样平均数(成数)所确定的范 围内。
因此上述不等式可推导为 :
x X x
x
x
pp P pp
(二)抽样推断的概率度 抽样极限误差与抽样平均误差的比值。
数理统计证明,当抽样总体的单位数足够大时,抽 样平均数和抽样成数都接近于以全及总体平均数或成数 为中心的正态分布,正态分布具有两个重要特征:
2.特点 (1)抽样推断是由部分推算总体的一种认识方法。 (2)抽样推断是建立在按随机原则抽取样本的基础上。 (3)抽样推断是运用概率估计的方法。 (4)抽样推断产生的误差可以事先计算、并加以控制。
二、抽样推断的作用 1.应用抽样推断法可对某些不可能或不容易进行全面 调查而又要了解其全面情况的社会经济现象进行数量 方面的统计分析。 2.应用抽样法可对全面调查的结果加以补充或订正。 3.应用抽样法可对生产过程中产品质量进行检查和控 制。 4.应用抽样推断法可对总体的某种假设进行检验,判 断假设的真伪。
抽样推断的基本概念
抽样平均误差越大,表示样本的代表性越
低;抽样平均误差越小,表示样本的代表
性越高。
16
统计学
利用它可以降低调查成本开支、减少差错的出现,提高调 查资料的质量。
但它也有一定的局限性。如只能对总体作推断而不能为 组成总体的各个部分提供统计资料。要想推断有效、准 确,有时还得依靠统计报表和其它专门调查的配合。
4
一、抽样推断的意义
抽样推断具有如下作用:
第一,在不可能进行全面调查的情况下可以使用抽样推 断的方法。
灵活。
5
抽样推断的基本概念
二、抽样推断的几个基本概念
教学资源
6
二、抽样推断的几个基本概念
1.总体和样本 在抽样推断中面临两个不同的总体,即全及总体和样本
总体。全及总体也叫母体,简称总体,是所要认识的研 究对象的全体,它由具有某种共同性质或特征的单位组 成。全及总体的单位数用N表示。
全及总体按其各单位标志的性质不同可分为变量总体和 属性总体。
N
9
二、抽样推断的几个基本概念
设总体N个单位中,有N1个单位具有某种属性,N0个单 位不具有某种属性,且N1+N0=N ,则:
P N1 N
Q N0 N N1 1 P
N
N
其中,P为总体中具有某种属性的单位数占全部单位数的 比重,Q为总体中不具有某种属性的单位数占全部单位数 的比重,这两者都称为全及总体成数。
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
确定抽样组织方式 4· 整群抽样(集团抽样) 整群抽样(集团抽样) —— 将总体全部单位分为若干“群”,然后 将总体全部单位分为若干“ 随机抽取一部分“ 随机抽取一部分“群”,被抽中群体的所有 单位构成样本 例:总体群数R=16 总体群数
A CM N B L D P J F KO E H I G L H
质量控制
2. 取得精确可靠的结果 3. 实际情况的约束
时间, 时间,成本等
抽样估计的一般步骤
设 计 抽 样 方 案
抽 取 样 本 单 位
收 集 样 本 数 据
计 算 样 本 统 计 量
推 断 总 体 参 数
总体参数
指被估计的总体指标, 指被估计的总体指标,又被 称为全及指标 称为全及指标
设总体中 N 个总体单位某项标志的标志值分别 为 X 1 , X 2 ⋯ , X N ,其中具有某种属性的有 N1个 单位, 个单位, 单位,不具有某种属性的有 N 0个单位,则 总体平均数(又叫总体均值): ⒈ 总体平均数(又叫总体均值):
确定样本容量
样本的可能数目 在考虑顺序的抽样条件下,从总体 在考虑顺序的抽样条件下, N中随机抽取 个样本单位共有多少 中随机抽取n个样本单位共有多少 中随机抽取 种可能的抽选结果
⒈ 重复抽样的可能样本数目: 重复抽样的可能样本数目:
Baidu Nhomakorabea
P
n N
= N ⋅N ⋯ N = N
共n个 个
n
不重复抽样的可能样本数目: ⒉ 不重复抽样的可能样本数目:
n n sp = p(1 − p ) = pq n −1 n −1
样本单位是非标志的方差: ⒍ 样本单位是非标志的方差: n n 2 sp = p (1 − p ) = pq n −1 n −1
为σ 的 无偏估计
2 P
第一节 抽样方案的设计
★ 一、抽样估计的意义和一般步骤 ★ 二、抽样方案设计的基本准则 三、抽样方案设计的主要内容
C
n N
= N
(N
− 1 )⋯
(N
− n + 1)
第四章 抽样推断
★ ★
第一节 抽样方案的设计 第二节 简单随机抽样的抽样误差的测定 第三节 简单随机抽样的抽样估计
第二节 简单随机抽样的抽样误差的测定
一、抽样分布 二、抽样估计量的优良标准 三、抽样误差的概念 四、抽样平均误差 五、抽样极限误差
样本统计量所有可能值的 抽样分布 概率分布
第一阶段:从该省所有县中抽取 个县 第一阶段:从该省所有县中抽取5个县 第二阶段:从被抽中的5个县中各抽 个县中各抽4个乡 第二阶段:从被抽中的 个县中各抽 个乡 第三阶段:从被抽中的20个乡中各抽 个乡中各抽5个村 第三阶段:从被抽中的 个乡中各抽 个村 第四阶段:从被抽中的100个村中各抽 户 个村中各抽10户 第四阶段:从被抽中的 个村中各抽 样本n=100×10=1000(户) × 样本 户
确定抽样组织方式
2· 类型抽样(分层抽样) 类型抽样(分层抽样) ——将总体全部单位分类,形成若干个类型组,然后 将总体全部单位分类,形成若干个类型组, 将总体全部单位分类 从各类型中分别抽取样本单位组成样本。 从各类型中分别抽取样本单位组成样本。
N
1
n
1
等额抽取
样本
总体 N
N
N
2
n
n
2
n 等比例抽取
抽样估计 按照随机原则 按照随机原则 从调查对象中抽取一部 分单位进行调查, 分单位进行调查,并以调查结果对总体 数量特征作出具有一定可靠程度的估计 与推断, 与推断,从而认识总体的一种统计方法
指样本单位的抽取不受主 观因素及其他系统性因素 的影响, 的影响,每个总体单位都 有均等的被抽中机会
抽样估计
连续到加油站加油的 汽车总体无法编制抽 样框:时间不定、 样框:时间不定、总量
也无法确定。 也无法确定。
确定抽样方法 重复抽样 抽出 个体 特点 又被称作重置抽样、 又被称作重置抽样、有放回抽样 登记 特征 放回 总体 继续 抽取
同一总体单位有可能被重复抽中, 同一总体单位有可能被重复抽中, 而且每次抽取都是独立进行
主 要 形 式
名单抽样框 抽样框 抽样框
区域抽样框 包河区 瑶海区 蜀山区 庐阳区 政务区 技术开发区 ……
某外国公司在合肥进行 微波炉市场调查: 微波炉市场调查: 在商场的大门口 在微波炉柜台前 在市区街道旁边 在某个住宅小区
时间表抽样框
连续出产的产品总体可 以编制抽样框: 以编制抽样框:均匀的 出产时间、 出产时间、可以预见到 的产品总量。 的产品总量。
第八章 抽样推断
★ 第一节 抽样方案的设计
第二节 简单随机抽样的抽样误差的测定 第三节 简单随机抽样的抽样估计
第一节 抽样方案的设计
★ 一、抽样估计的意义和一般步骤
二、抽样方案设计的基本准则 三、抽样方案设计的主要内容
一、抽样估计的意义和一般步骤
㈠ 抽样估计的定义 ㈡ 抽样估计的特点 ㈢ 抽样估计的运用 ㈣ 抽样估计的一般步骤 ㈤ 总体参数与样本指标
x =
n m
∑
x n
i=1
i
或 x =
∑
x
i=1 m
i
fi
∑
i=1
fi
为自由度 样本单位标志值的标准差: ⒉ 样本单位标志值的标准差:
2 1 n s= ∑ xi − x 或s = n −1 i=1
(
)
1
m i =1
为 σ 的无偏估计
fi −1 i=1 ∑
∑(x − x)
m i
2
fi
样本单位标志值的方差: ⒊ 样本单位标志值的方差:
样本统 样本统 样本统 样本统 样本统 计量样本统 计量 计量 样本统 计量 样本统 计量 样本统 计量 样本统 计量 样本统 计量 样本统 计量 样本统 计量 计量 计量 计量
主要样本 统计量
总体未 知参数
比率(成数) 平均数 比率(成数)
方差
x
p
S
2
平均数的抽样分布
全部可能样本平均数的均值等于总体均值, 全部可能样本平均数的均值等于总体均值, 即: E(x) = X (x = X ) 从非正态总体中抽取的样本平均数当n 从非正态总体中抽取的样本平均数当n足够大 时其分布接近正态分布。 时其分布接近正态分布。 从正态总体中抽取的样本平均数不论容量大 小其分布均为正态分布。 小其分布均为正态分布。 1 样本均值的标准差为总体标准差的 n 。
全及总体指标: 全及总体指标:
参数(未知量) 参数(未知量) 统计推断
样本总体指标: 样本总体指标:统 计量(已知量) 计量(已知量)
随机样本 与总体分布 特征相同
与总体分布 特征不同 总体 非随机样本
并非所有的抽样估计都按随机原 则抽取样本,也有非随机抽样 则抽取样本,也有非随机抽样
抽样估计的特点
确定抽样组织方式
1· 简单随机抽样(纯随机抽样) 简单随机抽样(纯随机抽样) ——对总体单位逐一编号,然后按随机原 对总体单位逐一编号, 对总体单位逐一编号 则直接从总体中抽出若干单位构成样本 应用 仅适用于规模不大、内部各单位 仅适用于规模不大、 标志值差异较小的总体
是最简单、最基本、最符合随机原则, 是最简单、最基本、最符合随机原则, 但同时也是抽样误差最大的抽样组织形式
能使样本结构更接近于总体结构, 能使样本结构更接近于总体结构,提高样本的 代表性; 代表性;能同时推断总体指标和各子总体的指标
···
k
···
k
确定抽样组织方式
3· 等距抽样(机械抽样或系统抽样) 等距抽样(机械抽样或系统抽样) ——将总体单位按某一标志排序,而后按一 将总体单位按某一标志排序, 将总体单位按某一标志排序 定的间隔抽取样本单位。 定的间隔抽取样本单位。
随机起点 半距起点 对称起点
······
(总体单位按某一标志排序) 总体单位按某一标志排序) 按无关标志排队,其抽样效果相当于简单随机抽样; 按无关标志排队,其抽样效果相当于简单随机抽样; 简单随机抽样 按有关标志排队,其抽样效果相当于类型抽样 类型抽样。 按有关标志排队,其抽样效果相当于类型抽样。
1 2 s = ∑ xi − x 或s = n −1 i=1
2 2
n
(
)
1
为σ 的无偏估计
2
∑ f −1
i=1 i
m
∑(x − x) f
m 2 i=1 i
i
样本成数: ⒋ 样本成数:
n1 n0 p = ,q = = 1− p n n
为 σP 的 样本单位是非标志的标准差: ⒌ 样本单位是非标志的标准差: 无偏估计
n≥30,为大样本; 30, n≥30,为大样本;n < 30,为小样本 确定适当样本容量的意义: 确定适当样本容量的意义: 过大,调查工作量增大, 若n过大,调查工作量增大,体现不出抽样 调查的优越性; 调查的优越性; 过小,抽样误差会增大, 若n 过小,抽样误差会增大,抽样推断就 会失去价值。 会失去价值。
X =
∑
N
X N
i=1
i
或 X =
∑
m
X
i=1 m
i
fi
∑
i=1
fi
总体单位标志值的标准差: ⒉ 总体单位标志值的标准差:
σ=
1 N
∑ (X
N i =1
i
− X 或σ =
)
2
1
∑
i =1
m
∑ (X
m
fi
i =1
i
−X
)
2
fi
总体单位标志值的方差: ⒊ 总体单位标志值的方差:
1 2 σ = ∑ X i − X 或σ = N i =1
2 2
N
(
)
1
∑ fi
i =1
m
∑ (X
m i =1
i
−X
)f
2
i
总体成数: ⒋ 总体成数:
N1 N0 P = ,Q = = 1− P N N
总体是非标志的标准差: ⒌ 总体是非标志的标准差:
σ P = P(1 − P ) = PQ
(当P = Q = 0.5时,σ P 有最大值)
总体是非标志的方差: ⒍ 总体是非标志的方差:
确定抽样方法 不重复抽样 抽出 个体 特点 又被称作不重置抽样、 又被称作不重置抽样、不放 回抽样 登记 特征 继续 抽取
同一总体中每个单位被抽中的机会并 不均等,在连续抽取时, 不均等,在连续抽取时,每次抽取都 不是独立进行
是最为常用的抽样方法, 是最为常用的抽样方法,用于无限总 体和许多有限总体样本单位的抽样。 体和许多有限总体样本单位的抽样。
σ P = P(1 − P ) = PQ
2
指根据样本单位的标志值计算的用 样本指标 以估计和推断相应总体指标的综合 指标,又被称为估计量或统计量 指标,又被称为估计量或统计量 设样本中 n 个样本单位某项标志的标志值 分别为 x1 , x 2 ⋯ , x n ,其中具有和不具有某 种属性的样本单位数目分别为 n1和 n 个,则 0 样本平均数(又叫样本均值): ⒈ 样本平均数(又叫样本均值):
抽样方案设计的基本准则
㈠ 随机原则 ——抽取样本单位时,应确保每个总体单位都 抽取样本单位时, 抽取样本单位时 有被抽取的可能; 有被抽取的可能;在对样本单位的资料进行搜 集和整理时, 集和整理时,不能随意遗漏或更换样本单位 ㈡ 抽样误差最小 ——在其他条件相同的情况下,选抽样误差 在其他条件相同的情况下, 在其他条件相同的情况下 设计抽样方案时, 设计抽样方案时,通常是 最小的方案 在误差达到一定要求的条 ㈢ 费用最少 件下,选择费用最少的方案 件下, ——在其他条件相同的情况下,选费用最少 在其他条件相同的情况下, 在其他条件相同的情况下 的方案
按随机原则抽取样本单位 目的是推断总体的数量特征 抽样推断的结果具有一定的可靠程度, 抽样推断的结果具有一定的可靠程度, 抽样误差可以事先计算并控制
抽样估计的应用
不可能进行全面调查时 不必要进行全面调查时 来不及进行全面调查时 对全面调查资料进行补充修正时
抽样调查研究
Sampling Study 为什么要抽样? 为什么要抽样? 1. 涉及破坏受试对象
确定抽样组织方式
在实际工作中, 在实际工作中,选择适当的抽样组 织方式主要应考虑: 织方式主要应考虑: 调查对象的性质特点 对调查对象的了解程度( 对调查对象的了解程度(抽样框的特 点) 抽样误差的大小 人力、 人力、财力和物力等条件的限制
确定样本容量
样本容量 指样本中含有的总体单位的 数目,通常用n 来表示。 数目,通常用 来表示。
样本群数r=4 样本群数
P D 样本容量
n = nd + np + nl + nh
简单、方便,能节省人力、物力、 简单、方便,能节省人力、物力、财 力和时间, 力和时间,但其样本代表性可能较差
确定抽样组织方式
5·多阶段抽样 多阶段抽样 —— 指分两个或两个以上的阶段来完成抽 取样本单位的过程 在某省100多万农户抽取 多万农户抽取1000户调查 例:在某省 多万农户抽取 户调查 农户生产性投资情况。 农户生产性投资情况。
第一节 抽样方案的设计
★ 一、抽样估计的意义和一般步骤 ★ 二、抽样方案设计的基本准则 ★ 三、抽样方案设计的主要内容
三、抽样方案设计的主要内容
㈠ ㈡ ㈢ ㈣
编制抽样框 确定抽样方法 确定抽样组织方式 确定样本容量
制抽样框
指包括全部抽样单位的名单框架, 指包括全部抽样单位的名单框架, 抽样框 仅对有限总体而言