第四章 抽样估计
统计学(抽样估计)

第四章第一节
二、抽样调查的特点
➢按随机原则抽取调查单位; ➢要抽取足够多的调查单位;
基本原则
➢可从数量上推断总体
基本目的及任务
➢要运用概率估计的方法
➢抽样调查中所产生的抽样误差可以事先计算
并加以控制。
科学性体现
3
第四章第一节
三、抽样调查的使用范围 ➢ 有些事情在测量或实验时有破坏性,不可能进行
1、用样本标准差替代总体标准差。大样本情况下,可 以直接用样本标准差S代表代表总体标准差;在小样
本的情况下,则采用样本修正标准差 S *来代替。
S* (xi x)2 n 1 S n n 1
2、用以前(近期)的总体标准差或同类地区的总体标 准差来代表所研究的标准差。若同时有多个可供参 考的数值时,应选择其中最大者。对于成数P,应选 最接近0.5的比率。
up
P(1 P)(重复) n
up
P(1 n
p)
(
N N
n 1
)或up
ux
σ 2 (N n)或 n N1
ux
σ 2 (1 n )(不重复) nN
P(1 P) (1 n )(不重复)
n
N
26
第四章第三节
注意:在上述公式中, 或 P(1 P)总体标准差,但
是实际中这两个数据却是未知的。计算抽样平均误 差时通常采用以下替代方法。
进行检验,来判断这种假设的真伪,以决定取舍
4
第四章第一节 四、抽样估计的一般步骤 1、设计抽样方案 2、抽取样本单位 3、搜集样本资料 4、整理样本资料 5、推断总体指标
5
第四章第二节 第二节 调样调查的基本概念及理论依据 一、全及总体和抽样总体(教材没有) ➢ 全及总体-简称总体(N):研究对象的全 体 (唯一确定) ✓ 变量总体 :各单位可用数量标志计量 A 有限总体:变量值有限 B 无限总体:变量值无限,分为可列或连续 ✓ 属性总体 :各单位用品质标志描述
第4章抽样分布与参数估计习题

第四章抽样分布与参数估计思考与练习一、单项选择题1.抽样平均误差与极限误差间的关系是( d )。
a. 抽样平均误差大于极限误差b. 抽样平均误差等于极限误差c. 抽样平均误差小于极限误差d. 抽样平均误差可能大于、等于或小于极限误差2.在其它条件不变的情况下,如果允许误差缩小为原来的二分之一,则样本容量( a )。
a. 扩大为原来的4倍b. 扩大为原来的2倍c. 缩小为原来的二分之一d. 缩小为原来的四分之一3.类型抽样影响抽样平均误差的方差是( b )。
a. 组间方差b. 组内方差c. 总方差d. 允许误差4.当样本单位数充分大时,样本估计量充分地靠近总体指标的可能性趋于1,称为抽样估计的( b )。
a.无偏性b.一致性c.有效性d.充分性二、多项选择题1.影响抽样平均误差的因素有( a b c d )。
a.总体标志变异程度b.样本容量c.抽样方式d.抽样的组织形式e.样本指标值的大小2.抽样估计的抽样平均误差(a c e)。
a.是不可避免要产生的b.是可以通过改进调查方法消除的c.是可以事先计算的d.只有调查结束之后才能计算e.其大小是可以控制的3.确定样本容量时,可用以下方法取得近似的总体方差估计值(a b c )。
a.参考以往调查的经验资料b.以试点调查的样本方差来估计c.在做成数估计时,用成数方差最大值0.25来代替d.假定总体不存在标志变异,方差为零三、计算题1.某市居民家庭人均年收入是服从μ=4 000元,σ=1 200元的正态分布,求该市居民家庭人均年收入:(1)在5 000~7 000元之间的概率;(2)超过8 000元的概率。
解:(1)1200,4000==σμ。
{}()()0.197055935.020325.09876.00062.08333.02}8333.0{1}5.2{2}5.2{1}8333.0{}5.2{}5.28333.0{}70005000{}70005000{=+-+=⎪⎪⎭⎫ ⎝⎛<+<--⎪⎪⎭⎫ ⎝⎛<+<-=<-<=<<=-<=-<-=<<z prob z prob z prob z prob z prob z prob z prob z x prob x prob σμσμσμ (2) {}{}{}00035.0333.32333.311333.31}333.3{}8000{}8000{=⎥⎥⎦⎤⎢⎢⎣⎡<+<--=<-=>=->=-=>z prob z prob z prob z prob z x prob x prob σμσμ2.某小组5个工人的周工资分别为140、160、180、200、220元,现在用重复抽样的方法从中抽出2个工人的工资构成样本。
第4章 抽样估计

• 解:根据题意,在重复抽样条件下,合格 率的抽样平均误差为:
p=
P(1-P)= n
0.9 0.1 50
=4.24%
在不重复抽样的条件下,合格率的抽样平均误差为:
p
P(1 P)(1 n )
n
N
0.9 0.1(1 50 )
50
5000
4.22%
答:抽取50件产品进行检验,该产品合格率的抽样平均误差 为4.22%。
• 例:2008年我国谷物平均产量为5548千克/公顷, 假如通过抽样调查得到的平均产量为5580千克/ 公顷或5534千克/公顷,则样本平均每公顷产量 与实际平均每公顷产量之间的误差分别为32千克 或−14千克。
1、抽样误差的种类
• 统计调查误差按产生的原因可以分为登记性误差和代 表性误差两大类。
• 例如在省抽县、县抽乡、乡抽村、村抽户的农产量 四阶抽样中,凡未被抽中的县、乡、村、户就不必 编制关于乡、村、户的抽样框。
4、整群抽样(Cluster sampling)
• 在二阶抽样中如果把初级抽样单元称作由次级抽样单 元组成的群,在抽中的群内不再对次级单元进行抽样 而是进行普查,那么这种抽样方法就称为整群抽样。
• 时间表抽样框:把总体的时间过程分为若干个小的时 间单位,并按时间顺序对总体单位进行抽样。如流水 线产品质量检查。
二、抽样误差及其度量
• 一般地说,抽样误差是指样本指标与被它估计未 知的总体参数(总体特征值)之差。具体地是指样 本平均数 x 与总体平均数μ的差,样本成数P与总 体成数π的差(P-π)。
2、抽样误差的度量
• 实际抽样误差:某一具体样本的样本估计值 与ˆ 总 体参数的真实值 之差( -ˆ )。
统计学 第四章 抽样估计

第一 单位
34 38 42 46 50
34 34 36 38 40 42
38 36 38 40 42 44
42 38 40 42 44 46
46 40 42 44 46 48
50 42 44 46 48 50
第二 单位
样本 均值
整理出样本平均数的频率分布如下: 整理出样本平均数的频率分布如下
⒈ 样本均值: 样本均值:
x =
∑
n
x n
i=1
i
或 x =
∑
m
x
i=1 m
i
fi
∑
i=1
fi
2.样本方差: 2.样本方差: 样本方差
n 2 1 2 s = ∑1 x i − x 或 n − 1 i=
(
)
s =
2
1
∑
m
i =1
fi − 1
∑ (x
m i =1
i
− x
)
2
fi
3. 样本成数(样本比例): 样本成数(样本比例):
34 36 38 40 42 44 46 48 50 合计
E ( x) =
例:我们选择奥运板块的个 股作为样本。 股作为样本。则样本分布为 该板块60只股票在4 23日的 60只股票在 该板块60只股票在4月23日的 涨跌情况 xi i=1……60 样本统计量 样本是随机产生的,为 样本是随机产生的, 了提高样本的代表性, 了提高样本的代表性, 可以选择合适的抽样组 织方式来产生样本
样本统计量:反映样本分特征的指标, T 样本统计量:反映样本分特征的指标,
样本统计量是随机变量, 样本统计量是随机变量,它的取值随样本的不同而发生 变化。 变化。
第四章 抽样与抽样估计

(一)样本统计量的极限分布 1、如果总体服从正态分布,且均值和方差均为已知,即
Y ~ N (, 2 )
则可以证明不论样本量大小如何,样本均值都围绕总体 均值而服从正态分布,并且其抽样分布的方差等于总体方差 的n分之一,即 y ~ N (, 2 / n)
2、对于非正态总体,若均值μ 和σ 2有限,则根据中心极限 定理,当样本量n充分大时,样本均值仍然围绕着总体均值 而近似地服从正态分布,即
3、缺点: (1)若群内个单元有趋同性,效率将会降低; (2)通常无法预先知道总样本量,因为不知道群内有 多少单元; (3)方差估计比简单随机抽样更为复杂。
(四)分层抽样
1、定义:在抽样之前将总体分为同质的、互不重叠 的若干子总体,也称为层。然后在每一个层独立地随机 抽取样本。 分层抽样示意图:
2、优点:
抽取样本
总体 样本
推断总体
抽样调查中的总体是有限的。在抽样以前,必须根
据实际情况把总体划分成若干个互不重叠并且能组合成 总体的部分,每个部分称为一个抽样单元,不论总体是 否有限,总体中的抽样单元数一定是有限的,而且是已 知的,因此说抽样调查的总体总是有限的。 抽样调查中影响样本代表性的因素有以下几个方面: (1)总体标志值分布的离散程度。 (2)抽样单元数的多少(或称样本量的大小)。 (3)抽样方法。
通常将反映总体数量特征的综合指标称为总体参
数。常见的总体参数主要有:总体总和;总体均值;总
体比率;总体比例。 一般将反映样本数量特征的综合指标称之为统计
量。统计量是n元样本的一个实值函数,是一个随机变
量,统计量的一个具体取值即为统计值。主要的样本统 计量有:样本总和;样本均值;样本比率;样本比例。
第四章 抽样技术

• (五)多阶段抽样
– 含义:multistage sampling-----即先抽大的调 查单元,在大单元中抽小单元,再在小单元 中抽更小的单元。如:我国的城市职工家计 调查,采用三阶段抽样,先城市-基层单位调查户。
第四章 抽样技术
– 应用:在复杂、大规模的市场调查中。
• (六)抽样技术的选用原则
• (四)常用术语
– 1.总体(population)与样本(sample) – 2.总体指标和样本指标
• 总体指标-------反映总体数量特征的指标,有总 体平均数µ,总体比例P, 总体方差 σ 2
第四章 抽样技术
– 样本指标------又称样本估计量或统计量,用 以估计和推断相应总体指标的综合指标,有 样本平均数 x ,样本比例p ,样本方差S2。
第四章 抽样技术
• 成数------分总体成数与样本成数 • 含义------总体中具有某种特征的单位占全部单 位的比例,称总体成数(总体比例) • 如:产品的合格率,市场占有率等。 • 样本成数的抽样分布
– 当从总体中抽出一个容量为n的样本时,样本中具有 某种特征的单位数x服从二项分布,即有x~B(n, π),且 有E(x)=n π V(x)=n π(1- π). – 因而样本比例p=x/n也服从二项分布,且有: – E(p)=E(x/n)= π – V(p)=V(x/n)=1/n π(1- π)
第四章 抽样技术
第四章 抽样技术
第四章 抽样技术
本章要点
• 1.抽样调查的含义、特点与程序; • 2.随机抽样技术的类型及其各自的特点、 方法; • 3.非随机抽样技术的类型及其各自的特 点、方法; • 4.抽样误差的含义及其计算方法 。
第四章 抽样技术
第四章 抽样技术基础知识

抽样技术的完整概念包括对样本的调查和对总体参 数的估计两个方面。首先介绍抽样调查,然后介绍总体 参数估计方法。
第一节
抽样调查
一、抽样调查的概念 抽样调查是统计学的重要分支,它已经成为当今世 界上最重要的统计方法。它广泛应用于社会、经济、科 技和自然等各个领域,成为现代统计学中发展最快、最 活跃的一个分支。 (一)抽样调查 它是一种非全面调查,是根据随机原则从总体中抽 取部分单位进行调查。这部分单位称为样本。而这部分 单位数目的多少不是随心所欲确定的,是根据一定原则 和要求用科学的方法计算来确定。所谓随机原则,就是 可能性原则,是指在抽取样本单位时,完全排除人们的 主观愿望,使总体中的每个单位机会确定,抽中与否全 凭偶然。
(四)参数和统计量 1.参数 2 即总体平均数,用 表示,总体标准差用σ 表示,总体成数 X (比重)用P 表示,这些数据在抽样技术称为参数。由于总体是 唯一确定的,总体参数也是唯一确定的。 2.统计量 样本平均数用 x表示,样本标准差用s 表示,样本成数用p 表示,这些数据在抽样技术称为统计量。 成数指总体或样本中具有某种属性的单位数占全部单位数的 比重。如,一片森林中病株数的比重、一批产品中合格品比重、 一片农作物中缺苗断垄数比重、某市居民拥有计算机户比重、某 电视节目收视率等等。 本节小结: (一)样本是从总体中随机抽取的一部分单位。 (二)参数是总体数量特征,是用样本统计量估计出来的。 (三)统计量是由样本变量直接计算得到的。
2.区域抽样框,按自然地域划分并排列出总体所有单位。例 如,一片土地划分为若干地块并编号、一片森林划分为若干林区 并编号等。 3.时间表抽样框,按时间顺序排列总体单位。例如,流水线 生产的产品质量检验,把一天划分为若干时段并按顺序排列。 抽样框的编制是抽样调查的前提条件,要求不重不漏来保证 样本对总体的代表性。 (二)总体和样本 总体指所要研究现象的整体,用字母N 表示。如,从1万平 方米小麦中抽取500平方米进行产量调查,则N =10000平方米。 样本,指从总体中抽取的样本单位数,用字母n 表示。如, 上例中n =500平方米 (三)大样本和小样本 大样本和小样本是根据样本容量多少来划分的。n≥30时为 大样本,n <30时为小样本。
统计学第四章抽样与参数估计

疗效评价
通过参数估计和假设检验等方法,评价药物 的疗效和安全性。
案例三:工业生产过程质量控制
抽样检验计划制定
根据产品特性和质量要求,制定合适的抽样 检验计划。
不合格品控制
对不合格品进行统计分析和处理,找出原因 并采取措施加以改进。
过程能力分析
收集生产过程中的质量数据,进行过程能力 分析和参数估计。
抽样作用
通过样本信息推断总体特征,为决策提供依据。
抽样方法分类
随机抽样
按照随机原则从总体中抽取样本,每个个体 被抽中的概率相等。
系统抽样
按照某种规则从总体中抽取样本,如每隔一 定距离或时间抽取一个样本。
分层抽样
将总体分成若干层,然后从各层中随机抽取 样本。
整群抽样
将总体分成若干群,然后随机抽取若干群作 为样本。
05
案例分析:实际场景下抽样 与参数估计问题探讨
案例一:市场调查中消费者满意度测评
01
抽样方法选择
根据市场调查的目的和预算,选 择合适的抽样方法,如简单随机 抽样、分层抽样或整群抽样。
03
数据收集与处理
设计调查问卷,收集消费者满意 度数据,并进行数据清洗和整理
。
02
样本量确定
综合考虑调查的精度要求、总体 规模、抽样误差等因素,合理确
运用统计学方法进行假设检验和参数估计,验证研究假 设的可靠性。
THANKS
定样本量。
04
参数估计
运用统计学方法,对消费者满意 度进行参数估计,如计算满意度
均值、标准差等。
案例二:医学研究中药物疗效评价
试验设计
采用随机对照试验等方法,确保试验组和对 照组的可比性。
样本量计算
统计学习题 第四章 抽样估计

第四章抽样估计一、判断题1.抽样估计的目的是用以说明总体特征。
2.抽样分布就是样本分布。
3.既定总体在当抽样方法、抽样组织形式和样本容量确定时,样本均值的分布惟一确定。
4.样本容量就是样本个数。
5.在抽样中,样本容量是越大越好。
6.抽样的目的是判断样本估计值是否处于以总体指标为中心的某规定区域范围内。
7.当估计量有偏时,人们应该弃之不用。
8.对于一个确定的抽样分布,其方差是确定的,因而抽样标准误也是确定的。
9.抽样极限误差越大,用以包含总体参数的区间就越大,估计的把握程度也就越大,因此极限误差越大越好。
10.非抽样误差会随着样本容量的扩大而下降。
二、单项选择题1.想了解学生的眼睛视力状况,准备抽取若干学校、若干班级的学生进行测试,则()。
A.观测单位是学校B.观测单位是班级C.观测单位是学生D.观测单位可以是学校、也可班级或学生2.下列误差中属于非一致性的有()。
A.估计量偏差B.偶然性误差C.抽样标准误D.非抽样误差3.抽样估计中最常用的分布理论是()。
A.t分布理论B.二项分布理论C.正态分布理论D.超几何分布理论4.抽样标准误大小与下列哪个因素无关?()A.样本容量B.抽样方式、方法C.概率保证程度D.估计量5.下列关于抽样标准误的叙述哪个是错误的?()A.抽样标准误是抽样分布的标准差B.抽样标准误的理论值是惟一的,与所抽样本无关C.抽样标准误比抽样极限误差小D.抽样标准误只能衡量抽样中的偶然性误差的大小三、计算分析题1. 某小组5个工人的每周工资分别为520、540、560、580、600元,现从中用简单随机抽样形式(不重复抽样)随机抽取2个工人周工资构成样本。
要求:(1)计算总体平均工资的标准差;(2)列出全部可能的样本平均工资;(3)计算样本平均工资的平均数,并检验其是否等于总体平均工资;(4)计算样本平均工资的标准差;(5)用抽样平均误差的公式计算并验证是否等于(4)的结果。
2.从某大型企业中随机抽取100名职工,调查他们的工资。
抽样估计试题及答案

For pers onal use only in study and research; not for commercial use第四章抽样估计、判断题部分1. 从全部总体单位中按照随机原则抽取部分单位组成样本,只可能组成一个样本。
(X)2. 在抽样推断中,全及指标值是确定的、唯一的,而样本指标值是一个随机变量。
(V )3. 抽样平均误差总是小于抽样极限误差。
(X )4. 在其它条件不变的情况下,提高抽样估计的可靠程度,则降低了抽样估计的精确程度。
(V)5. 抽样平均误差反映抽样误差的一般水平,每次抽样的误差可能大于抽样平均误差,也可能小于抽样平均误差。
(V )6. 在抽样推断中,抽样误差的概率度越大,则抽样极限误差就越大于抽样平均误差。
(V )、单项选择题1. 抽样平均误差是(A )。
A、抽样指标的标准差B、总体参数的标准差C、样本变量的函数D、总体变量的函数2. 抽样调查所必须遵循的基本原则是(B )。
A、准确性原则B、随机性原则C、可靠性原则D、灵活性原则3. 在简单随机重复抽样条件下,当抽样极限误差缩小为原来的1/2时,则样本单位数为原来的(C )。
A、2 倍B、3 倍C、4 倍D、1/4 倍4. 按随机原则直接从总体N个单位中抽取n个单位作为样本,这种抽样组织形式是( A )。
A、简单随机抽样B、类型抽样 C 、等距抽样D、整群抽样5. 事先将总体各单位按某一标志排列,然后依排列顺序和按相同的间隔来抽选调查单位的抽样称为(C )A、简单随机抽样B、类型抽样C 、等距抽样D、整群抽样6. 在一定的抽样平均误差条件下(A )。
A、扩大极限误差范围,可以提高推断的可靠程度B、扩大极限误差范围,会降低推断的可靠程度C、缩小极限误差范围,可以提高推断的可靠程度D、缩小极限误差范围,不改变推断的可靠程度7. 反映样本指标与总体指标之间的平均误差程度的指标是(C )。
A、平均数离差B、概率度C 、抽样平均误差D、抽样极限误差8. 以抽样指标估计总体指标要求抽样指标值的平均数等于被估计的总体指标值本身,这一标准称为(A )。
西南财大版统计学原理统计学作业练习题及答案

西南财大版统计学原理统计学作业练习题及答案第四章抽样估计 1.某工厂有1 500个工人,用简单随机重复抽样的方法抽出50个工人作为样本,调查其工资水平,如下表: 50个工人工资水平资料月工资水平(元) 524 534 540 550 560 580 600 660 工人数(人) 4 6 9 10 8 6 4 3 要求:(1)计算样本平均数和抽样平均误差。
(2)以95.45%的可靠性估计该厂工人的月平均工资和工资总额的区间。
2.采用简单随机重复抽样方法,在2 000件产品中抽查200件,其中合格品190件。
要求:(1)计算合格品率及其抽样平均误差。
(2)以95.45%的概率保证程度对合格品率和合格品数量进行区间估计。
(3)如果极限误差为2.31%,则其概率保证程度是多少? 3.某电子产品使用寿命在3 000小时以下为不合格品,现在用简单随机抽样方法,从5 000个产品中抽取进行调查.其结果如下: 100个电子产品使用寿命统计表使用寿命(小时) 产品个数 3 000以下 2 3 000—4 000 30 4 000—5 000 50 5 000以上 18 合计 100 要求:试根据上述资料:(1)按重复抽样和不重复抽样计算该产品平均寿命的抽样平均误差。
(2)按重复抽样和不重复抽样计算该产品合格率的抽样平均误差。
(3)根据重复抽样计算的抽样平均误差,以68.27%的概率保证程度对该产品的平均使用寿命和合格品率进行区间估计。
4.某外贸公司出口一种茶叶,规定每包规格不低于150克,现在用不重复抽样的方法抽取其中1%进行检验,其结果如下:抽查结果统计表每包重量(克) 包数 148-149 10 149-150 20 150-151 50 151-152 20 合计 100 要求:(1)以99.73%的概率估计该批茶叶平均每包重量的范围,以及确定平均重量是否达到规格要求。
(2)以同样的概率保证估计该批茶叶合格率范围。
第四章 抽样调查

p
p1 p
n
0.2 0.8 0.02 400
即:根据样本资料推断全部学生中戴眼镜的学 生所占的比重时,推断的平均误差为2%。
例: :
一批食品罐头共60000桶,随机抽查300桶,发 现有6桶不合格,求合格品率的抽样平均误差?
解: 已知 N 60000 n 300 n1 6
解:
x xf 12600 126件 f 100
s x x 2 f 4144 6.47件
f 1
99
x
s 2 1 n n N
6.472 1 100 0.614件
100 1000
x
通过例题可说明以下几点:
①样本平均数的平均数等于总体平均数。 ②抽样平均数的标准差仅为总体标准差的 1
n
③可通过调整样本单位数来控制抽样平均误差。
例:假定抽样单位数增加 2 倍、0.5倍时, 抽样平均误差怎样变化?
解:抽样单位数增加 2 倍,即为原来的 3 倍
则:
x
3n
1 0.577 3
二、抽样调查的特点
1、 是专门组织的一次性的非全面调查 2、 抽选样本单位遵循随机原则 3、 用样本指标数值去推断总体指标数值 (与重点调查的区别) 4、 抽样误差可计算并控制在一定范围内 (与典型调查的区别)
三、抽样调查的几个基本概念 (一) 全及总体和抽样总体
全及总体 指研究对象的全体。其单位数 (总体) 用N 表示。
即:当根据样本学生的平均体重估计全部学生的平均 体重时,抽样平均误差为1公斤。
例: 某厂生产一种新型灯泡共2000只,随机抽出 400只作耐用时间试验,测试结果平均使用寿 命为4800小时,样本标准差为300小时,求抽 样推断的平均误差?
李金昌《统计学》(最新版)精品课件第四章 抽样估计

Statistics
二、常用的抽样分布定理
(一)样本均值的抽样分布定理
1.正态分布的再生定理 如果某样本的n个个体完全随机地来自数学期望为 X 、方差 为S 2 的正态总体,则不论样本容量n多大,样本均值服从数学期 ( N n) S 2 S2 望为 X 、方差为 V ( x ) (重复抽样时)或 V ( x ) (有 Nn n 限总体且不重复抽样时)的正态分布。标准化统计量 z x X V (x ) 则服从数学期望为0、方差为1的标准正态分布。此即为正态分布 的再生定理。 2.中心极限定理 对于任一具有平均数 X 和方差 S 2的有限总体,当样本容量n 足够大时(例如 n 30或 n 50 ),样本均值 x的分布也趋于服从 正态分布,其数学期望和方差与再生定理的相同。此即为中心极 限定理。
Statistics
3.分布定理 当正态总体的方差未知且n较小,或任一方差为 S 2的总体但n 较小,则样本均值 x 的分布服从自由度为n-1的t分布。分布曲线 与正态分布相近,其中数学期望相同。
Statistics
(二)样本成数的抽样分布定理
1.二项分布定理 N 从一个数学期望为p、方差为 N 1 PQ 的是非变量(0-1分布) n1 总体中随机重复地抽取容量为n的样本,那么样本中含有 个某类 变量值的概率为:
反映样本分布特征的样本统计量的值(即样本统计值)是可 知的。但是由于抽样的随机性,样本统计值不是惟一确定的,因 此样本统计量是随机变量,其值随样本不同而不同。 抽样估计,就是要以可知但非惟一的样本统计值去估计惟一 却未知的总体参数的值。
Statistics
(三)抽样分布及其特征
1.抽样分布的概念及影响因素 一般意义上说,抽样分布就是样本统计量的概率分布,它由 样本统计量的所有可能取值和与之对应的概率所组成。如果说样 本分布是关于样本观测值的分布,那么抽样分布则是关于样本统 计值的分布,而样本统计值是由样本观测值计算而来的。 实际的抽样分布形成取决于以下五个因素: 总体分布; 样本容量; 抽样方法; 抽样组织形式; 估计量构造
统计学第四章的教材

几个直观的结论
1. 样本均值的均值(数学期望)等于总体均值(式中:M为样本 n 数目); xi 22 23 28 i 1 25 X M 16 2. 抽样误差是随样本不同而不同的随机变量。抽样误差均值 等于0; xX 0
3. 样本均值的方差等于总体方差的1/n。
3
(二)抽样估计的一般步骤 1、设计抽样方案 2、 随机抽取样本(从总体随机抽取部分单位构成样本) 3、搜集样本资料(对样本单位进行调查登记) 4、整理样本资料(审查、分组汇总、计算样本指标的
数值,即计算估计量的具体数值)
5、估计总体指标(即估计总体参数)
总体参数与样本估计量的关系——对于特定的目 的,总体是惟一的,所以参数也是惟一的;而由 于样本是随机的,所以样本估计量是随机变量。
(3)抽样方法。相同条件下,重复抽样的抽样平均误 差大比不重复抽样的抽样平均误差大。
(4)抽样组织方式。由于不同抽样组织方式有不同的 抽样误差,所以,在误差要求相同的情况下,不同抽 样组织方式所必需的抽样数目也不同。
21
不知道总体方差时如何计算
用样本方差代替计算 用过去(总体或样本)方差代替计算 用同类现象(当前 或过去、总体或样本) 方 代替计算 有若干个方差可选择时,选方差最大者 (注意:对比率,即选择最接近0.5的值所 得的方差最大)
进无偏估计量。
29
二、区间估计
(一)区间估计的原理 区间估计就是根据样本估计量以一定 可靠程度推断总体参数所在的区间范围。 特点:考虑了估计量的分布,所以它能 给出估计精度,也能说明估计结果的把握 程度(置信度)。
30
(一)总体均值的置信区间
(1)假定条件
总体服从正态分布,且总体方差(2)已知
抽样与抽样估计

第四章抽样与抽样估计一、单项选择题1.抽样估计的基本内容是()A.参数估计B.假设检验C.参数估计和假设检验两方面D.数据的收集2.估计量的标准差实质上就是()A.总体标准差B.抽样总体的标准差C.抽样总体方差D.样本统计量的标准差3.不放回抽样的误差()A.总是大于放回抽样的误差B.总是小于放回抽样的误差C.总是等于放回抽样的误差D.上情况都可能发生4.在简单随机抽样中,当其它条件保持不变,样本量增加一倍,则估计量的标准差()A.缩小为原来的81.6%B.缩小为原来的50%C.缩小为原来的25%D.扩大为原来的四倍5.概率抽样中,样本的形成是()A.随机的B.随意的C.非随机的D.确定的6.抽样误差之所以产生是由于()A.破坏了抽样的随机原则B.抽样的随机性C.破坏了抽样的系统D.调查人员的素质7.抽样误差指的是()A.系统性误差B.抽样框误差C.代表性误差D.随机性误差8.抽样误差的大小()A.可以事先计算,但不能控制B.不能事先计算,但能控制C.可以事先计算并进行控制D.能够控制,但不能消除9.随机抽出100个工人,占全体工人1%,工龄不到一年的比重为10%。
在概率为0.9545时,工龄不到一年的工人比重的估计标准差应为()A.0.6%B. 6%C.0.9%D. 3%10.根据抽样调查25个工厂(抽样比为2%)资料,采购阶段流动资金平均周转时间为52天,方差100,在概率为0.9545时,流动资金平均周转时间估计量的标准差为()A.0.8B.3.96C.4D.22611.假定10亿人口大国和100万人口小国的居民年龄的变异程度相同,现在各自用重复抽样方法抽取本国的1%人口计算平均年龄,则平均年龄的抽样标准差()A.两者相等B.前者比后者大C.前者比后者小D.不能确定12.根据抽样调查的资料,某城市人均日摄入热量2500千卡,抽样标准差150千卡,则在多大的置信度下可以断定该市人均摄入热量在2350千卡至2650千卡之间()A.0.9545B.0.6827C.1D.0.9013.在抽样调查某企业工人生产定额完成情况时,从工人按姓氏笔划多少的顺序名单中进行每五人抽样。
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
本统计量的标准差,表示为 = 。通过抽样标准误可以衡量抽样分布的离散程度,反映样本统计量 代表性的高低。抽样标准误能衡量抽样误差大小的一般水平。
(三)抽样极限误差 抽样极限误差是指以样本估计总体所允许的最大误差范围,
(二)样本分布及其特征
样本分布就是样本中所有个体关于某个变量(标志)的取值所形成的分布。反映样本分特 征的指标叫样本统计量,通常用
来表示。
常见的样本统计量:样本均值和样本方差 (三)抽样分布及其特征 1.抽样分布的概念及影响因素 抽样分布就是样本统计量的概率分布,它由样本统计量的所有可能
取值和与之对应的概率所组成。 取决于以下五个因素: 总体分布、样本容量、抽样方法 、抽样组织形式、估计量构造 2.抽样分布形式
或
其中 和 分别表示重复抽样和不重复抽样下所需的样本容量。在抽样要求相同情 况下, ﹥ 。
二、分层抽样总体参数的估计(自学) 三、整群抽样总体参数的估计(自学) 四、多阶段抽样总体参数的估计(自学)
样本均值抽样分布形式
…
… 样本成数抽样分布形式
…
…
3.抽样分布特征 样本统计量的数学期望:
样本统计量的方差:
举例证明,在简单随机抽样下,样本均值的数学期望为总体均值,样本成数的数学期望为 总体成数,不重复抽样的方差小于重复抽样。
在各种抽样方法和抽样组织形式下,样本统计量的数学期望都等于总体参数,抽样分布的 特征主要是通过抽样分布的方差来体现的。
第四章 抽样估计 第一节 抽样分布
一、抽样分布的基本问题 (一)总体分布及其特征 总体分布就是总体中所有个体关于某个变量(标志)的取值所形成 的分布。反映总体分布特征的指标叫总体参数,一般用
来表示。 常用的总体参数有两个 : 总体均值(包括是非变量的均值); 总体方差或标准差(包括是非变量的方差或标准差)。
。抽样极限误差实际上就是对估计量可允许取的最高值或最低值进 行了限制。 它取决于两个因素 抽样标准误,
抽样估计概率保证程度(置信水平):
抽样极限误差、抽样标准误和抽样概率保证程度三者关系:
=
。其中,
=
称为抽样概率度。
正是当显著性水平为
时的标准正态分布的双侧临界值,概率保证程度
的高低变化正好可以通过
第1节 各种抽样组织形式的参数估计
一、简单随机抽样 (一)总体均值
的估计 1.总体均值
的估计量为:
2.抽样标准误为:
(重复抽样时)
(不重复抽样时) 其中
,称为抽样比。
称为有限总体校正系数。 总体方差
未知时要以样本方差 来估计, 就变成了 。
3.抽样极限误差: 4.总体参数的置信区间:
(二)总体成数 的估计
1.总体成数 的估计量为:
2.抽样标准误为: (重复抽样时) (不重复抽样时) 当总体方差 未知时,要以样本方差 来估计。 3.抽样极限误差:
4.总体参数的置信区间:
(三)样本容量 的确定
样本容量的大小受总体分布(内在差异程度)、对抽样精度和可靠程度的要求、抽样方法 及调查经费等因素的影响。在不考虑调查经费时,简单随机抽样的样本容量可由以下公式 确定:
也称定值估计,就是以样本观测数据为依据,对总体参数做出确定 值的估计,
,
,
2.优点:能给出一个确定值。 缺点:把握程度不可知。
(二)区间估计 1.概念: 指用一个具有一定可靠程度的区间范围来估计总体参数 2.特点: a.)在一定概率把握下的估计;
b.)得到的估计值不是确定值; c.)只是一个可能区间; d.)区间的宽度可以调整 3.要求: 一定的置信度和精确度 抽样估计精度=1-误差率=1-⊿x/x=1-⊿p/p
二、常用的抽样分布定理(自学)
第二节 抽样误差
一、抽样中的误差构成
抽样中的总误差可以简单地分为两类(暂不考虑估计量偏差时),一类是抽样误差,一类
非抽样误差。
非抽样误差
总误差抽样误差来自抽样误差是由于抽样的非全面性和随机性所引起的偶然性误差,非抽样误差是由随机抽样
的偶然性因素以外的原因所引起的误差。
二、抽样误差的表现形式 (一)抽样实际误差 抽样实际误差是指样本估计值与总体参数值之间的离差,表示为
的大小变化来反映。 第三节 参数估计方法
一、估计量的评价标准 评价估计量好坏的标准有四个: 无偏性:
有效性:
。 一致性:随着样本容量的增大,估计量的值趋近总体参数的真值 充分性:估计量提取样本中包含的有关总体参数的全部信息 二、参数估计方法 参数估计的方法有两种:点估计与区间估计。 (一)点估计 1.概念: