统计学第七章抽样推断syong
抽样推断syong专业知识讲座

计算出各样本旳均值,如下表。
样本平均数
概率
11.52
2.533.54
1/162/163/164/163/162/161/16
样本平均数旳均值或
抽样平均误差是全部样本指标与总体指标离差旳平均水平,所以有下列计算
0.7906件旳含义是,对于16个样本,不论抽到哪个样本平均来说误差为0.7906件。
二、抽样推断旳特点 1、抽样推断是非全方面调查。能够节省人力物力和财力,取得事半功倍旳效果。 2、抽样推断是按随机原则抽选调查单位。 3、抽样推断是用样本旳指标数值去推算总体旳指标数值。 4、抽样推断利用旳是概率原理。 5、抽样推断中产生旳误差能够事先计算并加以控制。
2.抽样平均误差旳计算
27
(2)样本成数旳抽样平均误差
抽样平均误差
【例】从10000名学生中抽查200名测得平均身高为1.65m,已知学生身高旳总体原则差σ=0.28。其中女生占全部学生旳比重30%。求学生平均身高和女生比重旳抽样平均误差。
抽样平均误差(举例)
解:已知N=10000,n=200, x =1.65m,σ = 0.28,p = 30%
(例题分析)
【例】一家食品生产企业以生产袋装食品为主,为对产量质量进行监测,企业质检部门经常要进行抽检,以分析每袋重量是否符合要求。现从某天生产旳一批食品中随机抽取了25袋,测得每袋重量如下表所示。已知产品重量旳分布服从正态分布,且总体原则差为10克。试估计该批产品平均重量旳置信区间,置信水平为95%
§7.4 参数估计旳一般问题
估计量与估计值评价估计量旳原则点估计与区间估计
估计量:用于估计总体参数旳随机变量如样本均值,样本百分比、样本方差等例如: 样本均值就是总体均值 旳一种估计量参数用 表达,估计量用 表达估计值:估计参数时计算出来旳统计量旳详细值假如样本均值 x =80,则80就是旳估计值
第七章 抽样推断

x x X x x
第七章 抽样推断
p p P p p
合适统计量 的估计值 合理的允 许误差 可接受的 置信度水平
t
概率度
5-40
• 区间估计的三要素 估计区间覆盖 总体参数真值 的概率 F(t)
• 区间估计的特点: • 不指出参数的确定数值,而是在一定的概 率保证程度下指出参数的可能范围。 • 估计的可靠程度可知,即为概率保证程度
X
区间估计的两个基本要求: 置信度 精确度
• 希望置信度尽可能大,精确度尽可能高。 • 但在样本容量n一定时,两者矛盾。
一般在给定的概率保证程度下,尽可能 提高估计的精度(通过降低标准误)。
第七章 抽样推断
抽样极限误差(精度) 与概率保证程度(可靠程度) 99.73%
95.45% 68.27%
3 x 2x x
抽样推断包括三方面的内容:
1、抽样。按照随机原则从总体中抽取部分调查 单位(样本)。
2、 构造统计量 。对样本资料进行加工计算, 获得既能反映样本特征又能用于推断总体的样本数 据。 3、推断。运用概率估计方法,以一定的可靠 性推断总体指标数值。
二、抽样推断的特点 1、按随机原则抽取样本单位 2、用部分推断总体 3、抽样推断的误差可以事先计算并加以控 制 4、运用概率估计方法
实际上就是对估计量可允许取的最高值或最 低值进行了限制
ˆ ˆ Biblioteka 例子• 要估计某乡粮食亩产,从8000亩粮食作物中,用不 重复抽样抽取400亩,求得平均亩产为450公斤。如 果确定抽样极限误差为5公斤,这就要求某乡粮食 亩产为450〒5公斤,即在445公斤到455公斤之间。
x
i 1 n
第7章 抽样推断

D 所调查的200名学生
正确答案是( C )
同步训练
8. 某大学的一位研究人员希望估计该大学本科生 平均每月的生活费支出,为此,他调查了200名学 生,发现他们每月平均生活费支出是500元。该研 究人员感兴趣的参数是( ) A 该大学的所有学生 B该大学所有大学生的月平均生活费支出 C该大学所有的在校本科生
经常采用的样本指标主要有样本均值、样本比例和样 本方差。
(二)总体指标和样本指标
样本均值:
未分组 分 组
x x2 xn x 1 n
x
i 1
n
i
样本比例:
x f x f
i i
n
i
样本方差:
n1 p n
S
S
2
未分组
2
(x
i
i
x)2
n 1
x)2 fi
全及总体指标:参数 (未知量) 统计推断 样本总体指标:统计量 (已知量)
二、抽样推断的特点 • 按随机原则抽取样本
每个单位都有 相同的被抽中 的机会,哪个单 位被抽中,由随 机因素确定,完 全排除抽样者 的个人主观意 志
• 运用概率论的理论和方法,用样本指标来推断 总体指标。 • 推断的误差可以事先计算和控制。
N! M n!( N n)!
M
( N n 1)! n!( N 1)!
(五)抽样组织方式
简单随机抽样
类型抽样
整群抽样 等距抽样 多阶段抽样
抽样的组织方式
简单随机抽样
简单随机抽样也叫纯随机抽样。它是按照随机原则直接从总体 N个单位中抽取n个单位作为样本,然后通过对样本单位的调
统计学(本科)教学课件第七章抽样推断

样本个数又称样本可能数目。指从一个总 体中可能抽取的样本个数。
四、常用的抽样方法
(一)重复抽样与不重复抽样 重复抽样也叫重置抽样,是从一个总体中
抽出一个单位后,又放回总体,使总体始 终保持总体最先的单位数。
二、简单随机抽样条件下必要抽样数 目的计算
1.重复抽样条件下必要样本单位数目的 计算;
2.不重复抽样条件下必要样本单位数目 的计算;
三、计算必要样本单位数目应注意的问题
第一,上述计算公式的样本单位数目是最低的,也 是最必要的样本容量。
第二,用上述公式计算样本容量时,一般情况下, 总体方差是未知的,处理方法与“抽样平均计算公 式”相同。
不重复抽样也叫不重置抽样,其方法是, 从总体N个单位中要抽取一个样本容量为n 的子样,每次从总体中抽取一个,连续进 行n次抽选构成一个样本。但每次抽选一 个单位就不放回参加下一次的抽选。
五、抽样误差
(一)概念 抽样调查的意义是用样本指标来推断相应的总体
指标。这两者之间必然存在着差距,这个差距就 叫做抽样误差。 (二)分类 按产生的原因,抽样误差大体上可以归纳为以下 两类: 调查误差,也叫登记性误差, 抽样误差也叫代表性误差,它是抽样调查本身所 固有的一种误差,
等距抽样,是在各单位大小顺序排队基础上,再 按某种规则依一定间隔取样,这样保证所取到的 样本单位均匀地分布在总体地各个部分,有较高 的代表性。
(三)分类
等距抽样按照排列顺序时所依据的标志不同, 可分为按无关标志排序和按有关标志排序。
所谓按无关标志排序,是指用来排序的标志 与调查研究的标志无关。例如,研究工人的 平均收入水平时,将工人按照姓氏笔画顺序 排列。
统计学(第7章)

s2 p(1 p)
2020/1/18
第七章 推断统计
13
统计学
三、抽样的组织方式
(一)简单随机抽样(纯随机抽样)
1、重复抽样
也称回置抽样,它是指每次抽取一个样本登记后再将 它放回总体中参加下一次抽取。
重复抽样的特点是:每次抽取样本是在完全相同的条 件下进行的,总体中每个单位中选的机会在各次都完 全相等。
第七章 推断统计
6
(二)总体参数
是唯一的、 确定的。
统计学
1、总体的平均数与方差
总体平均数
对未整理资料:
X X N
对经过整理的资料: X Xf f
2020/1/18
第七章 推断统计
7
统计学
无法直接求得
总体的方差(或标准差):
对未整理资料:
σ 2 ( X X )2
假设检验:依据样本观察资料对总体综合 指标的某种假设检验,来判断这种假设的 真伪。
2020/1/18
第七章 推断统计
5
统计学
第二节 有关抽样的基本概念
一、总体的相关概念
(一)总体 (母体、全及总体)
一般用 N 表示总体的单位数。 一个总体的指标数值是确定的、唯一的,
所以称为参数。
2020/1/18
取第 a 个,则第二组起分别为:2k-a,2k+a, 4k-a,4k+a,6k-a,6k+a,……
2020/1/18
第七章 推断统计
18
统计学
(三)类型抽样(又称分层抽样)
类型抽样:是将总体各单位按主要标志进行分 组,然后再从各组中按随机原则抽取一定比例 的单位构成样本。
统计学原理第七章 抽样推断

11
§7.2 抽样误差
1. 抽样误差 样本指标与被估计的总体指标之间,总是存在着某种程度的离差,
这种离差就是抽样误差 2.抽样平均误差
又叫抽样标准误差,是反映抽样误差一般水平的指标,也可以说 是样本指标的标准差
12
§7.2 抽样误差
一、影响抽样误差的因素 1 样本容量 2 总体各单位标志值的差异程度 3 抽样方法 4 抽样组织形式
0.18 1.9% 500
p
p(1 p) (1 n )
n
NLeabharlann 0.18 (1 500 ) 1.84% 500 10000
因此,重复抽样下,手机持有率的抽样平均误差为1.9%;不重复 抽样下,手机持有率的抽样平均误差为1.84%。
20
§7.3 抽样估计
一、 抽样估计 根据样本平均数或成数估计总体平均数或成数。
3
§7.1 抽样推断的基础理论 抽样推断过程:
全及总体 样本
总体指标
样本统计量
4
§7.1 抽样推断的基础理论
概念 抽样推断是按随机原则从全部研究对象中抽取一部分单位进行调查, 并以调查结果对全部研究对象的数量特征作出具有一定可靠程度的估计 与推断,从而认识现象总体的一种统计方法。
特点 1.按随机原则抽选调查单位 2.非全面调查 3.抽样误差是可以事先计算并控制
1
x x xf
n f
2
s2 (x x)2 (x x)2 f
n
f
3 4
s (x x)2 (x x)2 f
n
f
p n1 n
5
s2 p(1 p)
9
§7.1 抽样推断的基础理论
第七章 抽样推断 (《统计学》PPT课件)

接作为相应全及指标的估计值。
2.定义:设x_
表示总体平均数
__
X
的估计值,p^ 表示
总体成数P的估计值,则有:
__ _
X x
或
^
Pp
27
第四节 抽样估计
二、总体参数的点估计
3. 性质:
用抽样指标估计总体指标时,要求抽样指标
的平均数等于被估计的总体指标;E(
_
x)
__
X
_
E( p) P
用抽样指标估计总体指标时,要求当样本容 量n充分大时抽样指标充分靠近总体指标;
6
第一节 抽样推断概述
二、有关抽样的基本范畴
2.指标
:根据全及总体各个单位的标志值或标 志特征计算的,用来反映全及总体某种属性的综合 指标;
:由样本总体各单位标志值或标志特征 计算出的综合指标。
注:对于一个确定的问题,全及指标是唯一的, 样本指标不是唯一确定的,即样本指标的随机变量。
7
抽样推断
2.种类:
根据抽样资料计算样本指标,并以此直接作 为相应全及指标的估计值;
根据给定的概率保证程度的要求,利用实 际抽样资料,求出总体被估计值的上限和下限,即给 出总体参数可能存在的区间范围,而不是直接给出总 体参数的估计值。
26
第四节 抽样估计
二、总体参数的点估计
根据抽样资料计算样本指标,并以此直
n
N
22
第三节 抽样误差
三、抽样极限误差
在抽样推断中可允许的误差范围,等于样本指 标可允许变动的上限或下限与总体指标之差的绝对值。
2.计算公式:
_ __
_
__ _
抽样平均数极限误差: 或
_ x- X
第七章 统计 抽样推断

与全面调查相比,抽样调查既节省了人力、 物力、财力和时间,又达到了认识总体数量特 征的目的。我国在1994年确立了以周期性普查 为基础,以经常性抽样调查为主体,同时辅之 以重点调查、科学核算等综合运用的统计调查 方法体系。
三、优点:
1、更科学
2、更经济 3、时效性强 4、应用广
四、抽样推断的应用
n AN N!/( N n)!
N
n
不考虑顺序的不重复抽样
不考虑顺序的重复抽样
C
n N
C
n N n1
第三节:点估计和抽样平均误差
人们每时每刻都在做估计。根据婴儿的哭 声估计其冷热和什么时候吃奶、根据望闻问切 来估计病人的病情、根据外表估计一个人的身 高体重、根据前几天的数据估计今天的股市行 情,根据营业数据等估计一个公司的业绩等等。 估计就是根据你拥有的信息来对现实世界进行 某种判断。统计中的估计也不例外,它是完全 根据数据做出的。
x 或p P
1、抽样误差是个概念,只能理解无法计算;
2、抽样误差是个变量,随着样本不同而不同。
问:抽样误差是个变量,那么抽样误差有多少个 变量值?
二、抽样平均误差
• 平均误差
(一)抽样平均误差的定义公式 1、平均数的抽样平均误差
x
(x )
2
所有可能的样本数目
2、成数的抽样平均误差
指样本单位的抽取不受主 观因素及其他系统性因素 的影响,每个总体单位都 有均等的被抽中机会
抽样推断
总体指标:参数
(未知量)
统计推断
样本总体指标:统
计量(已知量)
例1 对湖中鱼产量的估计。 欲了解某湖中鱼的总产量,如果湖中有N条鱼, 平均每条鱼的重量为
抽样推断-37页PPT文档资料

x :抽样平均数的抽样误极差限 p : 抽 样 成 数 的 抽 样 极 限差误
x
xX
xXx
x
x
P pP ppPpp
26
(xx,xx)或( pp,pp)称为置. 信区
23.09.2019
第二节 抽样误差 五、抽样误差的概率度
用 除以 (或者 除 用以 ),得到 t, t数 就值 称
样本又称子样,是从全及总体中随机抽取出来,作为代表 这一总体的那部分单位组成的集合体,一般用n表示。
总 体N (唯一)
7
样 本n (非唯一)
23.09.2019
第一节 统计推断概述 四、抽样推断中的基本概念
(二)总体指标和样本指标
总体指标是根据总体各单位的标志值或标志 特征计算的,反映总体数量特征的综合指标, 称为全及指标,由总体各单位的标志值或标 志特征所决定,全及指标的指标值是确定的, 唯一的,所以又称为参数。
15
23.09.2019
不同抽样方法的样本个数
重复抽样
考虑顺序 BnN=Nn
抽样方法
不考虑顺序 D n N C n N n 1 ( N n 1 ) n N ! n ( 2 ) N
不重复抽样
考虑顺序 A n N N ( N 1 ) ( N n 1 )
n
d.可以通过调整样本单位数n来控制抽样平均误差。
23
23.09.2019
第二节 抽样误差
抽样平均误差的计算
重复抽样
不重复抽样
样本平均数 的平均误差
2
x
nn
2 (1n)
x
nN
样本成数 的平均误差
统计学-07抽样推断

6 368
4 2 5 3 4 3 3 4 5 4 2 1 54
3
4 6 11 14 18 21 24 28 33 37 39 40 45 49 52
16 17 18 19 20 21 22 23 24 25 26 27 28 29 30
370 371 388 402 410 446 453 470 477 490 499 502 503 51 520 6
可编辑ppt
12
第三步:抽取调查单位
半距起点、等距抽样
可编辑ppt
13
半距起点、等距抽样
➢ 以第一个抽样距离的一半处作为第一个调查单 位
➢ 以后毎隔一个抽样距离抽取一个调查单位 ➢ 直到最后一个调查单位抽出为止
可编辑ppt
14
以抽取6户为例,抽取的户数依次为:
第1户 n1=17.5÷2=8.75 为第3号户 第2户 n2=8.75+17.5=26.25 为第8号户 第3户 n3=26.25+17.5=43.75 为第13号户 第4户 n4=43.75+17.5=61.25 为第19号户 第5户 n5=61.25+17.5=78.75 为第24号户 第6户 n6=78.75+17.5=96.25 为第28号户
可编辑ppt
22
7.2 抽样分布及抽样推断理论依据 ——基础知识:概率
发生概率很小的事件称为小概率事件(small probability event);
小概率事件不那么可能发生,但它往往比 很可能发生的事件更值得研究。
在某种意义上,新闻媒体的主要注意力大
都集中在小概率事件上。
可编辑ppt
23
例如:对某镇农户进行家计调查,以自然村庄划分群,
《应用统计学》第七章:抽样推断

样本指标
n
样本均值:
x
x1
x2
...
xN
xi
i1
n
n
样本成数: p n1
n
样本方差:S2 1
_
(x - x)2
n 1
样本标准差: S S2
四、抽样的理论依据
大数定律
• 切贝谢夫定理:当样本容量n足够大时,独立同分布的 一系列随机变量的算术平均数接近(依概率p收敛于)数 学期望值,即随机变量平均数具有稳定性,该定律提 供了用样本平均数估计总体平均数的理论依据。
N
总体均值:
X
X1
X2
...
XN
Xi
i1
N
N
总体成数: X)2 N _
总体方差: 2 (X - X)2 N
样本指标
由样本内各个单位标志值或标志特征计算的综合 指标称为样本指标
与总体指标相对应,样本指标也有样本平均数, 样本成数,样本标准差及样本方差,样本均值及 样本成数一般用小写字母来表示。
P(1- P) (1- n ) nN
【举例】抽样成数的抽样平均误差的计算
返回
第三节 抽样方案设计
简单随机抽样 类型抽样(分层随机抽样) 机械抽样 整群抽样 多阶段抽样
一、简单随机抽样
简单随机抽样又称为纯随机抽样,它是对总体不 作任何处理,不进行分类也不搞排队,而是从总 体的全部单位中随机抽选样本单位。
组单位数的多少与各组标志变动程度的差异两个
因素。
ni
抽样调查的特点
按随机原则抽取调查单位 根据部分实际资料对全部总体的数量特征
统计学基础第七章抽样推断

统计学基础第七章抽样推断【教学目的】1•理解抽样推断的含义及特点2.深刻理解抽样误差产生的原因3.对抽样误差、抽样平均误差、抽样极限误差加以区别4.了解并种抽样组织形式的特点5.重点掌握简单随机抽样组织形式的区间估计方法6.掌握必要样本单位数的确定方法【教学重点】1•理解抽样推断中的几个基本概念(总体指标、样本指标、平均数、成数、方差、标准差)。
2.理解抽样误差的概念3.理解和运用不同抽样方法下计算抽样误差4.掌握简单随机抽样组织形式的区间估计方法6.掌握必要样本单位数的确泄方法【教学难点】1•理解抽样推断中的几个基本概念(总体指标、样本指标、平均数、成数、方差、标准差)。
2.理解抽样误差的概念3.理解和运用不同抽样方法下计算抽样误差4.掌握简单随机抽样组织形式的区间估计方法6.掌握必要样本单位数的确泄方法【教学时数】教学学时为10课时【教学内容参考】第一节抽样推断的意义一、抽样推断的含义(一)抽样推断的特点抽样推断又称为抽样估计,它是在抽样调查的基础上,利用样本实际资料计算样本指标,并据以推算总体相应数量特征的一种统计调查方式。
【案例】从全国所有股份制企业中,抽取一部分企业,详细调查其生产经营状况,根据这一部分企业的调查资料,来推算所有股份制企业的生产经营状况,这就属于抽样推断。
抽样推断有以下几个特点:1•按随机原则从总体中抽取调査单位。
所谓随机原则是指在抽取调查单位时,总体中每个单位都有同等被抽中的机会,完全排除了人为主观意识的影响,哪个单位抽中与否,纯粹是随机的、偶然的。
按随机原则抽取调査单位是进行抽样推论的基本要求。
2.根据被抽取的调查单位,计算各种指标,并对总体的指标作出估计。
3.抽样推断中的抽样误差可以事先计算并加以控制,从而保证抽样推断的结论符合预泄的精确度和可靠度要求。
(二)抽样推断的作用抽样推断的主要作用有:1.对某些不可能进行全而调査而又需要了解全而情况的社会经济现象,可以采用抽样推断方式。
统计学原理 第七章 抽样推断

统计学原理
在抽样方案设计基本完成之后,为了验证抽样结果能否获得最 有代表性的数据,对所设计的方案进行检查是必要的。
这种检查主要有两个方面: 准确性的检查 代表性的检查
四、抽样误差的概率度
统计学原理
基于概率估计的要求,抽样极限误差通常需要以抽样平均误差 μx或μp 为标准单位来衡量。把极限误差Δx 或Δp 分别除以μx
或μp 得相对数t,表示误差范围为抽样平均误差的若干倍,t是测量
估计可靠程度的一个参数,称为抽样误差的概率度。即:
五、抽样估计置信概率
统计学原理
志加以分组,然后再从各组中按随机原则抽选一定单位构成样本。
(二)类型抽样误差的计算
四、等距抽样
统计学原理
(一)等距抽样的概念 等距抽样又称为机械抽样或系统抽样,它是事先将全及总体各 单位按某一标志排列,然后依固定顺序和间隔来抽选调查单位的一 种抽样设计。 (二)等距抽样误差的计算 按无关标志排队的条件下抽样误差的计算 按有关标志排队的条件下抽样误差的计算
统计学原理
本章目录
第一节 第二节 第三节 第四节 第五节
抽样推断的意义和作用 抽样误差 抽样估计的方法 必要样本容量 抽样方案设计及抽样组织形式
学习目标
通过本章学习要求了解: 了解抽样推断的特点和作用 理解抽样推断中的基本概念 掌握不同类型抽样误差的计算 掌握区间估计的步骤 掌握必要样本容量的确定 了解不同类型抽样组织方式的特点
?了解抽样推断的特点和作用?理解抽样推断中的基本概念?掌握不同类型抽样误差的计算?掌握区间估计的步骤?掌握必要样本容量的确定?了解不同类型抽样组织方式的特点学习目标第一节抽样推断的意义和作用统计学原理统计学原理统计抽样法是统计研究中的一种重要方法它包括抽样调查和抽样推断两部分
统计学 抽样推断课件

p
p
p
三、抽样估计与推算
总体参数的点估计 抽样估计的精度 抽样估计的置信度 总体参数的区间估计
1、总体参数的点估计
参数点估计的基本特点是,根据总体指标 的结构形式设计样本指标(称统计量)作 为总体参数的估计量,并以样本指标的实 际值直接作为相应总体参数的估计值。 优良估计总标准有三个方面:无偏性 、一 致性 、有效性
课堂练习
15.进行简单随机重复抽样,假定抽样单位增加3倍,则 抽样平均误差将发生如何变化?如果要求抽样误差减少 20%,其样本单位数应如何调整? 16.某工厂有1500个工人,用简单随机重复抽样的方法 抽出50个工人作为样本,调查其工资水平,如下表:
月工资水平(元) 524 534 540 550 560 580 600 660
课堂练习
8.假定10亿人口大国和100万人口小国的居民年龄变异程 度相同。现在各自用重复抽样的方法抽取本国的1%人口计 算平均年龄,问两国平均年龄抽样平均误差是否相同,或 哪国比较大? 9.参数估计的优良标准是什么?抽样平均数和抽样成数估 计是否符合优良估计标准,试加以说明。 10.什么是概率度?什么是置信度?这两者有什么关系? 11.类型抽样中的分组和整群抽样中的分群有什么不同意 义和不同要求? 12.试比较等距抽样中按无关标志和按有关标志排队的优 缺点,比较有标志排队中半距起点固定间隔取样和随机起 点对称等距取样的优缺点。
教学重点与难点
一、有关抽样的基本概念——总体和样本、 参数和统计量、样本容量和样本个数重复 抽样和不重复抽样。 二、抽样误差的意义及其影响因素、抽样 极限误差、抽样平均误差、抽样估计等内 容。
教学内容
一、抽样推断的基础 二、抽样推断与误差 三、抽样估计与推算
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
§7.2抽样推断的几个基本概念
一、全及总体和抽样(样本)总体
1、全及总体又称母体,简称总体,它是指所要认 识的,具有某种共同性质的许多单位的集合体。
组成全及总体的单位称为总体单位,全及总体的单 位数一般用N表示。
2、抽样总体又称子样,简称样本,是从全及总体 中随机抽取的那一部分单位所构成的集合体。
•
※它是抽样推断中不可避免不可消除的误差;
•
※抽样误差的大小反映了样本代表性的高低;
•
※它可以用数理统计方法进行计算和控制。
• 二、抽样平均误差
1.抽样平均误差的含义:
•
抽样平均误差从一般意义上说是所有样本指标与总体
指标差数的平均水平,它反映了抽样指标与总体指标的平
均离差程度。 实质就是所有可能出现的样本指标的标准差。
P N1 N
Q N0 N N1 1 P NN
iii. 总体标准差、总体方差
2 X X 2
N
2.样本指标(统计量)
i.
样本平均数
x x
ii. 样本成数
n
pˆ n1 n
q n0 n n1 1 pˆ nn
iii. 样本标准差、样本方差
s2 x x 2
n 1
• 四、重复抽样和不重复抽样
z
的大小
置信水平
1. 将构造置信区间的步骤重复很多次,置 信区间包含总体参数真值的次数所占的 比例称为置信水平
200
3.24%
➢ 在不重复抽样的条件下:
x
2 n
(1
n N
)
0.282(1 200 ) 0.0196
200 10000
p
P
(1P
n
)
(1
n N
)
0.3
(1 0.3) 200
(1
12000000)
3.21%
28
•
※在没有总体方差和标准差时怎么办?
•
(用样本的相关指标代替即可)
计算公式汇总:
抽样平均数 x
n
x
n
重复抽样 1 n 不重复抽样
N
抽样成数 p
p n
P(1 P) n
重复抽样
p
P(1 P) 1 n 不重复抽样
n
N
• 三、影响抽样(平均)误差的因素
•
1、抽样单位数目的多少;
•
2、总体被研究标志的变异程度;
•
3、抽样方法和组织形式的不同。
§7.4 参数估计的一般问题
一. 估计量与估计值 二. 评价估计量的标准 三. 点估计与区间估计
一全及总体可抽取的样本有多个 每个样本都可以计算出相应的样本指标(抽样平均数或
抽样成数指标) 样本指标和总体指标的抽样误差各不相同(随机变量)
为了测定样本(指标)的代表性程度的高低,单独用 某一次的抽样误差来衡量是不科学的,因此就需要采用一 定的方法(求标准差的方法)计算所有抽样误差的平均数, 这就是抽样平均误差。同时它在参数估计中也要用到。 •
•
以上都是考虑顺序的抽样!
§7.3 抽样误差
一、 抽样误差
1 抽样误差的概念
一般地说,抽样误差是指根据样本数据计算而得的样本 统计量值与被它估计的未知的总体参数真值之间的差值。
抽样误差
样本统计量值 总体参数真值 例 如
均值抽样误差
x
X
15
2、统计调查误差的种类 (1)登记性误差(工作误差)
调查过程中由于主客观原因在登记、汇总、计算、过录 中所产生的差错。
值之差的估计
• 2. 没有给出估计值接近总体参数程度 的信息
(二)区间估计
(interval estimate)
1. 在点估计的基础上,给出总体参数估计的一个区间 范围,该区间由样本统计量加减抽样误差而得到的
2. 根据样本统计量的抽样分布能够对样本统计量与总 体参数的接近程度给出一个概率度量
– 比如,某班级平均分数在75~85之间,置信水平是95%
0.7906 (件)
2 X
0.625
0.7906件的含义是,对于16个样本,无论抽到哪个样本 平均来说误差为0.7906件。
从以上计算中可以看出:
(1)抽样平均误差就是抽样指标的标准差, 所以也称为抽样标准误差或估计标准误。
(2)抽样平均误差(即抽样指标的标准差) 比总体标准差小的多,仅为总体标准差的 1 。
(2)代表性误差 用部分推算总体时产生的误差。 ①偏差(系统性误差):由于抽样调查没有遵循随机原
则而产生的误差。 ②随机误差 (偶然性误差):在没有登记性误差又遵循
了随机原则的情况下,所产生的样本指标与被它估计的总体相 应指标的差数。
•
• 3、抽样误差的进一步理解
•
※它就是指随机误差;
•
※它是一个随机变量;
200 名 测 得 平 均 身 高 为 1.65m , 已知学生身高的 总体标准差 σ=0.28 。 其 中 女 生占全部学生的 比 重 30% 。 求 学 生平均身高和女 生比重的抽样平 均误差。
➢ 在重复抽样的条件下:
0.28 0.0198 x n 200
p
P(1 P )
n
0.3 (1 0.3)
•
抽取样本有两种基本方法,不同的方法会影响抽样
的误差。
•
1、重复抽样(重置抽样、放回抽样)
•
基本的特点和做法
•
样本个数的计算:Nn(可重复排列数)
•
2、不重复抽样(不重置抽样、不放回抽样)
•
基本的特点和做法
•
样本个数的计算: (不重复排列数)
•
N(N-1)(N-2)......(N-n+1)=N!/(N-n)!
n
X
xi
i 1
M
1.0 1.5 16
4.0
2.5
或
X xi P(x) 11/16 1.5 2 /16 3.5 2 /16 41/16
2.5
抽样平均误差是所有样本指标与总体指标离差的平均水平
,所以有以下计算
M
X
(xi )2
i1
M
(1 2.5)2 (1.5 2.5)2 (4 2.5)2 16
置信区间
样本统计量 (点估计)
置信下限
置信上限
区间估计的图示
X z 2 X
X
- 2.58x
X
-1.65 x
+1.65x + 2.58x
-1.96 x
+1.96x
90%的样本
95% 的样本
99% 的样本
• 抽样极限误差(抽样允许误差、抽样边际误 差)
•
含义: 抽样极限误差是指抽样指标和总体指标
•
1、对无限总体全面情况的了解,必须采用抽
样推断。
• 2、对破坏性或消耗性检查,必须采用抽样调
查。
• 3、对某些可以但事实上不必或不可能进行全
面调查的现象总体,可以采用抽样推断获取相关
资料。
• 4、抽样调查可以对全面调查得来的资料进行
验证,并据以进行补充和修改。
• 5、抽样推断可以用于生产过程的质量控制。
(consistency)
• 一致性:随着样本容量的增大,估计量的
•
值越来越接近被估计的总体参数
P(ˆ) 较大的样本容量 B
较小的样本容量
A
ˆ
三、点估计与区间估计
参数估计的方法
估计方法
点估计
区间估计
(一)点估计
(point estimate)
1. 用样本的估计量直接作为总体参数的估计 值
▪ 例如:用样本均值直接作为总体均值的估计 ▪ 例如:用两个样本均值之差直接作为总体均
第七章 抽样推断
❖本章内容
第一节 抽样推断概述 第二节 抽样推断的几个基本概念 第三节 抽样误差 第四节 参数估计的一般问题 第五节 一个总体参数的区间估计 第六节 样本容量的确定——抽样方案设计
❖ 本章重点 ❖ 第三、五、六节内容 ❖ 本章难点 ❖ 第三、五节内容 ❖ 具体要求 ❖ 理解-抽样推断的含义、作用及基本概念 ❖ 掌握-抽样误差的计算、参数估计的方法等。
§7.1抽样推断概述
一、抽样推断的概念
“抽样推断、抽样调查和抽样估计”基本上 是相同的意思。『回顾第二节“抽样调查”的概 念』
抽样推断是按照随机原则从全部研究对象中 抽取一部分单位进行观察,并根据被抽取的那部 分单位的数量特征,运用一定的数理统计方法, 对总体的数量性作出具有一定可靠程度的估计和 判断。
二、评价估计量的标准
1. 无偏性(unbiasedness)
• 无偏性:估计量抽样分布的数学期望等于 被
•
估计的总体参数
P(ˆ)
无偏
有偏
A
B
ˆ
2.有效性
(efficiency)
有效性:对同一总体参数的两个无偏点估计量
,有更小标准差的估计量更有效
P(ˆ)
ˆ1 的抽样分布
B
A
ˆ2 的抽样分布
ˆ
3.一致性
三、总体指标和样本指标
• 1.总体指标(参数)
i. 总体平均数 ii. 总体成数
X
N
• 当研究的是总体个单位的属性特征时,
只能用一定的术语来描述,所以就应该计算
比重结构指标,称为总体成数。用大写 P
表示,它说明了总体中具有某种标志的单位
数在总体中所占的比重。
• 设总体N个单位中,有N1个单位具有某 种属性,N0个不具有某种属性, N1 +N0=N, P为总体中具有某种属性的单位数所占的比 重,Q为布局有某种属性的单位所占的比重, 则总体成数为: