第七章 抽样推断 (《统计学》PPT课件)

合集下载
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

接作为相应全及指标的估计值。
2.定义:设x_
表示总体平均数
__
X
的估计值,p^ 表示
总体成数P的估计值,则有:
__ _
X x

^
Pp
27
第四节 抽样估计
二、总体参数的点估计
3. 性质:
用抽样指标估计总体指标时,要求抽样指标
的平均数等于被估计的总体指标;E(
_
x)
__
X
_
E( p) P
用抽样指标估计总体指标时,要求当样本容 量n充分大时抽样指标充分靠近总体指标;
6
第一节 抽样推断概述
二、有关抽样的基本范畴
2.指标
:根据全及总体各个单位的标志值或标 志特征计算的,用来反映全及总体某种属性的综合 指标;
:由样本总体各单位标志值或标志特征 计算出的综合指标。
注:对于一个确定的问题,全及指标是唯一的, 样本指标不是唯一确定的,即样本指标的随机变量。
7
抽样推断
2.种类:
根据抽样资料计算样本指标,并以此直接作 为相应全及指标的估计值;
根据给定的概率保证程度的要求,利用实 际抽样资料,求出总体被估计值的上限和下限,即给 出总体参数可能存在的区间范围,而不是直接给出总 体参数的估计值。
26
第四节 抽样估计
二、总体参数的点估计
根据抽样资料计算样本指标,并以此直
n
N
22
第三节 抽样误差
三、抽样极限误差
在抽样推断中可允许的误差范围,等于样本指 标可允许变动的上限或下限与总体指标之差的绝对值。
2.计算公式:
_ __
_
__ _
抽样平均数极限误差: 或
_ x- X
x
x- _ X x _
x
x
以总体平均数 X__为中心,在
__
到 X - _
__
X _ 之间变动,区间
注:系统性误差和工作误差都属于思想、作风、技术问 题,可以防止和避免;随机误差不可避免,但可以控制。
18
第三节 抽样误差
二、抽样平均误差
抽样平均误差是反映抽样误差一般水平 的指标。
2.衡量尺度:
平均数;
抽样平均数的平均数等于总体
抽样成数的平均数等于总体成数。
故:抽样标准差恰好反映了抽样指标和总体指标 的平均离差程度。
样本指标值与总体指标值之间的离差。
17
第三节 抽样误差
一、抽样误差的含义
3.代表性误差
由于调查人员违反随机抽样的原则, 有意地抽选较好的单位或较差的单位进行调查,造 成样本指标值偏高或偏低。
由抽取样本的随机性引起的误差,又分 为:①抽样实际误差:每次抽样调查所得的样本指 标与总指标之间的实际差数;②抽样平均误差:所 有可能出现的抽样实际误差的标准差
组成。
设总体变量为X,其平均数为 。在重复抽样条件下, 从总体中抽出的样本为 x1,x2, ,xn ,并互相独立,而且每
个 xi(i=1,2,…,n)都是从总体中随机抽出的,所以变 量 xi 与总体X是同分布的随机变量。因此,样本平均数的期 望值与方差分别为:
E(
_
x)
E(
x1
x2
n
...
xn
)=
_
2
(1-
n

x nN
21
第三节 抽样误差
二、抽样平均误差
(二)抽样成数的平均误差:
p
n
p(1 p) n
p
2

N
-
n

n N 1
p(1 p)( N - n ) n N 1
同理:在总体单位数N很大的情况下,抽样成数的平均误差的公式可以 表达为如下近似式:
p
2
(1-
n

nN
p(1 p)(1- n )
3
第一节 抽样推断概述
一、抽样推断
1.统计抽样法
按照随机原则从全部研究对象中抽取 部分单位进行观察,获得各项数据的调查方法;
运用数理统计的原理,根据抽样调查 所得的非全面调查资料来推算总体情况的一种统计 研究方法。
2.抽样推断的特点
①由部分推算整体;②遵循随机原则; ③运用概率估计法; ④抽样推断的误差可以事先计算并加以控制。
的概率密度为: F(x;n1, n 2)
( ( n1
2
n1 n2 2
)(
) (
n2 ) 2
n1 n2
)( n1 n2
n1 1
x)2 (1
n1 n2 n2
n1 n2
x) 2
0
(x 0)
(x 0)
注:上述分布都是在总体为正态分布这一基本假定下得到的。
16
第三节 抽样误差
一、抽样误差的含义
2
F
成数
P N1 N
Q N0 1 P N
样本指标
n
Hale Waihona Puke 未加权加权_x
x
n
_
(x - x)2
sn1
n 1
_
xf
x
f
_
(x - x)2 f
sn1
f
_
s2 (x - x)2
n1
n 1
p n1 n
_
(x - x)2 f
s2
n1
f
q n0 1 p n
9
抽样方法的分类 根据取样方式不同,可分为:
1 n
[E(
x1
)
E(x2
)
...
E(
xn
)]
D(
_
x)
D(
x1
x2
n
...
xn
)=
1 n2
[ D( x1 )
D( x2
)
...
D(
xn
)]
2 n
12
第二节 抽样分布
二、样本均值的分布
完全相可同以,看样出本,平样均本数平的均方数差的是分总布体中分心布与方总差体的X1的/n分。布因中此心, 样本平均数分布的集中趋势优于总体分布自身的集中趋势。 由于样本平均数能“集中”分布于总体平均数附近,我们可 以考虑用样本平均数来估计总体的平均数。
以总体平均数为中心,两边完全对称分布,即抽样平 均数大于或小于总体平均数的概率完全相等;
抽样平均数愈接近总体平均数,误差出现的可能性愈 大,概率愈大;
注:抽样误差范围和估计置信度是密不可分的, 而且抽样误差范围愈小,则估计置信概率也愈小。
25
第四节 抽样估计
一、抽样估计
利用实际调查的抽样资料来估计相应总 体全及指标的数值,也称参数估计。
13
第二节 抽样分布
三、 2 分布
设 x1,x2, ,xn 是来自总体N(0,1)的样
本,则称统计量:
2 x12 x22 xn2
服从自由度为n的 2分布,记为 2 ~ 。 (2 n) 2 分布的概
率密度为:
1
n 1 x
x2 e 2
(x 0)
(2 x;n)
2
n 2

n

2
0
20
第三节 抽样误差
二、抽样平均误差
(一)抽样平均数的平均误差:
_ xn
_
2

N
-
n

x n N 1
N -n
注:由于修正因子 N 1 总是小于1,因而不重复抽样误差总是小于重 复抽样误差,但当总体单位数N很大的情况下,这个因子就十分接近1,因 而两种抽样误差就相差很小,抽样平均误差的公式可以表达为如下近似式:
抽样指标估计总体指标时,要求作为优良估 计量的方差应该比其他估计量的方差小。
28
第四节 抽样估计
三、总体参数的区间估计
根据给定的概率保证程度的要求,利用
实际抽样资料,求出总体被估计值的上限和下限,即 给出总体参数可x_ 能存在的区间范围,而不是直接给出
总体参数的估计值。
对于总体的被估计指标
__
X
三、总体参数的区间估计
2. 估计步骤 根据已经给定的抽样极限误差范围要求推算概率保证程度:
①抽取样本,计算样本指标,即计算样本平均数或样本成 数,作为总体指标的估计值,并计算样本标准差以推算抽 样平均误差;
由于随机抽样的偶然因素使样本各单位 的结构不足以代表总体各单位的结构,而引起样本 指标和全及指标之间的绝对离差。
如:样本平均数与总体平均数之间的绝对离差,样本成 数与总体成数之间的绝对离差,等等。
在统计工作过程中由于观察测量、登 记、计算上的差错所引起的误差,又称为工作误差, 它是所有统计工作都可能发生的;
(x 0)
式中的(
n) 2

函数在n/2上的函数值。特别地,当
n=2时, 2 分布为指数分布。
14
第二节 抽样分布
四、t分布
设 X ~ N(0,1), Y , ~ (2 n) 且X,Y相互独立,
则称随机变量:
t X Y/ n
服从自由度为n的t分布,记为 t ~ t(n)。t分布的概率
密度为:
t(x;n)
5
第一节 抽样推断概述
二、有关抽样的基本范畴
1.总体 N:研究对象,全及总体即统计总体,又
称母体,N总是很大的数; 品质标志→属性总体;数量标志→变量总体。
n:观察对象,又称子样,简称样本,是
指从全及总体中随机抽取出来,用来代表全及总体 的那部分单位构成的总体,n相对于N则是很小的数。
注:对于一个确定的问题,全及总体是唯一的, 样本总体不是唯一确定的。
第二节 抽样分布
一、抽样分布
样本是随机变量,样本估计量即统计 量是样本的已知函数,也是随机变量,因而有其概 率分布。统计量的概率分布称为抽样分布,也称统 计量分布或随机变量函数分布。
样本均值的分布; 2分布; t分布; F分布。
11
第二节 抽样分布
二、样本均值的分布
由总体中全部样本平均数的可能取值和与之相应的概率
重复抽样
从总体N个单位中随机抽取一个样本容 量为n的样本,每次从总体中抽取一个, 并把结果登记下来,又放回总体中重新 参加下一次的抽选。又称放回抽样
不重复抽样
总体单位数N不变,同一单位可能 多次被抽中。
每次从总体中抽选一个单位后就不 再将其放回参加下一次的抽选。又 称不放回抽样.
总体单位数减少n,同一单位只可 能被抽中一次。
x
x


__
X
-
__
_ ,X
_)称为平均数的估计区间,区间的总长度为
x
x
2 _
x
p pP
p-p P pp
抽样平均数极限误差 P - p 或P p
以总体(平P均- p成,P数 Pp为) 中心,在 到
之间变动,抽样
成数 p在
区间内,且与总体成数绝对离差不超
过。
23
第三节 抽样误差
四、抽样误差的概率度
4
第一节 抽样推断概述
一、抽样推断
3.抽样推断的作用:
①在无法或很难进行全面调查的场合下,可以运用抽 样法来了解全面情况;
②运用抽样法可以对全面调查的结果加以补充或订正; ③运用抽样法可以对生产过程中产品质量进行检查和
控制; ④运用抽样法可以对总体的某种假设进行检查,来判
断这种假设的真伪,决定行动的取舍。

n
1) 2 (1
x2
( n1)
)2
n (n) n
2
( x )
t分布又称为学生氏(Student)分布。
15
第二节 抽样分布
五、F分布
设 U ~ , (2 n1) V ~ , (2 n2) 且U,V相互独立,则
称随机变量:
F U / n1 V / n2
服从自由度为(n1,n2)的F分布,记为 F ~ F(n1,n2)。t分布
把极限误差 _ x

p
,分别除以
_
x
或 p 得相对数t
,表示误差范围为抽样平均误差的若干倍,t是测量估计可靠
程度的一个参数,称为抽样误差的概率度。
2.计算公式: _ t x _ t p x p
或 _ t _
x
x
或 p tp
24
第三节 抽样误差
五、抽样估计置信概率
表明抽样指标 x_ 和总 p体指标的误差x_ 不超 p过一定范 围的概率保证程度。
全及总体指标:
参数(未知量)
统计推断
样本总体指标:统
计量(已知量)
第一节 抽样推断概述
二、有关抽样的基本范畴
2.指标
单位数 类别
全及指标
N 未加权 加权
平均数
__
X
X
N
__
XF
X
F
标准差 方差
__
(X - X )2
N
__
2 (X - X )2 N
__
(X - X )2F
F
__
(X - X )2F
相信大家都知道,“2017年高校毕业生满意度”、 “37个城市平均月薪出炉”、“大学生平均月消费”中 所研究的都是总体,例如高校毕业生、37个城市和大学 生,即是针对所有高校毕业生、37个城市所有的劳动力、 所有大学生,但是所描述的指标如满意度、平均月薪和 平均月消费的计算却是来自于样本。这是出现了矛盾吗?
第七章 抽样推断
主要内容
抽样推断的基本概念 区间估计 必要样本容量的确定 抽样误差的计算 抽样组织方式的特点
2
引例
“2017年高校毕业生满意度”、“37个城市平均月 薪出炉”、“大学生平均月消费”等等,相信大部分同 学都或多或少看过这类的新闻,那么这些新闻所公布的 数据可信度到底是多少呢?例如大学生平均月消费为1 080元,有人就笑了,说他明明才800元左右,也有人说 他一个月2 000多元。为什么会出现这种情况呢?
19
第三节 抽样误差
二、抽样平均误差
总体标准差或方差的大小:抽样平均误差与总体标准 差或方差成正比;
样本单位数的多少:抽样平均误差与样本单位数的平 方根成反比;
抽样方法及抽样组织形式的差异。 (因总体标准差或方差未知)
样本方差 或 s2n1 p(1 p)代替; 用估计标准差代替; 用历史资料代替,若有几个方差,应选方差值最大的。
,找出样本的两个估计量 x和1
,使x2 被估计指标 落在X__ 区间 (x内1,x的2)概率为
1-(0 , 1)
是已知的,即P(x1
__
X x2) 1
,则称区间(x1,x2)是总体指标
的 __
X
置信区间,其置信概率为 1- 。 称为显著性水平,x1 是置信下
限,x2 为置信上限。
29
第四节 抽样估计
相关文档
最新文档