第2讲 抽样分布与参数估计

  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
s s
2 1 2 2
2 1 2
P 1P 2

2 1
2 2
如果现在睡觉, 你会做梦; 如果现在学习, 你将会圆梦。
点估计
点估计
(概念要点)
1. 从总体中抽取一个样本,根据该样本的统计 量对总体的未知参数作出一个数值点的估计
例如: 用样本均值作为总体未知均值的估计值 就是一个点估计
2. 是一种理论概率分布 3. 随机变量是 样本统计量

样本均值, 样本比例等
4. 结果来自容量相同的所有可能样本
样本均值的抽样分布
(一个例子)
【例】设一个总体,含有4个元素(个体),即总体单 位数 N=4 。 4 个个体分别为 X1=1 、 X2=2 、 X3=3 、 X4=4 。总体的均值、方差及分布如下
2 sx 12 2 2 ~ F (n1 1, n2 1) sy 2
s
2 y 2 2
将F(n1-1 , n2-1 )称为第一自由度为(n1-1),第二 自由度为(n2-1)的F分布
两个样本方差比的抽样分布
不同样本容量的抽样分布
(1,10) (5,10) (10,10)
F
T 统计量的分布
x 2.5
2 x 0.625
样本均值的抽样分布 与中心极限定理
当总体服从正态分布N ~ (μ,σ2 )时,来自该总体的所 有容量为n的样本的均值X也服从正态分布,X 的 数学期望为μ,方差为σ2/n。即X~N(μ,σ2/n)
=10
n=4 x 5 n =16 x 2.5
总体、个体和样本
(概念要点)
总体(Population):调查研究的事物或现象的全体
个体(Item unit):组成总体的每个元素 样本(Sample):从总体中所抽取的部分个体 样本容量(Sample size):样本中所含个体的数量
样本均值的抽样分布
抽样分布
(概念要点)
1. 所有样本指标(如均值、比例、方差等) 所形成的分布称为抽样分布
式中:M为样本数目 比较及结论:1. 样本均值的均值(数学期望)等于总体均值
2. 样本均值的方差等于总体方差的1/n
样本均值的分布与总体分布的比较
总体分布
.3
P(x)
抽样分布
.3 .2 .1 0
.2 .1 0
1
2
3
4
1.0 1.5 2.0 2.5 3.0 3.5 4.0 x
= 2.5
σ2 =1.25
95% 的样本
99% 的样本
置信水平
1. 总体未知参数落在区间内的概率 2. 表示为 (1 -

为显著性水平,是总体参数未在区间内 的概率 相应的 为0.01,0.05,0.10
3. 常用的显著性水平值有 99%, 95%, 90%

区间与置信水平
均值的抽样分布
/2
x
1-
总体均值的区间估计
(实例)
【例】从一个 正态总体中抽 取一个随机样 本, n = 25 ,其均值x = 50 , 标 准 差 s = 8。 建立 总体均值 的 95% 的置信区 间。
解:已知X~N(,2),x=50, s=8, n=25, 1- = 0.95,t/2=2.0639。 s n 1 s n 1 , x t 2 x t 2 n n
总体均值的区间估计
(2未知)
总体均值的置信区间
(2 未知)
1. 假定条件

总体方差(2)未知 总体必须服从正态分布
2. 使用 t 分布统计量 x t ~ t (n 1) s n1 n 3. 总体均值 在1-置信水平下的置信区间为 sn 1 sn 1 , x t 2 x t 2 n n
总体
不同容量样本的抽样分布
n=1 n=4 n=10
简单随机样本


计算样本方差S2
计算卡方值
n=20
2 = (n-1)S2/σ2
计算出所有的
Biblioteka Baidu2
2值
均值的标准误
1. 所有可能的样本均值的标准差,测度所 有样本均值的离散程度
2. 小于总体标准差 3. 计算公式为
x n
两个样本方差比的抽样分布
/2
x
(1 - ) % 区间包含了
X
% 的区间未包含
影响区间宽度的因素
1. 数据的离散程度,用 来测度
x 2. 样本容量, n
3. 置信水平 (1 - ),影响 Z 的大小
第三节 总体均值和总体比例 的区间估计
一. 总体均值的区间估计 二. 总体比例的区间估计 三. 样本容量的确定
总体均值的区间估计
(非正态总体:实例)
解:已知 x = 26, =6 , n=100, 1- = 【例】某大学从该 0.95,Z/2=1.96 校学生中随机抽取 100 人 , 调 查 到 他 x Z 2 , x Z 2 们平均每天参加体 n n 育锻炼的时间为 26 6 6 分钟。试以 95 %的 ,26 1.96 26 1.96 100 100 置信水平估计该大 学全体学生平均每 24.824,27.176 天参加体育锻炼的 我们可以 95 %的概率保证平均每天 时间(已知总体方 参加锻炼的时间在 24.824 ~ 27.176 差为36小时)。 分钟之间
置信区间 样本统计量 (点估计)
置信下限
置信上限
置信区间估计
(内容)
置信区间
均 值 2 已知 2 未知
比例
方差
落在总体均值某一区间内的样本
X = Zx

_ x
- 2.58x
-1.65 x
+1.65x
+ 2.58x
X
-1.96 x
+1.96x
90%的样本
一. 点估计 二. 点估计的优良性准则 三. 区间估计
参数估计的方法
估 计 方 法



区间估计
矩估计法 顺序统计量法 最大似然法 最小二乘法
被估计的总体参数
总体参数 均值 一个总体 比例 方差 均值之差 两个总体 比例之差 方差比 符号表示
用于估计的 样本统计量

P
x ˆ p
s2 x1 x2 ˆ1 p ˆ2 p
学习目标
1. 2. 3. 4. 了解抽样和抽样分布的基本概念 理解抽样分布与总体分布的关系 了解点估计的概念和估计量的优良标准 掌握总体均值、总体比例和总体方差的区 间估计
第一节 抽样与抽样分布
一. 二. 三. 四. 五. 六. 总体、个体和样本 关于抽样方法 样本均值的分布与中心极限定理 样本方差的分布 两个样本方差比的分布 T 统计量的分布
抽样分布与参数估计
参数估计在统计方法中的地位
统计方法
描述统计 推断统计
参数估计
假设检验
统计推断的过程
总体
样 本
样本统计量
例如:样本均 值、比例、方 差
抽样与参数估计
1、 2、 3、 4、 5、 抽样与抽样分布 参数估计基本方法 总体均值和总体比例的区间估计 两个总体均值及两个总体比例之差的估计 正态总体方差及两正态总体方差比的区间 估计
.2 .3 P(x)
.1
0 1.0 1.5 2.0 2.5 3.0 3.5 4.0 x
样本均值的抽样分布
所有样本均值的均值和方差
1.0 1.5 4.0 x 2.5 M 16
i 1
n
x
i 1
n
i
2 x
2 ( x ) i x
M (1.0 2.5) 2 (4.0 2.5) 2 2 0.625 16 n
均值和方差

X
i 1
N
总体分布
.3
i
N
N i 1
2.5
2
2 ( X ) i
N
1.25
.2 .1 0
1 2 3 4
样本均值的抽样分布
(一个例子)
现从总体中抽取n=2的简单随机样本,在重复 抽样条件下,共有42=16个样本。所有样本的结果 如下表
所有可能的n = 2 的样本(共16个) 第一个 观察值 第二个观察值 1 2 3 4
2. 点估计没有给出估计值接近总体未知参数程 度的信息
3. 点估计的方法有矩估计法、顺序统计量法、 最大似然法、最小二乘法等
估计量
(概念要点)
1. 用于估计总体某一参数的随机变量


如样本均值,样本比例、样本中位数等 例如: 样本均值就是总体均值的一个估计量 如果样本均值 x = 3 ,则 3 就是 的估计值
总体均值的区间估计
(正态总体:实例)
【例】某种零件 解:已知X~N(,0.152),x=2.14, n=9, 长度服从正态分 1- = 0.95,Z/2=1.96 布,从该批产品 总体均值的置信区间为 中随机抽取9件 x Z , x Z ,测得其平均长 2 2 n n 度为 21.4 mm 。 0.15 0.15 已知总体标准差 21.4 1.96 ,21.4 1.96 =0.15mm,试 9 9 建立该种零件平 21.302,21.498 均长度的置信区 我们可以95%的概率保证该种零件的平 间,给定置信水 均长度在21.302~21.498 mm之间 平为0.95。
1
2 3 4
1,1
2,1 3,1 4,1
1,2
2,2 3,2 4,2
1,3
2,3 3,3 4,3
1,4
2,4 3,4 4,4
样本均值的抽样分布
(一个例子)
计算出各样本的均值,如下表。并给出样本均 值的抽样分布
16个样本的均值(x) 第一个 观察值 1 2 3 4 第二个观察值 1 1.0 1.5 2.0 2.5 2 1.5 2.0 2.5 3.0 3 2.0 2.5 3.0 3.5 4 2.5 3.0 3.5 4.0
总体均值的区间估计
(2已知)
总体均值的置信区间
(2 已知)
1. 假定条件

总体服从正态分布,且总体方差(2)已知 如果不是正态分布,可以由正态分布来近似 (n 30)
2. 使用正态分布统计量Z x Z ~ N (0,1) n 3. 总体均值 在1-置信水平下的置信区间为 , x Z 2 x Z 2 n n
x
X
样本方差的抽样分布
样本方差的分布
设总体服从正态分布N ~ (μ,σ2 ), X1,X2,… ,Xn为来自该正态总体的样本,则样本方差 s2 的分布为
(n 1) s 2 ~ (n 1) 2
2
将2(n – 1)称为自由度为(n-1)的卡方分布
卡方 (2) 分布
选择容量为n 的
= 50
X
x 50
X
总体分布
抽样分布
中心极限定理
(图示)
中心极限定理:设从均值为,方差为 2的一个任意总 体中抽取容量为n的样本,当n充分大时,样本均值的抽 样分布近似服从均值为μ、方差为σ2/n的正态分布
一个任意分 布的总体
x
n
当样本容量足够 大时(n 30) , 样本均值的抽样 分布逐渐趋于正 态分布
2. 理论基础是抽样分布
二战中的点估计
估计量的优良性准则
(无偏性)
无偏性:估计量的数学期望等于被估计的总体 参数
P( X )
无偏 有偏
A
C

X
估计量的优良性准则
(有效性)
有效性:一个方差较小的无偏估计量称为一个更
有效的估计量。如,与其他估计量相比 ,样本均值是一个更有效的估计量
P(X )
均值的抽样分布
T 统计量的分布
设X1,X2,…,Xn1是来自正态总体N~(μ1,σ12 )的一个 样本, 称 n( X ) 为统计量,它服从自由度为(n-1)的t 分布 T S
t 分布
标准正态分布
t (df = 13)
正态分布
t (df = 5)
Z
X
t 分布与正态分布的比较
不同自由度的t分布
t
第二节 参数估计基本方法
两个样本方差比的抽样分布
设X1,X2,… ,Xn1是来自正态总体N~(μ1,σ12 )的 一个样本, Y1 , Y2 , … , Yn2 是来自正态总体 N~(μ2,σ22 ) 的 一 个 样 本 , 且 Xi(i=1,2,… , n1) , Yi(i=1,2, …,n2)相互独立,则
s

2 x 2 1
B
A
中位数的抽样分布

X
估计量的优良性准则
(一致性)
一致性:随着样本容量的增大,估计量越来越接 近被估计的总体参数
P(X )
较大的样本容量
B A
较小的样本容量

X
区间估计
区间估计
(概念要点)
1. 根据一个样本的观察值给出总体参数的估计范围 2. 给出总体参数落在这一区间的概率
3. 例如: 总体均值落在50~70之间,置信度为 95%
相关文档
最新文档