第7章 参数估计PPT课件

合集下载

概率论与数理统计第7章参数估计PPT课件

概率论与数理统计第7章参数估计PPT课件
5
a1(1, ,k )=v1
1 f1(v1, ,vk )
假定方程组a2(1, ,k ) v2 ,则可求出2 f2(v1, ,vk )
ak (1, ,k ) vk
k fk (v1, ,vk )
则x1 xn为X的样本值时,可用样本值的j阶原点矩Aj估计vj,其中
Aj
1 n
n i1
xij ( j
L(x1, ,xn;ˆ)maxL(x1, ,xn;),则称ˆ(x1, ,xn)为
的一种参数估计方法 .
它首先是由德国数学家
高斯在1821年提出的 ,然而, 这个方法常归功于英国统
Gauss
计学家费歇(Fisher) . 费歇在1922年重新发现了
这一方法,并首先研究了这
种方法的一些性质 .
Fisher
10
极大似然估计是在已知总体分布形式的情形下的 点估计。
极大似然估计的基本思路:根据样本的具体情况
注:估计量为样本的函数,样本不同,估计量不 同。
常用估计量构造法:矩估计法、极大似然估计法。
4
7.1.1 矩估计法
矩估计法是通过参数与总体矩的关系,解出参数, 并用样本矩替代总体矩而得到的参数估计方法。 (由大数定理可知样本矩依概率收敛于总体矩, 且许多分布所含参数都是矩的函数)
下面我们考虑总体为连续型随机变量的情况:
n
它是的函数,记为L(x1, , xn; ) f (xi , ), i 1
并称其为似然函数,记为L( )。
注:似然函数的概念并不仅限于连续随机变量 ,
对于离散型随机变量,用 P {Xx}p(x,)
替代f ( x, )
即可。
14
设总体X的分布形式已知,且只含一个未知参数,

参数估计PPT课件

参数估计PPT课件

2021/7/23
3
§1.1 矩估计法
• 设(X1,X2,…,Xn)是来自总体X的一个样本,根据大 数定律,对任意ε>0,有
lim P {X |E(X)|}0
n
并且对于任何k,只要E(Xk)存在,同样有
ln i m P { |1 ni n 1X ik E (X k)|} 0 , k 1 ,2 ,...
最大似然法的基本思想
先看一个简单例子: 某位同学与一位猎人一起外出打 猎。一只野兔从前方窜过。 只听一声枪响,野兔应声倒下 。 如果要你推测,是谁打中的呢?
你会如何想呢?
2021/7/23
13
你就会想,只发一枪便打中,猎人命中的概率一 般大于这位同学命中的概率。看来这一枪是猎人 射中的。
这个例子所作的推断已经体现了最大似然法的基 本思想 :一次试验就出现的事件有较大的概率。
6
例: 设总体 X 服从泊松分布 () ,参数λ未知, (X1, X2,, Xn) 是来自总体的一个样本,求参数λ的矩 估计量.
解 总体X的期望为 E(X)
从而得到方程
1 n
n i1
Xi
所以λ的矩估计量为
ˆ 1 n
n i1
Xi
X
2021/7/23
7
例: 设总体 X 服从参数为λ的指数分布,其中参
2021/7/23
11
§1.2最大似然法 它是在总体类型已知条件下使用的一种参数估 计方法 。
它首先是由德国数学家高斯在 1821年提出的。 然而, 这个方 法常归功于英国统计学家费歇。
Gauss
费歇在1922年重新发现了这一 方法,并首先研究了这种方法 的一些性质。
2021/7/23

概率论 第七章 参数估计

概率论  第七章 参数估计

L( ) max L( )
称^为
的极大似然估计(MLE).
求极大似然估计(MLE)的一般步骤是:
(1) 由总体分布导出样本的联合概率分布 (或联合密度);
(2) 把样本联合概率分布(或联合密度)中自变 量看成已知常数,而把参数 看作自变量, 得到似然函数L( );
(3) 求似然函数L( ) 的最大值点(常常转化 为求ln L( )的最大值点) ,即 的MLE;
1. 将待估参数表示为总体矩的连续函数 2. 用样本矩替代总体矩,从而得到待估参
数的估计量。
四. 最大似然估计(极大似然法)
在总体分布类型已知条件下使用的一种 参数估计方法 .
首先由德国数学家高斯在1821年提出。 英国统计学家费歇1922年重新发现此
方法,并首先研究了此方法的一些性质 .
例:某位同学与一位猎人一起外出打猎.一只 野兔从前方窜过 . 一声枪响,野兔应声倒下 .
p值 P(Y=0) P(Y=1) P( Y=2) P(Y=3) 0.7 0.027 0.189 0.441 0.343 0.3 0.343 0.441 0.189 0.027
应如何估计p?
若:只知0<p<1, 实测记录是 Y=k
(0 ≤ k≤ n), 如何估计p 呢?
注意到
P(Y k) Cnk pk (1 p)nk = f (p)
第七章 参数估计
参数估计是利用从总体抽样得到的信息 估计总体的某些参数或参数的某些函数.
仅估 计一 个或 几个 参数.
估计新生儿的体重
估计废品率
估计降雨量
估计湖中鱼数


参数估计问题的一般提法:
设总体的分布函数为 F(x, ),其中为未 知参数 (可以是向量).从该总体抽样,得样本

概率第7章 参数估计

概率第7章   参数估计
然而,这个方法常归功于 英国统 计学家费歇 . 费歇在1922年重新发现了 这一方 法,并首先研究了这 种方法的一些质 .
Gauss
Fisher
基本思想
甲.乙两人比较射击技术,分别射击目标一次,甲中而乙未中, 可以认为:甲射击技术优于乙射击技术. 事件A发生的概率为0.1或0.9,观察一次,事件A发生了, 可以认为:事件A发生的概率为0.9. 实际问题(医生看病、公安人员破案、技术人员进行质量 检验等)尽管千差万别,但他们具有一个共同的规律,即在 获得了观察资料之后,给参数选取一个数值,使得前面的观 察结果出现的可能性最大. 最大似然估计就是通过样本值 x1 , , x n 等数求得总体的 分布参数,使得 X1 ,, X n 取值为 x1 , , x n 的概率最大.
i
L( ) L( x1 , , x n ; ) f ( x i ; ),
i 1
n
的最大值,这里 ( )称为样本的似然函数 L .
ˆ 若 L( x 1 , , x n ; ) max L( x 1 , , x n ; )

ˆ 则称 ( x1 , , xn )为 的极大似然估计值 .
i
xi
在得到观测值 x1 , x 2 , , x n 的前提下,自然 应当选取使得 n
f ( x ; )dx
i i 1
i
达到最大的 值作为未知参数 的估计值.
因为当未知参数 等于这个值时,出现给 定的那个 样本观测值的可能性最 大.
但 dxi 不随 而变,故只需考虑:
3.期望和方差的点估计 在实际中,常常以样本均值作为总体均值的 点估计,以样本方差作为总体方差的点估计. 期望的点估计: (1)无偏性 1 n 选择估计量 X X i n i 1 (2)样本容量越大,估计值 越有效 方差的点估计:

第7章参数估计

第7章参数估计
对于是非标志(即服从两点分布的变量)来说,若 将其具体表现分别用1、0数量化 ,成数就是其平 均数 是非标志的方差=P(1-P)
x 1 0
f P 1-p
x
xf f
1 p 0 (1 p) p (1 p)
p
2 (x x)2 f (1 p)2 p (0 p)2 (1 p)
f
p (1 p)
似然函数常简记为L或 L 1,2, ,k
未知参数的函数。
38
若有 ˆi (x1, x2,..., xn ) i 1, 2, k 使得
L x1, x2,..., xn;ˆ1, ˆ 2,
, ˆ k
max L (1 ,2 , ,k )
x1, x2,..., xn; 1, 2,
, k
则 ˆi (X1, X2,..., Xn) 为参数θi的极大似然估计量。
中选出一个使样本观察值出现的概率为最大的 ˆ 作
为θ的估计量。
称 ˆ 为θ 的极大似然估计量。
37
2.似然函数的数学表达式
设X1,X2,…Xn是取自总体X的一个样本,样本的联合密度 (连续型)或联合分布律 (离散型)为 :
f (x; 1,2 , , k )
定义似然函数为:
n
L L x1,..., xn; 1, 2, , k f xi; 1, 2, , k i 1 x1, x2 ,..., xn 给定的样本观察值
§7.1.4抽样误差
1.误差:调查结果与实际值之间的差异 抽样调查中的误差
登记性误差(非抽样误差) 误差代表性误差随系机统误误差差((抽非样抽误样差误)差)
2.抽样误差—由于抽样的随机性而产生的 样本指标对总体指标的代表性误差。抽样误 差可以计算并加以控制,但不可以避免。

自考概率论课件_第七章_参数估计.ppt1

自考概率论课件_第七章_参数估计.ppt1

2 2 例3 设总体 X 的均值 及方差 都存在, 且有 0, 2 但 , 均为未知, 又设 X1 , X 2 ,, X n 是来自 X 的样 2 本, 试求 , 的矩估计量. 解 1 E ( X ) , 总体一阶原点矩 2 2 2 2 总体二阶 2 E ( X ) D( X ) [ E ( X )] ,
x ˆ 1 . x 1
为求的极大似然估计,先 易求得似然函数为
L( ) ( xi
i 1 n ( 1)
) xi i 1
n n
( 1)
,
ln L( ) n ln ( 1) xi ,
d ln L( ) n n xi 0. d i 1
以 A1 , A2 代替 1 , 2 , 得到 a , b 的矩估计量分别为
3 2 ˆ A1 3( A2 A ) X (Xi X ) , a n i 1
2 1
n
n 3 2 2 ˆ b A1 3( A2 A1 ) X (Xi X ) . n i 1
§7.1
参数的点估计
一、点估计的一般定义及步骤
设总体X~F(x,θ),θ是未知参数,(X1,X2,…,Xn)是 取自总体X的样本,适当选取一个统计量
ˆ 去估计参数θ, 称 ˆ为θ的估计量或把 ˆ 用 叫做 θ的点估计.
ˆ =ˆ(X1,X2,…,Xn)
二、获取点估计的两种方法
1.矩估计法 2.极大似然估计法
以 A1 , A2 代替 1 , 2 , 得到 a , b 的矩估计量分别为
3 2 ˆ A1 3( A2 A ) X (Xi X ) , a n i 1

07心理统计学-第七章 参数估计

07心理统计学-第七章 参数估计

犯错误的概率,常用α(或p)表示。则1-α为置信 度。(显著性水平越高表示的是α值越小,即犯错误的可
能性越低) α为预先设定的临界点,常用的如.05、.01、.001;p 为检验计算所得的实际(犯错误)概率。
第一节 点估计、区间估计与标准误
三、区间估计与标准误
3、区间估计的原理与标准误
转换成比率为
p

n
p, SE p

n

pq n
同理可得公式7-17。自习[例7-12、例7-13]
1、从某地区抽样调查400人,得到每月人均文化消费为 160元。已知该地区文化消费的总体标准差为40元。试 问该地区的每月人均文化消费额。(α=.05,总体呈正态
分布)
2、上题中总体方差未知,已知Sn-1=44元。 3、已知某中学一次数学考试成绩的分布为正态分布,总 体标准差为5。从总体中随机抽取16名学生,计算得平 均数为81、标准差为Sn=6。试问该次考试中全体考生成 绩平均数的95%置信区间。 4、上题中总体方差未知,样本容量改为17人。 5、假定智商服从正态分布。随机抽取10名我班学生测 得智商分别为98、102、105、105、109、111、117、 123、124、126(可计算得M=112,Sn≈9.4),试以95% 的置信区间估计我班全体的智商平均数。 返回
值表,求tα /2(df)。
5、计算置信区间CI。
σ2已知,区间为M-Zα /2 SE <μ< M+Zα /2 SE;
σ2未知,区间为M-tα /2(df)SE <μ< M+tα /2(df)SE。
6、对置信区间进行解释。
二、σ2已知,对μ的区间估计(Z分布,例7-1 & 2) 三、σ2未知,对μ的区间估计(t分布,例7-3 & 4)

统计学原理:第7章 参数估计

统计学原理:第7章 参数估计
7 - 25
一个总体参数的区间估计
总体参数 均值 比例 方差
7 - 26
符号表示 样本统计量
x
p
2
s2
7.2.1 总体均值的区间估计
1、正态总体、2已知,
非正态总体、大样本
2、正态总体、2未知,小样本
7 - 27
总体均值的区间估计
(1、Z分布)
1. 假定条件
总体服从正态分布,且方差(2) 已知
量进行监测,企业质检部门经常要进行抽检,以分析每袋重 量是否符合要求。现从某天生产的一批食品中随机抽取了25 袋,测得每袋重量如下表所示。已知产品重量的分布服从正 态分布,且总体标准差为10g。试估计该批产品平均重量的 置信区间,置信水平为95%
这表明一个具体的点估计值无法给出估计的可 靠性的度量,一个点估计量的可靠性是由它的 抽样标准误差来衡量的。
7 -9
抽样分布回顾
Xi ~
, 2
..X
~
,
2
n
p Z Z Z 1
2
2
p Z 2
X
X
Z 2
1
p
Z 7 - 10
2
X
X
Z
2
X
1
抽样分布回顾
p
Z
2
X
X
7 - 12
实际情况是,样本均值已知,而总体均值未知 。
x
样本均值与总体均值的距离是对称的,
若某个样本均值落在总体均值的两个标准差范围以内, 则总体均值就会被包括在以样本均值为中心左右两个标 准差的范围之内。
7 - 13
区间估计
(interval estimate)
1. 总体参数估计的一个区间: 样本统计量 加减 估计误差

统计学 第七章 参数估计

统计学 第七章 参数估计

[
]
2 χα (n) (n)的α 分位数,记为k≜ n k≜
抽样分布
(3)性质 • 若X服从χ2 (n),则均值E(X)=n ,方差 D(X) =2n 。 • χ2分布具有可加性。若 X1,X2相互独立,
X1~ χ2(n1) ,X2~χ2(n2)
则(X1+X2)~χ2(n1+n2) • 当n→∞时,χ2分布渐进于正态分布
σ
2
~ χ (n −1)
2
第三节两个总体参数的区 间估计(112页)
• • • • • • • 一、两个总体均值之差的区间估计 (一)两个总体均值之差的估计:独立样本 大样本:近似于正态分布 小样本: (1)两个总体的方差均已知,近似于正态分布 (2)两个总体的方差均未知但相等,近似于t分布 (3)两个服从正态分布的总体的方差均未知且不等, 但样本容量相等,近似于t分布 • (4)两个总体的方差均未知且不等,样本容量也不 等,近似于t分布,自由度为V
• 解:求(3)的计算步骤: • ①求样本指标:
x =1000小时
σ=50 (小时)
µ x=
σ
n

50 100
=(小时) 5
• ②根据给定的F(t)=95%,查概率表得t=1.96。 • ③根据∆x=t×µx=1.96×5=9.8,计算总体平均耐 用时间的上、下限: x − ∆ x=1000-9.8=990.(小时) 2 • 下限 x +∆ x=1000+9.8=1009 .(小时) 8 • 上限 • 所以,以95%的概率保证程度估计该批产品的平均耐 用时间在990.2~1009.8小时之间。
f (x;θ ) 其中 θ
或概率密度为
是未知参数。 是未知参数。
如何求极大似然估 计量呢? 计量呢?

统计学第7章参数估计1

统计学第7章参数估计1
中,有95%的区间不包含该总体参数
2. 根据一个具体的样本求出的总体均值的95% 的置信区间( )
A 以95%的概率包含总体均值 B 有5%的可能性包含总体均值 C 一定包含总体均值 D 要么包含总体均值,要么不包含总体均值
常用置信水平的临界值(Zα/2值)
置信水平
90% 95% 99%
α
0.10 0.05 0.01
样本均值经标准化处理后服从自由度为
(n-1)的t分布

t x ~ t(n 1)
s/ n
总体均值μ在1-α的置信水平下的置信区间为

x t
2
s n
【例】某时装店的管理人员想估计其顾客的平均
年龄,随机抽取了16位顾客进行了调查,得到 样本均值为32岁,样本标准差为8岁,假定顾客 的年龄近似服从正态分布,求该店全部顾客平均
α/2
0.05 0.025 0.005
Zα/2
1.645 1.96 2.58

X
- 2.58x
-1.65 x
+1.65x + 2.58x
-1.96 x
+1.96x
90%的样本
95% 的样本
99% 的样本
评价估计量的标准
1. 无偏性

E(θ) =θ
2. 有效性
对同一总体参数的两个无偏估计量,标准差 越小的估计量估计效果越好,称估计量越有效。
际误差不超过20元,应抽取多少个顾客作 为样本?
解:已知=120(元),Z/2=1.96,E=20(元)
应抽取的样本容量为
n

Z2 2 2
E2
(1.96) 2120 2

数理统计 第七章-参数估计

数理统计 第七章-参数估计

休息
结束
2. 最大似然法
是在总体类型已知条件下使用的一 种参数估计方法 。 它首先是由德国数学家高斯在1821 年提出的 ,费歇在1922年重新发现了这 一方法,并首先研究了这 种方法的一些 性质 。
休息 结束
最大似然法的基本思想:
已发生的事件具有最大概率。
休息
结束
先看一个简单例子: 在军训时,某位同学与一位教官同 时射击,而在靶纸上只留下一个弹孔。 如果要你推测,是谁打中的呢? 你会如何想呢?

max f ( xi , )

i 1
n
休息
结束
X 假设X 为连续型总体: f ( x; )
( X 1 , , X n ) 为子样
( x1 , , xn ) 为子样观察值。
已发生的事件为:
x x ,X {{X 11 1x, X 1 nx1 ,n } , xn x X n xn } x

休息
结束
ˆ
1 n ( X i X )2 n i 1
1 n ˆ X ( X i X )2 n i 1
休息
结束
矩法的优点是简单易行,并不需要 事先知道总体是什么分布 。 缺点是,当总体类型已知时,没有 充分利用分布提供的信息 . 一般场合下, 矩估计量不具有唯一性 。
( 1 )x , 0 x 1 f( x) 0, 其它
1
其中 1 是未知参数,
X1,X2,…,Xn是取自X的样本,求参数 的矩估计. 解:
1 E( X ) x( 1 )x dx

0
( 1 )
从 中解得
1
0
x
1

概率论与数理统计课件第7章参数估计

概率论与数理统计课件第7章参数估计

一、矩估计
4
A B
一、矩估计 例1
5
01
OPTION
02
OPTION
一、矩估计 解
6
一、矩估计
7
一、矩估计
8
解(1)
一、矩估计
9
解(2)
一、矩估计 例3
10
一、矩估计 解
11
一、矩估计
12
关于矩估计量有下列结论:
一、矩估计
13
例4

一、矩估计
14
01
OPTION
02
OPTION
一、无偏性 定义1
51
ˆ lim E θ 如果 n+ X1 ,
, X n θ
一、无偏性
52
例1
试求 1 3 2

(1)由矩估计定义可知
一、无偏性
53

一、无偏性
54
一、无偏性 例2
55
一、无偏性
56

一、无偏性 定理 1
57
则有
因此, 样本均值是总体均值的无偏估计, 样本
二、极大似然估计
48
极大似然估计求解
似然函数 对数似然求导法
直接法
49
目录/Contents
7.1 7.2
点估计 点估计的优良性评判标 准 置信区间 单正态总体下未知参数的置信区间 两个正态总体下未知参数的置信区间
7.3
7.4 7.5
50
目录/Contents
7.2
点估计的优良性评判标准 一、无偏性 二、有效性 三、相合性
置信区间
69
置信区间
70
置信区间

第七章 参数估计

第七章 参数估计



x


1
2
|x|
e
dx

0
不含θ ,故不能由“样本一阶矩=总体一阶矩”解得所

矩估计,需要2继E续(X 求2二) 阶2矩1: x2e|x|dx
河南理工大学精品课程
概率论与数理统计
1 x2exd 0
x 20x2exdx
其中未知参数θ >0,求θ 的矩估计量.
〖解〗单参数,连续型.
因为总体一阶矩

1
1E(X) xf (x)dx x dx

0

x 1
| 1 1 0

1

河南理工大学精品课程
1 A1
概率论与数理统计
即 解得:
X 1
X( 1)
(1X)X
X
1 X 故所求矩估计量为:
ˆ


1
X X
2

河南理工大学精品课程
概率论与数理统计
【例5】已知总体X的概率密度为:
f(x)21 e|x|( x )
其中未知参数θ >0,求θ 的矩估计量.
〖解〗单参数,连续型.
因为总体一阶矩
1E(X)
河南理工大学精品课程
概率论与数理统计
ddL(x1,x2, ,xn;)0
或与之等价的
ddlnL(x1,x2, ,xn;)0
来得到待估参数θ 的极大似然估计值(驻点);
③ 、必要时,参照极大似然估计值写出极大似然 估计量.
河南理工大学精品课程
概率论与数理统计
【例6】求服从二项分布B(m,p)的总体X未知参数 p的极大似然估计量。

第七章-参数估计

第七章-参数估计

• 根据n2=36的样本估计总体参数μ: • 0.95的置信区间
78 1.961.18 79 1.961.18
76.7 81.3
• 0.99的置信区间
79 2.581.18 79 2.581.18
75.7 82.04
• 【例7-2】
• 有一个49名学生的班级,某学科历年考试成绩的
• 3.一致性 • 当样本容量无限增大时,估计值应能够越来越接
近它所估计的总体参数,估计值越来越精确,逐 渐趋近于真值。 n大, X • 4.充分性 • 一个容量为n的样本统计量,是否充分地反映了 全部n个数据所反映总体的信息。
三、区间估计
(一)区间估计的定义 1. 根据估计量以一定可靠程度推断总体参数所在的区
少?
• 解:平均数的标准误
sn1 1 s1 8 2.67
X1
n1
n1 1 10 1
sn2 1 s2 9 1.52
X2
n2
n2 1 36 1
• 0.95的置信区间 • 当n1=10时,df1=n-1=9,t0.05/2=2.262
78 2.262 2.67 78 2.262 2.67 71.96 84.04
•置著性水平
• 显著性水平:估计总体参数落在某一区间时,可能 犯错误的概率,用符号表示。
• 置信度:被估计参数落在置信区间内的概率, • 1-表示 • 例:0.95置信区间(1-)指总体参数落在该区间内
,估计正确的概率为95%,而估计错误的概率为 5%(=0.05)
7.07 2.24
X1
n1
10
7.07 1.18
X2
n2
36
• 用n1=10的样本估计总体参数μ: • 0.95的置信区间

第7章参数估计

第7章参数估计

所以重量的标准差的95%的置信区间
√︁
√︁
为[
12*0.230256 23.337
,
12*0.230256 4.403
]
=
[0.3441,
0.7922]。
即,我们约有95%的把握估计该品牌袋装大米重量的标准
差������在0.3441千克到0.7922千克之间。
参数估计的基本原理 点估计 区间估计
=0.31 ± 1.645
2
������
100
=0.31 ± 0.07608
=(23.39%, 38.61%)
即,我们约有90%的把握估计全校学生戴眼镜比 例������在23.39%到38.61%之间。
R的计算结果: 90 percent confidence interval: 0.2340092, 0.3946717
假定A品牌袋装大米的重量服从正态分布,现随机抽取13袋大 米,测得其重量(单位:千克)分别为
⎛ 24, 24.2, 24.4, 24.6, 24.7, ⎞ ⎝ 24.8, 25, 25.1, 25.1, 25.2, ⎠
25.3, 25.4, 25.6.
分别计算该品牌袋装大米的重量的均值,及重量的标准差 的95%的置信区间。
参数估计的基本原理 点估计 区间估计
一个总体参数的区间估计 总体均值的区间估计 总体比例的区间估计 总体方差的区间估计
两个总体参数的区间估计 两个总体均值之差的区间估计 两个总体比例之差的区间估计 两个总体方差之比的区间估计
样本量������的确定 估计总体均值是样本量的确定 估计总体比例时是样本量的确定
2������
∑︁ ������������
������=1

第7章参数估计

第7章参数估计

评价估计量的标准
1. 无偏性

E(θ) =θ
2. 有效性
对同一总体参数的两个无偏估计量,标准差 越小的估计量估计效果越好,称估计量越有效。
3. 一致性
随着样本量的增大,点估计量的值越来越接 近被估总体的参数。
7.2 一个总体参数的区间估计
7.2.1 总体均值的区间估计
总体均值的置信区间=样本均值±边际误差
第7章 参数估计
统计方法
描述统计
推断统计
参数估计
假设检验
7.1 参数估计
1. 用样本统计量去估计总体参数。
2. 估计量——用来估计总体参数的统计量 估计值——一个具体样本计算出的统计 量的数值
参数估计的方法
点估计
区间估计
二战中的点估计— 德军有多少辆坦克?
二战期间,盟军非常想知道德军总共制造了 多少辆坦。德国人在制造坦克时是墨守成规的, 他们把坦克从1开始进行了连续编号。在战争过 程中,盟军缴获了一些敌军坦克,并记录了它们 的生产编号。那么怎样利用这些号码来估计坦克 总数呢?在这个问题中,总体参数是未知的坦克 总数N,而缴获坦克的编号则是样本。
常用置信水平的临界值(Zα/2值)
置信水平
90% 95% 99%
α
0.10 0.05 0.01
α/2
0.05 0.025 0.005
Zα/2
1.645 1.96 2.58
X
- 2.58x
-1.65 x
+1.65x + 2.58x
-1.96 x
+1.96x
90%的样本
95% 的样本
99% 的样本
用样本方差s2代替总体方差σ2
样本均值经标准化处理后服从自由度为

第七章__参数估计

第七章__参数估计

三、区间估计与标准误
㈠区间估计的定义 是根据样本统计量,利用抽样分布的原理,在一定的
可靠程度上,估计出总体参数所在的范围,即以数 轴上的一段距离表示未知参数可能落入的范围。 ㈡置信区间与显著性水平 ⑴置信区间:也称置信间距,指在一定可靠程度上,总体参
数所在的区域距离或区域长度。
⑵置信界限(临界值):置信区间的上下两端点值。 ⑶显著性水平:指估计总体参数落在某一区间时,可能犯错
⑶区间估计的原理是样本分布理论。在计算区间估计值解释估 计的正确概率时,依据的是该样本统计量的分布规律及样本 分布的标准误。样本分布可提供概率解释,而标准误的大小 决定区间估计的长度。一般情况下,加大样本容量可使标准 误变小。
当总体方差已知时,样本平均数的分布为正态分布或
渐近正态分布,此时,样本平均数的平均数uX u, 平均数的离散程度即平均数分布的标准差(简称
例4
解:由题意知,其总体方差未知,但其总体分布为正态分布,
则此样本均数的分布服从t分布, 可以依t分布对总平 均身高μ进行估计。
SEX
S 4.8 0.81; df n 1 36 1 35 n 1 35
查t值表可知 : t0.05 230 2.042;t0.01 230 2.75
例2 已知某区15 岁男生立定跳远的方差 为 436.8cm ,现从该区抽取58名15岁男生, 测得该组男生立定跳远的平均数为198.4cm, 试求该区15岁男生立定跳远平均成绩的95%和 99%的置信区间。
例2
解:由题意知:由于样本容量(n=58)大于30 ,
该样本的抽样分布为渐进正态分布。
SEX
因此, 的95%的置信区间为 :
82 2.0211.12 82 2.0211.12

概率论与数理统计第七章参数估计

概率论与数理统计第七章参数估计
则以hi (X1, X2,…, Xn)作为θi 的估计量 ,并 称hi(X1, X2,…, Xn)为θi 的矩法估计量,而 称hi(x1, x2,…, xn) 为θi 的矩法估计值。
例1. 设总体X的数学期望和方差分别是μ,
σ2 ,求μ , σ2的矩估计量。
E(X )
E( X 2 ) D( X ) [EX ]2 2 2
(3) 写出方程 ln L 0
i1
若方程有解,
求出L(θ)的最大值点 ˆ(x1,x2,..x.n,)
于 是 ˆ ˆ ( X 1 , X 2 , . . . , X n ) 即 为 的 极 大 似 然 估 计 量
例2. 设总体X服从参数λ>0的泊松分布,求 参数λ的极大似然估计量。
例3. 已知某产品的不合格率为p,有简单随机样本 X1 ,X2 ,…, Xn,求p的极大似然估计量。 若抽取100件产品,发现10件次品,试估计p.
ˆ(x1,x2,..x.n,),使得
L (ˆ) m a x L (), (或 L (ˆ) s u p L ())
则 称 ˆ ( x 1 ,x 2 , . . . ,x n ) 为 的 极 大 似 然 估 计 值
称 ˆ ( X 1 ,X 2 ,...,X n ) 为 极 大 似 然 估 计 量
第7章 参数估计
总体所服从的分布类型已知/未知
抽样
参数 估计
估计总体中未知的参数
参数估计 参数估计问题是利用从总体抽样得到的信息
来估计总体的某些参数. 估计新生儿的体重
估计废品率
估计湖中鱼数
§7.1
点估计
设有一个统计总体,总体的分布函数
为 F(x, ),其中为未知参数 (可以是向量) .

概率论第7章

概率论第7章
注: 估计量 θˆ 是一个随机变量,是样本的函数,即 是一个统计量,对不同的样本值, 的估计值 一般是 不同的.
X1, ... ,Xn是来自总体X的独立同分布样本,分布
律或概率密度函数是f(x,q),其中q∈Q是参数,Q已知, 是q的取值范围.f (x,q)的形式已知,则有统计模型
f ( x1,θ) f ( xn ,θ) θ Q
例1 某种型号的产品N个,其合格率q未知,从中随机
抽取n个(n<<N),设Xi 是第i次抽到的样品,正品Xi=1, 否则 Xi =0,则 X1,X2,…,Xn 就是样本.总体分布为两点
分布B(0,1),参数空间为q=(0,1),则可得统计模型
n
n
xi
n xi
θ i1 (1 θ) i1
用矩估计法估计λ的值。
解 设X为灯管寿命,则
1 n
x n i1 xi 130.55
μ1

E

X

=
1 λ
μ1 m1

μ1

E

X
=
1 λ

X
λˆ 1 0.0077 X
例2 设总体X的均值μ和方差σ2 >0都存在,μ,σ2未知.
X1,…,Xn是来自 X 的样本,试求μ, σ2的矩估计量 .
矩估计量的观察值称为矩估计值 .
总体k阶中心矩 样本k阶中心矩
Vk
Bk

E[ X 1n
n i1
E( X )]k; ( Xi X )k .
例1. 设有一批灯管,其寿命服从参数为λ的指数分 布,今随机从中抽取11只,测得其寿命数据如下:
110, 184, 145, 122, 165, 143, 78, 129, 62, 130, 168
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
2. 无法给出估计值接近总体参数程度的信息
虽然在重复抽样条件下,点估计的均值可望等于 总体真值,但由于样本是随机的,抽出一个具体 的样本得到的估计值很可能不同于总体真值
一个点估计量的可靠性是由它的抽样标准误差来 衡量的,这表明一个具体的点估计值无法给出估 计的可靠性的度量
二战中的 点估计
二战中的点估计— 德军有多少辆坦克?
二战期间,盟军非常想知道德军总共制造了多少辆坦克。德国 人在制造坦克时是墨守成规的,他们把坦克从1开始进行了连 续编号。在战争过程中,盟军缴获了一些敌军坦克,并记录了 它们的生产编号。那么怎样利用这些号码来估计坦克总数呢?
在这个问题中,总体参数是未知的坦克总数N,而缴获坦克的编 号则是样本。制造出来的坦克总数肯定大于等于记录的最大编 号。为了找到它比最大编号大多少,我们先找到被缴获坦克编 号的平均值,并认为这个值是全部编号的中点。因此样本均值 乘以2就是总数的一个估计;当然要特别假设缴获的坦克代表 了所有坦克的一个随机样本。这种估计N的公式的缺点是:不 能保证均值的2倍一定大于记录中的最大编号。
二、一个总体参数的区间估计
总体参数 均值 比例 方差
符号表示
2
样本统计 量
x
p
s2
(一)总体均值的区间估计
总体均值区间的一般表达式:
• 总体均值的置信区间是由样本均值加减估计误差 得到的
• 估计误差由两部分组成:一是点估计量的标准误 差,它取决于样本统计量的抽样分布。二是估计 时所要的求置信水平为时,统计量分布两侧面积 为的分位数值,它取决于事先所要求的可靠程度
第七章参数估计
大学生每周上网花多少时间?
回答类别
人数(人)
频率(%)
3小时以下
32
16
3~6小时
35
17.5
6~9小时
33
16.5
9~12小时
29
14.5
12小时以上
71
35.5
合计
200
100
平均上网时间为8.58小时,标准差为0.69小时。全校学生 每周的平均上网时间是多少?每周上网时间在12小时以上 的学生比例是多少?你做出估计的理论依据是什么?
N的另一个点估计公式是:用观测到的最大编号乘以因 子1+1/n,其中 n 是被俘虏坦克个数。假如你俘虏了10 辆坦克,其中最大编号是50,那么坦克总数的一个估 计是(1+1/10)50=55。此处我们认为坦克的实际数略 大于最大编号。
从战后发现的德军记录来看,盟军的估计值非常接近 所生产的坦克的真实值。记录仍然表明统计估计比通 常通过其他情报方式作出估计要大大接近于真实数目 。统计学家们做得比间谍们更漂亮!
• 总体均值在置信水平下的置信区间可一般性地表 达为
样本均值±分位数值×样本均值的标准误差
相关理论


总体正态?
σ2已知?


n≥30?


x Z 2 n
s x t 2
n
x Z 2
n
增大n?数学 变换?
实际中总体方差总是未知的, 因而这是应用最多的公式。在 大样本时t值可以用z值来近似。
根据中心极限定理得 到的近似结果。 σ未知时用s来估计。
资 料 来 源 : GUDMUND R.IVERSEN 和 MARY GERGRN著,吴喜之等译:《统计学—基本概念和 方法》,高等教育出版社,施普林格出版社,2000。
点估计量的常用评价准则:无偏性
无偏性:估计量的数学期望与总体待估参 数的真值相等: E(ˆ)
P(ˆ )
无偏
有偏
A
B
ˆ
点估计量的常用评价准则: 有效性
置信度1 - 的含义是:在同样的方法得到 的所有置信区间中,有100(1- )% 的区间 包含总体参数。
抽样分布是区间估计的理论基础。
置信区间
置信下限
估计值(点估计)
置信上限
点估计值
置信区间的表述
(95%的置信区间)
☺ 我没有抓住参数!
从均值为185的总体中抽出n=10的20个样本构造出的20个置信区间
Example:用SPSS进行总体均值区间估计
例:儿童电视节目的赞助商希望了解儿童每周看电 视的时间。下面是对100名儿童进行随机调查的结 果(小时)。计算平均看电视时间95%的置信区间。
39.7 19.5 34.7 27.0 41.3 15.1 20.5 31.3 18.3 17.0 21.5 29.9 15.0 16.4 36.8 23.4 24.1 28.9 23.4 24.4 40.6 46.4 23.6 39.4 35.5 19.5 29.3 31.2 20.6 34.9 15.5 31.6 38.9 38.7 27.2 26.5 14.7 15.6 28.4 24.0 43.9 20.6 29.1 9.5 21.0 42.4 13.9 32.8 29.8 32.9 33.0 38.0 28.7 20.6 19.7 38.6 37.1 17.0 15.1 23.4 21.0 21.8 29.3 21.3 22.8 23.4 32.5 11.3 43.8 30.8 15.8 23.2 20.3 33.5 30.0 37.8 24.4 26.9 29.0 27.7 27.1 22.0 36.1 23.0 22.1 26.5 22.9 26.9 30.2 25.2 23.8 35.3 21.6 35.7 30.8 22.7 24.5 21.9 26.5 50.3
2.估计量:用于估计总体参数的随机变量
如样本均值,样本比例、样本方差等
▪ 例如: 样本均值就是总体均值 的一个估计量
3.估计值:估计参数时计算出来的统计量的具体值
如果样本均值 x =80,则80就是 的估计值
4.参数用 表示,估计量用ˆ 表示
总体

☺ ☺
☺☺ ☺☺☺
样本
☺☺ ☺
参数
统计量
平均数
x
标准差
s
估计量
比例
p
用 ˆ表示
参数估计的方法
估计方法
点估计
矩估计法 顺序统计量法 最大似然法 最小二乘法
区间估计
点估计 (point estimate)
1. 用样本的估计量的某个取值直接作为总体参数 的估计值
▪ 例如:用样本均值直接作为总体均值的估计;用 两个样本均值之差直接作为总体均值之差的估计
学习目标
1、掌握参数估计的基本方法和原理。 2、理解并掌握置信区间和置信水平的
含义。 3、理解并掌握评价估计量的标准。 4、掌握一个总体参数的区间估计方法,
了解两个总体参数区间估计的基本 方法。 5、掌握估计一个总体均值和总体比例 时样本量的确定方法。
一、 参数估计的一般问题
1.参数估计:总体分布类型已知,仅需对分布 Байду номын сангаас未知参数进行的估计
在两个无偏估计量中方差较小的估 计量较为有效。
P(ˆ )
ˆ1 的抽样分布
B
A
ˆ 2 的抽样分布
ˆ
估计量的常用评价准则:一致性
指随着样本容量的增大,估计量越来越接 近被估计的总体参数。
较大的样本容量
P(X )
B
较小的样本容量
A
X
区间估计
根据事先确定的置信度1 - 给出总体参数 的一个估计范围。
相关文档
最新文档