概率论与数理统计第6章 参数估计
概率论与数理统计(06)第6章 统计量及其抽样分布

σx =
σ
n
当样本容量足够 大时( 大时(n ≥ 30) , 样本均值的抽样 分布逐渐趋于正 态分布
6 - 11
µx = µ
xቤተ መጻሕፍቲ ባይዱ
x 的分布趋 于正态分布 的过程
6 - 12
6.4 正态总体 6.3.1 χ2分布 6.3.2 t 分布 6.3.3 F 分布
6 - 13
χ2 分布
第六章 样本与统计量
6.1引言 6.1引言
数理统计学: 运用概率论的基础知识,对要研究的随机现象进行 多次观察或试验,研究如何合理地获得数据资料, 建立有效的数学方法,根据所获得的数据资料,对 所关心的问题作出估计与检验。
6-1
§6.2总体与样本 6.2总体与样本
对某一问题的研究对象全体称为总体。 组成总体的某个基本单元,称为个体。 总体可以是具体事物的集合,如一批产品。 也可以是关于事物的度量数据集合,如长度测量。 总体可以包含有限个个体,也可以包含无限个个体。 有限总体在个体相当多的情况下,可以作为无限 总体进行研究。 总体中的个体,应当有共同的可观察的特征。该 特征与研究目的有关。
6 - 16
χ2分布
(图示) 图示)
n=1 n=4 n=10
n=20
6 - 17 不同容量样本的抽样分布
χ2
t 分布
6 - 18
t 分布
1. 高 塞 特 (W.S.Gosset) 于 1908 年 在 一 篇 以 (W. “Student”(学生)为笔名的论文中首次提出 Student”(学生)
X ~ N(µ,σ ) ,则
2
χ2分布
2. 3.
z=
X −µ
Y=z
概率论与数理统计第2版教学课件第6章

极值的分布
定理2 设总体X的分布函数为F(x),X1,X2,…,Xn为其样本,则
(1) X(n)的密度函数f(n)(u)=nf(u)[F(u)]n-1;
(6-11)
(2) X(1)的密度函数f(1)(v)=nf(v)[1-F(v)]n-1;
(6-12)
其中f(x)为总体X的密度函数。
证明略。
6.2
同的分布。
(2) 要有独立性。每次抽取是独立的,即每个观测结果既不影响其他观测结果,也不受其他观测
结果的影响。
满足上述两条要求的抽取个体的办法称为简单随机抽样法。换句话说,简单随机抽样法就是独立
地、重复地做随机试验。今后,凡是提到随机抽样,都是指简单随机抽样。
6.1
随机样本与统计量
6.1.1
总体、个体与样本
6.1.2
样本统计量
(4) 样本k阶原点矩
(5) 样本k阶中心矩
—
n−1 2
应当注意的是:M1= X ,υ2=
S。
n
6.1
随机样本与统计量
6.1.2
样本统计量
定义3 (顺序统计量) 设x1,x2,…,xn为样本X1,X2,…,Xn的一个观察值,将x1,x2,…,xn由小到大重新
排列为
x(1)≤x(2)≤…≤x(k)≤…≤x(n),
由定义知,对于x的每个数值而言,经验分布函数Fn∗(x)为样本X1,X2,…,Xn的函数,它是一个统计
12
k
nn
n
量,即为一个随机变量,其可能取值为0, , ,…,1。事件“Fn∗(x)= ”发生的概率为
P Fn∗ (x) =
其中F(x)=P{X<x}是总体X的分布函数。
k
概率论与数理统计-参数估计_图文

或
于是得到
的置信水平为 的置信区间为
为已知
其中
于是得到
的置信水平为 的置信区间为
其中
例3 为比较 I ,ቤተ መጻሕፍቲ ባይዱⅡ 两种型号步枪子弹的枪口
速度 ,随机地取 I 型子弹 10 发 ,得到枪口速度的平
均值 为
标准差
随
机地取 Ⅱ 型子弹 20 发 ,得到枪口速度的平均值为
标准差
假设两总
体都可认为近似地服从正态分布.且生产过程可认
2. 估计的精度要尽可能的高. 如要求区间长度
尽可能短,或能体现该要求的其它准则.
可靠度与精度是一对矛盾,一般是在保证 可靠度的条件下尽可能提高精度.
二、置信区间的求法
在求置信区间时,要查表求分位点.
定义 设
, 对随机变量X,称满足
的点 为X的概率分布的上 分位点.
若 X 为连续型随机变量 , 则有 所求置信区间为
X~N( )
样本均值是否是 的一个好的估计量?
样本方差是否是 的一个好的估计量?
这就需要讨论以下几个问题: (1) 我们希望一个“好的”估计量具有什么特性? (2) 怎样决定一个估计量是否比另一个估计量“好”?
(3) 如何求得合理的估计量?
常用的几条标准是:
1.无偏性 2.有效性 3.相合性
这里我们重点介绍前面两个标准 .
概率论与数理统计-参数估计_图文.ppt
参数估计
现在我们来介绍一类重要的统计推断问题 参数估计问题是利用从总体抽样得到的信息来估 计总体的某些参数或者参数的某些函数.
估计新生儿的体重
估计废品率
在参数估计问题
估计降雨量 中,假定总体分 布形式已知,未
… 知的仅仅是一个 … 或几个参数.
概率论与数理统计实训06讲解

函 数 说 明
二项分布的最大似然估计 返回 水平的参数估计和置信区间 泊松分布的最大似然估计 返回 水平的 参数和置信区间 正态分布的最大似然估计 返回 水平的期望、方差和置信区间 均匀分布的最大似然估计 返回 水平的参数估计和置信区间 指数分布的最大似然估计 返回 水平的参数估计和置信区间
expfit
例 1 产生 100 行2 列服从区间(10, 12)上的均匀分布的随机数, 计算区间端 点“a”和“b”的极大似然估计值, 求出置信度为0.95 的这两个参数的置信 区间.
解 在命令窗口中输入: r = unifrnd(10, 12, 100, 2); [ahat, bhat, aci, bci] = unifit(r)
调 用 形 式
binofit (X, N) [PHAT, PCI] = binofit (X, N, ALPHA) poissfit (X) [LAMBDAHAT, LAMBDACI]= poissfit (X,) normfit (X, ALPHA) [MUHAT, SIGMAHAT, MUCI, SIGMACI] = normfit (X, ALPHA) unifit (X, ALPHA) [AHAT, BHAT, ACI, BCI] = unifit (X, ALPHA) expfit (X) [MUHAT, MUCI] = expfit (X, ALPHA)
基本数学原理:
样本数字特征法 1 用样本均值 x n x 作为总体均值EX的估计值; 用样本方差 S n 1 1 ( x x ) 作为总体方差DX的估计值。 在Matlab中,样本x = [x1, x2,…, xn],则 样本均值:mx = 1/n*sum (x) 样本方差:S2 = 1/(n-1)*sum ((x-mx).^2)
概率论与数理统计(茆诗松)第二版课后第六章习题参考答案

⎝ 2 2⎠
2
则X
=Y
+θ
−
1 2
,
X (1)
= Y(1)
+θ
−
1 2
, X(n)
= Y(n)
+θ
−
1 2
,即
1 2
(
X
(1)
+
X(n)) =
1 2 (Y(1)
+ Y(n) ) + θ
−1 2
,
可得 E( X ) = E(Y ) + θ − 1 = E(Y ) +θ − 1 = θ , Var(X ) = Var(Y ) = 1 Var(Y ) = 1 ,
y( n) 0
⎤ ⎥⎦
=
1 0
y(nn+)1dy(n)
=
n
1 +
2
y n+2 (n)
1 0
=
1 n+
2
,
即 Var(Y(1) )
=
(n
2 + 1)(n
+
2)
−
⎜⎛ ⎝
1 ⎟⎞2 n +1⎠
=
(n
n + 1)2 (n
+
2)
, Var(Y(n) )
=
n
n +
2
− ⎜⎛ ⎝
n ⎟⎞2 n +1⎠
=
(n
n + 1)2 (n
=
1 12n
>
Var⎢⎣⎡
1 2
( X (1)
+
X (n) )⎥⎦⎤
=
2(n
1 + 1)(n
东华大学《概率论与数理统计》课件 第6章样本与抽样分布

X
的
n
一
个
样
本的
观察
值
,
则g( x1 , x2 , xn )是统计量g( X1 , X 2 , X n )的观察值.
例1 设总体X 服从两点分布b(1, p) ,其中p 是未知参数,
X1,
,
X
是
5
来自X的简
单
随机样本.试指出
X1
X
,
2
max
1 i 5
X
i
,
X5 2 p,
( X5 X1)2
哪些是统计量,哪些不是统计量,为什么?
从国产轿车中抽5辆进行耗 油量试验
样本容量为5 抽到哪5辆是随机的
对总体X在相同条件下,进行n次重复、独立观察,其结果依次记 为 X1,X2,…,Xn.这样得到的随机变量X1,X2,…,Xn.是来自总体的一个简单 随机样本,其特点是:
1. 代表性:X1,X2,…,Xn中每一个与所考察的总体X有相同的分布. 2. 独立性:X1,X2,…,Xn相互独立.
k同分布,
E(
X
k i
)
k
k 1, 2, , n 再由辛钦大数定律可得上述结论.
再由依概率收敛性质知,可将上述性质推广为
g( A1 , A2 , , Ak ) P g(1, 2 , , k )
其中g为连续函数.
矩估计法的理论依据
2. 经验分布函数
设X1, X2,
,
X
是
n
总
体
F的
一
个Hale Waihona Puke 本,用S(
x
则称变量
t X Yn
所服从的分布为自由度为 n的 t 分布.
概率论与数理统计-第六章

这200人的年龄数据。
总体:北京市民的年龄 随机变量:年龄X
个体:张三28岁;李四5岁;
样本:{ 28;5;14;56;23;2;39;…;69} 样本容量:200
抽样:随机抽取200人进行调查的过程
6
例2:为了确定工厂生产的电池电量分布情况,在
产品中随机抽取500个,测量其电量。记录了
x
0
F n1 , n2
F分布的分位数
x
F分布的上α分位点
对于给定的 , 0 1, 称满足条件
F n1 , n2
f x; n1 , n2 dx 的点F n1 , n2
为F n1 , n2 分布的上 分位数。F n1 , n2 的值可查F 分布表
17
不易计算!
18
抽样分布 —— 任意统计量 Q = g (X1, X2, …, Xn ) 的分布函数 抽样分布的计算: 多维随机变量(独立、同分布)的函数的分布 函数的计算问题。
得到统计量 Q 的抽样分布,就可以用来解决
关于总体 X 的统计推断问题。
19
关于随机变量独立性的两个定理
解:(1)作变换 Yi
显然Y1 , Y2 ,
2 n i 1
Xi
, Yn相互独立,且Yi N 0,1 i 1, 2,
Xi
i 1, 2,
,n
,n
于是 (
) Yi 2 2 n
2 i 1
28
n
(2)
2 ( X X ) X1 X 2 ~ N (0, 2 2 ), 1 2 2 ~ 2 (1) 2
概率论与数理统计答案第六章

第六章 样本及抽样分布1.[一] 在总体N (52,6.32)中随机抽一容量为36的样本,求样本均值X 落在50.8到53.8之间的概率。
解:8293.0)78()712(}63.68.163.65263.62.1{}8.538.50{),363.6,52(~2=-Φ-Φ=<-<-=<<X P X P N X2.[二] 在总体N (12,4)中随机抽一容量为5的样本X 1,X 2,X 3,X 4,X 5. (1)求样本均值与总体平均值之差的绝对值大于1的概率。
(2)求概率P {max (X 1,X 2,X 3,X 4,X 5)>15}. (3)求概率P {min (X 1,X 2,X 3,X 4,X 5)>10}.解:(1)⎪⎪⎭⎪⎪⎬⎫⎪⎪⎩⎪⎪⎨⎧>-=⎪⎪⎭⎪⎪⎬⎫⎪⎪⎩⎪⎪⎨⎧>-=>-25541225415412}112{|X P X P X P=2628.0)]25(1[2=Φ- (2)P {max (X 1,X 2,X 3,X 4,X 5)>15}=1-P {max (X 1,X 2,X 3,X 4,X 5)≤15} =.2923.0)]21215([1}15{1551=-Φ-=≤-∏=i i X P (3)P {min (X 1,X 2,X 3,X 4,X 5)<10}=1- P {min (X 1,X 2,X 3,X 4,X 5)≥10} =.5785.0)]1([1)]21210(1[1}10{15551=Φ-=-Φ--=≥-∏=i iXP 4.[四] 设X 1,X 2…,X 10为N (0,0.32)的一个样本,求}.44.1{1012>∑=i iXP解:)5(1.0}163.0{}44.1{),10(~3.0101221012221012查表=>=>∑∑∑===i i i i i i X P X P χX7.设X 1,X 2,…,X n 是来自泊松分布π (λ )的一个样本,X ,S 2分别为样本均值和样本方差,求E (X ), D (X ), E (S 2 ).解:由X ~π (λ )知E (X )= λ ,λ=)(X D∴E (X )=E (X )= λ, D (X )=.)()(,)(2λX D S E nλn X D === [六] 设总体X~b (1,p),X 1,X 2,…,X n 是来自X 的样本。
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
2X ,2
n
n
1
X
n
,判别1与2哪个有效 n
2时?
解:Var
1
Var
2X
4 n
2
12
2
3n
由
fn
x
nx
n1 n
0
0 x
其它
E
X
2
n
0
nxn1
n
dx
n
n
2
2
于是Var
2
n
12
n2
EX2nEXn2
n
2
n
2
因为Var
1
2
3n
2
nn
2
Var
2
2比1更有效
10
例6.1.4 设 x1, x2 , …, xn 是取自某总体的样本,记总
替换原理是指用样本矩及其函数去替换相应的 总体矩及其函数,譬如: • 用样本均值估计总体均值E(X),即 Eˆ ( X ) x ; • 用样本方差估计总体方差Var(X),即Vˆ ar(X ) sn2 • 用样本的 p 分位数估计总体的 p 分位数, • 用样本中位数估计总体中位数。
例6.2.1 对某型号的20辆汽车记录其每加仑汽油 的行驶里程(km),观测数据如下:
记E X , D X 2 , 证明:样本均值X 和样本方
差S 2分别是和 2的无偏估计。
证:因X1, X 2, , X n与X同分布,故有:
E
X
E
1 n
n i1
Xi
1 n
n i1
E Xi
1 n
n
故X 是的无偏估计
E
S2
E
1 n 1
n i1
(Xi
X
)2
1 n 1
ˆj j(a1, ,ak ), j 1, ,k ,
其中
E(
X
k
)
1 n
n i1
xik
,
E X
E X k
1 n
n
xi
i1
k
x
例6.2.2 设总体服从指数分布,由于EX=1/,
即 =1/ EX,故 的矩法估计为
ˆ 1/ x
另外,由于Var(X)=1/2,其反函数为 1/ 因Va此r(X,) 从替换原理来看,的矩法估计也可取为
Es 2 (n / 2)
n 1 ((n 1) / 2) cn
这说明 s 不是 的无偏估计.
利用修正技术可得 cn s 是 的无偏估计,其中
cn
n 1 是 (修(n 偏1) /系2) 数.
2 (n / 2)
可以证明,当n时, 有cn1.
这说明 s 是 的渐近无偏估计。
无偏性不具有不变性,即若 是ˆ的无偏估计, 其函数g( )不是ˆ g()的无偏估计除非g()是的
定义6.1.2 设 ˆ ˆ(x1是, , xn的) 一个估计, 的参数空间为Θ,若对任意的∈Θ,有
E(ˆ)
则称 是ˆ 的无偏估计,否则称为有偏估计。
若E ˆ ,那么 E 称为估计量ˆ的偏差 若 lim E ,则称ˆ是的渐近无偏估计量
n
例6.1.1:设总体X的一阶和二阶矩存在,分布是任意的,
(1) 当样本量趋于无穷时,有E(s*2) 2,
我们称 s*2 为 2的渐近无偏估计。
(2)
若对s*2作如下修正:
s2
ns *2 n 1
1 ,n
n 1 i1
( xi
x )2
则 s2 是总体方差的无偏估计。
例6.1.2 设总体为N( , 2),x1 , x2 , …, xn是样本, 则s2是 2的无偏估计,且可求出
体均值为 ,总体方差为 2,则 ˆ,1 x,1 ˆ2 x 都是 的无偏估计,但
Var(ˆ1) 2, Var(ˆ2 ) 2 / n
显然,只要 n>1, 比ˆ2 有ˆ效1 。这表明用全部数 据的平均估计总体均值要比只使用部分数据更 有效。
§6.2 矩估计及相合性
6.2.1 替换原理和矩法估计
为: 28.695, 0.9185 和 28.6。
矩法估计的实质是用经验分布函数去替换总体 分布,其理论基础是格里纹科定理。
6.2.2概率函数P(x,θ)已知时未知参数的矩法估计
设总体具有已知的概率函数 P(x, 1, …, k), x1, x2 , …, xn 是样本,假定总体的k阶原点矩k存在, 若1, …, k 能够表示成 1, …, k 的函数j = j(1, …,k),则可给出诸j 的矩法估计为
参数估计的形式有两种:点估计与区间估计。
设 x1, x2,…, xn 是来自总体 X 的一个样本,
我们用一个统计量 ˆ ˆ(x1,的,取xn值) 作为 的 估计值, 称为ˆ的点估计(量),简称估计。 在这里如何构造统计量 并没有明ˆ确的规定,
只要它满足一定的合理性即可。这就涉及到 两个问题:
➢ 其一 是如何给出估计,即估计的方法问题;
n i1
E
Xi2
nX
2
1 n 1
n 2 2
2
故S 2是 2的无偏估计
对任一总体而言,样本均值是总体均值的无偏估
计。当总体k阶矩存在时,样本k阶原点矩ak是总体
k阶原点矩 k的无偏估计。但对中心矩则不一样,
譬如,由于
E(s
2
*
)
,n 样1本2 方差s*2不是总体方差
2
的无偏估计,对此,有n 如下两点说明:
线性函数
6.1.2 有效性
定义6.1.3 设 ˆ1是, ˆ2 的两个无偏估计,如果 对任意的 ∈Θ, 有 Var(ˆ1) Var(ˆ2), 且至少有一个 ∈Θ使得上述不等号严格成
立,则称 比ˆ1 有效ˆ2 。
例6.1.3:设总体X U 0, , X1, , X n是取自X的样本,已知的两
个无偏估计为1
第六章 参数估计
§6.1 点估计的概念与无偏性 §6.2 矩估计及相合性 §6.3 最大似然估计与EM算法 §6.4 最小方差无偏估计 §6.5 贝叶斯估计 §6.6 区间估计
一般常用 表示参数,参数 所有可能取值
组成的集合称为参数空间,常用表示。参 数估计问题就是根据样本对上述各种未知参 数作出估计。
29.8 27.6 28.3 27.9 30.1 28.7 29.9 28.0
27.9 28.7 28.4 27.2 29.5 28.5 28.0 30.0
29.1 29.8 29.6 26.9
经计算有
x 28.695,
sn2 0.9185,
m0.5 28.6
由此给出总体均值、方差和中位数的估计分别
➢ 其二 是如何对不同的估计进行评价,即估
计的好坏判断标准。
§6.1 点估计的概念与无偏性
6.1.1 点估计及无偏性 定义6.1.1 设x1 , x2 , …, xn 是来自总体的一个
样本,用于估计未知参数的统计量
ˆ ˆ(x1,称为, xn)的估计量,或者称为的点
估计,简称估计
6.1.1 无偏性