概率论第5章.参数估计
概率论与数理统计 第五章
Xn ⎯ ⎯→ X 2. 依概率收敛与依分布收敛的关系
依概率收敛 ⇒ 依分布收敛
L
3. 定义:中心极限定理 设随机变量 X ~ N(0,1),{Xi },i = 1, 2, … 相互独 立,且数学期望和方差都存在, 若标准化随机变量序列
∑
n
i =1
Xi −
∑ E(X
i =1
n
i
)
∑
n
i =1
D(X i)
所以结论成立。 由此有,若X ~ B( n, p ),对于足够大的n,有 ⎧ m1 − np X − np m2 − np ⎫ ⎪ ⎪ < ≤ P{m1 < X ≤ m2 }= P ⎨ ⎬ np(1 − p) np(1 − p) ⎪ ⎪ np(1 − p) ⎩ ⎭
⎧ Yn − np ⎫ ⎪ ⎪ ≤ x ⎬ = Φ( x ) lim P ⎨ n →∞ ⎪ np(1 − p ) ⎪ ⎩ ⎭
证明:对于任意正整数n,随机变量Yn 可表示为 证明:对于任意正整数n Yn = X1+ X2+…+ Xn X1, X2,…, Xn 相互独立,Xi ~ B( 1, p ),且有 E( Xi ) = p , D( Xi ) = p(1-p) 所以随机变量序列{ Xi }, i =1,2,…满足独立同分布 中心极限定理条件。即有
切比雪夫不等式的应用 1)估计随机变量落在某个区间内的概率 (P125例5.5.2) 2)估计ε的值, 使 P(│X - E(X)│<ε) ≥ a (0<a<1) 3)证明大数定律。
二. 大数定律 定义: 依概率收敛 设{Xn}是一个随机变量序列,X 是一个随机变量 或常数,若对于任意的ε> 0,有 lim P{| X n − X |≥ ε } = 0
概率论与数理统计教案参数估计
概率论与数理统计教案-参数估计教案章节一:参数估计概述教学目标:1. 理解参数估计的定义及意义;2. 掌握参数估计的两种方法:最大似然估计和最小二乘估计;3. 了解参数估计的假设条件。
教学内容:1. 参数估计的定义及意义;2. 最大似然估计和最小二乘估计的方法及步骤;3. 参数估计的假设条件。
教学方法:1. 讲授法:讲解参数估计的定义、意义、方法及步骤;2. 案例分析法:分析实际案例,让学生更好地理解参数估计的方法及应用。
教学难点:1. 最大似然估计和最小二乘估计的方法及步骤;2. 参数估计的假设条件。
教学准备:1. 教学PPT;2. 相关案例资料。
教学过程:1. 引入参数估计的概念,讲解其意义;2. 讲解最大似然估计和最小二乘估计的方法及步骤;3. 分析实际案例,展示参数估计的应用;4. 讲解参数估计的假设条件;5. 课堂互动,回答学生问题。
作业布置:1. 复习parameter estimation 的定义及意义;2. 学习maximum likelihood estimation 和least squares estimation 的相关知识;3. 思考如何应用parameter estimation 解决实际问题。
教案章节二:最大似然估计教学目标:1. 理解最大似然估计的定义及意义;2. 掌握最大似然估计的计算方法;3. 了解最大似然估计的应用场景。
教学内容:1. 最大似然估计的定义及意义;2. 最大似然估计的计算方法;3. 最大似然估计的应用场景。
教学方法:1. 讲授法:讲解最大似然估计的定义、意义、计算方法;2. 案例分析法:分析实际案例,展示最大似然估计的应用。
教学难点:1. 最大似然估计的计算方法;2. 最大似然估计的应用场景。
教学准备:1. 教学PPT;2. 相关案例资料。
教学过程:1. 引入最大似然估计的概念,讲解其意义;2. 讲解最大似然估计的计算方法;3. 分析实际案例,展示最大似然估计的应用;4. 课堂互动,回答学生问题。
《概率论与数理统计答案》第五章
P{ X − 8 > 3} = 0.1336
3.设 X 1 , X 2 , " , X n 为来自总体 X ~ P (λ ) 的一个样本, X 、 S 2 分别为样本均值 和样本方差。求 DX 及 ES 2 。 答案与提示:此题旨在考察样本均值的期望、方差以及样本方差的期望与总体 期望、总体方差的关系,显然应由定理 5-1 来解决这一问题。
2
=(
1
hd a
) e
n 2 − 1
n
为
2σ 2
2πσ 2
w. c
∑ ( xi − µ )2
i =1
om
,
8.设 X 1 , X 2 , " , X n 为来自正态总体 X ~ N ( µ , σ 2 ) 的一个样本, µ 已知,求 σ 2
第五章 习题参考答案与提示
⎧ ⎪λax a −1e − λx , x > 0, (2) f ( x, λ ) = ⎨ ⎪ x ≤ 0, ⎩ 0,
1 3 1 (3) X 1 + X 2Leabharlann + X 3 。 5 10 2
om
(1)
(2)
第五章 习题参考答案与提示
3,求 θ 的矩估计值和极大似然估计值。
ˆ = 1/ 4 。 答案与提示: θ 的矩估计值为 θ
对于给定的样本值,似然函数为 L(θ ) = 4θ 6 (1 − θ ) 2 (1 − 2θ ) 4 ,解得
其中 θ > −1 为未知参数。
网
9.设 X ~ N ( µ , 1) , X 1 , X 2 , " , X n 为来自正态总体 X 的一个样本,试求 µ 的极
概率论与数理统计 参数估计
数理统计
你就会想,只发一枪便打中, 猎人命中的概率 一般大于这位同学命中的概率 . 看来这一枪是猎人 射中的 . 这个例子所作的推断已经体现了极大似然法的 基本思想 .
数理统计
最大似然估计原理:
当给定样本X1,X2,…Xn时,定义似然函数为:
L( ) P( ; x1 , , xn ) P( ; X 1 x1 , X 2 x2 , , X n xn P( X 1 x1 ; ) P( X 2 x2 ; ) P( X n xn ; ) L( ) f ( ; x1 , , xn ) f ( x1 ; ) f ( x2 ; ) f ( xn ; )
而全部信息就由这100个数组成 . 据此,我们应如何估计 和 呢 ?
数理统计
二、寻求估计量的方法 1. 矩估计法 2. 极大似然法
数理统计
1. 矩估计法
矩估计法是英国统计学家K.皮尔逊 最早提出来的 . 由辛钦定理 , 若总体 X 的数学期望 E X μ 有限, 则有
1 n P X X i E( X ) μ n i 1 1 n k P Ak X i E ( X k ) μk ( k 1,2,) n i 1
数理统计
常用的几条标准是:
1.无偏性 2.有效性 3.相合性 这里我们重点介绍前面两个标准 .
数理统计
一、无偏性
估计量是随机变量,对于不同的样本值会得到 不同的估计值 . 我们希望估计值在未知参数真值附 近摆动,而它的期望值等于未知参数的真值. 这就 导致无偏性这个标准 .
ˆ( X ,, X ) 是未知参数 的估计量,若 设 1 n
在似然函数中 可以看成是“原因”,而 ( x1 , x2 ,, xn ) 则被看成是 “结果” .导致结果 ( x1 , x2 ,, xn ) 发生的所有
概率论参数估计
2
2 设 ~ b(1 p), X1, X2,L Xn是 自 的 个 本 、 X , , 来 X 一 样 , 试 参 p的 大 然 计 。 求 数 最 似 估 量
3、设总体X在[a,b]上服从均匀分布,a、b未 x , 知, 1, x2,L xn 是来自X的一个样本值,试求a、 b的最大似然估计量。
估计量的优良性准则 在介绍估计量优良性的准则之前, 在介绍估计量优良性的准则之前,我 们必须强调指出: 们必须强调指出: 评价一个估计量的好坏, 评价一个估计量的好坏,不能仅仅依 据一次试验的结果, 据一次试验的结果,而必须由多次试验结 果来衡量 . 这是因为估计量是样本的函数,是随机 这是因为估计量是样本的函数, 因此,由不同的观测结果, 变量 . 因此,由不同的观测结果,就会求得 不同的参数估计值. 因此一个好的估计,应 不同的参数估计值 因此一个好的估计, 在多次试验中体现出优良性 .
P X = x}= p(x,θ), θ ∈Θ {
的样本, 设X1,X2,…,Xn是来自 的样本,则X1, , 是来自X的样本 , , , X2,…,Xn的联合分布律为 , , 的联合分布律为
∏p(x ;θ)
i i= 1
n
样本X , , , 取得观察值x , , , 样本 1,X2,…,Xn取得观察值 1,x2,…,xn的概 率为
L(θ) = L(x1, x2,L xn;θ) =∏p(xi ;θ), θ ∈Θ ,
i= 1
n
称为样本的似然函数 (2)连续型 ) 若总体X属连续型 属连续型, 若总体 属连续型,其概率密度为
f (x;θ), θ ∈Θ θ为待估参数
是来自X的样本 设X1,X2,…,Xn是来自 的样本,则X1, , , , 是来自 的样本, , X2,…,Xn的联合密度为 , , 的联合密度为
概率论与数理统计课件第5章-PPT精品文档
PX Q 0 . 5 2
1
第三四分位数Q3: PX Q 0 . 7 5 3
例1
为对某小麦杂交组合F2代的株高X进行研究,抽
取容量为100的样本,测试的原始数据记录如下(单位: 厘米),试根据以上数据,画出它的频率直方图,求随
机变量X的分布状况。
87 99 86 87 84 85 96 90 103 88 91 94 94 91 88 109 83 89 111 98 102 92 82 80 91 84 88 91 110 99 86 94 83 80 91 85 73 98 89 102 99 81 80 87 95 70 97 104 88 102 69 94 95 92 92 90 94 75 91 95 102 76 104 98 83 94 90 96 80 80 90 92 105 92 92 90 94 97 86 91 95 94 88 96 80 94 92 91 77 83
样本方差( X X i n 1i 1
几个常用的统计量
设 (X ,X , 1 2 是总体 X 的一个样本, ,X n) 样本均方差或标准差
2 1 n S X i X n 1i 1
它们的观测值用相应的小写字母表示.反映总 体X取值的平均,或反映总体X取值的离散程度。
几个常用的统计量
设 (X ,X , 1 2 是总体 X 的一个样本, ,X n)
子样的K阶(原点)矩
1 n k Ak X i n i 1
子样的K阶中心矩
1 B k X i X n i1
n
k
数据的简单处理
为了研究随机现象,首要的工作是收集原始数据. 一般通过抽样调查或试验得到的数据往往是杂乱无章
概率论与数理统计第五章课后习题及参考答案
概率论与数理统计第五章课后习题及参考答案1.用切比雪夫不等式估计下列各题的概率.(1)废品率为03.0,1000个产品中废品多于20个且少于40个的概率;(2)200个新生儿中,男孩多于80个而少于120个的概率(假设男孩和女孩的概率均为5.0).解:(1)设X 为1000个产品中废品的个数,则X ~)1000,03.0(B ,有30)(=X E ,1.29)(=X D ,由切比雪夫不等式,得)3040303020()4020(-<-<-=<<X P X P )103010(<-<-=X P )1030(<-=X P 709.0101.2912=-≥.(2)设X 为200个新生儿中男孩的个数,则X ~)200,5.0(B ,有100)(=X E ,50)(=X D ,由切比雪夫不等式,得)10012010010080()12080(-<-<-=<<X P X P )2010020(<-<-=X P )20100(<-=X P 87205012=-≥.2.一颗骰子连续掷4次,点数总和记为X ,估计)1810(<<X P .解:设i X 为该骰子掷第i 次出现的点数,则61)(==k X P i ,6,,2,1 =i ,6,,2,1 =k .27)654321(61)(=+++++=i X E ,691)654321(61)(2222222=+++++=i X E ,35)]([)()(22=-=i i i X E X E X D ,4,3,2,1=i .因为4321X X X X X +++=,且1X ,2X ,3X ,4X 相互独立,故有14)(=X E ,335)(=X D .由切比雪夫不等式,得)1418141410()1810(-<-<-=<<X P X P )4144(<-<-=X P )414(<-=X P 271.0433512=-≥.3.袋装茶叶用及其装袋,每袋的净重为随机变量,其期望值为100g ,标准差为10g ,一大盒内装200袋,求一盒茶叶净重大于5.20kg 的概率.解:设i X 为一袋袋装茶叶的净重,X 为一盒茶叶的净重,由题可知∑==2001i i X X ,100)(=i X E ,100)(=i X D ,200,,2,1 =i .因为1X ,2X ,…,200X 相互独立,则20000)()(2001==∑=i i X E X E ,20000)()(2001==∑=i i X D X D .)()(20500)()(()20500(2001X D X E X D X E X P X P i i ->-=>∑=)1020020000205001020020000(⋅->⋅-=X P )2251020020000(>⋅-=X P 由独立同分布的中心极限定理,1020020000⋅-X 近似地服从)1,0(N ,于是0002.0)5.3(1)2251020020000(=Φ-≈>⋅-X P .4.有一批建筑用木桩,其80%的长度不小于3m .现从这批木桩中随机取出100根,试问其中至少有30根短于3m 的概率是多少?解:设X 为100根木桩中短于3m 的根数,则由题可知X ~)2.0,100(B ,有20)(=X E ,16)(=X D ,由棣莫弗—拉普拉斯定理,得)30(1)30(<-=≥X P X P )42030(1)()((1-Φ-=-Φ-=X D X E X 0062.0)5.2(1=Φ-=.5.某种电器元件的寿命服从均值为100h 的指数分布.现随机选取16只,设它们的寿命是相互独立的.求这16只元件寿命总和大于1920h 的概率.解:设i X 为第i 只电器元件的寿命,由题可知i X ~)01.0(E ,16,,2,1 =i ,且1X ,2X ,…,16X 相互独立,则100)(=i X E ,10000)(=i X D .记∑==161i i X X ,则1600)()(161==∑=i i X E X E ,160000)()(161==∑=i i X D X D .))()(1920)()(()1920(X D X E X D X E X P X P ->-=>)400160019204001600(->-=X P )8.04001600(>-=X P ,由独立同分布的中心极限定理,1600-X 近似地服从)1,0(N ,于是2119.0)8.0(1)8.04001600(=Φ-=>-X P .6.在数值计算中中,每个数值都取小数点后四位,第五位四舍五入(即可以认为计算误差在区间]105,105[55--⨯⨯-上服从均匀分布),现有1200个数相加,求产生的误差综合的绝对值小于03.0的概率.解:设i X 为每个数值的误差,则i X ~)105,105(55--⨯⨯-U ,有0)(=i X E ,1210)(8-=i X D ,1200,,2,1 =i .从而0)()(12001==∑=i i X E X E ,61200110)()(-===∑i i X D X D .由独立同分布的中心极限定理,X 近似地服从)10,0(6-N ,于是)03.0(<X P ))()(03.0)()((X D X E X D X E X P -≤-=12101200003.0121012000(44--⋅-≤⋅-=X P 9974.01)3(2=-Φ=.7.某药厂断言,该厂生产的某药品对医治一种疑难的血液病治愈率为8.0.医院检验员任取100个服用此药的病人,如果其中多于75个治愈,就接受这一断言,否则就拒绝这一断言.(1)若实际上此药对这种病的治愈率是8.0,问接受这一断言的概率是多少?(2)若实际上此药对这种病的治愈率是7.0,问接受这一断言的概率是多少?解:设X 为100个服用此药的病人中治愈的个数,(1)由题可知X ~)8.0,100(B ,则80)(=X E ,16)(=X D ,由棣莫弗—拉普拉斯定理,得)75(1)75(≤-=>X P X P 48075(1))()((1-Φ-=-Φ-=X D X E X 8944.0)25.1(=Φ=.(2)由题可知X ~)7.0,100(B ,则70)(=X E ,21)(=X D ,由棣莫弗—拉普拉斯定理,得)75(1)75(≤-=>X P X P 217075(1)()((1-Φ-=-Φ-=X D X E X 1379.0)09.1(1=Φ-=.8.一射手在一次射击中,所得环数的分布律如下表:X678910P 05.005.01.03.05.0求:(1)在100次射击中环数介于900环与930环之间的概率是多少?(2)超过950环的概率是多少?解:设X 为100次射击中所得的环数,i X 为第i 次射击的环数,则∑==1001i i X X ,15.9)(=i X E ,95.84)(2=i X E ,2275.1)]([)()(22=-=i i i X E X E X D ,100,,2,1 =i .由1X ,2X ,…,100X 相互独立,得915)()(1001==∑=i i X E X E ,75.122)()(1001==∑=i i X D X D .由独立同分布的中心极限定理,75.122915-X 近似地服从)1,0(N ,于是(1))930900(≤≤X P ))()(930)()()()(900(X D X E X D X E X X D X E P -≤-≤-=75.12291593075.12291575.122915900(-≤-≤-=X P )75.1221575.122915(≤-=X P 823.01)35.1(2=-Φ≈.(2))950(>X P ))()(950)()((X D X E X D X E X P ->-=75.122915950)()((->-=X D X E X P 001.0)1.3(1=Φ-≈.9.设有30个电子元件1A ,2A ,…,30A ,其寿命分别为1X ,2X ,…,30X ,且且都服从参数为1.0=λ的指数分布,它们的使用情况是当i A 损坏后,立即使用1+i A (29,,2,1 =i ).求元件使用总时间T 不小于350h 的概率.解:由题可知i X ~)1.0(E ,30,,2,1 =i ,则10)(=i X E ,100)(=i X D .记∑==301i i X T ,由1X ,2X ,…,30X 相互独立,得300)()(301==∑=i i X E T E ,3000)()(301==∑=i i X D T D .))()(350)()(()350(T D T E T D T E T P T P ->-=>30103003503010300(⋅->⋅-=T P )91.03010300(>⋅-≈T P ,由独立同分布的中心极限定理,3010300⋅-T 近似地服从)1,0(N ,于是1814.0)91.0(1)91.03010300(=Φ-=>⋅-T P .10.大学英语四级考试,设有85道选择题,每题4个选择答案,只有一个正确.若需要通过考试,必须答对51道以上.试问某学生靠运气能通过四级考试的概率有多大?解:设X 为该学生答对的题数,由题可知X ~41,85(B ,则25.21)(=X E ,9375.15)(=i X D ,85,,2,1 =i .由棣莫弗—拉普拉斯中心极限定理,近似地有9375.1525.21-X ~)1,0(N ,得)8551(≤≤X P ))()(85)()()()(51(X D X E X D X E X X D X E P -≤-≤-=)9375.1525.21859375.1525.219375.1525.2151(-≤-≤-=X P 0)45.7()97.15(=Φ-Φ=.即学生靠运气能通过四级考试的概率为0.。
概率论与数理统计第5章
p( x1 , x2 ,
, xn ) = p(x1 )p(x2 )
p(xn ) = ∏ p( xi )
i =1
n
14 September 2009
1.
若连续型总体 X 的密度函数为 p(x ), , X n )是取自总体 X 的样本, iid
(X 1 , X 2 ,
X1, X2, … , Xn
n 则 (X 1 , X 2 , , X n )的密度函数为 p( x1 , x2 , , xn ) = p(x1 )p(x2 ) p(xn ) = ∏ p( xi ) i =1
数理统计
学习基础:1、高等数学 2、概率论
前面的学习已知:随机变量及其所伴随的概率分布全面描述了 随机现象的统计规律性,所以要研究一个随机现象首先要 知道它的概率分布. 概率论中:许多问题的概率分布通常是已知的或假设为已知的然后 在此基础上进行一切计算与推理. 实际中:一个随机现象的概率分布可能完全不知道 或知道分布类型却不知道其中的参数.例如正态分布
则 (X 1 , X 2 ,
, X n )的密度函数为
p( x1 , x2 ,
, xn ) = p(x1 )p(x2 )
n
p(xn )
⎧n −λ ∑ xi ⎪ Π λe −λxi = λ ne i=1 = ⎨ i =1 ⎪ 0 ⎩
xi > 0, i = 1, 2, 其它
,n
例如 设某批产品共有N 个,其中的次品 数为M, 其次品率为 p = M / N 若 p 是未知的,则可用抽样方法来估计它. 从这批产品中任取一个产品,用随机变量 X来描述它是否是次品: 所取的产品是次品 ⎧ 1, X =⎨ ⎩ 0, 所取的产品不是次品 X 服从参数为p 的0-1分布,可用如下表示 方法: P(x) = p (1− p) ,
概率论——参数估计
极大似然估计法 —具体解法
当总体含有k个参数时,似然函数
L(1 ,2 , ,k )
为多元函数,选取使得似然函数
L( x1 , x2 , , xn;1 ,2 , ,k )
达到最大值的点 1( x1 , x2 , , xn ),
2 ( x1 , x2 , , xn ), ,k ( x1 , x2 , , xn )分别
1 2A1 1 2X .
A1 1 X 1
设x1, x2 , , xn是一个样本值.似然函数为
L
n 1
i 1
xi
1 n
x1 x2
xn ,
ln L nln 1
n i 1
ln
xi
.
令
d ln L
n
d 1
n i 1
ln
xi
0,
27
解得
1 n
20
极大似然估计法 —似然函数
设连续型随机变量X的概率密度为f ( x; ), X1 , X 2 , , X n是来自总体的样本,则称参数
n
的函数 L( ) f ( xi ; )为样本的似然函数. i 1 设离散型随机变量X的分布律为: P{ X x} P( x; ),
X1 , X 2 , , X n是来自总体的样本,则称参数
n
的函数 L( ) P( xi ; )为样本的似然函数. i 1 21
极大似然估计法 —基本思想
在已知总体X 概率分布时,对总体进行n次
观测,得到总体的一个样本 X1, X2 , , Xn .
极大似然估计法就是选取使得似然函数
L( x1 , x2 , , xn; )达到最大值的点ˆ( x1, x2 , , xn ) 作为未知参数的估计值的方法.
第5章概率论与假设检验简介
样本均 值分布
σ σx = n
µx = µ
2011-4-27
X
23
2.样本方差的分布
Statistics Statistics
设总体~ 的样本, 设总体 ~ N(µ,σ2 ), 取容量 的样本 , 则样 , 取容量n的样本 本方差 s2
χ2(n – 1):自由度为 :自由度为(n-1)的卡方分布 的卡方分布
1. 2.
密度函数f(x)曲线下的面积等于 曲线下的面积等于1 密度函数 曲线下的面积等于 分布函数是f(x) 下小于 x0 的面积 分布函数是
f(x)
F ( x0 )
x0
2011-4-27
x
8
期望和方差
Statistics Statistics
2011-4-27
E( X ) = ∫ xf (x)dx = µ
2011-4-27
12
正态分布标准化
Statistics Statistics
1. 标 准 化 线 性变换
2.
标准正态 分布的概 率密度和 分布函数
2011-4-27
13
一般正态分布
标准正态分布
σ
σ =1
µ
x
µ=0
Z
Excel:正态分布函数
Statistics Statistics
NORMDIST (x, mean, std, cumulative) Cumulative=0:返回指定平均值和标准差的正态分 : 布函数的概率密度 Cumulative=1:返回累积概率密度(分布函数值) :返回累积概率密度(分布函数值) NORMINV (prob, mean, std) NORMDIST (x, mean, std, 1)的反函数 的反函数 NORMSDIST(z) 返回标准正态分布函数的累积概率P(X ≤ z ) 返回标准正态分布函数的累积概率 NORMSINV(probability) NORMSDIST(z)的反函数 的反函数
概率论与数理统计 第五章
贝努里定理. 它的叙述如下:设是n次重复独立 对于任意给定的ε>0,有
lim P{| nA p | } 1
n
n
lim P{| nA p | } 1
n
n
其中nA/n是频率,p是概率,即次数多
时事件发生的频率收敛于概率.表示频率的稳定性.
定理3
lim P{|
n
1 n
n i 1
Xi
| } 1
数理统计的方法属于归纳法,由大量的资料作依据,而不
是从根据某种事实进行假设,按一定的逻辑推理得到的.例
如统计学家通过大量观察资料得出吸烟和肺癌有关,吸烟
者得肺癌的人比不吸烟的多好几倍.因此得到这个结论.
数理统计的应用范围很广泛.在政府部门要求有关的资
料给政府制定政策提供参考.由局部推断整体,学生的假期
第五章 大 数 定 律 与 中 心 极 限 定 律
§ 5.1大 数 定 律
定理1(切比雪夫定理) 设X1,X2,...,Xn,...是相互独立的随机变
量序列若存在常数C,使得D(Xi)≤C. (i=1,2,...n),则对任意给
定的ε>0,有
lim P{|
n
1 n
n i 1
[Xi
E( X i )] |
7200 6800 2
200 1
D 2
1
2100 2002
0.95
可见虽有10000盏灯,只要电力供应7200盏灯即有相当大的保 证率切贝谢夫不等式对这类问题的计算有较大价值,但它的精度 不高.为此我们研究下面的内容.
2021/9/5
10
§ 5.2 中 心 极 限 定 理
在随机变量的一切可能性的分布律中,正态分布占有特殊的
概率论参数估计
概率论参数估计问题的提出:一、参数估计参数估计总体X的估计有两类:总体X的分布形式已知,未知的只是分布中的参数,要估计的只是参数或参数的某一函数。
二、非参数估计总体X的分布形式未知,要估计的是总体的分布形式。
参数估计点估计区间估计设总体X的分布函数为F(x, ), 未知,的取值范围称为参数空间。
记作。
现估计。
步骤如下:从总体X 中抽取样本(X1, X2, …, X n ) 构造合适的统计量=T(X1, X2, …, X n )估参计数量的估参计数值的将样本观察值(x1, x2, …, x n )代入估计量计算出估计量的观察值=T(x1, x2, …, x n ) 或构造1 = T1(X1, X2, …, X n )和2 =T2(X1, X2, …, X n ) ( 1 2) 用区间( 1, 2 )作为可能取值范围的估计5.1参数的点估计构造点估计的估计量的具体方法有多种,在此,介绍两种方法。
一、矩估计法矩估计法的思想是:用样本的各阶矩去估计总体相应的各阶矩,而总体各阶矩都是总体分布中未知参数的函数,从而,通过估计总体矩来达到估计总体分布中未知参数的目的。
设总体分布为F(x, 1, 2…… , k), i未知,样本(X1, X2, …, X n ) m 1 n m 来自总体X,计算EXAm X i n i 1 令EX X 解未知量1, 2…… , k EX 2 A2EX Akk称为参数1, 2…… , k的矩估计量。
例1:设样本(X1, X2, …, X n )来自总体X,且总体的均值未知,求的矩估计量。
1 n 解:令EX X EX , X X i n i 1 n 1 Xi X n i 1 总体X 的均值矩估计量为一阶样本原点矩例2:设样本(X1, X2, …, X n )来自总体X~N( , 2), 求与2 的矩估计量。
EX X 解:EX 2 A 2 EX EX 2 DX ( EX )2 2 2 X 2 2 A21 n Xi X n i 12 1 n 2 1 n A 2 X X i X ( X i X )2 B2 n i 1 n i 1 2 2例3:设样本(X1, X2, …, X n )来自总体X~P( ), 求的矩估计量。
概率论与数理统计课件(完整)
1.3 频率与概率
某人向目标射击, 以A表示事件“命中目标”, P( A) =? 定义:(p8) 事件A在n次重复试验中出现nA次,则 比值nA/n称为事件A在n次重复试验中
(1) P(A) ≥0;
(2) P()=1;
(3) 可列可加性:设A1,A2,…, 是一列两两互不 相容的事件,即AiAj=,(ij), i , j=1, 2, …, 有 P( A1 A2 … )= P(A1) +P(A2)+…. 则称P(A)为事件A的概率。 (1.1)
2.概率的性质 P(8-9) (1) 有限可加性:设A1,A2,…An , 是n个两两互 不相容的事件,即AiAj= ,(ij), i , j=1, 2, …, n ,则有 P( A1 A2 … An)= P(A1) +P(A2)+… P(An); (2) 单调不减性:若事件AB,则 P(A)≥P(B) (3)事件差 A、B是两个事件, 则 P(A-B)=P(A)-P(AB)
种取法.
1、抽球问题
例1:设合中有3个白球,2个红球,现从合中 任抽2个球,求取到一红一白的概率。 解:设A-----取到一红一白
N () C
2 5
1 1 N ( A) C3 C2
CC 3 P( A) 2 C5 5
1 3
1 2
答:取到一红一白的概率为3/5
一般地,设盒中有N个球,其中有M个白 球,现从中任抽n个球,则这n个球中恰有
概率论与数理统计第5章
2、定理以数学形式证明了随机变量X
1
,
X
的算术平均
n
X
1 n
n i 1
X i接近数学期望E( X k ) (k
1,2, n),这种接近
说明其具有的稳定性
这种稳定性的含义说明算术平均值是依概率收敛的意义下 逼近某一常数.
1.(2010-1)设 n 为n次独立重复试验中事件A发生的次数,p是事件
10
3.(2009 1)
设X i
0, 1,
事件A不发生 事件A发生 (i 1, 2,
,100),且P(A) 0.8,
100
X1, X 2 , , X100相互独立,令Y Xi则由中心极限定理知Y 近似服从于 i 1
正态分布,其方差为________ .
4.(2008 -10)设总体X的分布律为P{X 1} p, P{X 0} 1- p, 其中0 p 1.
P{|
m n
p
|
}1
或
ln im
P{|
m n
p
|
}
0
注: 贝努里大数定律表明,当重复试验次数n充分 大时,事件A发生的频率m/n与事件A的概率p有较 大偏差的概率很小.
事件发生的频率可以代替事件的概率.
5.2.2 独立同分布随机变量的切比雪夫大数定律
定理5-3
设随机变量X
1
,
X
,
2
,X
n
,
是独立同分布随机变量序列,
E( Xi ) , D( Xi ) 2 (i 1, 2, )均存在,则对任意 0有
lim{|
n
概率论-第5章 大数定律及中心极限定理
§1 大数定律
一、问题的引入
生产过程中的 字母使用频率 废品率 启示:从实践中人们发现大量测量值的算术平均值 有稳定性.
大量抛掷硬币 正面出现频率
§1 大数定律
一、问题的引入
大数定律的概念 概率论中用来阐明大量随机现象平均结果的 稳定性的一系列定理,称为大数定律(law of large number)
§2 中心极限定理
即考虑随机变量X k (k 1, n)的和 X k的标准化变量
k 1 n
Yn
X
k 1
n
k
E ( X k )
k 1 n
n
D ( X k )
2
说明每一个随机变量都有相同的数学期望。
§1 大数定律
检验是否具有相同的有限方差?
Xn P
2
( na ) 1 2 2n
2 n
2
0 1 1 2 n
2
( na ) 1 2 2n
2
1 2 a , E ( X ) 2( na ) 2 2n 2 ) [ E ( X n )]2 a 2 . D( X n ) E ( X n
使得当 x a y b 时,
g( x , y ) g(a , b)பைடு நூலகம் ,
§1 大数定律
于是 { g( X n , Yn ) g(a, b) }
{ X n a Yn b }
X n a Yn b , 2 2
§2 中心极限定理
自从高斯指出测量误差服从正态分布之后,人 们发现,正态分布在自然界中极为常见.
如果一个随机变量是由大量相互独立的随机因 素的综合影响所造成,而每一个别因素对这种综合 影响中所起的作用不大. 则这种随机变量一般都服 从或近似服从正态分布. 现在我们就来研究独立随机变量之和所特有 的规律性问题.
第5章抽样估计和假设检验
第5章 抽样估计和假设检验
• §5.1.1 • 2.总体和样本 • 总体也称全及总体,指所要认识研究对象的全体。
它是由所研究范围内具有某种共同性质的全体单 位所组成的集合体。总体的单位数通常是很大的, 甚至是无限的,一般用N表示总体的单位数。 • 样本又称子样,它是从全及总体中随机抽取出来 的们作为代表这一总体的哪部分单位组成的集合 体,样本的单位数是有限的,相对值或标志属性 决定的。
• 1. 抽样平均误差的计算方法
• 样本平均数的抽样平均误差
• ⑴ 重复抽样: • ⑵ 不重复抽样:
x
2
nn
x
2 N n
n N 1 n
1 n N
第5章 抽样估计和假设检验
• 2. 样本比例的抽样平均误差
• ⑴ 重复抽样:
p
P
n
P(1 P) n
• ⑵ 不重复抽样: p
• §5.2.1 抽样分布 • 3. 样本方差的分布
• 当总体服从正态分布 N , 2 时,
n 1S 2 2
• 服从 2 分布(将在下一节中介绍),其中
样本方差为
s2 1 n n 1 i1
2
xi x
第5章 抽样估计和假设检验
• §5.2.1 抽样分布
• 4. 样本比例的分布
• 总体中具有某种属性的单位数与总体全部单位数 之比称为总体的比例,记作。而样本中具有某种 属性的单位数与样本总数之比称为样本比例,记 作。
第5章 抽样估计和假设检验
• §5.2.1 抽样分布
• 2. 样本均值的抽样分布
• 若 则从总总体服体从中均抽值取为出的,样方本差均为值仍2的然正服态从分正布,
态分布,即。
X
参 数 估 计
二、参 数 估 计
【例5-5】 设X~B(1,p),(X1,X2,…,Xn)是取自总体X的一个子样, 试求参数p的极大似然估计量。
解:设(x1,x2,…,xn)是子样(X1,X2,…,Xn)的一组相应的取值。总体X 的分布律为
则似然函数为 取对数后,有 令
二、参 数 估 计
从而得p的极大似然估计值为 p的极大似然估计量为
项目
参数估计
二、参 数 估 计
一、 参数估计的基本原理
参数估计是指由样本指标值(统计量)估计总体指标值 (参数),即当总体的分布性质已知,但其所含参数真值未 知时,根据一组样本的观察值X1,X2,…,Xn来估计总体中未 知参数θ或θ的某函数。首先从样本(X1,X2,…,Xn)中提取有 关总体X的信息,即构造样本的函数——统计量 g(X1X2,…,Xn);然后用样本值代入,求出统计量 g(x1,x2,…,xn)的值,用该值来作为相应待估参数的值。
二、参 数 估 计
二 、 评价估计量的标准
在参数估计中,用样本估计量 作为总体参数θ的估 计量,实际上,对于同一参数,用不同的估计方法求出的估 计量可能不相同,用相同的方法也可能得到不同的估计量。 也就是说,同一参数可能具有多种估计量,而且,从原则上 讲,任何统计量都可以作为未知参数的估计量,那么采用哪 一个估计量好呢?这就涉及估计量的评价问题,而判断估计 量好坏的标准是:有无系统偏差,波动性的大小,伴随样本 容量的增大是否越来越精确,这就是估计的无偏性、有效性 和一致性。
区间的概念,并给出在一定可信程度的前提下求置信区间的
方法,使区间的平均长度最短。
二、参 数 估 计
用给定的置信度1-α说明区间估计的可靠程度
,通常α取值很小,如取0.05、0.01,有时取0.1。
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
定义: 设总体的分布类型已知,但含有未知参数θ.
(1) 设 ( x1 , x 2 , , x n ) 为总体 X 的一个样本观察值,若似
然函数 L ( ) 在ˆ ˆ( x1, x2 , , xn ) 处取到最大值,则称
ˆ( x1, x2 , , xn ) 为θ的最大似然估计值.
(2) 设 ( X 1 , X 2 , , X n ) 为总体 X 的一个样本,若ˆ( x1 , x2 , , xn )
设总体的分布类型已知, 但含有未知参数θ.
设 (x1, x2 ,, xn ) 为总体 X 的一个样本观察值,若似然函
数 L( ) 关于θ可导.
令
d L( ) 0
d
解此方程得θ的最大似然估计值ˆ(x1, x2,, xn ) ,
问题
一般地, 如何构造未知参数的点估计 ? 如何选择
最优的点估计?
1 最大似然估计法
最大似然估计的基本思想
• 最大似然原理的直观想法是:一个随机试验 如有若干个可能的结果A,B,C,….若在一次试 验中,结果A出现, 则一般认为A出现的概率最 大,也即试验条件对A出现有利.或者说在试验 的很多可能条件中,认为应该是使事件A发生 的概率为最大的那种条件存在.
P=3/4 时 P{X=k} 1/64 9/64 27/64 27/54
如果样本中白球数为0, 则应估计p=1/4, 而不估计 p=3/4. 因为具有X=0的样本来自p=1/4的总体的可 能性比来自p=3/4的总体的可能性要大. 一般当 X=0,1时, 应估计p=1/4; 而当X=2,3时, 应估计p=3/4.
第五章 参数估计与假设检验
参数估计
在实际问题中,经常遇到随机变量X(即总 体X)的分布函数的形式已知,但它的一个或者多 个参数未知的情形,此时写不出确切的概率密度函 数.若通过简单随机抽样,得到总体X的一个样本观 测值(x1,x2,…,xn) ,我们自然会想到利用这一组数据 来估计这一个或多个未知参数.诸如此类,利用样 本去估计总体未知参数的问题,称为参数估计问题. 参数估计问题有两类,分别是点估计和区间估计.
为θ的极大似然估计值, 则称ˆ( X 1 , X 2 , , X n ) 为参数
θ的最大似然估计量.
最大似然思想源于德国数学家高斯(Gauss,1777- 1855) 在1809年提出的误差的正态分布理论. 英国统 计学家费歇尔(Ronald A. Fisher 1890-1962) 1912年将 这一思想用于构造点估计, 提出了点估计的最大似然 法.
S/ n
数理统计的基础知识
数理统计学 (mathematical statistics)就是研究统 计量(statistic) 一门学问; 研究如何将样本加工成适 当的统计量, 研究如何利用统计量及其抽样分布对总 体作统计推断的一门学问.
统计推断
参数估计
点估计 区间估计
假设检验
参数假设检验
非参数假设检 验
定义:设总体 X 的分布类型已知,但含有未知参数θ.
(1)设离散型总体 X 的概 率分布为 p(x; ) ,则样本
( X1, X 2,, X n ) 的联合分布
n
p(x1; ) p(x2 ; ) p(xn ; ) p(xi ; ) i 1 n
称为似然函数,并记之为 L( ) L(x1, x2,, xn; ) p(xi; ) . i 1
设总体X ~ N (, 2 ),( X1, X2 ,, Xn )是总体的一
~
N
,
2
n
U
X / n
~
N(0,1);
2.
(n 1)
2
S
2
=
1
2
n
(Xi
i1
X )2
~
2 (n 1);
3. X 与 S2 相互独立.
4. T X ~ t(n 1).
参数估计的基本思想
X~P(λ), X~e(λ), X~N(μ,σ2) 用所获得的样本值去估计参数取值称为参数估计.
参
点估计
用某一数值作为 参数的近似值
数
估 计
在要求的精度范围内 区间估计 指出参数所在的区间
§5.1 点估计
设总体 X 的分布函数 F(x;) 形式已知,其中θ 是待估计的参数,点估计问题就是利用样本 (X1, X 2 ,, X n ) ,构造一个统计量ˆ ˆ( X1, X 2,, X n ) 来估 计θ,我们称ˆ(X1, X 2 ,, X n ) 为θ的点估计量,它是 一个随机变量. 将样本观测值 (x1, x2 ,, xn ) 代入估 计 量 ˆ(X1, X 2 ,, X n ) , 就 得 到 它 的 一 个 具 体 数 值 ˆ(x1, x2 ,, xn ) ,这个数值称为θ的点估计值.
例:为估计某款手机的理论待机时间 , 现随机抽取 9部
该款新手机,测得实际待机时间分别为:(单位 : h) 168, 130, 169, 143, 174, 198, 108, 212, 252.
请问如何估计 的值. 解 : 直观上,可按如下两种方式估计 的值 ˆ :
1) ˆ X ˆ 172.7; 2) ˆ X(5) ˆ 169.
例:假若一个盒子里有许多白球和红球,而且已知
它们的数目之比是3:1,但不知是白球多还是红球多.
设随机地在盒子中取一球为白球的概率是p.如果有
放回地从盒子里取3个球,那么白球数目X服从二项
分布
P( X k ) C3k pk (1 p)3k
X
0 1 23
P=1/4 时 P{X=k} 27/64 27/64 9/64 1/64
数理统计的基础知识
基本概念 总体 样本 统计量
基础理论
总体分布
样本分布
抽样分布
数理统计学 (mathematical statistics)就是研究统 计量(statistic) 一门学问; 研究如何将样本加工成适 当的统计量, 研究如何利用统计量及其抽样分布对总 体作统计推断的一门学问.
正态总体的抽样分布
(2) 设连续型总体 X 的概率密度函数为 f (x; ) ,则样本
( X1, X 2,, X n ) 的联合概率密度函数
n
f (x1; ) f (x2 ; ) f (xn ; ) f (xi ; ) i 1 n
仍称为似然函数,并记之为 L( ) L(x1, x2,, xn; ) f (xi; ) . i 1