3参数估计

合集下载

三章参数估计ParametricEstimation

三章参数估计ParametricEstimation

会有多项分布,
p( x1,..., xm | p1,..., pm )
n!
m
m
p
xi i
xi ! i1
i 1
m
m
l ( p1,..., pm ) log( n!) log xi! xi log pi
i 1
i 1
m
pi 1
i 1
m
m
m
l( p1,...,pm,) log(n!) logxi! xi logpi ( pi 1)
1.点估计的基本概念(Point Estimator)
点估计: 就是由样本x1,x2,…xn确定一个统计量
gx1,x2,,xn
用它估计总体的未知参数,称为总体参数的估 计量。当具体的样本抽出后,可求得出样本统 计量的值。用它作为总体参数的估计值,称作 总体参数的点估计值。
2.两种基本的点估计方法
• (1)总体的方差越大,需要的样本量越大。 • (2)样本量n和置信区间长度的平方成反比。 • (3)置信度越高,样本量越大。
样本量的确定
需要考虑问题:
➢ (1)要求什么样的精度?即我们想构造多宽的区间? ➢ (2)对于构造的置信区间来说,想要多大的置信度?即我
k
阶中心矩。
矩法估计: V ^ k Ak, U ^ k Bk
这 是k包 个含 未 知 1, 参 , k 数 的 联 立 方
A1 11 ,2 , ,k
A2
21 ,2 , ,k
Ak k 1 ,2 , ,k
从中解出方,记 程为 组 ˆ1, 的 ,ˆ解 k,即
ˆˆ21
ˆ1 ˆ2
X1 ,X2 X1 ,X2
置信区间的含义
样本分布 /2

参数估计三要素

参数估计三要素

参数估计三要素参数估计是统计学中非常重要的一部分,它涉及到如何通过样本数据来得到总体参数的估计值。

而参数估计的实质就是利用样本信息来推断总体信息。

在进行参数估计的过程中需要掌握三要素,分别是点估计、区间估计以及最小二乘估计。

一、点估计点估计就是通过样本数据,估计总体参数的具体数值,也就是说利用样本数据来估计总体参数的单个值,这个单个值有可能等于总体参数,但也有可能不等于总体参数。

因为样本数据是有误差的,并且不能代表总体,所以点估计得到的估计量只是在数值上比较接近总体参数,而不是完全等于总体参数。

常见的点估计方法有矩估计和最大似然估计。

矩估计就是通过样本的前几个矩来估计总体参数的值,并且要求估计量是样本矩的函数。

最大似然估计是通过知道样本中观测值的概率分布,来确定估计量的值。

而在实际应用中,矩估计和最大似然估计常常同时使用,这样能够提高估计量的精确度。

点估计通过样本数据,确定总体参数的具体数值,它有其实际意义,但在实际应用中不能确定它的准确性。

二、区间估计点估计得到的估计量通常由于样本误差,不能代表总体参数。

在进行参数估计时,我们还需要确定一个区间,使得这个区间内的任一数值均可能是总体参数的真实值,这个区间就是区间估计。

对于总体参数的区间估计,我们可以利用统计量来求解。

如对于正态分布总体,其参数$\mu$,则样本均值是其最佳估计,而其标准差是未知的,所以我们的目的是得到一个包含总体参数的置信区间来进行估计。

假设总体的分布是正态分布,求出样本均值和样本标准差,以及统计学的知识,可以得到一个置信区间。

这个置信区间就是在某个置信水平下,总体参数落在这个区间内的概率为这个置信水平。

总体参数的置信区间是通过样本统计量计算而来的,而这个样本统计量的置信区间大小和置信水平有关,也和样本数量有关。

在实际应用中,当样本数量越大时,区间估计的精度就会越高。

三、最小二乘估计在线性回归分析中,最小二乘估计是一种广泛使用的估计方法。

第三章 参数估计

第三章   参数估计

第三章参数估计重点:1.总体参数与统计量2.样本均值与样本比例及其标准误差难点:1.区间估计2.样本量确实定知识点一:总体分布与总体参数统计分析数据的方法包括:描绘统计和推断统计〔第一章〕推断统计是研究如何利用样本数据来推断总体特征的统计学方法,包括参数估计和假设检验两大类。

总体分布是总体中所有观测值所形成的分布。

总体参数是对总体特征的某个概括性的度量。

通常有总体平均数〔μ〕总体方差〔σ2〕总体比例〔π〕知识点二:统计量和抽样分布总体参数是未知的,但可以利用样本信息来推断。

统计量是根据样本数据计算的用于推断总体的某些量,是对样本特征的某个概括性度量。

统计量是样本的函数,如样本均值〔〕、样本方差〔 s2〕、样本比例〔p〕等。

构成统计量的函数中不能包括未知因素。

由于样本是从总体中随机抽取的,样本具有随机性,由样本数据计算出的统计量也就是随机的。

统计量的取值是根据样本而变化的,不同的样本可以计算出不同的统计量值。

[例题·单项选择题]以下为总体参数的是( )a.样本均值b.样本方差c.样本比例d.总体均值答案:d解析:总体参数是对总体特征的某个概括性的度量。

通常有总体平均数、总体方差、总体比例题·判断题:统计量是样本的函数。

答案:正确解析:统计量是样本的函数,如样本均值〔〕、样本方差〔〕、样本比例〔p〕等。

构成统计量的函数中不能包括未知因素。

[例题·判断题]在抽样推断中,作为推断对象的总体和作为观察对象的样本都是确定的、唯一的。

答案:错误解析:作为推断对象的总体是唯一的,但作为观察对象的样本不是唯一的,不同的样本可以计算出不同的统计量值。

〔一〕样本均值的抽样分布设总体共有n个元素,从中随机抽取一个容量为n的样本,在重置抽样时,共有n n种抽法,即可以组成n n不同的样本,在不重复抽样时,共有个可能的样本。

每一个样本都可以计算出一个均值,这些所有可能的抽样均值形成的分布就是样本均值的分布。

3 第三章 参数估计与非参数估计

3 第三章 参数估计与非参数估计
• Bayes决策需要已知两种知识:
– 各类的先验概率P(ωi)
– 各类的条件概率密度函数p(x|ωi)

P(i | x)
p(x | i ) P(i ) p(x | j ) P( j )
j
知识的来源:对问题的一般性认识或一些训练数据 基于样本两步Bayes分类器设计
利用样本集估计p(ωi)和p(x|ωi)
θ N
argmax ln p( x k | θ)
θ k 1
16
• 最大似然估计计算方法
使似然函数梯度为0
θ H (θ) |ˆ θ ln p( xk | θ) |ˆ 0
ML
N
k 1
ML
θ 1
...
s
T
17
一.类概率密度最大似然估计
7
§3-1 参数估计与监督学习(续2)
下图表示对一幅道路图像按路面与非路面分类可用两种不同做法,其中左图 是在图像中路面区与非路面中各找一个窗口,将其中每个象素分别作为这两 类的训练样本集,用这两个样本集在特征空间的分布参数进行设计。 而无监督学习方法则不同,它不预先选择样本类别的样本集,而是将整幅图 的像素都作为待分类样本集,通过它们在特征空间中表现出来的聚类现象, 把不同类别划分开。 图中有监督学习,样本集分布呈现交迭情况,而无监督学习方法由于没有类 别样本指导,无法确定它们的交迭情况,只能按分布的聚类情况进行划分。
N 1 估计值: 1 Xk N k 1
1 N 2 Xk N k 1

Xk

T
结论:①μ的估计即为学习样本的算术平均
②估计的协方差矩阵是矩阵

p-3型分布参数估计

p-3型分布参数估计

X p X (1 cV p )
• 例3-2 已知某站年最大洪峰流量系列的平均 x=825m3/s,Cv=0.4,Cs=1.0,求p=1%的设计 值。 解:由Cs=1.0,查附表4,得p=1%的 Фp=3.02,则 X p X (1 cV p ) =825×(0.4×3.02+1)=1822
我国2020世纪世纪6060年代以来通过对洪年代以来通过对洪水极值资料的验证水极值资料的验证认为认为pp型能较好拟合我国大多数型能较好拟合我国大多数河流的洪水系列因此我国水利水电工程水文计算规范河流的洪水系列因此我国水利水电工程水文计算规范推荐采用该分布
第7章 估计理论
§7-3 P-Ⅲ型分布参数的估计
例如,对于p=90%的枯水流量,则T=10年,称此为十年一 遇枯水流量,表示小于等于这样的流量平均10年会遇到一次。
3、理论频率曲线 PⅢ型分布
x a0 1 e ( xa0 ) f ( x) ( )

4 C s2
2 xCV C s
2CV a 0 x 1 Cs
1 n 均值 x 的无偏估计: x xi n i 1
Cv的无偏估计量:
Cs 的无偏估计量:
Ki
xi x
模比系数
2. 现行水文频率计算——适线法 适线法(或称配线法)是以经验频率点据为基础, 在一定的适线准则下,求解与经验点据拟合最优的频 率曲线参数,得到一条理论频率曲线。 目估适线法、优化适线法 目估适线法: (1)将实测资料由大到小排列,计算各项的经验频率, 在频率格纸上点绘经验点据(纵坐标为变量取值,横 坐标为对应的经验频率)。 (2)选定水文频率分布线型(一般选用PⅢ型)。 (3)假定一组参数 x 、Cv、 Cs。为了使假定值大致接 近实际,可用矩法求出3个参数,作为3个参数第一次 的假定值。估计时,因Cs 的抽样误差太大,

三参数、四参数曲线拟合..

三参数、四参数曲线拟合..

四参数拟合的经典算法简介
牛顿法:该方法是基于一阶泰勒展开与误差修正技 术相结合的产物,搜索终止的判据可以是参数增量, 或残差平方和。 顺序搜索法:顺序对每一个参数在初始值上使用增 量搜索法寻找其最优点。
牛顿法简介
牛顿法是对方程四个参数求偏微分,得到E对给 定系数的增量的泰勒级数展开式。用增量对初始值 进行校正,以此方法进行多次迭代,直到相关系数 不再增大,或者设定一个迭代的次数,就可以得出 四个值的最终结果。
D(0)-C p=arcsin( ) A
四参数拟合的算法
四参数拟合有很多种算法。IEEE学会在标准 IEEE std1057-2007 IEEE Standard for Digitizing Waveform Recorders 的 Annex A 中给出了一种方 法,包括两种基本算法:一种通过矩阵运算,另一 种通过迭代过程,二者均需要良好的初始条件估计。
cos(n ) sin(n ) 1
三参数拟合算法示例
残差平方和用矩阵表示为:
T E=E(ω )=(y-Mx0 )(y-Mx ) 0
当式E最小时可得 x0 的最小二乘解为:
x0 =(M T M)-1(M Ty)

拟合函数的幅度和相位表达形式为:
y(i)=Ccos(ω i+θ )+D
其中:
谢 谢!
数学上,幅度、频率、相位和直流偏移4个参数 可以唯一确定一条正弦曲线。曲线拟合的目的就是 通过分析输入的正弦信号,得到正弦波形的四个参 数值,从而得到拟合曲线。
在已知输入正弦波形的前提下,怎样确定它的4 个参数呢?
正弦曲线拟合的总体思路
主要是通过改变拟合正弦函数的幅度、频率、 相位和直流偏移,使拟合函数和采样序列各点的残 差平方和最小,从而获得正弦波形序列最小二乘拟 合结果。

概率论与数理统计实验实验3参数估计假设检验

概率论与数理统计实验实验3参数估计假设检验

概率论与数理统计实验实验3 参数估计假设检验实验目的实验内容直观了解统计描述的基本内容。

2、假设检验1、参数估计3、实例4、作业一、参数估计参数估计问题的一般提法X1, X2,…, Xn要依据该样本对参数作出估计,或估计的某个已知函数.现从该总体抽样,得样本设有一个统计总体,总体的分布函数向量). 为F(x, ),其中为未知参数( 可以是参数估计点估计区间估计点估计——估计未知参数的值区间估计——根据样本构造出适当的区间,使他以一定的概率包含未知参数或未知参数的已知函数的真?(一)、点估计的求法1、矩估计法基本思想是用样本矩估计总体矩.令设总体分布含有个m未知参数??1 ,…,??m解此方程组得其根为分别估计参数??i ,i=1,...,m,并称其为??i 的矩估计。

2、最大似然估计法(二)、区间估计的求法反复抽取容量为n的样本,都可得到一个区间,这个区间可能包含未知参数的真值,也可能不包含未知参数的真值,包含真值的区间占置信区间的意义1、数学期望的置信区间设样本来自正态母体X(1) 方差?? 2已知, ?? 的置信区间(2) 方差?? 2 未知, ?? 的置信区间2、方差的区间估计未知时, 方差?? 2 的置信区间为(三)参数估计的命令1、正态总体的参数估计设总体服从正态分布,则其点估计和区间估计可同时由以下命令获得:[muhat,sigmahat,muci,sigmaci] = normfit(X,alpha)此命令以alpha 为显著性水平,在数据X下,对参数进行估计。

(alpha缺省时设定为0.05),返回值muhat是X的均值的点估计值,sigmahat是标准差的点估计值, muci是均值的区间估计,sigmaci是标准差的区间估计.例1、给出两列参数?? =10, ??=2正态分布随机数,并以此为样本值,给出?? 和?? 的点估计和区间估计命令:r=normrnd(10,2,100,2);[mu,sigm,muci,sigmci]=normfit(r);[mu1,sigm1,muci1,si gmci1]=normfit(r,0.01);mu=9.8437 9.9803sigm=1.91381.9955muci=9.4639 9.584310.2234 10.3762sigmci=1.68031.75202.2232 2.3181mu1=9.8437 9.9803sigm1=1.91381.9955muci1=9.3410 9.456210.3463 10.5043sigmci1=1.6152 1.68412.3349 2.4346例2、产生正态分布随机数作为样本值,计算区间估计的覆盖率。

加速寿命试验三参数威布尔分布的极小变异-极大似然估计

加速寿命试验三参数威布尔分布的极小变异-极大似然估计

装备环境工程第20卷第5期·12·EQUIPMENT ENVIRONMENTAL ENGINEERING2023年5月加速寿命试验三参数威布尔分布的极小变异-极大似然估计马小兵,刘宇杰,王晗(北京航空航天大学 可靠性与系统工程学院,北京 100191)摘要:目的在加速试验中,对寿命服从三参数威布尔分布的产品进行可靠性评估与寿命预测,解决形状参数小于1时传统方法难以计算的问题。

方法利用三参数威布尔分布与指数分布之间的转换关系,以变异系数误差最小为优化目标,在确定最优位置参数估计值的基础上,应用拟极大似然方法估计分布模型中的其余参数,建立极小变异–极大似然估计(MV-MLE)。

根据加速寿命试验中失效机理不变的原则,在失效机理等同条件下,将该方法推广至多应力水平下的可靠寿命评估。

结果在单一应力与多应力水平下,通过仿真模拟验证了所提方法的有效性。

与传统方法相比,在小样本条件下,所提方法可提高形状参数(机理等同性参数)估计精度40%以上。

结论所提方法对于三参数威布尔分布的参数估计和寿命评估具有较高精度,能够有效克服传统方法的不足,在加速寿命试验评估中具有良好的应用效果。

关键词:三参数威布尔分布;变异系数;加速寿命试验;机理等同性;可靠性评估;寿命预测中图分类号:TB114 文献标识码:A 文章编号:1672-9242(2023)05-0012-07DOI:10.7643/ issn.1672-9242.2023.05.003Minimum Variation-Maximum Likelihood Estimation of Three-parameterWeibull Distribution under Accelerated Life TestMA Xiao-bing, LIU Yu-jie, WANG Han(School of Reliability and Systems Engineering, Beihang University, Beijing 100191, China)ABSTRACT: The work aims to estimate the reliability and predict the lifetime of the products subject to three-parameter Weibull distribution under accelerated life test, so as to solve the problem that the traditional methods are difficult to complete the calculation when the shape parameter is less than 1. Through the conversion relationship between three-parameter Weibull distribution and exponential distribution, the best estimated value of the location parameter was determined with the error of co-efficient of variation as the optimization objective. Then, the analogue maximum likelihood method was used to estimate the remaining parameters of the Weibull distribution, based on which the minimum variation-maximum likelihood estimation收稿日期:2023–04–13;修订日期:2023–05–04Received:2023-04-13;Revised:2023-05-04基金项目:国家自然科学基金(72201019,52075020);可靠性与环境工程技术重点实验室项目(6142004210105);国防技术基础项目(JSZL2018601B004)Fund:The National Natural Science Foundation of China (72201019, 52075020); Reliability and Environmental Engineering Science & Tech-nology Laboratory (6142004210105); Basic Technical Research Project of China (JSZL2018601B004).作者简介:马小兵(1978—),男,博士。

数据模型决策-统计学3-参数估计

数据模型决策-统计学3-参数估计
W /n
均值和方差
若T ~ t(n) ,则 E(T ) = 0
D(T ) = n (n > 2) n−2
第3t 分章布与参正数态分估布计的比较
第3章 参数估计
(4) t分布(Students 分布)
性质:
当n很大时,
lim f (t) =
n→∞
1
− t2
e2

此时,tα/2≈uα/2,t 分布近似标准正态分布
2分布,即
V ~ χ 2 (n1) , W ~ χ 2 (n2,)
则随机变量 F = V / n1 W / n2
服从F分布, n1,n2分别是它的第一自由度和第二自由度,
且通常记为 F ~ F (n1, n2 )
第3章 参数估计
第3章 参数估计
(3) F分布
F分布查表

∫ P(F > Fα ) = Fα f (x)dx = α (0 <α < 1)
第3章 参数估计
抽样与抽样分布 点估计 区间估计 样本容量的确定
第3章 参数估计
3.1 抽样与抽样分布
总体由研究对象的全体所组成。 样本是总体中的部分元素所组成的集合。
有限总体和无限总体 无放回抽样和有放回抽样
简单随机抽样(x1, x2,…, xn):
简单随机抽样是指从总体中抽取样本容量为n 的样本时,x 1, x2,…, xn这n个随机变量必须具备以下两个条件:
与 t 分布有关的理论通常称为“小样本理论”
查表问题: P{t(n) > tα (n)} = α
第3章 参数估计
P(t(7)>1.8946)=0.05
第3章 参数估计
(5) 样本平均数的抽样分布

经典参数估计方法(3种方法)

经典参数估计方法(3种方法)

经典参数估计方法:普通最小二乘(OLS)、最大似然(ML)和矩估计(MM)普通最小二乘估计(Ordinary least squares,OLS)1801年,意大利天文学家朱赛普.皮亚齐发现了第一颗小行星谷神星。

经过40天的跟踪观测后,由于谷神星运行至太阳背后,使得皮亚齐失去了谷神星的位置。

随后全世界的科学家利用皮亚齐的观测数据开始寻找谷神星,但是根据大多数人计算的结果来寻找谷神星都没有结果。

时年24岁的高斯也计算了谷神星的轨道。

奥地利天文学家海因里希.奥尔伯斯根据高斯计算出来的轨道重新发现了谷神星。

高斯使用的最小二乘法的方法发表于1809年他的著作《天体运动论》中。

法国科学家勒让德于1806年独立发现“最小二乘法”,但因不为世人所知而默默无闻。

勒让德曾与高斯为谁最早创立最小二乘法原理发生争执。

1829年,高斯提供了最小二乘法的优化效果强于其他方法的证明,因此被称为高斯-莫卡夫定理。

最大似然估计(Maximum likelihood,ML)最大似然法,也称最大或然法、极大似然法,最早由高斯提出,后由英国遗传及统计学家费歇于1912年重新提出,并证明了该方法的一些性质,名称“最大似然估计”也是费歇给出的。

该方法是不同于最小二乘法的另一种参数估计方法,是从最大似然原理出发发展起来的其他估计方法的基础。

虽然其应用没有最小二乘法普遍,但在计量经济学理论上占据很重要的地位,因为最大似然原理比最小二乘原理更本质地揭示了通过样本估计总体的内在机理。

计量经济学的发展,更多地是以最大似然原理为基础的,对于一些特殊的计量经济学模型,最大似然法才是成功的估计方法。

对于最小二乘法,当从模型总体随机抽取n组样本观测值后,最合理的参数估计量应该使得模型能最好地拟合样本数据;而对于最大似然法,当从模型总体随机抽取n组样本观测值后,最合理的参数估计量应该是使得从模型中抽取该n组样本观测值的概率最大。

从总体中经过n次随机抽取得到的样本容量为n的样本观测值,在任一次随机抽取中,样本观测值都以一定的概率出现。

第五章 t检验 3参数估计 PPT课件

第五章 t检验 3参数估计 PPT课件
5
参数估计 - 区间估计
由于估计量是随机变量,所以一般都带有一 定的随机误差,点估计仅仅给出了参数的一 个估计值,有时候还需要了解这种估计结果 的可靠程度。 用区间的的形式给出未知参数的变化范围, 并赋予一定的概率保证,这便构成了区间估 计的基本思想。
6
参数估计 - 区间估计
设总体X的分布中含有未知参数θ
x
x
~ N(0,1)
标准正态分 布两尾概率 分位点
P(u
x
x
u ) 1
P( x u x x u x ) 1
9
参数估计 - 区间估计
正态总体平均数的区间估计当 2未知 Nhomakorabeax
x
~ N(0,1)
2
(n 1) s
2

确定置信区间的步骤 计算样本平均数 x ; 确定置信水平,一般用 1-α=0.95或0.99, 通过查表可确定分位数; 求出标准误 x ,(σ总体标准差,n n 样本数)。
8
参数估计 - 区间估计
当 2已知
正态总体平均数的区 间估计
x ~ N ( , )
n
2
P( u x x u x ) 1
(5-16)
(5-17)
ˆ 为样本百分数, S 为样本百分数标准误, S 的计算公 其中, P ˆ ˆ P P
式为:
SP ˆ ˆ (1 P ˆ) P n
(5-18)
14
【例 5.10】
调查某地 1500 头奶牛,患结核病的有 150 头,求
该地区奶牛结核病患病率的 95%、99%置信区间。
3
参数估计 - 点估计

三参数weibull分布参数估计的迭代公式

三参数weibull分布参数估计的迭代公式

三参数Weibull分布是一种常用的概率分布模型,它在可靠性工程、生物学、环境科学等领域有着广泛的应用。

而参数估计是统计学中的一项重要任务,它可以帮助我们从收集的数据中推断出未知的参数值,从而更好地理解和预测现象。

在Weibull分布中,参数估计也是一个关键的问题,尤其是对于三参数Weibull分布来说,传统的参数估计方法虽然有效,但并不总是能够得到最优的估计结果。

我们需要一种更加高效、精确的参数估计方法。

1. 三参数Weibull分布的概念在统计学中,Weibull分布是一种连续概率分布,它常用于描述生存分析和可靠性工程中的时间间隔或寿命数据。

Weibull分布的概率密度函数如下:f(x;λ, k, β) = (k/λ) * ((x-β)/λ)^(k-1) * exp(-((x-β)/λ)^k)其中,λ>0为尺度参数,k>0为形状参数,β为位置参数。

当β=0时,称为标准Weibull分布。

2. 三参数Weibull分布的参数估计问题对于给定的Weibull分布,我们常常需要从实际观测数据中估计出λ、k和β这三个参数的值。

传统的参数估计方法包括最大似然估计、矩估计等,但这些方法在实际应用中存在一定的局限性。

对于三参数Weibull分布,最大似然估计方法通常需要求解一个复杂的非线性方程组,而且可能受到初始值选择的影响,导致估计结果不稳定。

我们需要一种更加高效、精确的参数估计方法。

3. 基于迭代的参数估计方法基于迭代的参数估计方法是一种常用的优化方法,它通过迭代优化参数的值,使得目标函数达到最小值或最大值。

对于三参数Weibull分布的参数估计问题,我们可以借鉴这种方法,提出一种基于迭代的参数估计公式。

算法步骤如下:(1) 初始化参数值:设定λ0、k0、β0的初始值;(2) 迭代更新参数值:通过迭代更新λ、k、β的值,直至收敛;(3) 检验收敛性:检验参数估计结果的收敛性。

4. 具体迭代公式的推导对于三参数Weibull分布的参数估计问题,我们可以根据最大似然估计的原理,构建相应的目标函数,并基于此构建迭代公式。

数理统计之参数估计

数理统计之参数估计

X )2 ,
S2
1 n1
n
(Xi
i 1
X )2,试
比较 E(Sn2 - σ2)2 与 E(S 2 - σ2)2.
解: 由于
(n 1)S 2
2
~
2 (n 1)

(n 1)S 2
2
2(n 1)
(n 1)2
4
D(S 2 ),D(S 2 )
2
n1
4
D(Sn2 )
D( n 1 S2 )
j
j
解出似然估计 ˆjL ˆjL( X1, , Xn ).
否则可通过单调性或放大缩小的方法直接推求.
极大似然估计的性质:
(1) 若(^θ1, …, ^θm)是(θ1, …, θm)的极大似然计, η = g(θ1, …, θm)存在单值反函数,则g(θ^1, …, ^θm)是g(θ1, …, θm)的极大似然估计.
设X1,…,Xn 是来自总体 X 的样本,则
μk = E(Xk )= ∑ xk p(x; θ1, θ2), X 为离散型

μk = E(Xk )= xk f (x; θ1, θ2)dx,
X 为连续型
Ak
1 n
n i 1
Xik
1 n
X
k 1
1 n
X
k 2
1 n
X
k n
矩法思想: 用样本矩Ak 作为总体同阶矩μk 的近似,
例 设某种设备的寿命X (小时)服从指数分布,概
率密度为
et , t 0
f ( x; )
0,
其他
其中 λ>0为未知参数. 现从这批设备中任取n台在t =0
时刻开始寿命试验,试验进行到预定时间T0 结束, 此时有 k(0< k < n)台失效,求

含约束条件遗传算法在三参数威布尔分布参数估计中的应用

含约束条件遗传算法在三参数威布尔分布参数估计中的应用

[作者简介]!方华元,硕士研究生![收稿日期]!"##$"#%"&%[文章编号]!&##’"&%##("##()#("##%""#)含约束条件遗传算法在三参数威布尔分布参数估计中的应用方华元#,$胡昌华#,$曹小平%,$陈$伟#(#!第二炮兵工程学院,西安$&#’’%(;%!国防科技大学,长沙$)#’’&*)[摘$要]$为解决三参数威布尔分布参数估计问题,根据极大似然法基本思想建立了参数估计最优化模型!分别采用内点法和外点法,将有约束优化问题转化为无约束优化问题,再利用遗传算法优化工具箱进行优化计算,获得了参数估计值!实例结果说明,这种方法能很好地解决三参数威布尔分布的参数估计问题![关键词]$威布尔分布;$参数估计;$遗传算法;$惩罚函数[中图分类号]$+,&-’$$$$$$$$$$$$$[文献标识码]$.*+,-./012,-./,-343567899:/8/.9,982;9-<=00>-2,8-<=,-34?/29@34A949,-B C0D38-,7.E-,7F342,8/-42/0123405401#,$3467012740#,$6089:08;:12%,$67<1=<:#(#!+7<><?81@.AB:CC<A5D12:1<<A:12E1FB:B4B<,9:’01$&#’’%(,67:10;%!G0B:810C H1:I<AF:B58J K<J<1F<+<?718C825,67012F70$)#’’&*,67:10)C<2,8/B,:L<1<B:?0C28A:B7M (L.):F 01<JJ<?B:I<M<B78@B8F<0A?7B7<2C8N0C 8;B:M0C A<F8C4B:81!EB :F ;A8;8F<@B70B ;41:F7M<1B J41?B:81:F 4F<@B8A<0C:O<L.P:B7?81FBA0:1F ,01@B7<M<B78@:F A<0C:O<@N52<1<B:?0C28A:B7M 8;B:M:O0B:81B88CN8Q (L.R+)!.B C0FB ,B7:F M<B78@:F 0;;C:<@B8<FB:M0B<B7A<<;0A0M<"B<AF =<:N4CC @:FBA:N4B:81,01@B7<A<F4CB F78PF B70B :B :F <JJ<?B:I<!G9HE38@2:=<:N4CC @:FBA:N4B:81;$;0A0M<B<A <FB:M0B:81;$2<1<B:?0C28A:B7M ;$;41:F7M<1B J41?B:81&!引言三参数威布尔分布是一种较为完善的分布,在可靠性寿命分析中得到了广泛应用!如何由样本估计三参数威布尔分布的参数是工程中的一个重要问题,常用方法是极大似然法和图估计法进行参数估计!传统的极大似然法精度高,但一般要用迭代法求解联立的超越方程,相当复杂;此外,极大似然法的许多优良性质,由于三参数威布尔分布不满足通常的正则条件而不再成立,导致有时极大似然估计不存在或有多个解[#],为此人们一直在探讨三参数威布尔分布的参数估计问题!遗传算法(2<1<B:?0C28A:B7MF ,L.)是一种基于自然选择原理和自然遗传机制的搜索寻优算法,它在计算上模拟生物进行机制并在人工系统中实现特定目标的优化[%]!在三参数威布尔分布参数估计过程中,依据极大似然法的基本思想,建立有约束的非线性最优化模型,利用惩罚函数法与遗传算法相·%*·战术导弹技术$+0?B:?0C S:FF:C<+<?718C825$G8I<MN<A ,%’’-,(-):*%T *(万方数据结合的方法对建立的最优化模型进行优化计算,实现模型参数的优化估计!!"带约束条件的优化算法约束优化问题的传统解法包括随机试验法、随机方向法等弱搜索方法以及拉格朗日乘子法、惩罚函数法等强搜索方法!遗传算法是一种启发式的随机搜索方法,它仿效生物的进化与遗传,根据“生存竞争”和“优胜劣汰”的原则,使所要解决的问题从初始解逐渐逼近最优解!它的全局搜索性能要好于局部搜索算法,而且搜索效率高于随机搜索,遗传算法是弱搜索方法与强搜索方法的折衷!弱搜索方法的搜索效率低下,"#优于弱搜索方法在于利用遗传算子能启发式地自适应搜索到全局最优点的较小区域!因此,将弱搜索方法与"#结合意义不大!而强搜索方法则是利用梯度等确定性信息引导搜索,其优点是搜索效率高,缺点是容易陷入局部解,优化结果一般与初始值的选取有关,不同的初值可能导致不同的结果!"#优于强搜索方法在于不偏向于局部最优点!因此,将"#与强搜索方法相结合求解约束优化问题是现实可行的!本文中采用遗传算法与惩罚函数相结合的方法来求解约束优化问题!惩罚函数法[$]是解非线性约束优化问题常用的一种方法!它根据约束的特点构造某种惩罚函数,并把它加到目标函数中去,使约束问题的求解转化为一系列无约束问题的求解!对无约束问题求解过程中违反约束的迭代点给以很大的目标函数值,从而迫使这一系列无约束问题的极小点逐渐收敛于约束问题的极小点!惩罚函数法包括外部惩罚函数法(外点法)和内部惩罚函数法(内点法)!!!#"外点法外点法的基本思想是对违反约束的点在目标函数中加入相应的“惩罚”,而对可行点不予惩罚!此方法的迭代点一般在可行域外部移动!对于一般约束优化问题:%&’!(")(!)*#$(")$+,$%,,-,…,&;’$(")%+,(%,,-,…,)*(,)**可以定义如下辅助函数:+(",!)%!("),!-("),-(")%!&$%,[%./{+,.#$(")}]",!)(%,/’((")/#*(-)其中,"和#$,,且均为常数;!是一较大的合适整数*这样就可以把约束问题转换为无约束问题!!!!"内点法内点法是在可行域的内部迭代求解约束问题,这类方法不适用于带有等式约束的问题!对于一般约束优化问题:%&’!(")#$(")$+,$%,,-,…,&*($)**可行域记为0%{"/#$(")$+,$%,,-,…,&}***保证迭代点在可行域内部的情况下,可定义如下辅助函数:1(",2)%!("),23(")*(0)**把约束问题转化为无约束问题!3(")在实际中常采用倒数罚函数!&$%,,4#$(")和对数罚函数!&$%,1’#$(")*其中,2是一适当小的正数!在求解约束优化问题时,可以用上述惩罚函数法将有约束问题转化为无约束问题,然后再调用遗传算法工具箱进行优化计算!$"三参数威布尔分布参数估计的极大似然法[%2&]极大似然法的基本思想就是建立一个似然函数,然后极大化该似然函数!由于数据截尾方式的不同,建立似然函数的模型也是不尽相同的,但是极大似然法能够提供一种完全似然函数[-],可以同时处理完全失效数据、左删失数据3间隔数据和右删失数据!假设某部件的寿命试验数据服从三参数威布尔分布,其完全极大似然函数可表示如下:**5%"6$%,!(7$;#,$,%)#"8(%,[,.+(9(;#,$,%)]*#":;%,[+(<;=;#,$,%).+(<;5;#,$,%)]*(4)因为式(4)恒大于零,故可以对式(4)两边取自然·$$·战术导弹技术*).56&5.17&88&19)95:’;1;<=*>;?9%@9A,-++B,(B)万方数据对数,即!"!"!#$"#!"[%(&$;!,",#)]’"()"#!"[#*+(,);!,",#)]’"-."#!"[+(/.0;!,",#)*+(/.!;!,",#)]1($)式(%)和($)中,#为部件完全失效数;(为右删失数;2为左删失或者间隔删失数;&$为完全失效数据的第$次失效时间;,)为右删失数据的第)次删失时间;/.!为第.个删失数据的开始时间;/.0为第.个删失数据的结束时间;%为失效率函数;+为失效分布函数;!,",#分别为三参数威布尔分布的形状参数、尺度参数和位置参数1传统极大似然函数法的做法就是对似然函数两边取对数,然后对对数似然函数分别取三个参数的导数,建立似然方程组,即*!"!*!"&,*!"!*""&,*!"!*#"&1(’)((式(’)为复杂的超越方程组,求解过程相当复杂)在*+,-."/01234."迭代法求解似然方程组的过程中,需要计算二阶偏导数矩阵,特别是还要求逆矩阵,而且当5+4461"矩阵3(4)是奇异矩阵时,它的逆矩阵[3(4)]*不存在,使得方法失效1这个方法的另一个问题是,目标函数的最大值和最小值都满足迭代终止条件+(%(45)+"$,因此,我们最后得到的结果有可能是最大值,也可能是最小值1可见,传统方法在似然方程组的求解中是不能令人满意的)下面我们采用极大似然法的基本思想建立最优化模型)!"最优化模型的建立受文献[$]启发,依据极大似然法的基本思想,建模过程如下:设4"[4#,47,48]6"[#,!,"]为决策变量,由三参数威布尔分布三个参数的物理意义知,&"#7&#,&7"7&8,&7!7%[%]196"%(4)"*{"#$"#!"[%(&$;!,",#)]’"()"#!"[#*+(,);!,",#)]’("-."#!"[+(/.9;!,",#)*+(/.!;!,",#)]}1((:);)<&"4#7&#;&7477%;&748"&8{11((可见,该模型是一个有约束条件的非线性最优化问题)#"应"用#)$"基于外点法的遗传算法仿照式(7),建立如下辅助函数:+"*{"#$"#!"[%(&$;!,",#)]’"()"#!"[#*+(,);!,",#)]’"-."#!"[+(/.0;!,",#)*+(/.!;!,",#)]}’:#4#(&#*4#)’:747(%*47)’:848(&8*48)1(=)即将带约束的优化问题转化为无约束优化问题,然后调用遗传算法工具箱(>?@<)[$],即可求得威布尔分布的三个参数)其中,:#,:7和:8是惩罚因子,需要根据经验选取)#)%"基于内点法的遗传算法仿照式(A ),建立如下辅助函数:;"*{"#$"#!"[%(&$;!,",#)]’"()"#!"[#*+(,);!,",#)]’"-."#!"[+(/.9;!,",#)*+(/.!;!,",#)]}’5#<(4#(&#*4#))’57<(47(%*47))’58<(48(&8*48))1(#&)即将带约束条件的优化问题转化为无约束优化问题,然后调用遗传算法工具箱(>?@<)[$],即可求得威布尔分布的三个参数)其中,5#,57和58是惩罚因子,需要根据经验选取)#)&"应用实例在某部件的寿命试验中,共有%$个数据,即8=%$)A7,A&&A )#:,A&#=)$#,A8%%)&%,A8%%)A&,·A 8·战术导弹技术(<1B-6B1!C6446!+<+B3".!.DE(*.F+9G+H ,7&&$,($)万方数据表!"基于外点法的遗传算法威布尔分布参数优化估计结果!!#$%&’()*!+!"!!$))%##$’++#)$)+)##$(((#%$)++#*$)(%#’$’**#($’&$#&$’()#($*!)##$(’*#’!#!#+’%+!#!($&!#+*&%!#!+)*!#!#(&!#+’!(!#!(&(!#!))%!#!&*&!#+#’&!#!!)!!$%$$%#%%#!(#%%$%##!%%$+%%%(%##(%*%)#’%(+(#%%’#’#$%#(!#)%%&&##表#"基于内点法的遗传算法威布尔分布参数优化估计结果!!#$%&’()*!+!"!!$)))#)$)&’#%$*#!#$$*!%##$*&%#($)(*#&$)(%##$*#’#%$*%+#)$*#+#’$*+(#(!#!#+*)#!#+(%!!#+&(%!#+#&’!#++$)!#+)+’!#+)%#!#++’$+#**(&!#+++%!#+%#)!$%#%*#’%#!(#%%!!&#+%!#!#($*(+#(%!#)#$%++!#&%+!(#(%++&#&%+’+#(%+))#)(下转第%%页)%$(’,+!,%$*!,(*,%%)(,’),%($’,’(,%($’,’(,%*$*,)&,%*’$,’#,&##+,!*,&$&$,%!,&$(#,(#,&%!),+%,&%%%,!!,&’+$,!(,&’*),!+,&(%’,!(,&)%$,&#,’!(&,!%,’!*(,%!,’#%*,’*,’#(*,(’,’#(*,(’,’&(#,(%,’(%+,%),’))(,’&,(!)$,+*,(#+*,++,(#+*,++,(#+*,+*,(#+*,++,($’’,%+,(&)!,’%,(&)!,’%,(&)!,’%,(&)!,’%,(’%&,&*,)#%’,++,)&**,(+,)(!$,*(,)*$’,$%,*+%%,##,!!**+,&*,!##$(,(!,!#%++,$!,!#%++,$!,!#&&+,+!,!$!*),($,!$*%(,(),!&&&(,!#,!(’%’,!#,!*)%),#$,#$!**,+(,这&’个数据均是失效数据(本文方法同样可以应用于存在截尾数据的情形),由第$节得如下优化模型:-./$(!)%"!&’%!0/[$((’;!,",#)]#1,2+"!!)$*&’#%#;+)!#)&;+)!$"#$!**#+({#则基于外点法的辅助函数为*%"!&’%!0/[$((’;!,",#)]+,!!!($*&’#%#"!!)+,#!#(&"!#)+,$!$(#$!**#+("!$)#""基于内点法的辅助函数为-%"{!&’%!0/[$((’;!,",#)]+.!!!($*&’#%#"!!)+.#!#(&"!#)+.$!$(#$!**#+("!$)}#""由于遗传算法的初始种群选取具有随机性,为尽量消除其对最终参数估计结果的影响,我们将!+次遗传算法的优化结果的平均值作为最后的参数估计结果,其基于外点法的遗传算法参数优化估计结果如表!所示,基于外点法的遗传算法参数优化估计结果如表#所示,可见,基于外点法的遗传算法求得威布尔分布的三个参数估计值分别为#3%$(’*#’,!3%!#!!)!,"3%%%&&###基于内点法的遗传算法求得威布尔分布的三个参数优化估计值分别为#3%$*+(#(,!3%!#+%#),"3%%+))#)#""我们以均方差/作为衡量准则,来分析比较基于外点法和内点法求得的参数估计值的精度#/定义如下:/%!0!0’%![*((’;#3,!3,"3)"*0((’)]##""由上述得/外点法%+#++#!1/内点法%+#++!%#""均方差越小,则分布对数据拟合越好,参数估计值的精度越高,因此,基于内点法的参数估计值精度高于基于外点法的参数估计值,我们以基于内点法的参数估计值作为参数估计值,依据文献[’]获得的三个参数分别为·&$·战术导弹技术"2456.5407.88.09295:/;0;<=">;?9-@9A ,#++’,(’)万方数据表!"预测结果分析故障时间!#年!$%&’可靠度点估计%$(%))预测的导弹贮存可靠度值模型*%$(’+,模型!%$(’+-预测可靠度绝对误差模型*%$%’,*模型!%$%’,!通过回报计算以及预测分析可以看出,这两种方法虽然建模思路不同,但最终结果是一致的,并且都比较准确地拟合了可靠度并有较好的预测结果$同时,可以看出,模型得到的结果比实际测得的数据偏大,因为没有考虑检测间隔之间的更换率随服役年限的变化而变大,模型在二元线性回归计算时用常量!计算带来了结果偏大的缘故$与文献[-]所得结果相比,文献利用到!$%&’年共*%组记录数据所得的测试率""%#)(&*,而本文(只利用前+组记录数据)所得为""%#-!,%,可见一组数据对模型结果影响较大#文献[-]中通过实例得到模型的测试率",就判定测试率偏小的可信度值得怀疑$!"结束语采用本文介绍的方法和建立的模型,可以直接根据检测结果给出产品的可靠度水平和可靠性预测模型,形式上比较简单,所采用的方法也不难实现,所得结果比较可信,所以适合于在工程上应用$[参"考"文"献][*]"韩庆田,刘梦军$导弹贮存可靠性预测模型研究[.]$战术导弹技术,!%%!,(’)$[!]"陈迪,周百里,费鹤良$导弹系统贮存可靠性预测的数学模型[.]$宇航学报,*++-,*((’)$[’]"胡昌寿,等编$航天可靠性设计手册[/]$北京:机械工业出版社,*+++$[)]"贺国芳,主编$可靠性数据的收集与分析[/]$北京:国防工业出版社,*++,$[,]"王宇翔,王国华,袁洪$定检对导弹引信系统可靠性的影响分析[.]$可靠性与环境适应性理论研究,!%%’,())$[-]"孙亮,徐廷学,代莹$基于定期检测的导弹贮存可靠性预测模型[.]$战术导弹技术,!%%),())$(上接第’,页)#0"’&(,#),$0"*#%)-&,%0")*,%#+#""与基于内点法的参数估计值比较接近,这也说明了基于内点法的参数估计值精度更高$!"结"论在三参数威布尔分布的参数估计中,用123456法或拟123456法求解时,其收敛性和稳定性对参数真值和初始值具有很大的依赖性,初始值的选取不当常常导致不收敛或收敛到局部极大(极小)值点,甚至鞍点$遗传算法可以很好地克服局部最优解的陷阱,搜索得到全局最优解$本文研究的带约束条件的遗传算法在三参数威布尔分布参数估计中的应用,能体现遗传算法寻优速度快、收敛快以及全局寻优的特点,很好地解决了三参数威布尔分布极大似然法参数估计问题$[参"考"文"献][*]"72856$9$:$/;<=8>87=?2@=A55B CD4=8;4=56E5F4A2 GAF22H;F;8242FD I2=J>@@K=D4F=J>4=56L;D2B56M26ND5F2B O;8P@2D[.]$G2QA65824F=QD,*+(,,*((!)$[!]"王小平,曹立明$遗传算法———理论、应用与软件实现[/]$西安:西安交通大学出版社,!%%!$[’]"曹卫华,郭正$最优化技术方法及/RG7RL的实现[/]$北京:化学工业出版社,!%%,$[)]"郭小春,尹爱芹$三参数威布尔分布的参数估计[.]$河北农业大学学报,!%%),!((!)$[,]"蒋仁言$威布尔模型族———特性、参数估计和应用[/]$北京:科学技术出版社,*++&$[-]"傅惠民,高镇通$确定威布尔分布三参数的相关系数优化法[.]$航空学报,*++%,**(()$[(]"飞思科技产品研发中心$/RG7RL-$,辅助优化计算与设计[/]$北京:电子工业出版社,!%%’$·))·战术导弹技术"G;Q4=Q;@/=DD=@2G2QA65@5ST"15U28J2F,!%%-,(-)万方数据含约束条件遗传算法在三参数威布尔分布参数估计中的应用作者:方华元, 胡昌华, 曹小平, 陈伟, Fang Huayuan, Hu Changhua, Cao Xiaoping,Chen Wei作者单位:方华元,胡昌华,陈伟,Fang Huayuan,Hu Changhua,Chen Wei(第二炮兵工程学院,西安,710025), 曹小平,Cao Xiaoping(国防科技大学,长沙,410073)刊名:战术导弹技术英文刊名:TACTICAL MISSILE TECHNOLOGY年,卷(期):2006(6)被引用次数:3次1.Lemon G H Maximum Likelihood Estimation for the Three Parameters Weibull Distribution Based on Censored Samples 1975(02)2.王小平;曹立明遗传算法--理论、应用与软件实现 20023.曹卫华;郭正最优化技术方法及MATLAB的实现 20054.郭小春;尹爱芹三参数威布尔分布的参数估计[期刊论文]-河北农业大学学报 2004(02)5.蒋仁言威布尔模型族--特性、参数估计和应用 19986.傅惠民;高镇通确定威布尔分布三参数的相关系数优化法[期刊论文]-航空学报 1990(07)7.飞思科技产品研发中心MATLAB6.5辅助优化计算与设计 20031.赵德让.刘瑞元三参数威布尔分布参数估计的合理性[期刊论文]-青海师范大学学报(自然科学版)2002(3)2.孙丽玢.汤银才.SUN Li-bin.TANG Yin-cai在定时截尾样本下三参数威布尔分布的矩估计[期刊论文]-数学的实践与认识2010,40(22)3.吕箴.姚卫星.Lü Zhen.Yao Weixing小样本下估计疲劳寿命分布的历史数据融合方法[期刊论文]-应用力学学报2008,25(2)4.杨明川.王春秀.YANG Mingchuan.WANG Chunxiu基于相关系数法的数控机床评价模型[期刊论文]-制造技术与机床2010(1)5.陈张荣数控机床故障远程预警与诊断系统[学位论文]20106.胡恩平.罗兴柏.艾志利.HU En-ping.LUO Xing-bai.AI Zhi-li三参数威布尔分布条件下的无线电引信步进应力加速寿命试验与数据处理[期刊论文]-探测与控制学报2000,22(2)7.刘飞.王祖尧.窦毅芳.张为华.LIU Fei.WANG ZuYao.DOU YiFang.ZHANG WeiHua基于Gibbs抽样算法的三参数威布尔分布Bayes估计[期刊论文]-机械强度2007,29(3)8.郭强一种小子样商用飞机系统可靠性评估方法[期刊论文]-噪声与振动控制2010,30(1)9.杨志忠.刘瑞元三参数Weibull分布参数估计求法改进[期刊论文]-工程数学学报2004,21(2)1.张详坡.尚建忠.陈循.张春华.汪亚顺三参数Weibull分布竞争失效场合加速寿命试验统计分析[期刊论文]-兵工学报 2013(12)2.俞金松.程继红.张国导弹定时更换周期决策建模及仿真[期刊论文]-舰船电子工程 2013(8)。

考研数学三(参数估计)模拟试卷1(题后含答案及解析)

考研数学三(参数估计)模拟试卷1(题后含答案及解析)

考研数学三(参数估计)模拟试卷1(题后含答案及解析)题型有:1. 选择题 2. 填空题选择题下列每题给出的四个选项中,只有一个选项符合题目要求。

1.随机变量(X,Y)服从二维正态分布,其边缘分布为X一N(1,1),Y一N(2,4),X与Y的相关系数为pxy=一0.5且概率P{aX+by≤1)=,则( ).A.a=1/2,b=一1/4B.a=1/4,b=一1/2C.a=一1/4,b=1/2D.a=1/2,b=1/4正确答案:D解析:因为(X,Y)服从维正态分布aX+bY服从一维正态分布,又E(X)=1,E(Y)=2,记Z=aX+bY,则E(Z)=E(aX+bY)=a+2b于是显然只有-才成立.因此选项D正确.知识模块:随机变量的数字特征2.假设二维随机变量(X,Y)服从参数为μ1,μ2,σ12,σ22,p的正态分布,如果p由题设可知,X与Y的协方差矩阵是矩阵V的一阶主子式DX=σ2>0,二阶主子式|V|=σ12σ22一ρ2σ12σ22=(1一ρ2)σ12σ22>0因此矩阵V是正定矩阵.应选B.知识模块:随机变量的数字特征3.设随机变量x1~N(0,1),X2一B(),X3服从于参数为λ=1的指数分布,设则矩阵A一定是( ).A.可逆矩阵B.不可逆矩阵C.对称矩阵D.反对称矩阵正确答案:B解析:知识模块:随机变量的数字特征4.X1,X2,…X6是来自正态总体,v(μ,σ2)的样本=( ).A.B.C.D.正确答案:A解析:知识模块:随机变量的数字特征5.若随机变量X服从几何分布,且其数学期望为3,则方差D(X)=( ).A.6B.3C.D.正确答案:A解析:由X服从几何分布及所以知识模块:随机变量的数字特征6.设X—Z(μ,σ2)(σ>0),从总体X抽取样本X1…Xn样本均值为X,样本方差S2,则( ).A.B.C.D.正确答案:C解析:因为E(X)=E(X)=μ,E(S2)=DX=σ2,所以E(X—S2)=E(X)一E(S2)=μ一σ2,故选C.知识模块:随机变量的数字特征7.设X、Y为两相互独立的随机变量,则①E(XY)=E(X)E(Y),②D(X—Y)=D(X)+D(Y),③D(XY,)=D(X)D(Y),④cov(X,Y)=0中一定成立的是( ).A.①②③B.①③④C.①②④D.①②③④正确答案:C解析:因为由数学期望及方差的性质知①②成立;由协方差的定义式展开知④成立.故选C.知识模块:随机变量的数字特征8.设X2,X2,…,Xn相互独立的随机变量,且Xi(i=l,2,…,n)服从于参数为A的泊松分布,则正确答案:解析:由中心极限定理(林德伯格一列维定理)即可得结论.知识模块:大数定律和中心极限定理9.设X1,X2,…,X10是相互独立同分布的随机变量,E(X)=μ,D(Xi)=8(i=l,2,…,10),对于其满足的切比雪夫不等式为.正确答案:解析:故知识模块:大数定律和中心极限定理10.设随机变量X、Y,的数学期望E(X)=E(Y)=0,方差分别为D(X)=1,D(Y),D(Y)=9,相关系数,则由切比雪夫不等式有P{|X+Y|≥8}≤_____.正确答案:1/8解析:∵E(X+Y)=E(X)+E(Y)=0∴由切比雪夫不等式知识模块:大数定律和中心极限定理11.在每次试验中,事件A发生的概率为0.5,利用切比雪夫不等式估计在10( )0次独立重复试验中,事件A发生的次数在400一600之间的概率≥_____.正确答案:解析:设X表示1000次独立重复试验中事件A发生的次数,则A一B(1000,0.5),于是又因为知识模块:大数定律和中心极限定理12.设X2,X2,…,Xn是取自总体,N(μ,σ2)的样本,若是σ2的无偏估计量,则C=( ).A.B.C.D.正确答案:C解析:知识模块:参数估计13.设n个随机变量X1,X2,…,Xn是独立同分布,且,则( ).A.S是σ的无偏估计量B.S是σ的最大似然估计量C.S是σ的一致估计量D.S与X相互独立正确答案:C解析:由辛钦大数定律可知根据依概率收敛的性质可知知识模块:参数估计14.设X2,X3,…,Xn(n≥2)为来自总体N(0,1)的简单随机样本,X为样本均值,S2为样本方差,则( ).A.B.C.D.正确答案:D解析:根据简单随机样本的性质,可知X1,X2,…Xn相互独立且都服从分布N(0,1),于是相互独立都服从X2分布,自由度分别为l与n一1,因此应选D.进一步分析可知选项A、B、C均不正确:知识模块:参数估计15.总体X一N(μ,22),X1,X2,…,Xn为简单随机样本,要使μ的置信度为0.95的置信区间长度不超过1,则至少取样本容量n为( ).A.8B.7C.64D.49正确答案:C解析:因为方差已知,则置信区间的长度为由题设知识模块:参数估计16.设总体X一N(μ,σ2),σ2未知,若样本容量n和置信度1一a均不变,则对于不同的样本观察值,总体均值μ的置信区间的长度( ).A.变长B.变短C.不变D.不能确定正确答案:D解析:则μ的置信度为l—a的置信区间其长度为由于1—a不变,n不变,则tn/2(n—1)不变,置信区间的长度只依赖于S.对不同的样本观察值,Js是不同的,故置信区间的长度不能确定.知识模块:参数估计填空题17.随机变最X服从参数为2的泊松分布,且Y=3X一2,则cov(X,Y)=_____.正确答案:6解析:cov(X,Y)=cov(X,3X一2)=3cov(X,X)=30(X)=3×2=6 知识模块:随机变量的数字特征18.设二维正态变量(X,Y)的边缘分布为X一N(1,22),Y一N(0,1)且pxy=0,则P{X+1,解析:设Z=X+Y,则E(z)=E(X)+E(Y)=1+0=1∵p=0 ∴X、Y,相互独立.∴D(Z)=D(X+Y)=D(X)+D(Y)=4+1=5∴Z一N(1,5),P|X+Y 知识模块:随机变量的数字特征19.已知随机变量X的方差大于0,且Y=2X+1,cov(X,Y)=4,则D(X)=_____.正确答案:2解析:∵1,=2x+1∴pxy=1即知识模块:随机变量的数字特征20.将10双鞋随意分成10堆,每堆2只,以X表示lO堆中恰好配成一双鞋的堆数,则EX=_____.正确答案:解析:记将10双鞋(20只鞋)随意排成一行,l,2为第一堆,3,4为第二堆,如此下去,19、20为第10堆.我们将任意一种排列作为一个基本事件,其总数为20 1.事件Ai=“第i堆两只鞋恰成一双”等价于“从10双鞋任选一双随意放在第2i—1,2i位置上(共有C101×2 1种不同放法)”,余下的18只鞋随意放在其他位置上(共有18 !种放法),由乘法原理知对事件Ai的有利基本事件数为C101×2×18!,所以知识模块:随机变量的数字特征21.从l,2,…,n中任取一数X,再从1,2,…,X中任取一数y,则E(y)=_____.正确答案:解析:y的所有可能取值为l,2,…,n,从而由全概率公式可得y的概率分布为知识模块:随机变量的数字特征22.从正态总体,v(μ,σ2)中抽取一容量为16的样本,S2为样本方差,则正确答案:解析:因故知识模块:数理统计的基本概念23.设X1,X2,X3,X4,X5,X6是来自总体X~,N(0,22)的简单随机样本,且Q=a[(X1+X2+X3)2+(X4+X5+X6)2]一γ2(2),则a=_____.正确答案:解析:知识模块:数理统计的基本概念24.设X1,X2,…,Xn是来自正态总体,N(μ,σ2)的随机样本,其中μ未知,σ2已知,则样本的函数中不是统计量的是_____.正确答案:Xi-μ解析:因Xi-μ中含有未知参数μ,由定义知其不是统计量.知识模块:数理统计的基本概念25.设总体X一N(μ,32),其中μ为未知参数,X1,X2,…,X16为来自总体X的样本,X为样本均值.如果对于检验Hoμ=μo,取拒绝域,在显著水平a=0.05下,k的值为_____.(附φ(1.65)=0.95,φ(1.96)=0.975)正确答案:1.47解析:知识模块:假设检验。

p-3型分布参数估计解读

p-3型分布参数估计解读
0
一、经验频率曲线与理论频率曲线 1. 经验频率计算公式
经验频率曲线由实测资料绘制而成,它是水文频率 计算的基础,具有一定的实用性。 设某水文要素(如年径流量)的实测系列共n项,按 由大到小的次序排列为x1、x2、...、xm、...、xn。经验频 率就是在系列中大于及等于样本xi的出现次数与样本容量 之比值,即
量好,在数理统计中,极大似然法被认为是最
好的方法。
§7-3 P-Ⅲ型分布参数的估计
一、 P-Ⅲ型分布
在水文频率曲线线型选择上,世界各地差异很大, 常用线型达20多种。我国20世纪60年代以来,通过对洪 水极值资料的验证,认为P-Ⅲ型能较好拟合我国大多数 河流的洪水系列,因此我国水利水电工程水文计算规范 推荐采用该分布。 ( x a0 ) 1 e ( x a ) • x a0 P-Ⅲ型分布的密度函数: f ( x) ( )
1 n 均值 x 的无偏估计: x xi n i 1
Cv的无偏估计量:
Cs 的无偏估计量:
Ki
xiห้องสมุดไป่ตู้x
模比系数
2. 现行水文频率计算——适线法 适线法(或称配线法)是以经验频率点据为基础, 在一定的适线准则下,求解与经验点据拟合最优的频 率曲线参数,得到一条理论频率曲线。 目估适线法、优化适线法 目估适线法: (1)将实测资料由大到小排列,计算各项的经验频率, 在频率格纸上点绘经验点据(纵坐标为变量取值,横 坐标为对应的经验频率)。 (2)选定水文频率分布线型(一般选用PⅢ型)。 (3)假定一组参数 x 、Cv、 Cs。为了使假定值大致接 近实际,可用矩法求出3个参数,作为3个参数第一次 的假定值。估计时,因Cs 的抽样误差太大,
3. 统计参数对频率曲线的影响: (1)均值 x 对频率曲线的影响

3参数等级反应模型及其参数估计

3参数等级反应模型及其参数估计

关 键 词 : 参数 等级反应模 型 ; M E E 3 M L / M算 法 ;ie信息量 F hr s
中图分类 号 :P1 T 2 8
文献标 识码 : A
项 目反应理 论 (t epneT er, T 是 现代 教育 心理 测量 领域 中最有 影 响的一 种 测量 理论 , 的一 I m R so s ho I ) e yR 它
题. 因此本 文将 引入 3 数等 级反 应模 型 . 配套 开发 了参数 估计 程序 , 既可 以检验 模型 的合理 性 , 可 以 参 并 这 也 在实践 者认 可这 一模 型的前 提下 , 这一模 型 的实 际应用 提供 便利 . 为
1 3 LG M 模 型 介 绍 P—R
等 级反应模 型是 由 Sm j a ] 出的一个 多 级评分 模 型 , 数等 级 反应 模 型是 基 于该 模 型产 生 的 , a em [提 i 5 3参 其
Vo .4 1 3 No. 2 Ma . 0l r2 O
文章 编 号 : 0 —822 1 )20 1— 1 056 (00 0—170 0 6
3参 数等 级 反 应 模 型 及 其 参 数 估计
陈 青 一 丁树 良 朱 隆 尹 一 许 志 勇4 , , , , ,
( . 西师 范 大 学 计 算 机 信 息 工 程 学 院 , 1江 江西 南 昌 302 ;. 东 交 通 大 学 计 算 机 学 院 , 西 南 昌 30 22 华 江 30 1 3 03
G M( .R _ , 因为其 要求 测验 中每 个 多级 评 分 项 目的等 级 ( 目) R M G M)3 也 J 类 数相 同 , 不 一 定 适合 于处 理 这种 故 类级 数不 一定相 同 的较灵 活 的题 型 . 另外 , 所 周 知 , 众 当题 组 长度 较 短 时 , 将 其看 成 是 多 级评 分 题 然 后用 可 多级评 分项 目反应 模 型处理 H . 由于 目前 尚未 有 含 猜 测 度 的多 级 评 分项 目反 应 模 型 , 以无 法 处 理上 述 J但 所
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

点估计的不足
任何点估计不是对就是错,并不能提供误差情况如何、误差程度 有多大的信息
5
3.2.2 点估计的优良性标准
无偏性
ˆ) 即估计量 ˆ,如果 E ( 设总体的参数为 ,其估计量为 ˆ 是参数 的数学期望等于被估计的总体参数,我们称估计量 的无偏估计量 样本平均数是总体平均数的无偏估计量 无偏性是对估计量的一个常见而重要的要求 无偏性的实际意义是指没有系统性的偏差
3参数估计
1
学时:3 授课内容:参数估计 目的要求:掌握参数估计的基本原理、点估计与区 间估计。 旧知复习:数据搜集整理与SPSS基础
1.调查问卷基本结构如何? 2.数据集中趋势和离散程度可用那些指标表征? 3.如何利用SPSS取得数据的上述指标值?
2
3.1参数估计的基本原理
估计、估计量与估计值

U

2 n 1
~ t n 1
n 1
20
例3.7 大学生平均完成作业时间
某大学从该校学生中随机抽取100人,调查到他们平均每人每天 完成作业的时间为120分钟,样本标准差为30分钟,试以95%的置 信水平估计该大学平均每天完成作业时间。 解: 根据题意可知: =120,S=30,n=100且 =0.95, 2 =1.96 1 的置信区间为 故在95%的置信度下,
相合性/一致性 ˆ( X ,..., X ) 是参数 估计量,若对于任意的 , 设 1 n ˆ( X ,..., X ) 依概率收敛于 ,则称 ˆ 为 的 当n 时 1 n
相合估计量 对任意 0 有,lim
n
ˆ | ) 0 P(| n
p z 2
p (1 p ) n 65%(1 65%) 100
65% 1.96 65% 9.35%
55.65%,74.35%
故该城市下岗职工中女性比例的置信区间为55.65%~74.35%
25
3.3.5区间估计的SPSS应用
正态分布的区间估计
Analyze→Descriptive Statistics→Explore→Statistics

U
x ~ N 0,1 n
可得到1-α置信度下,μ的置信区间为 , x 2 x 2 n n 置信区间的宽度为
2 L 2 / 2

n
17
例3.6 零件直径问题
已知某零件的直径服从正态分布,从该批产品中随机抽取10件, 测得平均直径为202.5mm,已知总体标准差σ =2.5mm,试建立该 种零件平均直径的置信区间,给定置信度为0.95。
15
置信区间示意图
ˆ) f (
1-α
ˆ1
θ
ˆ 2
ˆ
置信区间表达了区间估计的精确度,置信度(置信概率) 表达了区间估计的可靠性,它是区间估计的可靠概率; 显著性水平表达了区间估计的不可靠的概率 可靠度与精度是一对矛盾,一般是在保证可靠度的条件 下尽可能提高精度
16
3.3.2总体方差σ2已知时,总体均值μ的估计 x1 , x2 ,, xn 为来自总体的样本 X ~ N , 2 , 样本均值 x 服从数学期望为μ、方差为 2 /n的正态分布,
2
注意:
无偏性、有效性、一致性之间并没有必然的联系。如无偏的未必
有效,有效的也未必无偏。
7
3.2.3点估计的方法
(1)矩法
矩估计法:英国统计学家K.皮尔逊最早提出
矩在统计学中是指以数学期望为基础而定义的数字特征,如数学期 望、方差等
基本思想
样本矩估计总体矩
理论依据
大数定律
矩的分类
中心矩 原点矩
矩法的优点
18
3.3.3总体方差σ2未知时,总体均值μ的估计
n≥30时
2 s 通常用样本方差 来估计,只需将
中的σ 用S 近似代替即可
x , x 2 2 n n
n<30时
需要引入t分布 x t ~ t n 1 S n
x P t 2 S n t 2 1 即1-α 置信度下,μ 的置信区间为
样本方差
从100个样本中推断总体的净重均值为343.76g,方差为17.053
描述统计模块
• Analyze→Descriptive Statistics→Descriptives→Options
均值 标准差 方差
N 净重 100 100 Descriptive Statistics
Mean 343.76
S S x t , x t 2 2 n n
19
关于t分布的一点说明
t x ( x ) / ( / n ) S n ( S n ) / ( / n ) x / n (n 1) S 2 1 2 n 1
x / n S
2 =0.95,查标 解:已知 X ~ N , , =202.5mm,n=10, 准正态分布表,得1 =1.96,所以在1 置信度下, 的 置信区间为
2

x
x , x 2 2 n n
计算结果为:[200.95,204.05]
,k ) 0
例:设总体X~N(μ ,σ ),x1,x2,……,xn是一个样本,试求μ 和σ 的 估计量。
3.2.4点估计的SPSS应用
估计均值、方差、标准差
11
频次分析模块
Analyz→Descriptive Statistics → Frequencies Statistics
按顺序分组
计算四分点
估计:以样本统计量(样本数字特征)作为未知总体参 数(总体数字特征)的估计量。 估计量:用来估计总体参数的统计量名称 估计值:用来估计总体参数,是计算出来的估计量的具 体数值
统计估计值关系式
估计值
样本数据 所估计
=
参数
总体真正的 特性
+
方法偏差
不当抽样 所造成
+
抽样误差
抽样对象不 同所造成
3
科学的抽样估计方法具备的三个条件
k
k 1 n Xi X n i 1
数的估计量。显然,有几个待估参数,就列几个方程,最后解 方程就可估计出参数。
例:设总体X~U[a,b],x1,x2,……,xn是一个样本,试求a和b的估 计量
9
(2)极大似然估计法
一种在总体类型已知条件下使用的参数估计方法 由德国数学家高斯(Gauss)在1821年首先提出的 费歇(Fisher)在1922年再次提出,并首先研究了这种方法的一 些性质 原理
如果一个随机试验有若干种可能的条件,若在一次试验中,结果A 出现,则一般认为试验条件对A出现有利 在试验的诸多可能条件中,认为使事件A发生的概率最大的那种条 件成立
最大似然的思想
选择适当的 ˆ ,使 L( ) 取得最大值,即
L(x1, x2 ,
ˆ) max{f(x , )f(x , ) , xn , 1 2
均值 中位数 众数 样本数据值总和
设置指定的百分点
最小值 标准差 方差 最大值与最小值之差 最大值 均值标准差 数据分布的斜度 数据分布的峰度
频次分析模块(续)
Statistics 净 重 N 样本均值 Mean Std. Deviation Variance Valid Missing 100 0 343.76 4.130 17.053
要有合适的统计量作为估计量 要有合理的允许误差范围 要有一个可接受的置信度
参数估计方法
点估计 区间估计
4
3.2点估计
3.2.1点估计概况
点估计的概念
点估计是直接以样本统计量作为相应总体参数的估计量 例如:用样本均值 X 直接作为总体均值 的估计值

点估计的优点
能够提供总体参数的具体估计值,可以作为行动决策的数量依据
简单易行,并不需要事先知道总体是什么分布
矩法的缺点
当总体类型已知时,没有充分利用分布提供的信息;一般场合下, 矩估计量不具有唯一性
8
矩估计法的基本思想是根据大数定律,用样本的 k 阶原点矩
Ak
Bk
1 n X ik n i 1
作为总体 k 阶原点矩 EX k 的估计,用样本的 k 阶中心矩 去估计总体的 k 阶中心矩 E X EX , 从而得到未知参
p p ~ N (0, 1) p(1 p ) n
总体比例p在1-α置信水平下的置信区间为
p z 2
p(1 - p ) n
( 未知时)
24
例3.9 城市下岗女职工比例
某城市想要估计下岗职工中女性所占的比例,随机抽取了100个 下岗职工,其中65人为女性职工。试以95%的置信水平估计该城 市下岗职工中女性比例的置信区间。 解:已知n=100,p=65%,1- =95%, 2 =1.96
f(xn , )}
称这样得到的 ˆ 为参数 的最大似然估计值,称统计量
ˆ g (x , x , , x ) 1 2 n
为参数 的最大似然估计量
10
求极大似然估计的一般步骤
• 写出似然函数
L(x1 , x 2 ,
• 求解
, x n ;1 , 2 ,
,k ) L(1 , 2 ,
Std. Deviation 4.130
Variance 17.053
Valid N (listwise)
净重均值、方差估计值,结果同Statistics表
3.3区间估计
3.3.1基本概念
用一个区间去估计未知参数,即把未知参数值估计在某 两界限之间 设x1 , x2 ,, xn 是来自密度 f ( X , ) 的样本对给定的 , (0 1) 如能找到两个统计量 1 ( x1 , x2 ,, xn )及 2 ( x1 , x2 ,, xn ) ,使 得 P{1 ( x1 , x2 ,, xn ) 2 ( x1 , x2 ,, xn )} 1 ,则 1 是置信度,置信度也称为置信概率。 1 x1, x2 ,, xn ,2 x1, x2 ,, xn 是置信度为1 的θ的置信区 间, 称为显著性水平(Significance Level) 置信度+显著性水平=1 区间 [1 ,2 ] 是随机区间,不同样本会得到不同区间
相关文档
最新文档