极大似然参数辨识方法
参数辨识算法
参数辨识算法
参数辨识算法是一种用于确定未知系统参数的算法,其主要应用于控制系统、信号处理、通讯系统等领域。
该算法通过输入输出数据的分析,推导出系统的参数,以便更好地理解和控制系统行为。
常见的参数辨识算法包括极大似然估计法、最小二乘法、系统辨识工具箱等。
极大似然估计法是一种基于统计学的参数辨识算法,其原理是通过观察到的数据,计算一组最有可能的参数值,使得该参数下的系统输出数据和观察到的数据尽可能接近。
最小二乘法是另一种常用的参数辨识算法,其原理是通过最小化模型输出与实际输出之间的误差,推导出最优参数值。
系统辨识工具箱是一种集成各种参数辨识方法的软件工具,可快速方便地进行系统辨识。
参数辨识算法在控制系统中的应用非常广泛,例如,用于飞机、汽车、机器人等机械系统的运动控制,以及用于噪声控制、降噪处理等领域。
在通讯系统中,参数辨识算法可用于信道估计、信号跟踪、调制识别等方面。
总之,参数辨识算法在现代科技中扮演着重要的角色,它对于提高系统控制和信号处理的精度和可靠性具有重要意义。
- 1 -。
极大似然参数辨识方法
2 极大似然参数辨识方法极大似然参数估计方法是以观测值的出现概率为最大作为准则的,这是一种很普遍的参数估计方法,在系统辨识中有着广泛的应用。
2.1 极大似然原理设有离散随机过程}{k V 与未知参数θ有关,假定已知概率分布密度)(θk V f 。
如果我们得到n 个独立的观测值,21,V V …n V ,,则可得分布密度)(1θV f ,)(2θV f ,…,)(θn V f 。
要求根据这些观测值来估计未知参数θ,估计的准则是观测值{}{k V }的出现概率为最大。
为此,定义一个似然函数)()()(),,,(2121θθθθn n V f V f V f V V V L = (2.1.1)上式的右边是n 个概率密度函数的连乘,似然函数L 是θ的函数。
如果L 达到极大值,}{k V 的出现概率为最大。
因此,极大似然法的实质就是求出使L 达到极大值的θ的估值∧θ。
为了便于求∧θ,对式(2.1.1)等号两边取对数,则把连乘变成连加,即 ∑==ni iV f L 1)(ln ln θ (2.1.2)由于对数函数是单调递增函数,当L 取极大值时,lnL 也同时取极大值。
求式(2.1.2)对θ的偏导数,令偏导数为0,可得0ln =∂∂θL(2.1.3)解上式可得θ的极大似然估计ML ∧θ。
2.2 系统参数的极大似然估计设系统的差分方程为)()()()()(11k k u z b k y z a ξ+=-- (2.2.1) 式中111()1...nn a z a z a z ---=+++1101()...nn b z b b z b z ---=+++因为)(k ξ是相关随机向量,故(2.2.1)可写成)()()()()()(111k z c k u z b k y z a ε---+= (2.2.2) 式中)()()(1k k z c ξε=- (2.2.3)nn z c z c z c ---+++= 1111)( (2.2.4))(k ε是均值为0的高斯分布白噪声序列。
极大似然法原理
极大似然法原理在统计学中,极大似然法是一种常用的参数估计方法。
它的原理是基于已知数据集的情况下,通过寻找最大概率使模型参数最接近真实值。
接下来,我们将围绕极大似然法原理进行分步骤的阐述。
第一步,定义似然函数。
似然函数是指在已知数据集的情况下,模型参数的取值所产生的概率。
假设我们要估计一个二项分布模型的参数p,数据集中有n个实例,其中有m个成功实例(成功实例概率为p)。
那么这个模型的似然函数可以表示为:L(p;m,n) = C(n,m) * p^m * (1-p)^(n-m)其中,C(n,m)表示从n个实例中选择m个成功的组合数。
这个式子中,p取值不同,所对应的似然函数值也不同。
第二步,求解极大化似然函数的参数值。
在求解参数值时,我们要找到一个能使似然函数取到最大值的p值。
这个过程可以通过求解似然函数的导数为零来实现。
即:dL/dp = C(n,m) * [m/(p)] * [(n-m)/(1-p)] = 0这个式子中,p的值是可以求出来的,即为p = m / n。
这个p值被称为最大似然估计值,意味着在该值下,似然函数取值最大。
这个值也是对真实参数值的一个良好估计。
第三步,检验极大似然估计值的可靠性。
为了检验极大似然估计值的可靠性,我们需要进行假设检验。
通常我们会计算一个置信区间,如果实际参数值在置信区间内,那么我们就认为估计值是可靠的。
置信区间可以通过计算似然函数的二阶导数来得到。
即:d^2L/dp^2 = -C(n,m) * [m/(p^2)] * [(n-m)/((1-p)^2)]计算得到极大似然估计值的二阶导数在该参数值下是负数。
根据二阶导数的符号,可以确定p = m / n是最大值,同时也可以计算出该置信区间的范围。
在这个过程中,我们还需要参考似然比值,以便更好地确定参数估计值。
综上所述,极大似然法是统计学中重要的一种参数估计方法。
它的原理在求解模型参数时非常实用,能够帮助我们更好地估计真实值,从而使得我们的模型更加准确。
参数辨识方法
参数辨识方法指通过实验数据或观测结果,推断或估计系统或模型的参数值的一类方法。
这些方法通常用于建立数学模型、探索系统行为、优化控制策略等领域。
以下是几种常见的参数辨识方法:
1. 最小二乘法(Least Squares Method):最小二乘法是一种常见的参数辨识方法,通过最小化实际观测值与模型预测值之间的差异来估计参数。
它适用于线性和非线性模型,并可考虑测量误差。
2. 极大似然估计(Maximum Likelihood Estimation):极大似然估计是一种统计方法,用于通过最大化观测数据的似然函数来估计参数。
它适用于概率模型和随机过程的参数辨识。
3. 遗传算法(Genetic Algorithms):遗传算法是一种优化算法,可以用于参数辨识问题。
它模拟生物进化过程中的选择、交叉和变异等操作,通过迭代搜索来找到最优参数组合。
4. 粒子群优化算法(Particle Swarm Optimization):粒子群优化算法是一种启发式优化算法,模拟鸟群或鱼群的行为,通过协作和信息共享来寻找最优参数组合。
5. 系统辨识理论(System Identification Theory):系统辨识理论提供了一系列数学和统计方法,用于从实验数据中推断系统的结构和参数。
它涵盖了许多方法,包括参数估计、频域分析、时域分析等。
这些方法的选择取决于具体的应用和问题领域。
不同方法有不同的假设和适用条件,需要根据实际情况选择合适的参数辨识方法来获得准确的参数估计。
参数辨识的过程
参数辨识的过程一、引言参数辨识是指根据已知的输入输出数据,通过建立数学模型,对系统的未知参数进行估计和辨识的过程。
在科学研究和工程实践中,参数辨识对于系统建模、控制与优化等问题具有重要意义。
本文将介绍参数辨识的基本概念、方法和应用。
二、参数辨识的基本概念1. 参数:在数学模型中,描述系统特性的未知量被称为参数。
参数可以是物理量、几何参数或统计参数等。
2. 辨识:辨识是指根据已知的输入输出数据,对系统的未知参数进行估计和推断的过程。
3. 数学模型:数学模型是对系统行为进行描述的数学表达式,可以是线性或非线性、时变或时不变的。
三、参数辨识的方法1. 参数估计法:参数估计是指通过最小二乘法或极大似然估计等方法,利用已知的输入输出数据,对系统的未知参数进行估计。
2. 信号处理法:信号处理方法通过对输入输出信号进行滤波、频谱分析等处理,提取系统的频率响应特性,进而推断系统的参数。
3. 优化方法:优化方法通过调整系统参数,使得系统输出与实际观测值之间的误差最小化,从而得到最优参数估计。
4. 神经网络方法:神经网络是一种模仿生物神经网络结构和功能的数学模型,可以通过训练神经网络,得到系统的参数估计。
四、参数辨识的应用1. 控制系统设计:参数辨识可以用于建立系统的数学模型,从而设计出有效的控制算法,实现系统的自动控制。
2. 机器学习:在机器学习领域,参数辨识可以用于训练模型,对大数据进行分析和预测。
3. 信号处理:参数辨识可以用于信号处理领域中的滤波、频谱分析等问题。
4. 物理实验:在物理实验中,参数辨识可以用于对物理系统的特性进行分析和实验验证。
五、参数辨识的挑战和发展方向1. 噪声干扰:在实际应用中,系统输入输出数据往往受到噪声的影响,这给参数辨识带来了挑战。
2. 非线性系统:大多数实际系统都是非线性的,参数辨识方法需要考虑非线性系统的特性。
3. 多参数辨识:往往一个系统存在多个参数需要辨识,参数辨识方法需要考虑多参数辨识的问题。
极大似然估计方法
极大似然估计方法极大似然估计(Maximum Likelihood Estimation,MLE)方法是一种用于估计参数的统计方法,它基于观测到的样本数据,通过选择最大化观测数据出现的概率的参数值来估计未知参数。
极大似然估计是概率论和统计学中最重要的方法之一,广泛应用于各个领域的数据分析与建模中。
极大似然估计方法的核心思想是基于某一参数下观测数据出现的概率,选择使得这个概率最大的参数值。
具体而言,给定一个观测数据集合X,其来自于一个具有参数θ的概率分布,我们要估计未知参数θ的值。
极大似然估计的目标是找到一个参数值θ^,使得给定θ^条件下观测数据集合X出现的概率最大。
数学上,极大似然估计可以通过最大化似然函数来求解。
似然函数是一个参数的函数,表示给定某个参数θ下观测数据出现的概率。
似然函数的定义如下:L(θ|X) = P(X|θ)数的函数,表示给定某个参数θ下观测数据出现的概率。
极大似然估计的目标是寻找一个参数θ^,使得似然函数最大化,即:θ^ = arg max L(θ|X)为了方便计算,通常将似然函数转化为其对数形式,即对数似然函数:l(θ|X) = log L(θ|X)本文将主要介绍如何利用极大似然估计来估计参数。
具体而言,将分为两个部分:首先是介绍极大似然估计的理论基础,包括似然函数和对数似然函数的定义,以及如何通过最大化似然函数来估计参数;其次是通过一个实际的例子,展示如何使用极大似然估计来求解参数。
理论基础似然函数是极大似然估计的核心概念之一。
似然函数是一个参数的函数,表示给定某个参数θ下观测数据出现的概率。
似然函数的定义如下:L(θ|X) = P(X|θ)数的函数,表示给定某个参数θ下观测数据出现的概率。
似然函数的值越大,则表示给定参数θ的取值越可能产生观测数据X。
对数似然函数是似然函数的对数变换,通常在实际计算中会更加方便。
它的定义如下:l(θ|X) = log L(θ|X)对数似然函数和似然函数存在着一一对应关系,因此在求解参数时,两者等价。
现代控制理论极大似然法辨识
L z1,z2,L ,zn / f1 z1 / ,f2 z2 / ,L ,fn zn /
n
fi zi /
i1
(15-1)
上式右边是n个概率密度函数的边乘,似然函数L是 的函数。
如果L达到极大值,zk 的出现概率为最大。因此,极大似然法的
实质就是求解L达到极大值的 的估值ˆ。为了便于求ˆ,对式(15-1) 等号两边取对数,则把连乘变成连加,即
(15-17)
k 是均值为零的高斯分布白噪声序列。多项式a z1,bz1, c z1 中的各系数 a1,a2,L ,an;b0,b2,L ,bn;c1,c2,L ,cn 和序列 k
的均方差 都是未知参数。
设待估参数
a1L an b0b2 L bn c1L cn T
(15-18)
令 k n 1,n 2,L ,n N,可得 ek 的N个方程式。把这N个方程式
写成向量-矩阵形式:
eN yN N
(15-22)
式中
yN y n 1,y n 2,L ,y n N T eN en 1,en 2,L ,en N T a1,L , an,b0,b2,L ,bn,c1,L ,cn T
n
ln L fi zi /
i1
(15-2)
由于对数函数是单调增加函数,当L取极大时,ln L 也同时取极 大值。于是由
L 0
(15-3)
可得 的极大似然估计ˆL 。
现在用极大似然法辨识系统差分方程中的参数。从式(13-6) 和式(13-9)可得
n
n
y k ai y k i biu k i k
假设预测误差 ek 服从高斯分布,并且序列ek 具有相同的方
差 2 。因ek 与cˆ(z1),aˆ z1 及bˆ z1 有关,所以 2是被估参数 的
概率论极大似然估计
概率论极大似然估计
概率论极大似然估计是一种常用的参数估计方法。
它假设我们已经知道了概率分布的形式,但是不知道其中的参数。
我们通过观测到的样本数据来估计这些参数。
极大似然估计的思想是选择使得观测到的样本出现的概率最大的参数值作为估计值。
具体地,在给定概率分布形式的前提下,我们可以通过计算样本数据出现的概率函数,也就是似然函数,来确定参数值。
极大似然估计的优点是简单易用,且在大样本情况下具有渐进无偏性和渐进正态性等良好的性质。
但是在小样本情况下可能会出现偏差较大的情况,需要注意。
因此,在实际使用中,需要对样本数据的特点和概率分布的形式进行分析,选择合适的估计方法。
- 1 -。
极大似然参数估计
1.4 1.2 1 0.8 0.6
ˆ
0.4 0.2 0 -0.2 -0.4
ML
1
1.2
1.4
1.6
1.8
2
2.2
2.4
2.6
2.8
3
N 1 N [ yi ]2 ln L(YN | ) ln 2 2 2 2 i 1 2
d 1 N 1 ln L(YN | ) 2( yi ) 2 2 d 2 i 1
数的确定问题)
12
似然函数的确定 L(YL | ) ?
1)独立观测情况 各观测量 y(1), y(2),, y( N ) 由随机变量 y 的独立 样本所组成,观测量是独立的。
L(YN | ) p( y(1) | ) p( y(2) | ) p( y( N ) | ) p( y(i) | )
L(YN | ) -------- 似然函数
L(YN | ) p(YN | )
ML
ˆ ML ------- 使似然函数取极大值。 L(YN | ) ˆ
Max ( p (YN | ))
7
或
L(YN | ) 0 ˆ ML ln L(YN | ) 0 ˆ ML
L(YN | )
L(YN | H )
H1N1 !!!
L(YN | S ) > L(YN | H )
ˆ S
11
说明:
极大似然法是根据对观测量(输出量)y 的观测, 估计未知参数的一种方法,必然需要可观测变量
y
的
联合概率密度函数 p(YN | )的先验知识.(涉及到似然函
2 ML
第八章—极大似然法辨识
二、系统参数的极大似然估计
A( z −1 ) = C ( z −1 )
n ( k ) = e ( k ) / C ( z −1 )
A( z −1 ) z (k ) = B( z −1 )u (k ) + e(k ) e(k ) = D( z −1 )v(k )
v ( k ) 是零均值,方差为 σ v2 的服从正态分布的不相关
,L ,L+n
λ ( j) 0
ˆ ˆ i.e. 2v( j ) + λ ( j ) + ∑ di λ ( j + i ) = 0
i =1 n
j = n + 1, n + 2, j = L + 1, L + 2,
,L
λ ( j) = 0
,L+n
L (θ )对λ (k )求导
ˆ ˆ ˆ ˆ v( k ) = z ( k ) + ∑ ai z ( k − i ) − ∑ bi u ( k − i ) − ∑ di v(k − i )
, z ( L)]T
, u ( L − 1)]T
v 2 (k ) ∑
k =1 L
l ( z L | uL −1 , θ ) = log L( z L | uL −1 , θ ) = log p ( z L | uL −1 , θ ) L L 1 2 = const − log 2π − log σ v − 2 2 2 2σ v
L 1 L 2 L L 1 L 2 l ( z L | u L −1 , θ ) = const − log( ∑ v ( k )) − = const − log( ∑ v (k )) 2 L k =1 2 2 L k =1
《极大似然估计法》PPT课件
x;
)
1
e
x
,
0 ,
x0 other
( 0)
今取得一组样本Xk数据如下,问如何估计θ?
16 29 50 68 100 130 140 270 280
340 410 450 520 620 190 210 800 1100
9
L( )
n i 1
1
e
xi
5
(1) 写出似然函数
n
L( p) pxi (1 p)1xi i 1
(2) 对似然函数取对数,得到对数似然函数:
n
l( p) [xi ln p (1 xi ) ln(1 p)] i 1
n
n ln(1 p) xi[ln p ln(1 p)] i 1
y(n)
y(n 1)
y(n N 1)
y(1) u(n 1) y(2) u(n 2)
y(N) u(n N)
u(1)
u(2)
u(N )
e Y
17
由于e(k)是均值为零的高斯不相关序列,且与{u(k)}
不相关,于是得到似然函数:
e n
1
n i1
xi
ln
L
n
ln
1
n
i 1
xi
d ln L
d
n
1
2
n
i 1
xi
0
ˆ
1 n
n
系统辨识辨识方法性能分析
系统辨识辨识方法性能分析引言系统辨识是指通过观测系统的输入和输出,利用数学模型对系统的动态行为进行建模和预测的过程。
辨识方法的性能分析是评估辨识方法的优劣和适用范围的过程,对于选择合适的辨识方法和优化辨识结果具有重要意义。
本文将对系统辨识中常用的几种方法进行性能分析,包括参数辨识方法、非参数辨识方法和半参数辨识方法。
参数辨识方法参数辨识方法是指通过估计系统的参数来建立系统模型。
常见的参数辨识方法包括最小二乘法、极大似然法和支持向量回归等。
这些方法通过寻找最优参数来拟合系统的输入和输出数据,从而得到系统的数学模型。
对于参数辨识方法的性能分析,可以从以下几个方面进行评估:1.拟合优度:拟合优度是指辨识方法得到的模型与实际系统之间的拟合程度。
可以通过计算模型的残差平方和或R方值来评估拟合优度,拟合优度越高,模型与实际系统的拟合程度越好。
2.参数估计误差:参数估计误差反映了辨识方法对系统参数的估计准确程度。
可以通过计算参数估计误差的均方根误差或标准偏差来评估辨识方法的参数估计精度,参数估计误差越小,辨识方法的性能越好。
3.参数可辨识性:参数可辨识性指的是辨识方法是否能够准确地估计系统的参数。
对于具有多个参数的系统,如果某些参数之间存在相关性或冗余性,辨识方法可能无法准确地估计这些参数。
因此,参数可辨识性是评估辨识方法是否适用于系统辨识的重要指标。
非参数辨识方法非参数辨识方法是指通过不对系统模型做任何假设,直接从输入和输出数据中提取系统的特征来进行辨识。
常见的非参数辨识方法包括频域方法、时域方法和小波分析等。
这些方法不需要对系统进行具体的数学建模,对系统的特征进行直接提取和分析。
对于非参数辨识方法的性能分析,可以从以下几个方面进行评估:1.频谱分辨能力:频谱分辨能力是指辨识方法对系统频域特征的提取能力。
通过计算频谱分辨能力指标,可以评估辨识方法在不同频率下对系统信息的提取精度,频谱分辨能力越高,辨识方法对系统频域特征的分析能力越强。
各种参数的极大似然估计
各种参数的极大似然估计1.引言在统计学中,参数估计是一项关键任务。
其中,极大似然估计是一种常用且有效的方法。
通过极大化似然函数,我们可以估计出最有可能的参数值,从而进行推断、预测和优化等相关分析。
本文将介绍各种参数的极大似然估计方法及其应用。
2.独立同分布假设下的参数估计2.1参数估计的基本理论在独立同分布假设下,我们假设观测数据相互独立且具有相同的概率分布。
对于一个已知的概率分布,我们可以通过极大似然估计来估计其中的参数。
2.2二项分布参数的极大似然估计对于二项分布,其参数为概率$p$。
假设我们有$n$个独立的二项分布样本,其中成功的次数为$k$。
通过极大似然估计,我们可以得到参数$p$的估计值$\h at{p}$为:$$\h at{p}=\f ra c{k}{n}$$2.3正态分布参数的极大似然估计对于正态分布,其参数为均值$\mu$和标准差$\si gm a$。
假设我们有$n$个独立的正态分布样本,记为$x_1,x_2,...,x_n$。
通过极大似然估计,我们可以得到参数$\mu$和$\si gm a$的估计值$\h at{\m u}$和$\ha t{\s ig ma}$分别为:$$\h at{\mu}=\f rac{1}{n}\su m_{i=1}^nx_i$$$$\h at{\si gm a}=\s q rt{\fr ac{1}{n}\s um_{i=1}^n(x_i-\h at{\mu})^2}$$3.非独立同分布假设下的参数估计3.1参数估计的基本理论在非独立同分布假设下,我们允许观测数据的概率分布不完全相同。
此时,我们需要更加灵活的方法来估计参数。
3.2伯努利分布参数的极大似然估计伯努利分布是一种二点分布,其参数$p$表示某事件发生的概率。
假设我们有$n$组独立的伯努利分布样本,其中事件发生的次数为$k$。
通过极大似然估计,我们可以得到参数$p$的估计值$\h at{p}$为:$$\h at{p}=\f ra c{k}{n}$$3.3泊松分布参数的极大似然估计泊松分布是一种描述罕见事件发生次数的概率分布,其参数$\la mb da$表示单位时间(或单位面积)内平均发生的次数。
参数估计极大似然法
e x x 0 f ( ; x ) 0 x0
所以似然函数为
L ( ) n e
xi
i 1
n
取对数 令
ln L( ) n ln xi
i 1
n
d n n ln L( ) xi 0 d i 1
设 总 体 的 分 布 类型 已 知 , 但 含 有 多个 未 知 参 数
1 , 2 ,, k ,这时总体的概率函数为 f ( x;1 , 2 ,, k ) . 设
( x1 , x2 ,, xn ) 为总体
X 的一个样本观察值,若似然函数
n i 1
L(1 , 2 ,, k ) L( x1 , x2 ,, xk ;1 , 2 ,, k ) f ( xi ;1 , 2 ,, k )
(x )
n
0
1 n 解得 xi x n i 1
n 1 2 ( xi x )2 n i 1
所以μ,2的极大似然估计量为
1 n ˆ Xi X n i 1
n 1 2 2 ˆ ( Xi X ) n i 1
与矩估计量 相同
7-26
求极大似然估计的一般步骤归纳如下:
(1)求似然函数 L( ) ;
(2)求出 ln L( ) 及方程
d ln L( ) 0 d
;
(3)解上述方程得到极大似然估计值
ˆ ˆ( x , x ,, x ) 1 2 n .
(4)解上述方程得到极大似然估计量
ˆ ˆ( X , X ,, X ) 1 2 n .
解得λ的极大似然估计值为
ˆ
n
x
系统辨识 第6章 极大似然估计
n N
k n 1
2 e (k )
可见在ξ(k)为高斯白噪声序列这一特殊情况下,极大似然辨 识与一般最小二乘法辨识有相同结果。
2、动态系统模型参数的极大似然估计
2.有色噪声情况
a( z 1 ) y (k ) b( z 1 ) u (k ) c( z 1 ) (k ) 1 1 n a ( z ) 1 a z a z 1 n 系统差分方程 1 1 n b ( z ) b b z b z 0 1 n c( z 1 ) 1 c z 1 c z n 1 n ˆ ˆ (k ) e(k ) y(k ) y eN YN Φ N θ
L( y1, y2 ,..., yN | ) P( y1, y2 ,..., yN | )
各观测量y1,y2,…,yN由随机变量y的独立样本所组成,观测量 是独立的
L( y1 , y2 ,..., y N | ) P( y1 | ) P( y2 | )...P( y N | ) P( yi | )
2、动态系统模型参数的极大似然估计
因为ε(k)为高斯白噪声, 故而e(k)可假设为零均值的高斯白噪声。
则似然函数L为: ˆ ) T (Y Φ θ ˆ) ( Y Φ θ 1 N N N N ˆ) L(e N θ exp( ) 2 N/2 2 (2πσ ) 2σ
ln L(e N
N N 1 2 ˆ θ) ln 2π ln σ 2 2 2 2σ
i 1 N
θ的极大似然估计
L 0
观察值概率分布密度函数的乘积
ln L 等价于 0 ˆmLE
但一般不容易得到解析解,需采用数值方法得到其近似解
第六章 极大似然法辨识
i 1
i0
i 1
令 k n 1, n 2, , n N ,可得 e(k) 的N个方程式,把 这N个方程式写成向量-矩阵形式
eN YN N
式中
[a1 an b0 bn c1 cn ]T
y(n 1)
YN
y(n
2)
,
y(n
N
)
e(n 1)
eN
e(n 2)
e(n N )
u(1)
u(2)
u( N )
假定{ (k)}是均值为0的高斯分布不相关随机序列, 且与 {u(k )}不相关。由上式有
N YN N
系统的残差为
^
^
e(k) a(z1) y(k) b(z1)u(k)
由上式可建立系统的向量-矩阵方程
eN YN N
式中
e(n 1)
eN
e(n
2)
|)
N k 1
p(x(k) | )
2N
N k 1
x(k
)
exp
N k 1
x(k
)
对上式等号两边取对数,可得
N
N
ln L(xN | ) 2N ln ln x(k) x(k)
k 1
k 1
求上式对 的偏导数,并且令偏导数等于0,可得
ln L(xN | ) 2N N x(k) 0
则可建立向量-矩阵方程
YN N N
式中
y(n 1)
YN
y(n
2)
,
y(n
N
)
a1
a
n
,
b0
bn
(n 1)
N
(n 2)
(n N )
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
2 极大似然参数辨识方法极大似然参数估计方法是以观测值的出现概率为最大作为准则的,这是一种很普遍的参数估计方法,在系统辨识中有着广泛的应用。
2.1 极大似然原理设有离散随机过程}{k V 与未知参数θ有关,假定已知概率分布密度)(θk V f 。
如果我们得到n 个独立的观测值,21,V V …n V ,,则可得分布密度)(1θV f ,)(2θV f ,…,)(θn V f 。
要求根据这些观测值来估计未知参数θ,估计的准则是观测值{}{k V }的出现概率为最大。
为此,定义一个似然函数)()()(),,,(2121θθθθn n V f V f V f V V V L = (2.1.1)上式的右边是n 个概率密度函数的连乘,似然函数L 是θ的函数。
如果L 达到极大值,}{k V 的出现概率为最大。
因此,极大似然法的实质就是求出使L 达到极大值的θ的估值∧θ。
为了便于求∧θ,对式(2.1.1)等号两边取对数,则把连乘变成连加,即 ∑==ni iV f L 1)(ln ln θ (2.1.2)由于对数函数是单调递增函数,当L 取极大值时,lnL 也同时取极大值。
求式(2.1.2)对θ的偏导数,令偏导数为0,可得0ln =∂∂θL(2.1.3)解上式可得θ的极大似然估计ML ∧θ。
2.2 系统参数的极大似然估计设系统的差分方程为)()()()()(11k k u z b k y z a ξ+=-- (2.2.1) 式中111()1...nn a z a z a z ---=+++1101()...nn b z b b z b z ---=+++因为)(k ξ是相关随机向量,故(2.2.1)可写成)()()()()()(111k z c k u z b k y z a ε---+= (2.2.2) 式中)()()(1k k z c ξε=- (2.2.3)nn z c z c z c ---+++= 1111)( (2.2.4))(k ε是均值为0的高斯分布白噪声序列。
多项式)(1-z a ,)(1-z b 和)(1-z c 中的系数n n c c b b a a ,,,,,10,1和序列)}({k ε的均方差σ都是未知参数。
设待估参数n a a 1[=θ n b b 0 ]Tn c c 1 (2.2.5) 并设)(k y 的预测值为+-+++-----=∧∧∧∧∧)()()()1()(01n k u b k u b n k y a k y a k y n n)()1(1n k e c k e c n -++-∧∧(2.2.6) 式中)(i k e -为预测误差;i a ∧,i b ∧,i c ∧为i a ,i b ,i c 的估值。
预测误差可表示为+-+-⎢⎣⎡--=-=∑∑=∧=∧∧)()()()()()(01i k u b i k y a k y k y k y k e n i i n i i-+++-+++=⎥⎦⎤--∧-∧∧-∧-∧=∧∑)()()()1()(110111k u z b z b b k y z a z a i k e c n n n n ni i )()(2211k e z c z c z c n n -∧-∧-∧+++(2.2.7) 或者)()1(11k e z c z c n n -∧-∧+++ =-+++-∧-∧)()1(11k y z a z a nn)()(110k u z b z b b nn -∧-∧∧+++ (2.2.8) 因此预测误差{})(k e 满足关系式)()()()()()(111k u z b k y z a k e z c -∧-∧-∧-= (2.2.9) 式中n n z a z a z a -∧-∧-∧+++= 1111)(n n z b z b b z b -∧-∧∧-∧+++= 1101)( n n z c z c z c -∧-∧-∧+++= 1111)(假定预测误差)(k e 服从均值为0的高斯分布,并设序列{})(k e 具有相同的方差2σ。
因为{})(k e 与)(1-∧z c ,)(1-∧z a 和)(1-∧z b 有关,所以2σ是被估参数θ的函数。
为了书写方便,把式(2.2.9)写成)()()()()()(111k u z b k y z a k e z c ----= (2.2.10)-------++-+= )1()1()()1()()(101k u b k u b n k y a k y a k y k e n,2,1),()1()(1++=------n n k n k c k e c n k u b n n (2.2.11) 或写成)()()()()(11i k e c i k u b i k y a k y k e ni ini ini i-----+=∑∑∑=== (2.2.12)令k=n+1,n+2,…,n+N,可得)(k e 的N 个方程式,把这N 个方程式写成向量-矩阵形式θN N N Y e Φ-= (2.2.13) 式中⎥⎥⎥⎥⎦⎤⎢⎢⎢⎢⎣⎡+++=)()2()1(N n y n y n y Y N ,⎥⎥⎥⎥⎦⎤⎢⎢⎢⎢⎣⎡+++=)()2()1(N n e n e n e e N ,⎥⎥⎥⎥⎥⎥⎥⎥⎦⎤⎢⎢⎢⎢⎢⎢⎢⎢⎣⎡=n n b b a a 01θ⎢⎢⎢⎢⎣⎡-+-+--=Φ)1()1()(N n y n y n y N )()2()1(N y y y --- )()2()1(N n u n u n u +++ )()2()1(N u u u)1()1()(-++N n e n e n e ⎥⎥⎥⎥⎦⎤)()2()1(N e e e因为已假定{})(k e 是均值为0的高斯噪声序列,高斯噪声序列的概率密度函数为])(21ex p[)2(122212m y f --=σπσ (2.2.14)式中y 为观测值,2σ和m 为y 的方差和均值,那么)](21ex p[)2(122212k e f σπσ-=(2.2.15) 对于)(k e 符合高斯噪声序列的极大似然函数为)21exp()2(1)]}()2()1([21exp{)2(1])([])2([])1([])(,),2(),1([),(222222222NT N NNN e e N n e n e n e N n e f n e f n e f N n e n e n e L Y L σπσσπσθθθθσθ-=++++++-=+++=+++=(2.2.16)或]2)()(exp[)2(1),(222σθθπσσθΦ-Φ--=N T N NN Y Y Y L(2.2.17) 对上式(2.2.17)等号两边取对数得N T N NT N N N e e N N e e Y L 2222221ln 22ln 2)21ex p(ln )2(1ln),(ln σσπσπσσθ---=-+= (2.2.18)或写为∑++=---=N n n k N k e N N Y L 1222)(21ln 22ln 2),(ln σσπσθ (2.2.19)求),(ln σθN Y L 对2σ的偏导数,令其等于0,可得0)(212),(ln 12422=+-=∂∂∑++=Nn n k N k e N Y L σσσσθ (2.2.20)则J N k e N k e NN n n k Nn n k 2)(212)(112122===∑∑++=++=∧σ (2.2.21) 式中∑++==N n n k k e J 12)(21 (2.2.22)2σ越小越好,因为当方差2σ最小时,)(2k e 最小,即残差最小。
因此希望2σ的估值取最小J Nmin 22=∧σ (2.2.23) 因为式(2.2.10)可理解为预测模型,而e(k)可看做预测误差。
因此使式(2.2.22)最小就是使误差的平方之和最小,即使对概率密度不作任何假设,这样的准则也是有意义的。
因此可按J 最小来求n n c c b b a a ,,,,,10,1的估计值。
由于e(k)式参数n n c c b b a a ,,,,,10,1的线性函数,因此J 是这些参数的二次型函数。
求使),(ln σθN Y L 最大的∧θ,等价于在式(2.2.10)的约束条件下求∧θ使J 为最小。
由于J 对i c 是非线性的,因而求J 的极小值问题并不好解,只能用迭代方法求解。
求J 极小值的常用迭代算法有拉格朗日乘子法和牛顿-拉卜森法。
下面介绍牛顿-拉卜森法。
整个迭代计算步骤如下:(1)确定初始的0∧θ值。
对于0∧θ中的n b b a a ,,,0,1可按模型)()()()()(11k u z b k y z a k e -∧-∧-= (2.2.24) 用最小二乘法来求,而对于0∧θ中的nc c ,1可先假定一些值。
(2)计算预测误差)()()(k y k y k e ∧-= (2.2.25) 给出∑++==N n n k k e J 12)(21并计算∑++=∧=Nn n k k eN 122)(1σ (2.2.26)(3)计算J 的梯度θ∂∂J和海赛矩阵 22θ∂∂J,有θθ∂∂=∂∂∑++=)()(1k e k e J N n n k (2.2.27) 式中⎢⎣⎡∂∂∂∂=∂∂n a k e a k e k e )()()(1θ n b k e b k e ∂∂∂∂)()(0 Tn c k e c k e ⎥⎦⎤∂∂∂∂)()(1 --------++-+∂∂=∂∂)()1()()()1()([)(101n k u b k u b k u b n k y a k y a k y a a k e n n ii )]()1(1n k e c k e c n ---- in i i a n k e c a k e c a k e c i k y ∂-∂--∂-∂-∂-∂--=)()2()1()(21 (2.2.28) 即i nj j i a j k e c i k y a k e ∂-∂--=∂∂∑=)()()(1(2.2.29) 同理可得i nj j i b j k e c i k u b k e ∂-∂---=∂∂∑=)()()(1 (2.2.30) in j j i c j k e c i k e c k e ∂-∂---=∂∂∑=)()()(1 (2.2.31) 将式(2.2.29)移项化简,有in j j i n j j i a j k e c a j k e c a k e i k y ∂-∂=∂-∂+∂∂=-∑∑==)()()()(01 (2.2.32)因为j z k e j k e -=-)()( (2.2.33)由)(j k e -求偏导,故iji a z k e a j k e ∂∂=∂-∂-)()( (2.2.34) 将(2.2.34)代入(2.2.32),所以j nj j i i j n j j i nj j z c a k e a z k e c a j k e c i k y -=-==∑∑∑∂∂=∂∂=∂-∂=-000)()()()( (2.2.35) n n z c z c z c ---+++= 1111)(所以得)()()(1i k y a k e z c i-=∂∂- (2.2.36) 同理可得(2.2.30)和(2.2.31)为)()()(1i k u b k e z c i--=∂∂- (2.2.37) )()()(1i k e c k e z c i--=∂∂- (2.2.38) 根据(2.2.36)构造公式)(])([)]([)(1i k y j j i k y a j i k e z c j-=---=∂--∂- (2.2.39)将其代入(2.2.36),可得ij a k e z c a j i k e z c ∂∂=∂--∂--)()()]([)(11 (2.2.40)消除)(1-z c 可得1)1()()(a i k e a j i k e a k e j i ∂+-∂=∂+-∂=∂∂ (2.2.41) 同理可得(2.2.37)和(2.2.38)式)()()(b i k e b j i k e b k e j i ∂-∂=∂+-∂=∂∂ (2.2.42)1)1()()(c i k e c j i k e c k e j i ∂+-∂=∂+-∂=∂∂ (2.2.43)式(2.2.29)、式(2.2.30)和式(2.2.31)均为差分方程,这些差分方程的初始条件为0,可通过求解这些差分方程,分别求出e(k)关于n n c c b b a a ,,,,,10,1的全部偏导数,而这些偏导数分别为)}({k y ,)}({k u 和)}({k e 的线性函数。