基于最小二乘法的数据处理问题研究综述
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
基于最小二乘法的数据处理问题研究综述
摘要:对基于最小二乘法的数据处理方法进行了介绍。首先对传统最小二乘法基本原理进行了介绍,然后根据例子来说明怎样运用传统最小二乘法来解决实际辨识问题。而且本文针对传统最小二乘存在的缺陷进一步阐述了一些改进型最小二乘法,综述了最小二乘法的研究现状,最后对最小二乘的发展趋势做了预测。
关键字:最小二乘法数据处理改进型最小二乘法发展趋势
1引言
在科学实验中经常要把离散的测量数据转化为直观的便于研究的曲线方程,即曲线拟合[1]。由于在实验室或实际应用中,误差是不可避免的,所以为了不把原有离散数据中的误差引入,人们经常用拟合来确定模拟函数。拟合方法不要求模拟函数通过已知离散的点,而追求的是所有点到模拟函数达到某种误差指标的最小化,是一种整体上的逼近性质。最小二乘法是解决这类曲线拟合中一种较为常用的方法,根据最小二乘法的定义[2]:“最小二乘法是一种数学优化技术,它通过最小化误差的平方和寻找数据的最佳函数匹配。”最小二乘法是从误差拟合角度对回归模型进行参数估计或系统辨识,因此最小二乘在参数估计、系统辨识以及预测、预报等众多领域中得到极为广泛的应用。
本文在阐述最小二乘法理论的基础上对于其在实际问题中的辨识应用做了简单介绍,并指出实际应用中存在的不足,列举了几种改
进型的最小二乘算法来进行优化比较,最后给出了最小二乘法的发展趋势。
2 最小二乘法的理论基础及应用 2.1最小二乘法的理论基础
最小二乘法作为一种传统的参数估计方法,早已经被大家所了解。 然而大多同学对最小二乘法的认识都比较模糊,仅仅把最小二乘法理解为简单的线性参数估计。 事实上,最小二乘法在参数估计、系统辨识以及预测、预报等众多领域都有着广泛的应用[3]。特别是针对动态系统辨识的方法有很多[4],但其中应用最广泛,辨识效果良好的就是最小二乘辨识方法,研究最小二乘法的应用在就要对其基本原理有较为深刻的理解。
下面是一般的最小二乘法问题:求实系数线性方程组
11112211211222221122
.........00 0
n n n n m m mn n m b b b a x a x a x a x a x a x a x a x a x ++-++-++-⎧+=⎪
+=⎪⎨
⎪⎪+=⎩ (1)
方程组可能无解。即很可能不存在一组实数x 1,x 2,……,x n 使
2
112120()i i in n i m
i a x a x a x b =++⋯+-=∑ (2) 恒成立。因此我们转而求其次,设法找到实数组 x 1,x 2,…,x n 使误差的平方和最小,这样的 x 1,x 2,…,x n 称为方程组的最小二乘解,这样问题就叫最小二乘法问题[5]。
2.2 最小二乘法的应用举例
理论只有被利用才能体现其价值意义,下面我就以系统辨识中的最小二乘法的例子为大家讲讲怎样在实际中应用最小二乘法解决辨识问题。
考虑如下图1中的线性系统:
()()()()()() 11
11
a b
n a n b
z k a z k a z k n bu k b u k n e k +-++-=-++-+(3)
其中,u(k)为系统激励信号,y(k)为系统输出,e(k)为模型噪声。
其系统模型如图1所示:
图1 SISO的系统模型结构图
其中G(z-1)是系统函数模型,N(z-1)为有色噪声系统模型,e(k)为白噪声v(k)经过系统函数为N(z-1)的系统后的输出[6]。通常
()()
()()
()
()
11
11
11
,
B z D z
G z N z
A z C z
--
--
--
==(4)
式中:
()
()
112
12
112
12
1a
a
b
b
n
n
n
n
A z a z a z a z
B z b z b z b z
-
---
-
---
⎧=++++
⎪
⎨
=+++
⎪⎩
(5)
()
()
112
12
112
12
1c
c
d
d
n
n
n
n
C z c z c z c z
D z d z d z b z
-
---
-
---
⎧=++++
⎪
⎨
=+++
⎪⎩
(6)
则系统可表示为:()()()
()()
()
()111
1
B z D z z k u k v k A z
C z
----=+
(7)
设样本和参数集为:
1212()[-(-1) , -(-2), ...... -(-), (-1),(-2), ......, (-)][,,......,,,,......,]T
T
n n h k z k z k z k n u k u k u k n a a a b b b θ⎧=⎨=⎩
(8) h(k)为可观测的量,差分方程可写为最小二乘形式
()()()T z k h k e k θ=+ (9)
那么如何在系统噪声e(k)存在的情况下从该方程中正确的解出
θ,即是系统辨识的任务。
为了求出θ,我们面临三大问题:一是输入信号的选择,二是判决准则的选取,三是辨识算法的选择,下面一一探讨。 一.选择输入
为了准确辨识系统参数,我们对输入信号有两大要求,一是信号
要能持续的激励系统所有状态,二是信号频带能覆盖系统的频带宽度。除此之外还要求信号有可重复性,不能是不可重复的随机噪声,因此我们通常选择M 序列或逆M 序列作为输入。 二.准则函数
因为本文主要探讨最小二乘方法,在此选取准则函数
()()()()2
2
1
1
T
k k J e k z k h k θθ∞
∞
==⎡⎤==-⎡⎤⎣⎦⎣⎦∑∑ (10)
使准则函数()min J θ=的θ估计值记做LS θ,称作参数θ的最小二乘估计值。
在式(7)中,令k=1,2,3,……L ,可构成线性方程组:
()()()T
L L L z k H k e k θ=+ (11)