最小二乘法的原理及其应用
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
最小二乘法的原理及其应用
一、研究背景
在科学研究中,为了揭示某些相关量之间的关系,找出其规律,往往需要做数据拟合,其常用方法一般有传统的插值法、最佳一致逼近多项式、最佳平方逼近、最小二乘拟合、三角函数逼近、帕德(Pade)逼近等,以及现代的神经网络逼近、模糊逼近、支持向量机函数逼近、小波理论等。
其中,最小二乘法是一种最基本、最重要的计算技巧与方法。它在建模中有着广泛的应用,用这一理论解决讨论问题简明、清晰,特别在大量数据分析的研究中具有十分重要的作用和地位。随着最小二乘理论不断的完善,其基本理论与应用已经成为一个不容忽视的研究课题。本文着重讨论最小二乘法在化学生产以及系统识别中的应用。
二、最小二乘法的原理
人们对由某一变量t或多个变量t1…..tn 构成的相关变量y感兴趣。如弹簧的形变与所用的力相关,一个企业的盈利与其营业额,投资收益和原始资本有关。为了得到这些变量同y之间的关系,便用不相关变量去构建y,使用如下函数模型
,
q个相关变量或p个附加的相关变量去拟和。
通常人们将一个可能的、对不相关变量t的构成都无困难的函数类型充作函数模型(如抛物线函数或指数函数)。参数x是为了使所选择的函数模型同观测值y相匹配。(如在测量弹簧形变时,必须将所用的力与弹簧的膨胀系数联系起来)。其目标是合适地选择参数,使函数模型最好的拟合观测值。一般情况下,观测值远多于所选择的参数。
其次的问题是怎样判断不同拟合的质量。高斯和勒让德的方法是,假设测量误差的平均值为0。令每一个测量误差对应一个变量并与其它测量误差不相关(随机无关)。人们假设,在测量误差中绝对不含系统误差,它们应该是纯偶然误差,围绕真值波动。除此之外,测量误差符合正态分布,这保证了偏差值在最后的结果y上忽略不计。
确定拟合的标准应该被重视,并小心选择,较大误差的测量值应被赋予较小的权。并建立如下规则:被选择的参数,应该使算出的函数曲线与观测值之差的平方和最小。用函数表示为:
用欧几里得度量表达为:
最小化问题的精度,依赖于所选择的函数模型。
三、最小二乘法的应用
(1)最小二乘法在化学生产中的应用:蔗糖的水解反应的实验
该实验的目的是测定蔗糖转化的反应级数、速率常数。实验中测出一组旋光度)(--a a t 和时间t ,判断反应级数和计算出速率常数。若t a a t ~)ln(--呈线性关系,为一级反应,若t a a t ~)(--呈线性关系,为二级反应,若t a a t ~)(2--呈线性关系,为三级反应。该实验应是一级反应,但由于用目测法手工作图,由于误差的原因,有时会得出一级或二级均可以的奇怪结论,所以在以往的实验中把该反应级数作为已知条件,只要求学生求出速率常数。而用线性最小二乘法拟合曲线,在计算机上处理,即可得出满意的结论。原理是,先用线性最小二乘法对)(--a a t 曲线进行高次拟合,从)(--a a t 曲线上读取等间隔时间t 时的t a ,作数据匀整,改进数据的离散性,然后进行直线拟合,拟合偏差最小者为该反应的反应级数。表1为某学生的实验数据,输入计算机后,进行高次拟合,并进行数据修匀,得到表2数据。本次拟合次数为7,拟合偏差为0.026,表示拟合较好。 表1 蔗糖水解反应实验数据
温度:20℃ 气压:101325Pa HCl 浓度:3M 00.5=t a 时间t/min
7 12 17 27 37 47 62 77 92 旋光度αt 6.37 6.42 6.47 4.71 2.82 1.50 0.00 -1.02 -2.
10
表2 蔗糖水解反应实验拟合修匀后的数据
时间t/min
10 20 30 40 50 60 70 旋光度αt 6.5125 5.12
5 4.1178 2.4181 1.0690
-0.1684 -0.5024 最后将匀整后的数据作直线拟合,一级拟合偏差平方和最小为0.064,证明蔗糖
水解反应确为一级反应。
(2)最小二乘法在系统识别中的应用
1、原理分析
系统辨识是通过建立动态系统模型,在模型输入输出数据的基础上,运用辨识方法对模型参数进行辨识,从而得到一个与所观测的系统在实际特性上等价的系统。应用最小二乘法对系统模型参数进行辨识的方法有离线辨识和在线辨识两种。离线辨识是在采集到系统模型所需全部输入输出数据后,用最小二乘法对数据进行集中处理,从而获得模型参数的估计值;而在线辨识是一种在系统运行过程中进行的递推辨识方法,所应用的数据是实时采集的系统输入输出数据,应用递推算法对参数估计值进行不断修正,以取得更为准确的参数估计值。由于在线辨识方法具有实时采集系统输入输出数据,实时辨识模型参数,且占据计算机存储量小的优点,因此与离线辨识相比,在线辨识方法得到了更为广泛的应用。在线辨识的参数估计的最小二乘递推算法如下:
^θ(k+1) = ^θ(k)+K(k+1)[y(k+1)-xT(k+1)^θ(k)]
K(k+1) = P(k)x(k+1)[1+xT(k+1)P(k)x(k+1)]-1
P(k+1) = P(k)-K(k+1)xT(k+1)P(k)
递推初值:^θ(0) =任意值; P(0) =α2
I,α取计算机容许的最大值。 式中x 与y 分别为系统的输入输出,θ为参数估计值,K 为增益矩阵,
P(m) = (x T m x m )
1- 其最优性准则函数为:
J =)(12i e m
i ∑=
其中m 为数据采集的次数,e 为残差向量。由于上述递推算法无法反映参数随时间变化的特点,新数据被大量的老数据所淹没,对于慢时变参数的辨识来说,这必然得不到跟踪参数变化的实时估计,因此又进一步有了改进的最小二乘递推算法,即带遗忘因子的渐消记忆的递推算法,该算法贬低老数据的作用,强调新数据的作用,选取遗忘因子λ,得到渐消记忆的最小二乘递推算法如下:
^θ(k+1) = ^θ(k)+K(k+1)[y(k+1)-xT(k+1)^θ(k)]
K(k+1) = P(k)x(k+1)[λ+xT(k+1)P(k)x(k+1)]-1
P(k+1) =1λ[P(k)-K(k+1)xT(k+1)P(k)]
递推初值:^θ(0) =任意值; P(0) =α2I ,α取计算机容许的最大值。 其最优性准则函数为:
J =)(21i e m
i i m ∑=-λ
其中加权系数0<λ≤1。λ通常在0.9与0.99之间取值。
2、实例分析
以某微循环流体系统模型的参数辨识为例。我们已经得到该系统模型的差