法的软测量技术应用研究

合集下载
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

河北工业大学城市学院2013届本科毕业设计(论文)中期报告
毕业设计(论文)题目:基于回归分析法的软测量技术应用研究
专业(方向):自动化
学生信息:学号:096227 姓名:李潇婧班级:自动化C092班
指导教师信息:教师号:98017 姓名:梁秀霞职称:教授
报告提交日期:2013年4月 27日
一、回归分析法的特点和原理
1、回归分析法的特点
人们经常会遇到一些处于同一个统一体中的变量,这些变量相互联系、相互制约,客观上存在一定的关系。

但由于随机因素的影响,使变量之间的关系具有某种不确定性,无法得到精确的关系表达式。

这时人们往往用统计的方法,在大量反复的试验和观察中,寻找隐藏的统计规律性,即相关关系。

这种研究变量间相关关系的统计分析方法称为回归分析法。

回归分析是一种经典的建模方法,为我们寻找多个变量之间的函数关系或相关关系提供了有效的手段。

回归分析法不需要建立复杂的数学模型,只要在收集到的大量易测变量数据的基础上,运用统计方法将这些数据中隐含的对象信息浓缩和提取,研究输出和输入之间的相互关系,从而建立主导变量和辅助变量之间的数学模型。

它在参数预测、实时控制和工艺优化等方面均得到广泛应用。

回归分析方法是数理统计诸方法中应用最广泛的一个分支,它研究的主要问题是:(1)从一组数据出发,建立有相关关系的变量间的经验公式,也就是确定Y与X之间的定量关系表达式,这种表达式就是回归方程;
(2)对求得的回归方程的可信程度进行统计检验;
(3)从影响着某一个变量的众多变量中,判断哪些变量的影响是明显的,哪些变量的影响是不明显的,即判断哪个自变量X对因变量Y的影响最显著;
(4)利用所求得的优化的关系式进行预测和控制。

回归分析是研究1个变量Y与其它若干变量X之间相关关系的1种统计推断法。

它是在一组试验或观测数据的基础上,利用数理统计方法建立因变量与自变量之间的回归关系函数表达式,寻找被随机性掩盖了的变量之间的依存关系。

粗略地讲,可以理解为用1种确定
的函数关系去近似代替比较复杂的相关关系,这个函数在实际问题中称为经验公式。

回归分析所研究的主要问题就是如何利用变量X ,Y 的观察值(样本),对回归函数进行统计推断,包括进行估计及检验与有关的假设等。

1.1 一元线性回归
在一元线性回归中,有2个变量,其中x 是可观测、可控制的普通变量,称为自变量或控制变量,y 为随机变量,称为因变量或响应变量。

通过散点图或计算相关系数判定y 与x 之间存在着显著的线性相关关系,即y 与x 之间存在如下关系:
()1.1 )N(0,~,bx a y 2σεε++= 其中未知参数a ,b 及2
σ都不依赖于x ,称为一元线性回归模型。

ε为随机误差或随机干扰,是1个分布与x 无关的随机变量,常假定其为均值为0的正态变量。

建立一元线性回归模型的过程,就是利用一组观测数据i i y x ,(i =1,2,,,n)确定参数a ,b 的最小二乘估计值∧a 和∧b 的过程,进而得到y 关于x 的经验回归方程x b a y ∧∧∧+=。

一元线性回归分析的任务就是要利用这组数据求出回归系数∧a ,∧b ,并对参数和方差进行估计,并对回归的效果进行显著性检验,从而接受回归模型,最后在把模型用于预测和控制。

1. 2 多元线性回归
多元线性回归是多元回归中最简单的一种,一些非线性回归和多项式回归均可化为多元线性回归。

多元回归分析法运用的是最小二乘法,为了避免矩阵求逆运算可以采用递推最小二乘法。

在最小二乘法基础上又提出了许多改进的算法,如逐步回归法、主元分析、主元回归以及部分最小二乘法。

在实际的问题中,影响变量y 的因素往往不只1个,而包含多种影响的多个自变量x 。

通常要研究1个因变量y 与多个自变量之间的相互关系称为多元回归分析,其回归模型为: ()
2.1)
N(0,~,x b ...x b b y 2m m 110σεε++++= 其中2
m 10,b ,...,b ,b σ都是与m 21x ,...,x ,x 无关的未知参数,
ε为互相独立的服从均值为0,方差为2σ的正态随机变量。

建立多元线性回归模型的过程,就是利用一组观测数据i x ,i y (i =1,2,,,n),在最小二乘法原则下确定m+1个回归参数m 10b ,...,b ,b 的估值
0∧b ,1∧b ,...,m b ∧ 的过程,即得到m 元经验线性回归方程m m ^
11^^0^x b ...x b b y +++=。

多元线性回归分析的过程与一元线性回归分析类似,即把m 10b ,...,b ,b 作为未知数,令X = [i Ix ],
i=1,2,...,m 作为已知系数,把多元回归模型表示成线性方程组的形式,...bm]b [b *X y T 10=然后采用一元线性回归分析的方法进行参数的估计以及回归效果的假设检验。

1. 3 非线性回归
自变量与因变量之间的关系并非都是线性的,常常会出现非线性关系。

解决这种非线性回归问题,一般都是通过变量的变换化为线性回归问题:即把曲线方程化为直线方程。

当把非线性模型化为线性形式以后,就可以采用线性回归分析方法。

建立非线性回归模型的过程:通过适当的变量替换将非线性关系线性化;用线性回归分析方法分析新变量下的线性回归模型,求出未知参数的估计值,得到非线性回归方程,并对其做相应的显著性检验,从而验证模型的严密性;通过新变量之间的线性相关关系反映原来变量之间的非线性相关关系。

2、回归分析法的原理
在线性回归中,多元线性回归技术应用是最广泛的,以下是该方法的原理。

设有p 个因变量(输出主导变量)
p y y y ,....,21其中: ()
()p i y y y y in i i i ,.....2,1...,,,21==T (1.3) q 个自变量(输入辅助变量)
q x x x ,....,21 其中: ()()q i x x x x in i i i ,.....2,1...,,,21==T (1.4)
对于n 次独立观察,多元线性回归模型结构可写为:
ε+=AX Y (1.5) 其中:
⎪⎪⎪⎪⎪⎭
⎫ ⎝⎛=⎪⎪⎪⎪⎪⎭⎫ ⎝⎛=T T T pn p p n n p y y y y y y y y y y y y Y ...,,,...............,,,...,,,...21222211121121 (1.6)
⎪⎪⎪⎪⎪⎭⎫ ⎝⎛=⎪⎪⎪⎪⎪⎭⎫ ⎝⎛=T T T qn q q n q x x x x x x x x x X ...,,,...............,,,1...,,1,1...211121121 (1.7)
()⎪⎪⎪⎪⎪⎭⎫ ⎝⎛==pq p p q q q a a a a a a a a a a a a A ...,,,...............,,,...,,,...,,1022120111101,0(1.8)
⎪⎪⎪⎪⎪⎭⎫ ⎝⎛=⎪⎪⎪⎪⎪⎭⎫ ⎝⎛=T T T pn p p n n p εεεεεεεεεεεεε...,,,...............,,,...,,, (21222211121121)
(1.9)
Y 是因变量观测矩阵;X 是自变量设计矩阵;A 是回归系数矩阵;ε是误差矩阵。

模型结构确定以后,下一步就是如何估计系数矩阵A 。

通常采用最小二乘法(Least Squares ,简记为:LS)来求解。

设⎥⎦
⎤⎢⎣⎡=∧∧∧
,...,,,10q a a a A 是回归系数矩阵A 的LS 估计,也就是说,模型的估计输出值与实际输出Y 的误差平方和:⎪⎭⎫ ⎝⎛-⎪⎭
⎫ ⎝⎛-∧T ∧AX Y AX Y 要达到最小。

由此可解得A 的LS 估计为: ()
()10.1A 1-T T ∧=XX YX 显然,上式是方程 ()()11.1T T =YX XX A
的解,称上式为多对多(多输入多输出)正规方程组。

当有正规方程组求得A 的LS 估计后,便可建立多对多回归方程,并可求得回归值: ()()12.11X XX YX X A Y -T
T ∧∧==
称实测值矩阵Y 与预测值矩阵∧
Y 之差: ()()()()13.1111X XX X Y X XX YX Y Y Y -T T -T T ∧∧-=-=-=ε
为残差矩阵,而称
()()()14.111T -T T T ∧∧∧∧-=⎪⎭⎫ ⎝⎛-⎪⎭⎫ ⎝⎛-=Y X XX X Y Y Y Y Y εε
为残差交叉乘积矩阵,它们均可作为模型预测性能的评价标准。

多元回归分析通常都要处理大量的数据,工作量非常大。

随着MATLAB 等计算机软件的开发和普及,减少了对计算机编程的要求,大大提高了数据处理的效率。

运用MATLAB 统计工具箱,人们可以十分方便地在计算机上进行计算,从而进一步加深理解,同时,其强大的图形功能使回归分析的过程和结果可以直观地展现在人们面前。

应用举例:在工业洗煤过程中,用溢出溶液中固体悬浮物的量y(mg/l)来作为洗煤有效性的度量。

影响洗煤有效性的变量有:输入溶液中的固体百分比1x ;输入溶液中的pH 值2x ;清洗流速3x (mm/s)。

为研究上述变量对y 的影响,做了一批试验,其结果如下表1所示:
试建立y 关于i x (i=1,2,3)的回归模型。

(1)建立基本的回归模型
为了大致分析y 与i x (i=1,2,3)的关系,首先利用上表的数据分别作出y 对i x 的散点图,在MATLAB 命令窗口输入程序:
>>X1=[1.5 1.5 1.5 1.5 2.0 2.0 2.0 2.0 2.5 2.5 2.5 2.5];
>>X2=[6.0 6.0 9.0 9.0 7.5 7.5 7.5 7.5 9.0 9.0 6.0 6.0];
>>X3=[131.5 131.5 189.0 189.0 157.5 157.5 157.5 157.5 131.3 131.5 189.0 189.0]; >>y=[243 261 244 285 202 180 183 207 216 160 104 110];
>>subplot(1,3,1),plot(x1,y,′*′),title(′y 与x1的散点图′);axis([1.4 2.6 100 300])
>> subplot(1,3,2),plot(x2,y,′o ′),title(′y 与x2的散点图′);axis([5.5 9.5 100 300])
>> subplot(1,3,3),plot(x3,y,′^′),title(′y 与x3的散点图′);axis([125 195 100 300])
执行命令后输出的结果如图1:
图1 y 对x 的散点图
从三个图中都可以发现大部分点是分布在直线两边的,说明y 与Xi(i=1,2,3)之间有比较好的线性关系,因此可以建立如下的多元线性回归模型:
⎩⎨⎧+++=)
,0(~23322110σεββββN x x x y 其中,随机误差ε包含了影响y 的其它因素作用,ε应大致服从均值为零的正态分布。

在 回 归 过 程 中 , 回 归 方 程 是 不 可 能 全 部 通 过 每 个 回 归 数 据点的,为了判断关联式的好坏,可借助样本相关系数“R ”,统计量“F ”的临界值,样本剩余标准偏差“p ”进行判断;“R ”越趋近于 1 越好;“F ”的绝对值越大越好;“p ”越趋近于 0 越好。

(2)模型的求解及检验
假设基本的回归方程为:3322110x x x y ∧∧∧∧∧+++=ββββ,下面根据试验数据,用MATLAB 统计工具箱中的命令regress 进行求解,接上栏继续在MATLAB 命令窗口中输入程序:
>> A=[1.5 1.5 1.5 1.5 2.0 2.0 2.0 2.0 2.5 2.5 2.5 2.5; 6.0 6.0 9.0 9.0 7.5 7.5
7.5 7.5 9.0 9.0 6.0 6.0; 131.5 131.5 189.0 189.0 157.5 157.5 157.5 157.5 131.3 131.5 189.0 189.0]′;
>> x=[ones(12,1) A];
>> y=[243 261 244 285 202 180 183 207 216 160 104 110]′;
>> [b,bint,r,rint,stats]=regress(y,x)
因此,得到基本的回归方程为:
3210.5834x -15.5736x +110.7792x
-397.2851=y ∧
模型的检验: 本例中由R2=0.8996可得R 的绝对值为0.9485,接近于1,表明线性相关性较强。

F 检验法:当F>F1-α(k,n-k-1)时则认为因变量y 与自变量x1,x2,x3之间存在显著地线性相关关系,本例中F=23.8843>F1-0.05(3,8)=4.07(查表)。

p 值检验法:若p<α(α为预定显著水平),则说明因变量y 与自变量x1,x2,x3之间存在显著地线性相关关系。

本例p=0.0002<α=0.05。

以上三种统计检验方法推断的结果是一致的,说明因变量y 与自变量x1,x2,x3之间存在显著地线性相关关系。

二、带钢厚度的软测量方法
1、出口带钢厚度的测量方法
在冷连轧生产过程中,要完成高精度的AGC 控制(自动厚度控制)和提高产品质量,就必须准确实时地得到轧机出口处钢板的厚度,钢板出口厚度一般由安装在轧机出口处的 X 射线测厚仪来进行测量,但由于测厚仪安装位置距离轧机有一段距离,造成了较大的测量滞后。

而且出于成本等因素的考虑,连轧机组一般不是每个机架都配备测厚仪。

为了克服系统中测厚仪测量的迟延特性,或者在没有测厚装置的情况下得到机架出口处的钢板厚度,就需要构造一个数学模型,根据一些与它相关的参数对其进行预测。

传统的预测方法一般有两种:一是通过空载压靠的实验方法测得轧机的刚度曲线,然后使用弹跳方程求出口钢板厚度,需要计算的参数是轧制压力和辊缝值; s k p h += (2.1)
公式(2.1)中:h 为机架出口厚度;P 为轧制压力;K 为轧机模数;S 为机架辊缝值。

该方法的主要难点在于轧制压力的测量精度和辊系偏心的影响,使得各次测得轧机弹跳性重复性较差,而且轧机模数是钢板刚度和轧制力的非线性函数,特别是成品的轧制工作点往往就处于非线性段,给弹跳方程的建立和有效应用带来了难度。

另一种方法是为人们所熟知的用流量方程来计算,需要的参数是入口带钢厚度、入口和出口处的带钢速度。

h V H V o e = (2.2)
上述方法可以比较准确地预测出口带钢厚度,但是也存在着其本身无法克服的误差。

因为影响出口带钢厚度的因素有很多,除了上述的那些参数外,还有带钢张力、摩擦力、油膜厚度、温度等因素的制约,因此利用一个简单的公式来代替复杂非线性的生产过程进行计算,其精度是有限的。

为了突破上述局限性,本课题尝试采用目前正在蓬勃发展的软测量技术来取代传统方法。

2、基于软测量技术建立模型
软测量模型的基本结构如图2所示。

其中x为被估计变量集,d1为不可测扰动,d2为可测扰动,u为对象的控制输入,y为对象可测输出变量。

X*为可能有的离线分析计算值或大采样间隔的测量值,一般用于离线辨识的模型参数,也用于软测量模型的在线自校正。

如图2所示:
图2 软测量模型的基本结构
辅助变量的选择:
根据工艺机理分析(如物料、能量平衡关系),在可测变量中,初步选择所有与被估计变量有关的原则辅助变量,根据弹跳方程可知,钢板出口厚度与辊缝、轧制力、轧机的刚度曲线、温度、油膜厚度、轧辊的磨损有关。

根据质量流方程,带钢的入口速度、带钢的出口速度、入口厚度、入口张力、出口张力影响轧机出口带钢厚度。

因此初选的参数有:轧制压力、辊缝、温度、油膜厚度、轧辊辊径偏差、轧机的弹跳量、轧辊转速、带钢的入口速度、带钢的出口速度、入口厚度、入口张力、出口张力。

显然,将这些变量都作为模型的输入既不可能也完全没有必要。

鉴于现场仪表的实际安装情况,温度、油膜厚度没有对应的测量仪器,故不能作为辅助变量。

另外轧辊转速与带钢的轧制速度之间存在线性关系:
=(2.3)

D
V
因此可省略轧辊转速,由带钢轧制速度取代。

轧机的弹跳量与轧制压力相关,故弹跳量也可省略。

在冷连轧过程中,影响钢板出口厚度的主要变量有(如图3所示):
①轧制压力fw(MN);
②辊缝s(mm);
③轧辊辊径偏差 D(m);
④入口速度Ve(m/s);
⑤出口速度Vo(m/s);
⑥入口厚度he(mm);
⑦入口张力Te(KN);
⑧出口张力To(KN).
图3 轧机各参数示意图
三、工作过程
在基于回归分析法的软测量技术的应用研究中,中期分析了回归分析法特点,对历史数据进行了解和分析,获取了历史数据的特征。

在应用于冷连轧过程中对厚度的预测研究中,分析了冷连轧过程中对于厚度的影响因素,包括轧制压力、辊缝、温度、油膜厚度、轧辊辊径偏差、轧机的弹跳量、轧辊转速、带钢的入口速度、带钢的出口速度、入口厚度、入口张力、出口张力等,选择了软测量模型中的辅助变量。

下一步的工作是要采集和处理数据,利用回归分析法建模和进行在线校正。

同时分析软测量模型建立的准确性和实时性。

参考文献:
[1]王岩,隋思涟. MATLAB回归分析[J]. 青岛理工大学学报,2006,(04):129-132+146.
[2]叶峰. 运用MATLAB软件进行回归分析建模[J]. 成都航空职业技术学院学
报,2007,(02):44-47.
[3]易芳. 采用MATLAB的线性回归分析[J]. 兵工自动化,2004,(01):68-69.
[4]刘文波,程浩,饶俊国,耿磊,孟伟. 冷连轧厚度控制研究[J]. 电工技
术,2011,(07):49-51.
[5]赵奋军,胡远新. 基于MATLAB的测量数据回归分析研究[J]. 采矿技
术,2011,(05):77-80.
[6]刘冬花,童明华,王超厚. 基于多元线性回归分析的机床主轴电动机电流软测量模型的建立[J]. 职业,2012,(S1):55-56.
[7]张宇山. 多元线性回归分析的实例研究[J]. 科技信息,2009,(09):54-56.
[8]任建英. 一元线性回归分析及其应用[J]. 才智,2012,(22):116-117.
[9]金彪. 一元线性回归分析在处理实验数据中的应用[J]. 物理教师,2009,(06):24+26.
[10]赵玉新. 多元线性回归分析中自变量的筛选[J]. 中国城市经济,2011,(27):31-32+34.
[11]郭辉,王玲. 冷连轧带钢厚度控制策略研究及发展趋势的探讨[A]. 中国金属学会轧钢分会冷轧板带学术委员会.2009年全国冷轧板带生产技术交流会论文集[C].中国金属学会
轧钢分会冷轧板带学术委员会:,2009:12.
[12]蔡召君. 冷连轧机厚度控制的研究与应用[D].河北工业大学,2006.
[13]王振友,陈莉娥. 多元线性回归统计预测模型的应用[J]. 统计与决
策,2008,(05):46-47.
[14]林彬. 多元线性回归分析及其应用[J]. 中国科技信息,2010,(09):60-61.
[15]HervéAbdi. Partial least squares regression and projection on latent structure regression (PLS Regression)[J]. Wiley Interdisciplinary Reviews Computational Statistics,2010,2(1):55-57.
[16]Semra Türkan ,Öniz Toktamış. Detection of influential observations in ridge regression and modified ridge regression[J]. Model Assisted Statistics and Applications,2012,7(2):28-30.。

相关文档
最新文档