基于偏最小二乘回归的投影寻踪耦合模型在土地利用预测中的应用
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
收稿日期:2009-10-29修稿日期:2010-04-01第一作者:李逸川(1986-),女,吉林延边人,硕士研究生。主要研究方向为地理信息系统应用。E-mail:liyichuan@ 通讯作者:王海涛(1979-),男,黑龙江龙江人,硕士研究生。主要研究方向为土地利用规划和遥感资源调查。E-mail:wanght001979@
中国土地科学China Land Science Vol.24No.5May.,2010
第24卷第5期2010年5月Application of Coupling Model of Projection Pursuit Based on Partial Least-Square Regression in Land Use Prediction
LIYi-chuan1,WANGHai-tao2,TIANShu-fang1
(1.SchoolofEarthSciencesandResources,ChinaUniversityofGeosciences(Beijing),Beijing100083,China;2.SchoolofUrbanandEnuironmentalSciences,ChangchunNormalUniversity,Changchun130032,China)Abstract:Thepurposeofthispaperistoestablishthecouplingmodelofprojectionpursuitbasedonpartialleast-squareregression(PLS-PP)soastoimprovetheprecisionoflanduseprediction.Methodsemployedincludeliteratureanalysis,partialleast-squareregressionmodel,projectionpursuitmodelandempiricalanalysis.Theresultsindicate:(1)themeanabsolutevalueofrelativeerrorofthepredictionresultsofthismodelhasbeenreducedat0.13%(theoriginalis3.92%inthePLSmodel);(2)theprojectionpursuitandpartialleast-squareregressionhavebeencoupledandthefactorswhichhavestronginfluencesonthedependentvariableshavebeenextracted.Theproblemofmulti-collinarityamongstvariableshasbeensolvedandtheinputdimensionshavebeenreduced.Theimplementationofthemodelissimpleriftheprojectionindexfunctionisoptimizedbyusingthereal-codedaccelerategeneticalgorithm.ItisconcludedthatPLS-PPCouplingModelisaneffectivemethodforresearchonlanduseprediction,whichcansupportthemanagementofregionallandresourceandthepolicymakingoflocaleconomicdevelopment.
基于偏最小二乘回归的投影寻踪耦合模型
在土地利用预测中的应用
李逸川1,王海涛2,田淑芳1
(1.中国地质大学(北京)地球科学与资源学院,北京100083;2.长春师范学院城市与环境科学学院,吉林长春130032)
摘要:研究目的:构建偏最小二乘回归投影寻踪耦合模型(PLS-PP),提高土地利用预测精度。研究方法:文献分析法,偏最小二乘回归模型和投影寻踪模型,实证分析法。研究结果:(1)此模型预测结果的相对误差绝对值均值从PLS模型的3.92%,降低到了0.13%;(2)将投影寻踪与偏最小二乘回归耦合,运用偏最小二乘回归法提取对因变量影响强的成分,克服了变量之间多重相关性的问题,并降低投影寻踪输入维数。运用基于实数编码的加速遗传算法来优化投影指标函数,实现过程更为简单。研究结论:PLS-PP耦合模型是研究土地利用预测的有效的方法,可以为区域土地资源管理和制定地方经济发展政策提供支持。
关键词:土地利用预测;偏最小二乘回归投影寻踪中图分类号:F301.2
文献标识码:A
文章编号:1001-8158(2010)05-0009-04
10中国土地科学2010年5月第5期
Key words:landuseprediction;partialleast-squareregressionprojectionpursuit
以往国内外对土地利用预测及其影响因子的研究方法主要有典型相关分析、
最小二乘准则下的多对多回归分析以及提取自变量成分的主成分分析等[1]。但这些方法建模时,因土地利用及其影响因子变量之间的相互影响和制约难以满足一些模型要求的不相关假设,常有样本数量不足等局限。本文借助偏最小二乘回归法在解决土地利用预测模型中自变量多重相关性问题上的优势,引入投影寻踪方法,运用基于实数编码的加速遗传算法来优化投影指标函数,计算最佳投影方向,使降维结果的相对误差降低。
1PLS-PP 模型求解步骤[2]
建立基于偏最小二乘回归的投影寻踪耦合模型,其中投影寻踪回归模型为基于Hermite多项式的投影寻踪回归模型。具体过程为:
步骤1:建立偏最小二乘回归模型提取成分,设有单因变量y i (i =1,2,…,n )和p 个自变量{x 1,x 2,…,x p },观测n 个样本点,构成自变量与因变量的数据表X =[x 1,x 2,…,x p ]n ×p 和Y =[y ]n ×1。偏最小二乘回归分别在X 和Y 中提取成分t 1和u 1,在第一个成分t 1和u 1被提取后,偏最小二乘回归分别实施X 对t 1的回归以及Y 对t 1的回归,如果回归方程已经达到满意的精度,则算法终止;否则,将利用X 被t 1解释后的残余信息以及Y 被t 1解释后的残余信息进行第二轮的成分提取。如此往复,通过交叉有效性判别,直到能达到一个较满意的精度为止。最终对X 共提取了d 个成分t 1,t 2,…,t d 。
步骤2:由步骤1提取的d 个成分t 1,t 2,…,t d 计算投影值:
z i =∑d
j =1a j t ij ,(i =1,2,…,n ;j =1,2,…,d )
(式1)
式1中,a j 为投影方向,t ij 已进行归一化处理。
步骤3:对散布点(z ,y ),用基于正交Hermite多项式拟合,此时基于偏最小二乘回归的投影寻踪耦合模型为:
y ^
=∑m
i =1∑r
j =1c ij h ij (z
),(i =1,2,…,m ;j =1,2,…,r )(式2)
式2中,r 为多项式阶数;c 是多项式系数,可用最小二乘法获得;h 表示正交Hermite多项式。
步骤4:优化投影指标函数。在优化投影方向a 时,同时考虑多项式系数c 的优化问题,可以通过求解投影指标函数最小化问题来估计最佳a ,c 值,即:
min Q (a ,c )=1n ∑n
i =1(y i -y ^i
)2
(式3)s.t ∑n
i =1a 2
(j )=1(式4)
这是一个以a 、c 为优化变量的复杂非线性优化问题,用传统的优化方法处理较难。本文应用模拟生物优胜劣汰与群体内部染色体信息交换机制的基于实数编码的加速遗传算法(RAGA)来解决其高维全局寻优问题[3-6]。
步骤5:计算第一次的拟合残差r 1=y -y ^
,如果满足要求则输出模型参数,否则,进行步骤6计算。
步骤6:用r 1代替y ,回到步骤1开始下一个岭函数的优化,直到满足一定要求,停止增加岭函数个数,输出最后结果。
2PLS-PP 模型应用
本文选择黑龙江省某市为典型区进行案例研究。该市耕地面积从1994—2006年发生了较大变化,根据研究区的社会发展情况,分别从经济、政策、人口等方面选取因子,应用Matlab对原始数据进行初值化处理,分辨率取0.5,做灰色关联度分析[7]。依据关联度大小,从中选取19个影响耕地面积的主要相关因子(表1)。