基于加速遗传算法的投影寻踪聚类评价模型研究与应用_黄勇辉

合集下载

鸟群算法-投影寻踪回归模型在多元变量年径流预测中的应用

鸟群算法-投影寻踪回归模型在多元变量年径流预测中的应用

鸟群算法-投影寻踪回归模型在多元变量年径流预测中的应用崔东文;金波【摘要】利用投影寻踪回归(PPR)模型进行年径流预测.针对PPR模型矩阵参数难以确定的不足,利用一种新型群体智能仿生算法——鸟群算法(BSA)优化PPR模型矩阵参数,提出BSA-PPR预测模型,以新疆伊犁河雅马渡站年径流预测为例进行实例研究,并构建BSA-SVM模型作对比.利用实例前17年资料对模型进行训练,后6年资料进行预测.结果表明:BSA-PPR模型对实例后6年年径流预测的平均相对误差绝对值为5.99%,精度优于BSA-SVM模型及相关文献,具有较高的预测精度和泛化能力.该模型及方法可解决其他相关回归预测问题,具有良好的应用前景.【期刊名称】《人民珠江》【年(卷),期】2016(037)011【总页数】5页(P26-30)【关键词】径流预测;鸟群算法;投影寻踪回归;参数优化【作者】崔东文;金波【作者单位】云南省文山州水务局,云南文山663000;云南省文山州水务局,云南文山663000【正文语种】中文【中图分类】P378+.2研究探索年径流预测模型及方法,以期提高其预测精度一直是水文预测预报中的热点和难点。

由于河川径流预测的随机性和不确定性,传统回归分析、数理统计等方法往往难以达到理想的预测效果。

目前,除传统预测方法外,人工神经网络[1-3]、小波分析[4]、集对分析[5]、支持向量机[6-8]、灰色预测[9]、组合预测[10-11]等模型及方法被尝试用于径流预测预报,取得了一定的预测效果。

投影寻踪(Projection Pursuit,PP)是由美国科学家Kruskal首先提出,其原理是将高维数据投影到低维空间上,在低维空间研究能反映高维数据结构或特征的投影特征值的统计方法,在各行业及领域均有广泛应用。

投影寻踪回归(Projection Pursuit Regression,PPR)是Friedman 于1981年基于投影寻踪思想提出的一种用来分析和处理高维非正态多元数据的统计方法,其核心是用若干个岭函数加权和的形式来逼近回归函数,以解决高维空间中的回归问题[12]。

投影寻踪方法及应用

投影寻踪方法及应用

投影寻踪方法及应用
投影寻踪方法是一种图像处理技术,主要用于跟踪或寻找图像中的某个目标或区域。

它通过对目标的投影进行分析和处理,从而实现目标的寻找和跟踪。

常见的投影寻踪方法包括:
1. 基于阈值的方法:将图像转换为二值图像,然后使用阈值来提取目标的投影,通过对投影进行分析和处理来实现目标的寻踪。

2. 基于模板匹配的方法:使用预先定义的模板与图像进行比较,通过对比图像中的局部区域与模板的相似度来实现目标的寻踪。

3. 基于特征点的方法:通过检测图像中的特征点,并使用特征点间的相对位置和运动信息来实现目标的寻踪。

4. 基于边缘检测的方法:通过检测图像中的边缘,并利用边缘的形状和分布信息来实现目标的寻踪。

投影寻踪方法在许多领域都有应用,例如:
1. 视频监控:用于实时跟踪目标物体,如行人、车辆等。

2. 机器人导航:用于机器人的自主导航和避障。

3. 动作识别:用于分析和识别人体动作,如姿态跟踪、手势识别等。

4. 医学图像处理:用于跟踪和分析医学图像中的病变和器官。

5. 航空航天:用于航空器或卫星的轨迹预测和跟踪。

总的来说,投影寻踪方法是一种重要的图像处理技术,可以在许多领域中应用,实现目标的寻找和跟踪。

基于加速遗传算法的投影寻踪聚类评价模型研究与应用_黄勇辉

基于加速遗传算法的投影寻踪聚类评价模型研究与应用_黄勇辉

收稿日期: 2009-08-12 基金项目: 国家自然科学基金资助项目 ( 70771046) 作者简 介: 黄勇辉 ( 1974-) , 男 , 江西南昌人 ,南京航空航天大学博士 研究生 , 江西财经大学讲师 ,研究方向: 政府绩效 与综合评价 , 系统工程 ; 朱金福 ( 1955-) , 男 ,江苏常州人 ,南京航空航天大学教授 ,博士生导师 , 研究方向: 管理智能化。
想是: 把高维度的数据通过一定的组 合投影到低维度子空 间上 ,对于投影 到的构型 ,采用投 影指标函 数 (目标函 数 ) 来描述投影值 ,进而暴露原系统综合 评价问题某种分类排 序结 构的可 能性 大小 ,寻找 出使 投影 指标 函数 达到 最优 (即能反映高维度数据结构或者特征 )的投影值 ,然后根据 该投影值来分析高维度数据的分类结构特征 (即投影寻踪 聚类评价模型 )。其中 ,投影指标函数的构造 及其优化问题 是应用 PP方 法能否成功的关 键因素 ,其复杂性 在一定程 度上限 制了 P P方法 的深 入研 究和广 泛应 用。为 此 ,本文 提 出 基于 实 数 编 码 的 加速 遗 传 算 法 ( Real coding based Accelerating Genetic Alg orithm, R AG A)的 投影 寻踪 聚类 评价模型 ,并开展了相应的应用研究 。
局部 投影点尽可 能密集 ,最好凝聚 成若干 个点团 ;而在 整
体上 投影点团之 间尽可能 分散开。基于此 ,投影 指标函 数 可构造为
Q( a) = Sz Dz
( 3)
式 中 , Sz 为投影值 z ( i)的标准差 , Dz 为投 影值 z (i )的 局
部密度 ,即
n
∑ ( z (i ) - z )2

投影寻踪模型

投影寻踪模型

投影寻踪方法及应用内容摘要:本文从投影寻踪的研究背景出发,给出了投影寻踪的定义和投影指标,在此基础上得出了投影寻踪聚类模型,随后简单介绍了遗传算法。

最后结合上市公司的股价进行实证分析,并给出结论和建议。

关键词:投影寻踪投影寻踪聚类模型遗传算法一、简介(一)产生背景随着科技的发展,高维数据的统计分析越来越普遍,也越来越重要。

多元分析方法是解决高维数据这类问题的有力工具。

但传统的多元分析方法是建立在总体服从正态分布这个假定基础之上的。

不过实际问题中有许多数据不满足正态假定,需要用稳健的或非参数的方法来解决。

但是,当数据的维数很高时,即使用后两种方法也面临以下困难:第一个困难是随着维数增加,计算量迅速增大。

第二个困难是对于高维数据,即使样本量很大,仍会存在高维空间中分布稀疏的“维数祸根”。

对于核估计,近邻估计之类的非参数法很难使用。

第三个困难是对低维稳健性好的统计方法,用到高维时则稳健性变差。

另一方面,传统的数据分析方法的一个共同点是采用“对数据结构或分布特征作某种假定——按照一定准则寻找最优模拟——对建立的模型进行证实”这样一条证实性数据分析思维方法〔简称CDA法)。

这种方法的一个弱点是当数据的结构或特征与假定不相符时,模型的拟合和预报的精度均差,尤其对高维非正态、非线性数据分析,很难收到好的效果。

其原因是证实性数据分析思维方法过于形式化、数学化,受束缚大。

它难以适应千变万化的客观世界,无法真正找到数据的内在规律,远不能满足高维非正态数据分析的需要。

针对上述困难,近20年来,国际统计界提出采用“直接从审视数据出发—通过计算机分析模拟数据—设计软件程序检验”这样一条探索性数据分析新方法,而PP就是实现这种新思维的一种行之有效的方法。

(二)发展简史PP最早由Kruskal于70年初建议和试验。

他把高维数据投影到低维空间,通过数值计算得到最优投影,发现数据的聚类结构和解决化石分类问题。

1974年Frledman和Tukey加以改正,提出了一种把整体上的散布程度和局部凝聚程度结合起来的新指标进行聚类分析,正式提出了PP概念,并于1976年编制了计算机图像系统PRIM——9。

投影寻踪方法及其应用优秀课件

投影寻踪方法及其应用优秀课件
ia1(j,k,i)。同理可得另外的n个父代个体 ia2(j,k,i)。选择是遗传算法的关键,它体现 了优胜劣汰的思想。
步骤5:父代个体的杂交。
由步4得到的父代个体配对成n对双亲。生 成两随机数u1和u2,再转成十进制整数: IU1=INT(1+u1·e),IU2=INT(1+u2·e),设 IU1≤IU2(否则互换其值)。杂交是指第i对双 亲ia1(j,k,i)和ia2(j,k,i)随机变换一段二进制数,从 而生成第i对子代个体:
IU1=INT(1+e·u2),IU2=INT(1+e·u3) 设子代变异的概率(称为变异率)为pm。变异是 当u4≤pm时对子代个体的IU1位和IU2位的值进行 翻转操作:
0 1 1 0 1——0 0 1 1 1
(变异前)
(变异后)
步骤7:进化迭代。 第i个子代个体经式(3)、式(2)转化成第i组
Ij(i)=INT[u(j,i)2e]
(4)
式中INT为取整函数。由式(3)得对应二进制
数ia(j,k,i),它们与n组模型参数cj(i)对应,并 把它们作为初始父代个体群。
编码与解码的逻辑过程:cj(i)~ Ij(i)~ ia(j, k,i)
步骤3:父代个体适应能力评价。 把第i组参数代入式(1)得目标函数值fi,fi越 小表示模型与观测值拟合得越好,适应能力
2大方 11.8 31.5 –8.8 3332.8 1176.9 1265.9 84 256 1700.0 33.2 1.283
3黔西 14.1 35.4 –8.6 4047.4 964.1 1263.6 81 274 1272.1 14.6 1.722
4金沙 15.1 36.0 –6.2 4703.3 1049.7 1091.6 81 304 920.0 7.5 2.191

基于实码加速遗传算法的投影寻踪方法 在砂土液化势评价中的应用

基于实码加速遗传算法的投影寻踪方法 在砂土液化势评价中的应用
2 基于实码加速遗传算法的地震液 化投影寻踪可视化评价模型
2.1 投影寻踪基本原理 投影寻踪的基本思想是利用计算机技术,把高
维数据通过某种组合,投影到低维(1~3 维)子空间
上,并通过极小化某个投影指标,寻找出能反映原
高维数据结构或特征的投影,在低维空间上对数据
结构进行分析,以达到研究和分析高维数据的目的。
p
z(i) = ∑α( j)x(i,j) (i = 1~n)
(4)
j =1
式中:S(α ),D(α )分别为α 投影方向的投影值 z(i) 的数据散布特征和低维数据点的局部密度;E(α )为 α 投影方向投影值的均值;R 为估计局部密度的宽 度指标,可由数据特征来确定;I 为单位阶跃函数, 当 R≥rij 时,I 取值 1,否则为 0;rij 为距离,rij= rij = z(i) − z( j) 。 2.3 投影方向优化
集,整体上投影点团尽可能散开的目标,砂土液化
势评价的投影指标函数 Q(α )可构造如下:
Q(α ) = S(α )D(α )
(1)
∑ S

)
=
⎧ ⎨
n
[z(i) − E(α )]2
(n
பைடு நூலகம்

⎫0.5 1)⎬
(2)
⎩ i=1

nn
∑ ∑ D(α) =
(R − rij ) I (R − rij )
(3)
i=1 j=1
Wang Mingwu1,2,Jin Juliang1, Li Li3
(1School of Civil Engineering,Hefei University of Technology, Hefei 230009 China) (2Disaster Prevention Research Institute,Kyoto University, Kyoto 6110011 Japan) (3School of Natural Resources and Environmental Engineering,Hefei University of Technology, Hefei 230009

基于实码加速遗传算法的投影寻踪分类模型在水稻灌溉制度优化中的应用

基于实码加速遗传算法的投影寻踪分类模型在水稻灌溉制度优化中的应用
n
( 3)
sz =
n n
i =1
∑( z ( i )
- E ( z) )
2
n - 1 r ( i , j) ) ・u ( R - r ( i , j) )
( 4) ( 5)
Dz =
i =1
∑∑( R j=1
式中 : E ( z ) 为序列 { z ( i ) | i = 1~ n} 的平均值 ; R 为局部密度的窗口半径 , R 为可以根据试验 来确定 , 一般可取值为 011 S z ; r ( i , j ) 表示样本之间的距离 , r ( i , j ) = | z ( i ) - z ( j ) | ;
[1 、 2]
。通过一系列评价指标 , 来评价何种灌溉
模式为最优 。在模糊评判的每一阶段 , 都涉及权重矩阵 A 。对于权重矩阵 A , 多由专家凭经验给出 , 因此存在较大的主观性和人为干扰因素 , 不同专家往往会给出不同的数值 , 最终可能会影响评价的结 果 。模糊综合评判的实质是对高维数据 ( 多个评价指标值) 的处理 。即降低高维数据的维数 , 通过专 家给出的权重矩阵 , 对应于每个指标的低维投影值 , 在低维子空间实现其降维评价过程 。但专家的权 重矩阵是否属于各项指标 ( 多维) 在低维子空间的最佳投影 , 还无法确定 。为此 , 我们引进一种新兴 而又有效的降维技术 — — — 投影寻踪方法 ( PP) , 来实现其高维数据的降维过程 , 并将新兴的适合于多
[1 ]

。从另一方面看 , 影响水稻生长发育的因素众多纷繁 , 灌溉过程的土壤
水分状况又具有模糊性 , 而且外界环境因子和栽培措施对水稻生育和产量的影响 , 不单作用程度不 一 , 也难于定量化 , 按常规不易进行数量分析 。 基于上述原因 , 对水稻灌溉的优化分析不采用一般的数学规划法 。朱庭芸等采用了模糊数学理论 与田间试验相结合的方法 , 提出了水稻的优化灌溉模式

投影寻踪动态聚类模型及其在地下水分类中的应用

投影寻踪动态聚类模型及其在地下水分类中的应用

投影寻踪动态聚类模型及其在地下水分类中的应用倪长健;王顺久;崔鹏【期刊名称】《四川大学学报(工程科学版)》【年(卷),期】2006(038)006【摘要】针对投影寻踪聚类模型的不足,结合动态聚类方法对投影寻踪聚类模型进行了改进,建立了投影寻踪动态聚类模型.首先,利用投影技术将多因素(高维)问题投影到一维线性空间,以达到在一维空间研究高维数据的目标;其次,以动态聚类方法构造新的投影指标,对投影到线性空间的反映高维数据结构或特征的投影特征值序列进行聚类分析,进而完成多因素样本聚类分析.投影寻踪动态聚类模型是高维数据样本聚类分析的一种有效的统计方法,模型在整个运算过程中毋需人为给定参数,聚类结果合理、客观.投影寻踪动态聚类模型在地下水分类中的成功应用表明,投影寻踪动态聚类模型具有稳定性好、分类结果明确、操作简便等特点,为多因素聚类分析提供了一种新方法,有着广阔的应用前景.【总页数】5页(P29-33)【作者】倪长健;王顺久;崔鹏【作者单位】中国科学院水利部,成都山地灾害与环境研究所,四川,成都,610041;成都信息工程学院,四川,成都,610041;中国气象局,成都高原气象研究所,四川,成都,610071;中国科学院水利部,成都山地灾害与环境研究所,四川,成都,610041【正文语种】中文【中图分类】TV213【相关文献】1.基于免疫进化算法的投影寻踪聚类及其在地下水动态分类中的应用 [J], 舒栋才;樊明兰;林三益2.投影寻踪动态聚类模型在房地产投资环境评价中的应用 [J], 周勇;龚海东3.投影寻踪模型在地下水水质评价中的应用 [J], 张鹏4.基于投影寻踪原理的动态聚类模型及其在气候区划中的应用 [J], 王顺久;李跃清5.投影寻踪动态聚类模型及其在天然草地分类中的应用 [J], 倪长健;王顺久;崔鹏因版权原因,仅展示原文概要,查看原文内容请购买。

基于投影寻踪的kNN文本分类算法的加速策略

基于投影寻踪的kNN文本分类算法的加速策略

基于投影寻踪的kNN文本分类算法的加速策略张永;孟晓飞【摘要】传统的后近邻(k-nearest neighbors,kNN)文本分类中,由于文本被表示成向量空间模型后维数非常高,且训练文本的数目巨大,kNN分类算法通常被视为是一种虽然有效,但并非高效的文本分类算法.针对传统kNN分类算法效率低下的问题,提出了一种基于投影寻踪思想的kNN分类算法加速策略.基本思想是:通过投影的方法缩减训练集的规模,同时在寻找七近邻过程中对文本进行降维处理,从两方面着手降低算法的计算开销.实验数据表明,优化后的kNN算法比传统kNN算法在时间性能上有较大的提升,同时保证了分类的精度.【期刊名称】《科学技术与工程》【年(卷),期】2014(014)036【总页数】6页(P92-96,102)【关键词】kNN;文本分类;投影寻踪;降维;训练集缩减【作者】张永;孟晓飞【作者单位】兰州理工大学计算机与通信学院,兰州730050;兰州理工大学计算机与通信学院,兰州730050【正文语种】中文【中图分类】TP391.3目前文本分类方法主要包括k近邻(kNN)、支持向量机(SVM)、决策树、关联规则、贝叶斯等传统的分类算法和基于软计算的模糊逻辑、神经网络、粗糙集和遗传算法等。

由于kNN算法[1]思想简单、分类效果好,在文本分类中有着广泛的应用。

使用kNN算法时,首先要计算测试文本与所有训练文本的相似度,根据文本间的相似度,寻找出测试文本的k个近邻文本。

因此,kNN算法存在缺陷:处理相似性计算的计算开销巨大,尤其当特征空间的维数特别高、训练集非常大的时候。

投影寻踪(projeetion pursuit,PP)[2]是一种探索性数据分析方法。

它通过某种组合,将高维数据投影到低维(一至三维)子空间上,并通过极大(小)化某个投影指标,寻找出能反映原高维数据结构或特征的投影,在低维空间上对数据结构进行分析,以达到研究和分析高维数据的目的。

一种改进投影寻踪回归算法在湖泊水质富营养化评价中的应用

一种改进投影寻踪回归算法在湖泊水质富营养化评价中的应用

9
的因素作为评判指标,采用投影寻踪回归理论对原始数 据进行处理,提取原始样本的特征,将人工鱼群算法引 入到投影方向优化计算中,建立了湖泊富营养化等级评 价的数学模型, 在此基础上编制出基于 MATLAB 语言 的相应的计算程序,利用该评价模型对湖泊水体富营养 化进行综合评价,并通过实例予以验证。 研究结果证明 投影寻踪回归评价理论克服了以往分析方法的不足,为 湖泊富营养化等级的评定提供了一种简单方便、客观准 确的新方法,对我国湖泊污染的综合治理与防治具有重 要意义。
据的结构特征, 所以可以通过求解投影指标函数优化
问题来估计最佳投影方向,即:
‖max (α)
(7)
s.t.‖α‖1
因此,可以利用人工鱼群算法来解决上述优化问题。
1.1.4 湖泊富营养 化的等级评 价 该步骤在 获得的近
似最佳投影方向后,计算各经验等级样本点的投影值,
然后依据各经验等级及其对应的投影值建立基于投影
李 晓 磊 等[13]采 用 基 于 行 为 的 多 并 行 通 路 结 构 来 构
造人工鱼个体的模型, 模型封装了人工鱼的自身状态
和行为模式。 算法的进行也就是人工鱼个体的自适应
行为活动,个体每活动 1 次就是算法的 1 次迭代。
人 工 鱼 个 体 的 状 态 可 用 向 量 表 示 :X =(x1,x2,...,
群体规模。人工鱼群算法对人工鱼的觅食行为、聚群行
为 、追 尾 行 为 等 几 种 典 型 行 为 的 数 学 描 述 [14]方 法 如 下 :
1.2.1 觅食行为 人工鱼当前状态为 Xi,在其感知范围 内(即可见域内 di,j<Visual)随机选择 1 个状态 Xi,当该
状 态 食 物 浓 度 大 于 当 前 状 态 时 (即 Fi>Fi,此 处 以 求 极

基于投影寻踪的组合评价方法研究

基于投影寻踪的组合评价方法研究
(07JA790109);合肥工业大学科学研究发展基金项 目(061103F) [作 者 简 介 ] 王 硕 (1964一),男 ,安徽 合肥市人 ,合肥工业大学教授 ,博士后 ,研究方 向为经济预测与评 价
60 中 国工 程 科 学
维普资讯
Step 2 计算 加权 标准 化判 断矩 阵
U = [“i( )] = [W Y ( )]
(2)
其 中 为 指标 的权 重 ,(i= 1,2,… ,m; =
1,2,… ,n)。
Step 3 确定理 想解 和 负理 想解
理想解
一 “ (’『) ., “ (’『)IjEJ一}=
E =÷∑ 』eij,(i:1,2,…,m) (10) : l
“ (n)) 负 理想 解
(3)
一 m in /Zi( ) J m ax 1. ̄i( ) .,一}=

。—
( 。一(1),u。一(2),… ,u。一( ),… ,
“ 一(n))
(4)
式 中 ,., 为效 益 型指标 集合 ;.,一为 成本 型指 标集 合 。 Step 4 计算 各 方 案 到理 想 解 和 负 理 想解 之 间
的距离 : 方案 Ai到理 想解 距离
维普资讯
基 于投 影 寻 踪 的组 合 评 价 方法 研 究
王 硕 ,杨善林 ,胡笑旋
(合肥工业大学计算机网络 系统研究所 ,合肥 230009)
[摘要 ] 以理 想解法和灰色关联度分析法为基础进行组合 ,得 到的组合评 价方法能够 提高评 价结 果 的有效 性 。在该组合评价方法 的研究 中 ,常规的做法 是对指标组 合权重 的运用 主观赋值法 ,组合 的偏好系 数 、灰 色 关联度的分辨系数采取 人为赋值法 ,没能充分 挖掘组合评 价方法 的优 势。针 对此问题 ,提 出用投影 寻踪 法构 建处理组合评价法 的优化模型 ,运用 实码加 速遗传 算法处 理该非 线性优 化问题 ,所得 的指标 权重 为客 观权 重 ,同时得 到确定组合评价法组合偏好系数和灰色关联 度分辨 系数的新方法 。实例表 明,基于投影 寻踪的组 合 评 价 方 法 具 有 科 学 性 和 客 观性 。 [关键词] 组合评价 ;投影寻踪法 ;实码加速遗传算法 ;分辨 系数 ;组合偏好 系数 [中图分类号] 0223 [文献标识码 ] A [文章编号 ] 1009—1742(2008)08—0060—05

投影寻踪技术及其应用进展

投影寻踪技术及其应用进展

投影寻踪技术及其应用进展投影寻踪技术是一种广泛应用于不同领域的分析方法,它旨在通过将高维数据投影到低维空间中,寻找数据中的结构或规律。

本文将介绍投影寻踪技术的基本概念、原理和发展历程,并探讨其在不同领域的应用进展。

本文将介绍投影寻踪技术及其在多个领域中的应用进展,重点探讨该技术的原理、算法和应用场景。

投影寻踪技术最初是为了解决高维数据的可视化问题而提出的。

由于高维数据的复杂性,人们很难通过直观的方式理解其内部的结构和规律。

因此,通过将高维数据投影到低维空间中,可以帮助人们更好地理解数据。

投影寻踪技术的原理主要是通过寻找最佳投影方向,使投影后的数据结构尽可能地保留原有数据中的信息。

随着技术的发展,投影寻踪技术已经发展成为一种广泛应用于多个领域的分析方法。

它的应用范围涵盖了医学、军事、工业等多个领域。

医学领域:在医学领域,投影寻踪技术被广泛应用于基因表达数据分析、医学图像处理等方面。

例如,通过将高维基因表达数据投影到低维空间中,可以帮助生物学家更好地理解基因之间的关系和功能。

军事领域:在军事领域,投影寻踪技术被应用于目标跟踪、雷达信号处理等方面。

例如,通过将雷达信号投影到低维空间中,可以更好地分析和识别目标。

工业领域:在工业领域,投影寻踪技术被应用于故障诊断、质量控制等方面。

例如,通过将机器运行数据投影到低维空间中,可以帮助工程师更好地分析机器的运行状态和潜在故障。

本文通过实验对比了不同算法在投影寻踪技术中的表现。

实验结果表明,基于随机森林的投影寻踪算法在处理高维数据时具有较好的效果。

通过将实验结果与传统的线性降维方法进行比较,发现基于随机森林的投影寻踪算法可以更好地保留高维数据的结构和规律。

实验一:在基因表达数据分析中,我们采用了基于随机森林的投影寻踪算法对一组基因表达数据进行降维处理。

通过将降维后的数据与原始数据进行对比,发现降维后的数据仍然能够很好地反映原始数据中的基因表达模式和规律。

实验二:在雷达信号处理中,我们采用基于随机森林的投影寻踪算法对一组雷达信号进行降维处理。

基于核的投影寻踪方法及其在模式分类中的应用

基于核的投影寻踪方法及其在模式分类中的应用

基于核的投影寻踪方法及其在模式分类中的应用
罗玮;肖健华
【期刊名称】《五邑大学学报(自然科学版)》
【年(卷),期】2003(017)003
【摘要】分析了一般投影寻踪方法存在的局限和核方法在处理非线性方面所具有的优势,在此基础上结合支持向量机的最新研究成果,提出了基于核的投影寻踪方法,并将其应用到滚动轴承的质量分类中,取得了较为理想的效果.
【总页数】6页(P6-11)
【作者】罗玮;肖健华
【作者单位】广州市交通委员会,信息中心,广州,510405;五邑大学,智能技术与系统研究所,广东,江门,529020
【正文语种】中文
【中图分类】O235
【相关文献】
1.基于实数编码加速遗传投影寻踪方法在物流供应商选择中的应用 [J], 杨树果;王新利
2.基于J散度的模式分类方法在故障诊断中的应用 [J], 苗刚;马孝江;任全民
3.基于采样点局部密度的径向基函数核宽度确定方法及其在装备设计中的应用范例[J], 黄昊;胡永峰
4.基于核的机器学习方法及其在多用户检测中的应用 [J], 周亚同;张太镒;刘海员
5.基于核方法的非线性灰色多变量模型在交通污染预测中的应用 [J], 解铭; 吉伟卓; 齐丹媛; 段冬冬; 刘丽英
因版权原因,仅展示原文概要,查看原文内容请购买。

投影寻踪动态聚类模型

投影寻踪动态聚类模型

投影寻踪动态聚类模型
倪长健;崔鹏
【期刊名称】《系统工程学报》
【年(卷),期】2007(22)6
【摘要】投影寻踪聚类模型在多因素聚类分析中被广泛应用并取得了满意的效果,然而,该模型还存在诸如密度窗宽参数取值经验确定等不足,有待改进提高.本文针对投影寻踪聚类模型的不足,首次把投影寻踪的思想和动态聚类方法结合起来构造投影指标,基于免疫进化算法,建立了投影寻踪动态聚类新模型.新模型一方面在整个运算过程中毋需人为给定参数,聚类结果客观、明确,另一方面,它还具有稳定性好、操作简便等特点.洪水分类的实际应用表明,投影寻踪动态聚类模型切实可行,取得了很好的效果,在多因素聚类分析领域具有广阔的应用前景.
【总页数】5页(P634-638)
【作者】倪长健;崔鹏
【作者单位】中国科学院山地灾害与环境研究所,四川,成都,610041;成都信息工程学院环境工程系,四川,成都,610041;中国科学院山地灾害与环境研究所,四川,成都,610041
【正文语种】中文
【中图分类】TV213
【相关文献】
1.基于投影寻踪动态聚类法的水库水质评价模型 [J], 康明;王丽萍;赵璧奎;张验科
2.基于投影寻踪动态聚类模型尾矿库溃坝风险的研究 [J], 段沛霞
3.投影寻踪动态聚类模型在房地产投资环境评价中的应用 [J], 周勇;龚海东
4.基于投影寻踪动态聚类模型的p2p网贷风险评价体系构建及实例分析 [J], 张亚晶;楼文高
5.基于投影寻踪动态聚类模型的川东北雷暴预警的分析 [J], 涂朝勇;倪长健;朱育雷;郑云华
因版权原因,仅展示原文概要,查看原文内容请购买。

基于加速遗传算法的投影寻踪模型代码

基于加速遗传算法的投影寻踪模型代码

基于加速遗传算法的投影寻踪模型代码以下是一个基于加速遗传算法的投影寻踪模型的代码示例:```pythonimport numpy as npdef fitness_function(x, y):#计算适应度函数#在此示例中,适应度函数计算点(x,y)到目标点的距离target_point = (5, 5)distance = np.sqrt((x - target_point[0])**2 + (y -target_point[1])**2)return 1 / (distance + 1)def selection(population, fitness_values, num_parents):#选择函数,选出适应度较高的个体作为父代parents = []for i in range(num_parents):max_index = np.argmax(fitness_values)parents.append(population[max_index])fitness_values[max_index] = -1 # 将已选个体的适应度设为负数,防止重复选择return parentsdef crossover(parents, num_offsprings):#交叉操作,生成新的子代个体offsprings = []for i in range(num_offsprings):parent1 = parents[i % len(parents)]parent2 = parents[(i+1) % len(parents)]offspring = (parent1[0], parent2[1])offsprings.append(offspring)return offspringsdef mutation(offsprings, mutation_rate):#变异操作for i in range(len(offsprings)):if np.random.uniform(0, 1) < mutation_rate:x = offsprings[i][0]y = offsprings[i][1]mutation_value = np.random.uniform(-1, 1) # 从[-1, 1]区间随机选择一个值来增加变异x += mutation_valuey += mutation_valueoffsprings[i] = (x, y)return offspringsdef genetic_algorithm(population, num_generations,num_parents, num_offsprings, mutation_rate):for generation in range(num_generations):fitness_values = []for i in range(len(population)):x = population[i][0]y = population[i][1]fitness = fitness_function(x, y)fitness_values.append(fitness)parents = selection(population, fitness_values, num_parents) offsprings = crossover(parents, num_offsprings)offsprings = mutation(offsprings, mutation_rate)population = parents + offspringsbest_solution_index = np.argmax(fitness_values)best_solution = population[best_solution_index]return best_solution#设置模型参数num_parents = 10num_offsprings = 100num_generations = 100mutation_rate = 0.1#生成初始种群population = []for _ in range(num_parents):x = np.random.uniform(0, 10)y = np.random.uniform(0, 10)population.append((x, y))#使用遗传算法找到最佳解best_solution = genetic_algorithm(population,num_generations, num_parents, num_offsprings, mutation_rate) print("最佳解:", best_solution)```这个代码示例实现了一个简单的投影寻踪模型,使用加速遗传算法来找到最佳解。

投影寻踪模型在国民经济综合评价中的应用

投影寻踪模型在国民经济综合评价中的应用

投影寻踪模型在国民经济综合评价中的应用
方必和;程志宏;刘慧萍
【期刊名称】《运筹与管理》
【年(卷),期】2005(014)005
【摘要】文章针对区域国民经济发展的多属性,采用投影寻踪评价模型,用加速遗传算法寻找最佳投影方向,将多维属性指标转换为一维投影值.在此基础上,通过建立单属性指标的分类等级区间,给出区域国民经济发展水平分类的投影值区间,从而实现
对区域国民经济发展水平的分类.应用表明,它是国民经济评价的一种计算过程简单、直观的新方法.
【总页数】4页(P85-88)
【作者】方必和;程志宏;刘慧萍
【作者单位】合肥工业大学,管理学院,安徽,合肥;合肥工业大学,土木建筑工程学院,
安徽,合肥,230009;安徽省水利水电勘测设计院,安徽,合肥,230022
【正文语种】中文
【中图分类】F224.5
【相关文献】
1.蛙跳算法投影寻踪模型及其在甘肃省主要城市国民经济综合指标评价中的应用[J], 代永强;王联国
2.投影寻踪模型在医疗质量综合评价中的应用 [J], 董小小;魏歆;宋丽娟
3.遗传算法与投影寻踪模型在湿地水质综合评价中的应用 [J], 张浩;户超
4.差分进化算法-投影寻踪模型在水质综合评价中的应用 [J], 崔东文;姜敏
5.投影寻踪模型在国民经济综合评价中的应用 [J], 江澜
因版权原因,仅展示原文概要,查看原文内容请购买。

  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

Sz =
i= 1
n- 1
( 4)
nn
∑ ∑ Dz =
( R - rij )u ( R - rij )
( 5)
i= 1 j= 1
式中 , z 为序列 { z ( i )|i= 1~ n}的 均值 ; R 为求局 部密 度
的窗 口半径 , 它的 选取既 要使包 含在窗 口内的 投影点 的
平均 个数不太少 ,避免 滑动平均偏 差过大 ,又不 能使它 随
1 0. 00 0. 38 0. 67 0. 40 0. 00 0. 20 0. 80 0. 45 0. 60 0. 73 1. 00 0. 24
2 0. 10 0. 00 1. 00 0. 00 0. 05 0. 00 0. 00 0. 40 0. 00 0. 00 0. 00 0. 00
3 0. 20 1. 00 0. 92 0. 12 1. 00 1. 00 0. 45 1. 0 1. 00 1. 00 0. 80 1. 00
10 8
系 统 工 程 2009年
x( i, j ) =
x* ( i, j ) xmax ( j ) -
x min x min
( (
j) j)
,
x max ( j ) xmax ( j ) -
x* (i , j ) x min ( j )
,
x* ( i, j ): 有利因子 ( 1)
7 0. 00 1. 00 0. 00 0. 18 1. 00 0. 00 0. 00 0. 00 0. 05 0. 00 0. 79 0. 43
8 1. 00 0. 40 0. 33 0. 83 0. 00 0. 31 0. 71 0. 02 0. 06 0. 92 0. 58 0. 03
针对 上述问 题 , 学术界提 出了直 接由 样本数 据驱 动 的探索性数据分析方法 ,投影寻踪 ( Projectio n Pursuit, PP) 方法 [1,2 ]是这类 方法的典 型代表。所谓投 影寻踪 就是将 高 维数 据向低 维空间 投影 , 通过分 析低维 空间的 投影特 性 进而 来研究 高维数 据的特 征 , 是 处理多 因素复 杂问题 的 统计方法。投影寻踪聚类 ( Pro jection Pursuit Cluster, P PC) 模型 则是依 据投影 寻踪思 想建立 的聚类分 析模型 , 它 已 被广泛应用于模式识别和多因素分析领 域 [3- 12]。其基本思
想是: 把高维度的数据通过一定的组 合投影到低维度子空 间上 ,对于投影 到的构型 ,采用投 影指标函 数 (目标函 数 ) 来描述投影值 ,进而暴露原系统综合 评价问题某种分类排 序结 构的可 能性 大小 ,寻找 出使 投影 指标 函数 达到 最优 (即能反映高维度数据结构或者特征 )的投影值 ,然后根据 该投影值来分析高维度数据的分类结构特征 (即投影寻踪 聚类评价模型 )。其中 ,投影指标函数的构造 及其优化问题 是应用 PP方 法能否成功的关 键因素 ,其复杂性 在一定程 度上限 制了 P P方法 的深 入研 究和广 泛应 用。为 此 ,本文 提 出 基于 实 数 编 码 的 加速 遗 传 算 法 ( Real coding based Accelerating Genetic Alg orithm, R AG A)的 投影 寻踪 聚类 评价模型 ,并开展了相应的应用研究 。
问题较为简便和有效。
② 基于实码的加速遗传算法原理及 实现的流程
基于 实码加 速遗传 算法 ( R AG A)的选 择、交 叉、变异 是并行处理的 ,因此 R AG A实 际搜索范围广 ,得到全局最 优点的机会也 大。RA G A的循 环可逐步调 整、缩 小优化变 量的寻优区间 ,解的精度随着循环次 数的增加可望逐步提 高。
4 0. 30 0. 17 0. 42 0. 03 0. 37 0. 29 0. 30 0. 26 0. 06 0. 33 0. 93 0. 45
5 1. 00 0. 48 0. 00 1. 00 0. 42 0. 11 1. 00 0. 00 0. 66 0. 12 0. 78 0. 33
6 0. 00 0. 40 1. 00 1. 00 0. 76 0. 00 1. 00 0. 47 0. 00 0. 12 0. 00 0. 00
局部 投影点尽可 能密集 ,最好凝聚 成若干 个点团 ;而在 整
体上 投影点团之 间尽可能 分散开。基于此 ,投影 指标函 数 可构造为
Q( a) = Sz Dz
( 3)
式 中 , Sz 为投影值 z ( i)的标准差 , Dz 为投 影值 z (i )的 局
部密度 ,即
n
∑ ( z (i ) - z )2
收稿日期: 2009-08-12 基金项目: 国家自然科学基金资助项目 ( 70771046) 作者简 介: 黄勇辉 ( 1974-) , 男 , 江西南昌人 ,南京航空航天大学博士 研究生 , 江西财经大学讲师 ,研究方向: 政府绩效 与综合评价 , 系统工程 ; 朱金福 ( 1955-) , 男 ,江苏常州人 ,南京航空航天大学教授 ,博士生导师 , 研究方向: 管理智能化。
图 1 加速遣传算法实现的流程 ( 4)聚类 (优序排列 ) 把由 ( 3)求得的最佳投影方 向 a* 带入 式 ( 2)后即得各 样本 点的投影 值 z* ( i)。投影 值 z* ( i)与 z* ( j )越接近 ,表 示样 本 i 与 样本 j 越倾向 于归为 一类。按 z* ( i )值 从大到 小排序 ,据此可把对样本集进行分类 。
1 引言
常规 的系统评 价方法存在 一个共 同特点 ,即采 用“对 数据 结果或分布 特征先作 某种假定 — — 按照一 定准则 建 立显式评价函数 —— 对建立的评价函数 模型进行证实”这 样一 条证实性数 据分析方 法。目前 常用的 评价方 法有: 模 糊综合评价方法在对各指标进行“特征化”处理后 ,会出 现 不同程度的 信息丢失 ,为 评价结论带来误差 ; A HP法和 灰 色关 联评价法具 有能解决 多目标、多层次、多准 则决策 问 题的 优势 ,但 评价结果 往往受主观 因素的 支配与 干扰 ; 基 于特 征向量的最 优综合评 价法 ,不 需人为 确定权 重 ,评 价 结果接近实际 ,但难于从系统各层次把握被评对象的综 合 水平 及应采取的 技术措施。而且由 于数学 化、形 式化等 局 限性 ,这类方法对于处理某些高维度、非线 性 ,非正态评 价 问题的适应能力不强。
3 实例运用与分析
现 以 南京 地区 ( 5县 4区 )的 农 业生 产 力综 合 评价 为 例 [13] ,进一步说明 RA G A— P PC模型的应用。农业生产力 综合评价 指标体系包 括劳动生 产率、土地生产 率、农业总 产值、化肥用量、机械总动力、农村用电 量、有效灌溉 率、耕 地复种指数、每劳动力负担耕地能力 、净产值率、水稻气候 生产力和小麦气候生产力共 12项评价指标 ,因而指标样本 集共有 9个 ( 5县 4区 ) , 12个评价指标 (已归 一化处理 ) ,详见 表 1。
基于实码 的加速遗传 算法是分 别在父 代群体 的基础 上通过选择、交叉、变异算子得到 3个子代群体 ,选择 N (群 体规模 )个优秀 个体作为 下一代父代 群体。有限次 运算后 进行加速遗传 ,缩小优秀个体选择 的区间 (分别将 M 次演 化迭代的 S个优 秀个体共 M× S个体 的变化区 间作为下 一次加速 遗传的变 量区间 ) ,这样 演化迭代 与加速 遗传的 反复交替进行可实现遗传进化逐步向最优个体逼近 ,并且 随着接近 优秀个体 ,个体的 密度加大 ,这样 可在一 定程度 上减少早熟收敛的机率。加速遗传算 法的流程见图 1。
第 11期 黄勇 辉 ,朱金福: 基于加速遗传算法的投影寻踪聚类评价模型研究与应用
109
样本
六合县 江浦县 江宁县 溧水县 高淳县 浦口区 大厂区 栖霞区 雨花区
表 1 农业生产力评级指标样本集及其投 影值
序号
评价指标 j
j= 1 j= 2 j= 3 j= 4 j= 5 j= 6 j= 7 j= 8 j= 9 j= 10 j= 11 j= 12
第 27卷第 11期 (总第 191期 ) 系 统 工 程 2009年 11月 Syst ems Engineeri ng
文章编号: 1001-4098( 2009) 11-0107-04
V o l. 27, N o. 11 Nov. , 2009
基于加速遗传算法的投影寻踪聚类评价模型研究与应用( 7) Nhomakorabeaj= 1
这 是一个以 {a ( j )|j= 1~ p }为优 化变量 的复杂 非线性 优
化问 题 ,用常 规优化方 法处理较困 难。模 拟生物 优胜劣 汰
规 则与 群 体内 部染 色 体信 息 交换 机 制的 加 速遗 传 算 法
( R AG A)是一种通用的 全局优化方法 ,可用它来求解上 述
黄勇辉 1, 2 ,朱金福 1
( 1. 南京航空航天大学 民 航学院 ,江苏 南京 210016; 2. 江西财经大学 公共管理学院 ,江西 南昌 330013)
摘 要: 针对农业生产 力综合评价这类高 维指标体系决策问 题 ,采用降 维技术: 投影 寻踪分类模型 ,利用基于 实数编码的加速遗传算法优化其投影方向 ,将多维数据指标 (样本 评价指标 )转换 到低维子空 间 ,根 据投影函 数值的大小评价出样本的优劣 ,从而做出决策。该模型 最大限度地避免了传统评判中权重取值的人为干扰 ,评 价结果更为准确客观 ,为农业生产力综合评价决策及其它评判决策问题提供一条新的方法与思路 。 关键词: 投影寻踪 ;加速遗传算法 ;聚类 ;农业综合生产力 ;高维指标 中图分类号: N 945; C934 文 献标识码: A
着 n 的增大太快 , R 一般可取值为 0. 1Sz ; 距离 rij = |z ( i) z ( j )|; u( t )为单位阶跃函数 , 当 t≥ 0时其函数值为 1,当 t
相关文档
最新文档