投影寻踪方法及应用
投影寻踪方法及应用
投影寻踪方法及应用
投影寻踪方法是一种图像处理技术,主要用于跟踪或寻找图像中的某个目标或区域。
它通过对目标的投影进行分析和处理,从而实现目标的寻找和跟踪。
常见的投影寻踪方法包括:
1. 基于阈值的方法:将图像转换为二值图像,然后使用阈值来提取目标的投影,通过对投影进行分析和处理来实现目标的寻踪。
2. 基于模板匹配的方法:使用预先定义的模板与图像进行比较,通过对比图像中的局部区域与模板的相似度来实现目标的寻踪。
3. 基于特征点的方法:通过检测图像中的特征点,并使用特征点间的相对位置和运动信息来实现目标的寻踪。
4. 基于边缘检测的方法:通过检测图像中的边缘,并利用边缘的形状和分布信息来实现目标的寻踪。
投影寻踪方法在许多领域都有应用,例如:
1. 视频监控:用于实时跟踪目标物体,如行人、车辆等。
2. 机器人导航:用于机器人的自主导航和避障。
3. 动作识别:用于分析和识别人体动作,如姿态跟踪、手势识别等。
4. 医学图像处理:用于跟踪和分析医学图像中的病变和器官。
5. 航空航天:用于航空器或卫星的轨迹预测和跟踪。
总的来说,投影寻踪方法是一种重要的图像处理技术,可以在许多领域中应用,实现目标的寻找和跟踪。
用投影寻踪方法建立准确的定量构性关系模型
找到 隐 含在 数据 中的规 律 有利 于 建立 好 的模 型 . 文 用投 影 寻踪 方法 先 对数 据 进行 分 类 , 利用 得到 的 本 再 分类 信 息建 立构 性关 系模 型,
1 理 论 与方 法
投 影 寻 踪[ 是 由统 计 学 家 F i ma 2 ] r d n于 7 e O年 代 提 出来 的. 基本 思 想 是 : 高 维 数 据 空 间 , 本 其 在 样 间 的关 系不 容 易被 观 察 到 , 果 能找 到 一个 好 的 投影 方 向 , 高维 数 据 投 影 到 低维 空 间 , 容 易 观 察 到 如 将 便
条 件 下 的 保 留指 数 . 扑 指 数 采 用 在 QS / P 中被 广 泛 使 用 的分 子 连 接 性 指 数 , X , 3 拓 AR QS R 即。 ,X . X,
研究 中用到 的所 有 计算 程 序 均 用软 件 MATL . AB 5 3版编 写.
收 稿 日期 : 0 2 0 — 3 2 0 —4 2
J n ,0 2 u . 2 0
文 章 编 号 :0 71 5 ( 0 2 0 —0 50 1 0 —8 7 2 0 ) 20 2 — 3
用投影 寻踪 方法建 立准确 的定量 构性关 系模型
杜 一 平 ,王 文 明 ,张彦 芳
( 山东 理 工大 学 , 山东 淄博 2 5 9 ) 5 0 1
算 描述 分 类结 果 的 投影 指 标. 研究 随 机地 选 取 了 1 , 1 。 包 含 9个 样本 的样 本 子集 , 本 0 次 即 0个 计算 了相
应 的 1 。 投影 指 标 值 , 留其 中具 有 最小 投 影 指 标 的 1 0个 样 本 子 集 , 究 样 本 的 分 类 ( 计 算 用 时 0个 保 0 研 此 1 6小 时 ) 我 们最 感 兴趣 的一 种分 类 模式 如 图 1 示. . 所
投影寻踪方法及其应用优秀课件
步骤5:父代个体的杂交。
由步4得到的父代个体配对成n对双亲。生 成两随机数u1和u2,再转成十进制整数: IU1=INT(1+u1·e),IU2=INT(1+u2·e),设 IU1≤IU2(否则互换其值)。杂交是指第i对双 亲ia1(j,k,i)和ia2(j,k,i)随机变换一段二进制数,从 而生成第i对子代个体:
IU1=INT(1+e·u2),IU2=INT(1+e·u3) 设子代变异的概率(称为变异率)为pm。变异是 当u4≤pm时对子代个体的IU1位和IU2位的值进行 翻转操作:
0 1 1 0 1——0 0 1 1 1
(变异前)
(变异后)
步骤7:进化迭代。 第i个子代个体经式(3)、式(2)转化成第i组
Ij(i)=INT[u(j,i)2e]
(4)
式中INT为取整函数。由式(3)得对应二进制
数ia(j,k,i),它们与n组模型参数cj(i)对应,并 把它们作为初始父代个体群。
编码与解码的逻辑过程:cj(i)~ Ij(i)~ ia(j, k,i)
步骤3:父代个体适应能力评价。 把第i组参数代入式(1)得目标函数值fi,fi越 小表示模型与观测值拟合得越好,适应能力
2大方 11.8 31.5 –8.8 3332.8 1176.9 1265.9 84 256 1700.0 33.2 1.283
3黔西 14.1 35.4 –8.6 4047.4 964.1 1263.6 81 274 1272.1 14.6 1.722
4金沙 15.1 36.0 –6.2 4703.3 1049.7 1091.6 81 304 920.0 7.5 2.191
投影寻踪方法及应用
投影寻踪方法及应用内容摘要:本文从投影寻踪的研究背景出发,给出了投影寻踪的定义和投影指标,在此基础上得出了投影寻踪聚类模型,随后简单介绍了遗传算法。
最后结合上市公司的股价进行实证分析,并给出结论和建议。
关键词:投影寻踪投影寻踪聚类模型遗传算法一、简介(一)产生背景随着科技的发展,高维数据的统计分析越来越普遍,也越来越重要。
多元分析方法是解决高维数据这类问题的有力工具。
但传统的多元分析方法是建立在总体服从正态分布这个假定基础之上的。
不过实际问题中有许多数据不满足正态假定,需要用稳健的或非参数的方法来解决。
但是,当数据的维数很高时,即使用后两种方法也面临以下困难:第一个困难是随着维数增加,计算量迅速增大。
第二个困难是对于高维数据,即使样本量很大,仍会存在高维空间中分布稀疏的“维数祸根”。
对于核估计,近邻估计之类的非参数法很难使用。
第三个困难是对低维稳健性好的统计方法,用到高维时则稳健性变差。
另一方面,传统的数据分析方法的一个共同点是采用“对数据结构或分布特征作某种假定——按照一定准则寻找最优模拟——对建立的模型进行证实”这样一条证实性数据分析思维方法〔简称CDA法)。
这种方法的一个弱点是当数据的结构或特征与假定不相符时,模型的拟合和预报的精度均差,尤其对高维非正态、非线性数据分析,很难收到好的效果。
其原因是证实性数据分析思维方法过于形式化、数学化,受束缚大。
它难以适应千变万化的客观世界,无法真正找到数据的内在规律,远不能满足高维非正态数据分析的需要。
针对上述困难,近20年来,国际统计界提出采用“直接从审视数据出发—通过计算机分析模拟数据—设计软件程序检验”这样一条探索性数据分析新方法,而PP就是实现这种新思维的一种行之有效的方法。
因此,高维数据尤其是非正态高维数据分析的需要,加上80年代计算机技术的高度发展是PP产生的主要背景。
(二)发展简史PP最早由Kruskal于70年初建议和试验。
他把高维数据投影到低维空间,通过数值计算得到最优投影,发现数据的聚类结构和解决化石分类问题。
基于投影寻踪学习网络的盲水印方法
基 于投影 寻踪 学 习网络 的盲水 印方法
何 帆 ,丁卫平 ,胡 琳 2
(.湖南 理工学院 数学学 院, 1 湖南 岳 阳 4 4 0 ; .华南师范大学 计 算机学院,广州 5 0 3 ) 10 6 2 16 1 摘 要 :给 出了基 于投 影寻踪学 习网络 的数 字图像盲水 印嵌入 和提 取的 方法. 通过 实验 比较 了相 同隐节 点下使 用投影
Abta t B sdo r et np r i l rign t r, oo g l dwa r rigme o speetd A dw s c: ae npo c o us te nn e r j i u a wok aclri ebi t makn t dwa rsne . n e ma n e h
Байду номын сангаас
引 言
随 着 因 特 网 的广泛 应 用 ,数 字化 产 品 的交 流 已达 到 了前 所 未有 的深度 和广 度 .如今 任 何 人都 可 以通
过因特网发布 自己的作品、 重要信息或进行 网络贸易等, 但是随之 出现 的侵权问题也 日 趋严重. 如何有效 地保护数字产品的知识产权问题受到人们高度重视, 数字水印由此得到了广泛的发展. 近几年, 神经网络 在数字水印技术 中的应用开始发展起来 . r si asl E. hs B na给出了使用 B 神经 网络辅助将水印嵌入到图像 A h P
(. ol e f te t snu a s tto Sin e n eh oo yY e ag4 4 0 ; . olg f o p tr cec, 1C lg Ma mai , n nI tue f cec dT cn lg, uy 1 0 6 2 C l e C m ue ine e o h c ni a n e o S S uhC ia r l nv r t, u n z o 6 C ia o t hn ma U iesy G a gh u5 3 , hn ) No i 1 1 0
【R】R语言常用包汇总
【R】R语⾔常⽤包汇总⼀、⼀些函数包⼤汇总时间上有点过期,下⾯的资料供⼤家参考基本的R包已经实现了传统多元统计的很多功能,然⽽CRNA的许多其它包提供了更深⼊的多元统计⽅法,下⾯要综述的包主要分为以下⼏个部分:1)多元数据可视化(Visualising multivariate data)绘图⽅法 基本画图函数(如:pairs()、coplot())和 lattice包⾥的画图函数(xyplot()、splom())可以画成对列表的⼆维散点图,3维密度图。
car 包⾥的scatterplot.matrix()函数提供更强⼤的⼆维散点图的画法。
cwhmisc包集合⾥的cwhplot包的pltSplomT()函数类似pair()画散点图矩阵,⽽且可以在对⾓位置画柱状图或密度估计图。
除此之外,scatterplot3d包可画3维的散点图,aplpack包⾥bagplot()可画⼆变量的boxplot,spin3R()可画可旋转的三维点图。
misc3d包有可视化密度的函数。
YaleToolkit包提供许多多元数据可视化技术,agsemisc也是这样。
更特殊的多元图包括:aplpack包⾥的faces()可画Chernoff’s face;MASS包⾥的parcoord()可画平⾏坐标图(矩阵的每⼀⾏画⼀条线,横轴表⽰矩阵的每列); graphics包⾥的stars()可画多元数据的星状图(矩阵的每⼀⾏⽤⼀个星状图表⽰)。
ade4包⾥的mstree()和vegan包⾥的spantree()可画最⼩⽣成树。
calibrate包⽀持双变量图和散点图,chplot包可画convex hull图。
geometry包提供了和qhull库的接⼝,由convexhulln()可给出相应点的索引。
ellipse包可画椭圆,也可以⽤plotcorr()可视化相关矩阵。
denpro包为多元可视化提供⽔平集树形结构(level set trees)。
地图投影的应用和变换
地图投影的应用和变换1. 引言地图投影是将地球的三维表面展示在平面上的一种转换方法。
由于地球是一个球体,而大部分的地图都是平面图,为了准确地表示地球表面上的地理信息,地图投影成为了不可或缺的工具。
本文将介绍地图投影的应用和变换。
2. 地图投影的意义和应用地图投影对于地理信息的准确传达非常重要,它可以帮助我们更好地理解和解读地球上的各种地理现象和空间关系。
以下是地图投影的主要应用领域:2.1 地理信息系统(GIS)地理信息系统(GIS)是一种用于收集、存储、分析、管理和展示地理信息的系统。
地图投影在GIS中广泛应用,用于将地球表面的地理信息转换为平面图,并进行空间分析和数据处理。
2.2 地图制作和导航地图投影在地图制作和导航中起着至关重要的作用。
通过地图投影,我们可以将地球上的各种地理特征准确地展示在地图上,使人们能够更好地理解和识别地理位置,并利用地图进行导航。
2.3 气象预报地图投影在气象预报中也扮演了重要角色。
通过将地球表面的气象数据投影到平面图上,气象学家们可以更好地分析和预测天气现象,为人们提供准确的天气预报。
2.4 城市规划和地理分析地图投影在城市规划和地理分析中也得到了广泛的应用。
通过将地球表面的地理数据转换为平面图,城市规划师和地理分析师可以更好地分析城市的发展趋势、交通规划等,并为城市规划和发展提供决策支持。
3. 常见的地图投影方法地图投影有多种方法,每种方法都有其特点和适用范围。
下面介绍几种常见的地图投影方法:3.1 圆柱投影圆柱投影是最常见的地图投影方法之一。
它将地球表面的经纬线投影到一个圆柱体上,然后再将圆柱体展开成平面图。
该投影方法在赤道周围的地区表现较好,但在离赤道较远的地区会出现形变。
3.2 锥形投影锥形投影是将地球表面的经纬线投影到一个圆锥体上,然后再将圆锥体展开成平面图。
该投影方法在中纬度地区表现较好,但在靠近两极地区会出现形变。
3.3 圆锥柱面投影圆锥柱面投影是将地球表面的经纬线投影到一个圆锥体和一个圆柱体上,然后将两个表面展开成平面图。
水土流失分区的赋权投影寻踪方法
水利规划与设计
2 0 1 3 年第 1 l 期
水土流失分 区的赋权投影寻踪方法
张庆 文 金 菊 良
( 1 . 甘肃省陇南市水利 电力勘 测设计院 甘肃 武都 7 4 6 0 0 0 ; 2 .合肥工 业大学 安徽 合肥 2 3 0 0 0 9 )
【 摘 要 】 以兰 州新 区为 背 景 ,分 析 了新 区水 资源 的特 征 、 结构 以及 水 资 源 的可 持续 利 用 状况 ,论证 了兰 州新 区 的水 资源 的利 用 结 构 ,进行 了新 区的 需水 量 预测 和 可供 水 量预 测 ,从 兰州 新 区水 资源 供 需平 衡分 析 结果 入手 ,针 对 本 区特 点从 几个 方 面提 出了加 强兰 州新 区水 资源 可持 续利 用 的对 策和 建 议 。 【 关键词】 兰州 新 区 水 资 源 可 持续 利 用 水 资 源供 需 平衡 分 析 对 策 【 D O I编码 】 1 0 . 3 9 6 9 / j . i s s n . 1 6 7 2 — 2 4 6 9 . 2 0 1 3 . 1 1 . 0 1 3
分 区过 程 兼 有 许 多 定 量 指 标 和 定 性指 标 , 且 各 指
流 失强度越 大的标准化处理公式 可取 为:
, ,= X i i / m a x,
.
( 1)
,
标 的量 纲和 对水土流失分 区的效用不尽相 同, 特 别是各 指标的权重 目前 尚较难确 定 。 上 述这些分 区 方法 在 实 际 应 用 中存 在 不 足 , 集 中体 现 在 定性 指标 如 何 定 量 化 , 各 指标 权 重 如 何合 理 确 定 问 题, 各单元综合评价指标值 的差异较 小等 。 为此 , 本文在上述研 究成果基 础上 , 综合挖 掘主观判断
比较分析四种投影调查技法
比较分析四种投影调查技法什么是投影技法投影技法是一种无结构的非直接的询问形式,可以鼓励被调查者将他们对所关心问题的潜在动机、信仰、态度或感情投射出来。
在投影技法中,并不要求被调查者描述自己的行为,而是要他们解释其他人的行为。
在解释他人的行为时,被调查者就间接地将他们自己的动机、信仰、态度或感情投影到了有关的情景之中。
因此,通过分析被调查者对那些没有结构的、不明确而且模棱两可的“剧本”的反应,他们的态度也就被揭示出来了。
投影技法的应用和心理学中的分类一样,投影技法可分成联想技法、完成技法、结构技法和表现技法。
1)联想技法:在投影技法中,将一种刺激物呈放在被调查者面前,然后询问被调查者最初联想到的事。
在这类技法中最常用的叫词语联想法。
在词语联想中,给出一连串的词语,每给一个词语,都让被调查者回答其最初联想到的词语(叫反应语)。
调研者感爱好的那些词语(叫试验词语或刺激词语)是散布在那一串展示的词语中的,在给出的一连串词语中,也有一些中性的或充数的词语,用于掩盖研究的目的。
例如在对百货商店顾客光顾情况的调研中,试验词语可以选择“位置”、“购物”、“停车场”、“质量”、“价格”之类的词语。
被调查者对每一个词的反应是逐字记录并且计时的,这样反应犹豫者(要花三秒钟以上往返答)也可以识别出来。
调查员记录反应的情况,这样被调查者书写反应语所要求的时间也就得到了控制。
这种技法的潜在假定是,联想可让反应者或被调查者暴露出他们对有关问题的内在感情。
对回答或反应的分析可计算如下几个量:每个反应词语出现的频数;在给出反应词语之前耽搁的时间长度;在合理的时间段内,对某一试验词语,完全无反应的被调查者的数目;根本无反应的被调查者就被判定为是情感卷入造成的反应阻塞。
研究者经常将这些联想分为赞成的、不赞成的和中性的三类。
一个被调查者的反应模式以及反应的细节,可用来决定其对所研究问题的潜在态度或情感。
2)完成技法:在完成技法中,给出不完全的一种刺激情景,要求被调查者来完成。
地图投影的原理及应用实例
地图投影的原理及应用实例1. 地图投影的基本概念地图投影是指将三维的地球表面投影到一个平面上,以便于进行测量、绘制和分析地理信息。
地图投影的过程中,由于地球是一个球体,不可避免地会出现一定的形变。
不同的地图投影方法会选择不同的投影面,以及不同的数学模型和变形形式,以最大程度地减小形变。
2. 常见的地图投影方法2.1 圆柱投影法•圆柱投影法是将地球投影到一个圆柱体上,再将圆柱体展开为平面的投影方法。
•常见的圆柱投影方法有墨卡托投影、等面积圆柱投影、等距圆柱投影等。
2.2 锥形投影法•锥形投影法是将地球投影到一个圆锥体上,再将圆锥体展开为平面的投影方法。
•常见的锥形投影方法有兰勃特圆锥投影、兰勃托等角圆锥投影等。
2.3 平面投影法•平面投影法是将地球投影到一个平面上的投影方法。
•常见的平面投影方法有斯体列克平面投影、等角正矩形平面投影等。
3. 地图投影的原理地图投影的原理是将地球上的地理坐标转换为平面上的坐标。
具体的计算方法有很多种,但基本思想是利用数学模型将球面的点映射到平面上的相应点,从而实现地球表面到地图平面的映射。
地球经纬度坐标转换为平面坐标的公式如下:X = R * cos(φ) * cos(λ0 - λ)Y = R * cos(φ) * sin(λ0 - λ)其中,X和Y表示地球上的点在平面上的投影坐标,R表示地球的半径,φ和λ表示地球上的点的纬度和经度,λ0表示中央子午线的经度。
4. 地图投影的应用实例4.1 航空航天地图投影在航空航天领域中起着重要的作用。
航空航天中常用的地图投影方法是墨卡托投影。
墨卡托投影能将地球表面的航线直观地展示出来,便于飞行员进行导航和飞行计划。
4.2 地理信息系统地图投影在地理信息系统(GIS)中的应用非常广泛。
GIS系统中的地图投影方法需要考虑到形变问题,并且需要选择适合不同应用场景的投影方法。
例如,在城市规划中,会使用等面积圆柱投影;在区域分析中,会使用兰勃特圆锥投影等。
企业信用评级模型
企业信用评级模摘要社会信用体系是市场经济体制中的重要体系。
当前,社会中商业欺诈,制假售假,非法集资等现象屡禁不止,这些社会信用问题归根到底都是企业信用的问题,因此,科学、合理、公正、权威的企业信用评级技术是当前紧要的任务。
本文通过研究研究国内外企业信用评价方法,构建了一个企业信用评价平台。
该平台提供了信用评价,信用等级,信用反馈等功能,是一个功能非常完备的信用评价平台。
企业信用评级模型是评价企业信用等级的有效工具,随着全世界债券市场的迅猛发展、抵押品价值降低及其波动性增加,该模型将会得到更为广泛的关注,并将为我国各公司企业运用数学模型度量企业信用评级提供了重要参考意义。
关键词:数学模型企业信用等级企业信用评级模型信用评价AbstractThe social credit system is an important system of market economy system. At present, commercial fraud in the society of counterfeit goods, the phenomenon such as illegal fund-raising, the social credit problems in the final analysis are enterprise credit problems, therefore, scientific, reasonable, fair and authority of enterprise credit rating technology is the current urgent task.Through research the enterprise credit evaluation methods both at home and abroad, this paper builds a enterprise credit evaluation, credit rating, credit feedback, and other function, is a very complete credit evaluation platform. Enterprise credit rating model is an effective tool for evaluation of enterprise credit rating with the rapid development of bond markets around the world the value of collateral reduces and its volatility increases, the model will be more widespread attention, and the mathematical model for the companies in our country enterprise use metric enterprise credit rating provides an important reference significance.Key words: mathematical model Enterprise credit rating Enterprise credit rating model Credit evaluation目录摘要·················……························Abstract··········································第一章绪论 (1)1.1 选题背景和意义 (1)1.2 国内外文献综述 (2)1.2.1 国外研究现状 (2)1.2.2 国内研究现状 (5)1.3我国研究现状及存在的问题 (9)第二章信用评级主要方法与模型综述 (10)2.1 专家评估法及其优缺点 (10)2.2 财务比率分析法及其优缺点 (12)2.3 多元判别分析(MDA ) 及其优缺点 (14)2.4 logistic分析及其优缺点 (15)2.5 非参数方法 (17)2.5.1 聚类分析及其优缺点 (17)2.5.2 K近邻判别及其优缺点 (19)2.6 Z模型和Zeta模型及其优缺点 (19)2.7 基于投影寻踪和最优分割及其优缺点 (21)2.8 模糊综合评判法及其优缺点 (26)2.8.1 确定评语集 (27)2.8. 2 确定指标权重集 (28)2.8.3 确定评判矩阵 (28)2.8.4 模糊综合评判 (29)2.8.5 模糊合成算子的选择 (31)2.9 遗传算法优化BP神经网络及其优缺点 (34)2.10 基于有序分类和支持向量机方法及其优缺点 (39)2.10.1 有序分类问题与内置空间法 (39)2.11 C4.5算法建立决策树模型及其优缺点 (42)2.12 kmv公司的kmv模型及其优缺点 (44)2.13 j.p摩根的credit metrics模型及其优缺点 (45)2.14 麦肯锡公司的credit portfolio view模型及其优缺点 (46)2.15 瑞士信贷银行的credit risk+模型及其优缺点 (46)第三章现代模型在中国应用的缺陷性及改进措施 (47)3.1对于现代模型的运用还处于尝试阶段 (47)3.2 改进措施 (48)第四章对我国企业信用评级工作的建议 (50)参考文献 (52)第一章绪论1.1项目背景及意义社会信用体系是市场经济体制中的重要体系。
测绘中常用的地图投影方法
测绘中常用的地图投影方法地图作为一种常见的信息呈现方式,在测绘工作中扮演着重要的角色。
而地图投影方法则是地图制作过程中不可或缺的一环。
地图投影是将地球表面的三维信息投射到二维平面上的过程,由于地球是一个近似于椭球体的三维地理模型,所以将其表现在平面上会引起一些形状、大小和方向的失真。
本文将介绍一些测绘中常用的地图投影方法。
一、等距投影法等距投影法是一种保持地球表面上各点距离不变的地图投影方法。
其中最著名的等距投影法是墨卡托投影法。
墨卡托投影法是一种圆柱投影法,即将地球投影到一个接触地球表面的圆柱体上,再展开成平面图。
墨卡托投影法具有以下特点:1. 在赤道附近地图形状保持几乎不变,适合用来制作大尺寸地图。
2. 北纬高于赤道的地区会呈现出纵向拉长的形状,而南纬高于赤道的地区则是纵向收缩。
二、等面积投影法等面积投影法是一种保持地球表面上各个区域面积比例不变的地图投影方法。
其中最常见的等面积投影法是兰勃托投影法。
该投影法将地球投影到一个接触地球表面的圆锥体上,再展开成平面图。
兰勃托投影法具有以下特点:1. 在地图上,各个区域的面积比例与实际相符,适合用来制作区域面积比例重要的地图。
2. 高纬度地区形状会发生压缩和形变。
三、正轴等距投影法正轴等距投影法是一种使某一点保持在地图上的位置与实际相符的地图投影方法。
其中最常见的正轴等距投影法是汇卢卓投影法。
该投影法将地球投影到一个接触地球表面的切平面上,再展开成平面图。
汇卢卓投影法具有以下特点:1. 在地图上,特定地点的位置保持不变。
2. 地图整体形状会产生扭曲和拉伸。
四、等经纬度投影法等经纬度投影法是一种直接将地球经纬线映射到平面图上的地图投影方法。
其中最常见的等经纬度投影法是正投影法。
该投影法将地球投影到一个与地球相切的平面上,使得地图上经纬线直线简单。
正投影法具有以下特点:1. 经纬线在地图上表现为直线。
2. 不同纬度上的东西向距离不同,形成等经线。
综上所述,地图投影方法在测绘工作中起到至关重要的作用。
遗传算法投影寻踪模型matlab代码
遗传算法投影寻踪模型近年来,遗传算法在寻优问题中的应用越来越广泛,其中遗传算法投影寻踪模型在MATLAB代码中的实现备受关注。
本文将以此为主题,结合具体的内容,对遗传算法投影寻踪模型进行深入探讨。
一、遗传算法的原理1.1 遗传算法的基本概念遗传算法是一种基于生物进化过程的启发式优化技术,它模拟了自然选择和遗传机制,通过不断的迭代优化过程来寻找最优解。
遗传算法包括选择、交叉、变异等基本操作,其中选择过程通过适应度函数来评价个体的优劣,交叉过程通过染色体的交换来产生新的个体,变异过程通过基因的随机改变来增加种群的多样性。
1.2 遗传算法的应用领域遗传算法广泛应用于优化问题、机器学习、神经网络、信号处理、图像处理等领域,在工程、科学领域有着重要的应用价值。
二、投影寻踪模型的概念2.1 投影寻踪模型的基本原理投影寻踪模型是一种在信号处理领域中常用的算法,其基本原理是通过对信号进行投影变换来实现信号的降维和提取特征。
2.2 投影寻踪模型的应用投影寻踪模型在语音识别、图像处理、数据压缩等方面有着广泛的应用,是一种常见的信号处理技术。
三、MATLAB代码实现3.1 MATLAB环境准备在进行遗传算法投影寻踪模型的实现之前,首先需要在MATLAB环境中准备好相应的工具箱和设置参数。
3.2 遗传算法投影寻踪模型代码编写通过MATLAB的编程能力,可以实现遗传算法投影寻踪模型的代码编写,包括遗传算法的参数设置、适应度函数的定义、种群的初始化、交叉和变异操作的实现等步骤。
3.3 代码调试和优化在编写完整的遗传算法投影寻踪模型代码后,需要进行充分的调试和优化,确保代码的正确性和效率。
四、实验结果分析4.1 实验数据准备在进行实验结果分析之前,需要准备相应的实验数据集,以便进行测试和对比分析。
4.2 结果对比分析通过对遗传算法投影寻踪模型的实验结果进行对比分析,可以评估其算法性能和适用范围,与其他优化算法进行效果比较。
4.3 结果展示与解读最后需要将实验结果进行展示,并对结果进行解读和分析,从数学模型和应用角度分析遗传算法投影寻踪模型的优缺点和改进方向。
地图学第二章地图投影和应用
ds
长度比是变量,随位置和方向的变化而变化。
Vm表示长度变形
Vm m 1
= 0 不变 > 0 变大 < 0 变小
新编地图学教程 第2章 地图的数学基础
特别方向: 变形椭圆上相互垂直的两个方向及经向和纬向
长轴方向(极大值)a 最大长度比 短轴方向(极小值)b 最小长度比 经线方向 m ;经线长度比
新编地图学教程 第2章 地图的数学基础
新编地图学教程 第2章 地图的数学基础
1 投影变形的概念
上述比较表明,地图上的经纬网与地球的缩影 —地球仪并不完全相同。由球面向平面投影时 引起的经纬网几何特征的变化,称为地图投影 变形。
把地图上和地球仪上的经纬线网进行比较,可 以发现变形表现在长度、面积和角度三个方面 (等积、等角)
正轴圆锥投影经纬线形状:经线为放射状直线束, 纬线为同心圆弧
新编地图学教程 第2章 地图的数学基础
在切线和割线 上无任何变形, 离切线或割线 愈远,则变形 愈大; 在割线外侧的 变形为正,在 内侧的则为负。
新编地图学教程 第2章 地图的数学基础
新编地图学教程 第2章 地图的数学基础
(2)非几何投影: 根据某些条件,用数 学解析法确定球面与平面之间点与点的函 数关系。
新编地图学教程 第2章 地图的数学基础
复式比例尺 又称投影比例尺,是一种根据地图主比例尺和地
图投影长度变形分布规律设计的一种图解比例 尺。
新编地图学教程 第2章 地图的数学基础
④ 特殊比例尺
变比例尺 无级别比例尺
新编地图学教程 第2章 地图的数学基础
3.3 地图投影变形
a图投影在角度上未发生变化,经线按同一比例缩小,纬线未按 同一比例缩小,经纬网格面积产生了变化。 b图中央经线与各条纬线正交,其余经线与纬线均不正交,说明 投影后角度仅局部未变化,大部分去都产生了变化。 c图投影经线和纬线均未按同一比例缩小,在同一纬线上随经度 增大其纬线变化比例逐渐缩小,经线的变化比例由中央经线向 两边逐渐增大。
一种数字图像盲水印投影寻踪检测方法
一种数字图像盲水印投影寻踪检测方法HE Fan;DING Weiping;HU Lin【摘要】针对数字图像提出了一种投影寻踪盲数字水印检测方法,利用图像投影的归一化相关值来检测水印的存在.实验结果表明该方法有较好的鲁棒性,比直接使用像素值计算归一化相关值来检测水印更有效.【期刊名称】《湖南理工学院学报(自然科学版)》【年(卷),期】2019(032)002【总页数】4页(P29-31,41)【关键词】数字水印;投影寻踪;归一化相关值【作者】HE Fan;DING Weiping;HU Lin【作者单位】;;【正文语种】中文【中图分类】TN911.73随着印刷打印技术的发展和进步,使得印刷产品的盗版变得非常容易,印刷品在版权保护、来源认证和防止伪造等方面受到日益严重的挑战.各类证件复印件的大量使用也使得复印件可能被不法分子泄密而造成非法使用;重要的纸质证件或文件更容易被仿冒.因此水印技术在印刷品的版权保护、来源认证和防止伪造等问题上越来越有用武之地,抗打印扫描数字水印技术更是具有较高的实用价值,可应用于解决上述问题.抗打印扫描数字水印技术是指嵌入数字图像或文本的水印信息经过打印设备输出后,再经扫描设备重新获取后,仍能够正确检测的数字水印技术.打印扫描过程通常比较复杂,需经过多次数模变换、模数变换,同时人工操作会对数字图像产生较大影响,其水印攻击类型综合了灰度转换攻击、低通滤波攻击和几何攻击等.Lin[1]等提出一种在图像对数极坐标的傅立叶幅度域中嵌入扩频水印的抗打印扫描数字水印算法;D.Gueluy[2]等综合利用了空域和频域算法,其中空域算法采用二维周期性模式来进行信息的嵌入,在频域中则采用了模板法,保证水印的鲁棒性;Solanki[3~6]等采用不同的校正模型,建立扫描过程中像素值失真和几何失真校正模型,分析打印扫描前后系数变化规律来选择嵌入系数,这类算法对设备依赖性过强或者算法过于复杂;Hernandez[7~9]等给出了将图像经过离散余弦变换后,在DCT域选择嵌入水印信息的系数来嵌入水印.然而这些方法在提取水印时均无法避免几何变换后所得的图像与原始图像在像素位置上不同步的问题.为了避免使用图像像素值进行水印检测,本文给出一种先将图像投影到某多尺度空间上,再利用图像投影的归一化相关值进行水印检测的盲水印检测方法.1 投影寻踪水印方法为了避免几何变换后所得的图像与原始图像在像素位置上不同步的问题,我们考虑将图像和水印投影到相同的多尺度空间,再使用投影进行水印检测,从而避免水印检测器计算归一化相关值使用像素值信息.1.1 模型建立假设Xm,n 为数字图像信号,Wm,n为需要嵌入的水印.本文的基本思想是将嵌入水印的图像和水印都投影到某多尺度空间,在该尺度空间中通过优化投影方向,使得带水印图像的投影和水印的投影的相关值最大化.记Ak,m和Bn,k分别为水平投影方向和垂直投影方向的投影矩阵,嵌入水印的图像为Y,则带水印图像的投影可以记为水印的投影可以记为为了检测图像Y 中是否带有水印,使用如下归一相关运算方法进行检测:由于不是任意一个投影方向都能保证检测出图像中存在水印,因此需要对投影方向进行优化.从而可以建立投影寻踪的优化模型,即寻找最优的投影方向使得I 最大:其中E 为单位矩阵.A和B 通过正交投影方向的平移进行构造.投影方向的优化采用遗传算法进行优化,经过优化后,投影方向可以用于水印的检测.1.2 水印的嵌入和检测水印的嵌入方法采用常规的乘法规则,为了视觉上的效果,采用自适应的变化强度:其中为自适应强度,α 为最大嵌入强度.β(i,j)为变嵌入强度,它随着像素值增加而减小,从而可以更好地隐藏水印而不影响图像的视觉效果.水印检测时,利用优化的投影方向进行投影,再计算投影的归一相关值I.对预先给定的阈值ρ,如果I ρ>,则判定Y 中嵌入了水印W,否则没有嵌入水印W.2 实验结果与分析本实验主要考察通过图像的投影来实现水印检测的鲁棒性问题.图1(a)是大小为512×512的Lena 灰度图像,随机生成1000个服从高斯分布的随机矩阵Wi,i=1,2,3…,1000.其中 W500作为数字水印,每个随机矩阵与Lena 图像有相同的大小.图1(b)是取最大嵌入强度α=15时,将 W500嵌入Lena 图像所获得的带水印图像.图1 原始图像与带水印图像对比2.1 检测结果对比分析分别使用原始图像像素和在某尺度下投影计算归一化相关值进行水印检测,结果如图2所示.由图2可以看出,投影检测的结果要优于使用原始像素检测的结果.这是因为使用投影进行检测的结果更容易通过设定阈值检测出水印.另外随机取四个投影方向对带水印图形进行投影检测,其结果表明均不能检测出水印(图3),从而说明优化的投影方向能提高检测的鲁棒性.图2 归一化相关值检测结果(a)使用投影计算归一化相关值检测结果;(b)使用原始图像像素计算归一化相关值检测结果图3 随机四个投影方向检测结果2.2 抗噪声攻击分析实验中在带水印的图像中添加了均值为0,方差为1的高斯噪声,使用受到噪声攻击后的图像按本文方法进行检测,仍能检测出水印,如图4(a)所示;而使用像素值检测,水印并不明显,结果如图4(b)所示.2.3 打印扫描攻击分析将图像加入水印后,通过打印并扫描成图像,经过人工分离出图像后再进行水印检测,其结果如图5所示.从图5 可看出,采用本文方法仍能明显检测出水印,而使用像素值进行检测的方法已经无法判定是否存在水印.图4 添加噪声后归一化相关值检测结果(a)使用投影计算归一化相关值检测结果;(b)使用原始图像像素计算归一化相关值检测结果图5 添加水印后归一化相关值检测结果(a)使用投影计算归一化相关值检测结果 (b)使用原始图像像素计算归一化相关值检测结果3 结论从实验结果来看,本文提出的投影寻踪盲水印检测方法具有一定的鲁棒性、抗噪声能力和抗打印扫描攻击能力.然而这里所嵌入的水印是正态随机分布的水印信号,不能携带具有意义的认证信息,在今后的研究中,如何嵌入有意义的水印信息是需要重点关注的问题.参考文献【相关文献】[1]Lin C Y,Chang S H.Distortion modeling and in-variant extraction for digital image print-and-scanprocess[C].International Symposium on Multime-dia Information Processing,1999[2]D Gueluy,B Macq,D Delannay.A Print and Scan Optimized WatermarkingScheme[C].IEEE Transactions on Image Processing,2001[3]Solanki K,Madhow U,Manjunath B S,Chandrasekaran,S. Modeling the print-scan process for resilient data hiding[C].In:Proc.SPIE Security,Steganography,and Watermarking of Multimedia Contents VII,2005:418~429[4]Yu L,Niu X,Sun S.Print-and-scan model and the watermarking countermeasure[C].In:Image and Vision Computing,2005:807~814[5]Chen P,Zhao Y,Pan J.Image Watermarking Robust to Print and Generation Copy[C].First International Conference on Innovative Computing,Information and Control,2006:496~500[6]Song Y J,Liu R Z,Tan T N.Digital Watermarking for Forgery Detection in Printed Materials[C].In:PCM,LNCS,2001(2195):403~410[7]Hernandez J R,Amado M,Perez-Gonzalez F.DCT-domain Watermarking Techniques for Still Images:Detector Performance Analysis and A New Structure[C].IEEE Transactions on Image Processing,2000[8]MIZUMOTO Tadashi,MATSUI Kineo.Robustness Investigation of DCT Digital Watermark for Printing and Scanning[C].Electronics and Communications in Japan,2003[9]Vassilios,Solachidis,Loannis Pitas.Circularly symmetric watermark embedding in2D DFT domain[C].IEEE Transactions on Image Processing,2001。
软科学__一个多属性群决策的权重计算方法_基于投影寻踪分类模型
收稿日期:2008-12-09基金项目:国家自然科学基金项目(60875001);国家社会科学基金资助项目(07BJY041);江苏省基础研究计划(自然科学基金)项目(BK2006184)作者简介:姚 奕(1976-),女,江苏省宜兴市人,讲师、博士生,研究方向为管理科学与工程;郭军华(1976-),男,湖北省天门市人,讲师、博士生,研究方向为管理科学与工程。
一个多属性群决策的权重计算方法———基于投影寻踪分类模型姚 奕1,2,郭军华1,3(1.南京航空航天大学经济与管理学院,南京210016;2.南京师范大学数学与计算机科学学院,南京210097;3.华东交通大学经济管理学院,南昌330013)摘要:针对属性权重和决策者权重完全未知的多属性群决策问题,提出了基于投影寻踪分类模型的权重确定方法。
该模型通过最佳投影方向(即权重)将决策矩阵综合成一维投影值(即群体综合属性值),投影值越大表示该方案越优,根据投影值的大小对各方案进行综合排序决策。
该方法针对具体的决策问题,充分利用了决策数据的信息,且操作简便易行。
最后通过一个实例分析说明了此方法的可行性与可靠性。
关键词:多属性群决策;权重;投影寻踪;遗传算法中图分类号:N945.25 文献标识码:A 文章编号:1001-8409(2009)06-0126-04W e ig h ts C om p u ta t io n o f M u lt i -a t t r ib u teG ro u p D e c is io n M a k in g———Based on Pr ojecti on Pursuit Classificati on ModelY AO Yi 1,2,G UO Jun 2hua1,3(1.School of Econo m ics and M anage m ent,N anjing U niversity of A eronautics and A stronautics,N anjing 210016;2.School of M athe m atics and Co m puter Science,N anjing N or m al U niversity,N anjing 210097;3.School of Econo m ics and M anage m ent,East China J iaotong U niversity,N anchang 330013)Abstract:A model based on p rojection pursuit model to calculate attribute weights and decision makers’w eights with weights infor mati on comp letely unknown is p resented in the paper .Decision matrices can be synthesized with p rojecti on values in one di m ensi on which indicates comp rehensive quality of decision schemes based on the op ti 2mum p r ojection vect ors of data,and the decision schemes can be ordered according t o the p r ojection values .This model which is easily fulfilled utilizes the infor mati on of data according t o s pecial decisi on making p r oblem.Final 2ly,the si m ulation result shows that the p r oposed model is feasible and credible .Key words:multi -attribute gr oup decisi on making;weight;p r ojection pursuit;genetic algorithm引言决策是人们进行选择的行为,决策正确与否往往关系着事业的成败和利益的得失,因此决策的研究一直以来都是管理科学和系统工程研究的热点问题之一。
投影寻踪聚类模型应用步骤
2投影寻踪分类模型简介一、投影寻踪分类模型投影寻踪分类模型(Projection Pursuit classification ,简称PPc)的建模过程包括如下几步:步骤1:样本评价指标集的归一化处理。
设各指标值的样本集为{x*(i,j)|i=1,2,…,n; j=1,2,…,p },其中x*(i,j)为第i 个样本第j 个指标值,n,p 分别为样本的个数(样本容量)和指标的数目。
为消除各指标值的量纲和统一各指标值的变化范围,可采用下式进行极值归一化处理:对于越大越优的指标:)(x -)()(x -j)(i,*x =j)(i,x min max min j j x j 对于越小越优的指标: )(x -)(),(*x -(j)x =j)(i,x min max max j j x j i 其中,(j)x max ,)(x min j 分别为第j 个指标值的最大值和最小值,j)(i,x 为指标特征值归一的序列。
步骤2:构造投影指标函数Q(a)。
PP 方法就是把p 维数据{x(i,j)|i=1,2,…,p}综合成以a={a(1),a(2),a(3),…,a(p)}为投影方向的一维投影值z(i)),,()(=)(∑1=j i x j a i z pj i=1,2,…,n然后根据{z(i)|i=1,2,…,n}的一维散布图进行分类。
式(4.2)中α为单位长度向量。
综合投 影指标值时,要求投影值z(i)的散布特征应为:局部投影点尽可能密集,最好凝聚成若干个 点团;而在整体上投影点团之间尽可能散开。
因此。
投影指标函数可以表达成:Q(a)=S z D Z其中,S z 为投影值z(i)的标准差,D z 为投影值z(i)的局部密度,即: 1-E(z))-)((=∑1=2n i z S n i z∑∑1=1=)j)r(i,-u(R ×j))r(i,-(=n j n i Z R D其中,E( z)为序列{z(i)|i=1,2,…,n}的平均值;R 为局部密度的窗口半径,它的选取既要使包 含在窗口内的投影点的平均个数不太少,避免滑动平均偏差太大,又不能使它随着n 的增大 而增加太高,R 可以根据试验来确定; r(i,j)表示样本之间的距离, z(j)-)(=),(i z j i r ;u(t)为一单位阶跃函数,当t ≥0时,其值为1,当t<0时其函数值为0。
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
投影寻踪方法及应用内容摘要:本文从投影寻踪的研究背景出发,给出了投影寻踪的定义和投影指标,在此基础上得出了投影寻踪聚类模型,随后简单介绍了遗传算法。
最后结合上市公司的股价进行实证分析,并给出结论和建议。
关键词:投影寻踪投影寻踪聚类模型遗传算法一、简介(一)产生背景随着科技的发展,高维数据的统计分析越来越普遍,也越来越重要。
多元分析方法是解决高维数据这类问题的有力工具。
但传统的多元分析方法是建立在总体服从正态分布这个假定基础之上的。
不过实际问题中有许多数据不满足正态假定,需要用稳健的或非参数的方法来解决。
但是,当数据的维数很高时,即使用后两种方法也面临以下困难:第一个困难是随着维数增加,计算量迅速增大。
第二个困难是对于高维数据,即使样本量很大,仍会存在高维空间中分布稀疏的“维数祸根”。
对于核估计,近邻估计之类的非参数法很难使用。
第三个困难是对低维稳健性好的统计方法,用到高维时则稳健性变差。
另一方面,传统的数据分析方法的一个共同点是采用“对数据结构或分布特征作某种假定——按照一定准则寻找最优模拟——对建立的模型进行证实”这样一条证实性数据分析思维方法〔简称CDA法)。
这种方法的一个弱点是当数据的结构或特征与假定不相符时,模型的拟合和预报的精度均差,尤其对高维非正态、非线性数据分析,很难收到好的效果。
其原因是证实性数据分析思维方法过于形式化、数学化,受束缚大。
它难以适应千变万化的客观世界,无法真正找到数据的内在规律,远不能满足高维非正态数据分析的需要。
针对上述困难,近20年来,国际统计界提出采用“直接从审视数据出发—通过计算机分析模拟数据—设计软件程序检验”这样一条探索性数据分析新方法,而PP就是实现这种新思维的一种行之有效的方法。
因此,高维数据尤其是非正态高维数据分析的需要,加上80年代计算机技术的高度发展是PP产生的主要背景。
(二)发展简史PP最早由Kruskal于70年初建议和试验。
他把高维数据投影到低维空间,通过数值计算得到最优投影,发现数据的聚类结构和解决化石分类问题。
1974年Frledman和Tukey加以改正,提出了一种把整体上的散布程度和局部凝聚程度结合起来的新指标进行聚类分析,正式提出了PP概念,并于1976年编制了计算机图像系统PRIM——9。
1979年后,Friedman 等人相继提出了PP回归、PP分类和PP密度估计。
在这以后Huber等人积极探索了PP的理论。
1981年Donoho提出了用Shannan嫡作投影指标比wiggins用标准化峰度更好的方法,接着他又利用PP的基本思想给出了多元位置和散布的一类仿射同变估计。
Diaeonis、Friedman和Jones等还讨论了与PP有关的其他理论问题。
上述工作和结果在1985年Huber的综述论文中作了概括和总结。
我国学者成平和吴健福于1985年证明了PP密度估计的一个收敛性问题,并于1987年给出PP经验分布的极限分布。
陈忠琏和李国英等于1986年用PP方法给出了散布阵和主成分的一类稳健估计。
成平和李国英于1986年还对多元位置和散布的PP型估计性质进行了讨论叫。
陈家弊于1986年证明了密度PP估计的一个极限定理。
宋立新和成平于1996年就PP回归逼近的均方收敛性,回答了Huber1985年的猜想。
这些都是很好的工作。
在PP的应用研究方面,从1985年起,郑祖国、杨力行等人通过几年的潜心研究和探索,成功地完成了投影寻踪回归(PPR)和投影寻踪时序(PPTS)软件包的程序设计,并对大量实例进行了验算。
二、PP及其分类投影寻踪是用来分析和处理高维数据,尤其是来自非正态总体的高维数据的一类统计方法。
其基本思想是:利用计算机技术,把高维数据通过某种组合,投影到低维(1~3维)子空间上,并通过极小化某个投影指标,寻找出能反映原高维数据结构或特征的投影,在低维空间上对数据结构进行分析,以达到研究和分析高维数据的目的。
它的一般方案是:(l)选定一个分布模型作为标准(一般是正态分布),认为它是最不感兴趣的结构;(2)将数据投影到低维空间上,找出数据与标准模型相差最大的投影,这表明在投影中含有标准模型没能反映出来的结构;(3)将上述投影中包含的结构从原数据中剔除,得到改进了的新数据;(4)对新数据重复步骤(2)(3),直到数据与标准模型在任何投影空间都没有明显差别为止。
PP方法的主要特点是:(l)PP方法能够在很大程度上减少维数祸根的影响,这是因为它对数据的分析是在低维子空间上进行的,对1-3维的投影空间来说,高维空间中稀疏的数据点就足够密了,足以发现数据在投影空间中结构特征;(2)PP方法可以排除与数据结构和特征无关,或关系很小的变量的干扰;(3)PP方法为使用一维统计方法解决高维问题开辟了途径,因为PP方法可以将高维数据投影到一维子空间,再对投影后的一维数据进行分析,比较不同一维投影的分析结果,找出好的投影;(4)与其他非参数方法一样,PP方法可以用来解决某些非线性问题。
PP虽然是以数据的线性投影为基础,但它找的是线性投影中的非线性结构,因此它可以用来解决一定程度的非线性问题,如多元非线性回归;(二)PP的分类PP包括手工PP和机械PP两方面内容。
手工PP主要是利用计算机图像显示系统在终端屏幕上显示出高维数据在二维平面上的投影,并通过调节图像输入装置连续地改变投影平面,使屏幕上的图像也相应地变化,显示出高维数据在不同平面上投影的散点图像。
使用者通过观察图像来判断投影是否能反映原数据的某种结构或特征,并通过不断地调整投影平面来寻找这种有意义的投影平面。
最早的图象显示系统是斯坦福大学教授J.H.Friedman 等人1974年编制的,PRIM 一9。
利用这个系统可以看到不超过九维的数据在任何二维平面上的投影图象,以发现数据的聚类和超曲面结构。
这个系统还可以只显示指定的区域内的高维点,把其他点移出屏幕不显示出来。
因此当人们在投影平面上发现了某种聚类结构时,可以把不同类的数据分开,再分别考察每个类中的数据的结构和特征。
使用手工PP 成功的例子是美国的Reaven 和Miller 于1979年关于多尿病病理的研究。
他们将145人的5项指标观察值输入PRIM 一9图像显示系统,对5项指标中的每3项指标,观察145个3维点构成的点云在任何2维平面上的投影图像,最后找到了一个在医学上有意义的图像。
从这张图像上可以看到隐性和显性多尿症患者的数据是完全分开的。
不经过中间正常状态,两者是不能相互转换的。
机械PP 是模仿手工PP ,用数值计算方法在计算机上自动找出高维数据的低维投影,即让计算机按数值法求极大解的最优化问题的方法,自动地找出使指标达到最大的投影。
它要求对一个P 维随机向量X ,寻找一个K (K<p )维投影矩阵A ,使定义在某个K 维分布函数集合k F 上的实值函数Q (投影指标),满足Max Ax Q Ax Ax Ax Q k ==)(),,,(21Λ。
如果原数据确有某种结构或特征,指标又选得恰当,那么在所找到的某些方向上,一定含有数据的结构或特征。
有些传统的多元分析方法可以看成是机械投影寻踪的特例。
例如主成份分析,判别分析等,但是主成分分析方法是用主成分来描述或逼近原始数据,所反映的是数据的全局特征或宏观特征,这样显然就有可能会漏掉主要的局部特征或细节特征。
下面以大家熟知的主成份分析为例具体说明机械投影寻踪方法。
主成份分析的目的是要考察P 维数据n x x x ,,,21Λ,是否真正散布在P 维空间上,还是主要只散布在某个维数小于P 的子空间上。
好比一块铁饼,虽然是三维空间中的形体,由于相对地说厚度明显地小,所以它主要是散布在二维平面上的园形东西,在与这个园形垂直的方向上没有多少布散布。
我们取描述一维数据散布程度的标准差作为投影指标。
实数n y y y ,,,21Λ的标准是∑--=ni n n y y y y y 1221)1/()(),,,(Λσ,其中n y y ni /1∑=。
用投影寻踪了解数据n x x x ,,,21Λ的散布情况,就是找出一个方向b ,使得数据在这个方向上的投影的散布达到最大,即),,(m ax ),,('1'1'11'1n a n x a x a x b x b ΛΛσσ==,1b 就是n x x x ,,,21Λ的样本协差阵S 的最大特征根1λ的特征向量。
把S 的特征根从大到小排列,记作p λλλ,,,21Λ,这样投影寻踪就给出了n x x x ,,,21Λ的第一主成份n x b x b x b '12'11'1,,,Λ,它的标准差1'11'1),,(λσ=n x b x b Λ。
继续作投影寻踪,在与1b 垂直的空间里求单位向量2b ,使),,(m ax ),,('1',1'21'21n b a a n x a x a x b x b ΛΛσσ<==。
可以证明2b 就是相应于2λ的特征根,进而得到n x x x ,,,21Λ的第二主成份n x b x b '21'2,,Λ,及其标准差2λ,如此类推,就可以求出第三、第四主成份等等,直到某个主成份的标淮差接近零为止。
当然,主成份分析只是机械投影寻踪的一个特例。
一般的并不要求后面的投影方向与前面找到的投影方向垂直。
而且,对于主成分分析其样本协方差阵及特征根和特征向量对离群点是非常敏感的,正是由于样本协方差阵的不稳定,造成了传统主成分分析的不稳健。
为了得到稳健性,可以采用稳健的散布度量加以改进另外,实际作主成份分析时也不用求极值的投影寻踪法,而是直接求样协差阵S 的特征根和特征向量。
三、投影指标PP 的出发点是度量投影分布所含信息的多少,而我们知道高维数据集合的线性投影是?几乎正态的,并且正态分布通常为无信息分布的代表。
从而寻求与正态分布差异最大的线性投影分布,即含信息最多的投影分布,成为PP 方法的常用方式之一。
既然如此,那么它是如何实现的呢?为了避免繁杂的细节讨论,突出问题的重点,我们选取简单的度量准则,如方差、偏度、峰度,至于更加复杂的度量准则也有完全类似的描述、解释,这里从略。
(1)方差指标)()(X a Var X a Q T T =设),,,(21n x x x Λ是总体X 的独立同分布的样本,方差指标的样本形式为21))((1)(∑=-=n i Ti T TX a E x a n X a Q 。
如果我们求)(max X a Q T ,得到的∧a 就是样本散布最大的方向。
主成分分析就是取样本方差为投影指标的PP 方法。
(2)Friedman 指标 设有Legendre 多项式R R Q R Q ==)(,1)(10, Λ3,2],)1()12[(121=---=--j Q j RQ j jQ j j j设X 为P 维随机向量,协方差阵∑的正交分解T UDU =∑,U 是标准正交阵,D 是对角阵。