流形判别分析和支持向量机的恒星光谱数据自动分类方法
合集下载
相关主题
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
J a n u a r y ,2 0 1 4
流 形判 别 分 析 和 支持 向量 机 的恒 星 光谱 数 据 自动分 类 方 法
刘忠宝 ,王召 巴 , 赵 文娟。
1 .中北大学计算机与控制工程学 院,山西 太原 3 .山西大学商务学 院信息学 院,山西 太原 0 3 0 0 5 1
级 数_ 8 ] ; 李 乡儒 等提出基于最近邻方法 的类 星体 与正常星 系
收稿 日期 : 2 0 1 3 — 0 3 - 2 8 。修订 日期 :2 0 1 3 — 0 6 - 2 8
基 金项 目: 国家 自然科学基金项 目( 6 1 2 0 2 3 1 1 ) 和山西省高等学校科技创新项 目( 2 0 1 3 1 1 1 2 ) 资助 作者简 介: 刘忠宝 , 1 9 8 1 年生 , 中北大学计算机与控制工程学院博士研究生
数据 的 自动分类方 法实现未知天体的识别成为 当今天文界的
研究 热 点 之 一。 支 持 向 量 机 ( s u p p o r t v e c t o r ma c h i n e , S VM) [ 1 3 ] 是一种经典 的模式分类方法 , 具有稳 定 的分类 性能
和优 良的泛化能力 , 因而备受 中外学者 的推崇 并广泛应 用于 光谱分析 、 信息检索 、 机 器学 习等领域 。 但S VM 易受到输入 数据仿射或伸缩等变换 的干扰 , 其原 因是该方 法进行分 类决 策时只考虑类 间的绝对 间隔而忽 略各类 的分布性 状。与 此同
第3 4 卷 , 第1 期 2 0 1 4年 1月
光
百度文库
谱
学
与
光
谱
分
析
Vo 1 . 3 4 , No . 1 , p p 2 6 3 — 2 6 6
S p e c t r o s c o p y a n d S p e c t r a l 。 An a l y s i s
,
也是恒星和星系天文学 的一个重要 研究方 向。随着 光谱
数据规模 的不断增大 ,传统 的数 据处 理方 式变得 无 能为力 , 迫切需要提 出计 算机 自动光谱处理新技术 。 近些年 , 光谱数据 自动分类 问题逐 渐成为 国外学者 的研
究热点 ,一些重要 的研 究成 果不 断涌现 :在 国外 ,Au t o c l a s s 是一种基 于贝叶斯统计 的分类方法 , 其 最大特 色在于可 以发
光度敏感 的光谱 中选 择线一 强指数 集进 行训 练实 现对 低信 噪 比的光谱 有效分类 _ 6 ; Ad a m通过 选择 高质 量 的光谱源实现
对 光谱数据 的有效分类『 7 ] 。在 国内,罗 阿理 在 S t r a c k方法 的 基 础上利用多尺度小波滤 波器 自动确定小波变换 的最大变换
引 言
恒 星光谱数据分类是天体数据分析 与处理 的主要任务之
一
增量式学 习和并行实现 ; L i 等将 面 向光谱数据 的局部特征分 类方 法在计算 机视觉 中成功应用[ g ;覃冬梅等提 出一种新颖 的基 于主成分分析和支持 向量机 的光谱分 类方法 ;刘 中田等
提 出基 于小波 特征的 M 型星 自动识别 方法_ 1 阳; 许 馨等提 出
现一些新 的光 谱类 型_ 1 ;G u l a t i 等利用 两层 B P神经 网络 对 恒星光谱次 型进 行分 类_ 2 ;J o n e s 在 进行光 谱次 型分 类 时利 用多个 B P神 经网络[ 3 ;S t a r c k将 小 波变换 方法 应用 在光 谱
分析 中_ 4 ;Ma h d i 提出基于无监督人 工神经 网络 的 自组织 映
和基于流形 的类 间离 散度 Me 。所提方法找 到的分类 面 同时保证 Mw最小 且 Me最大 。可建立相 应最优化 问
题, 然后将原 最优化问题转化为 QP对偶形式求得支持 向量 和判别函数 , 最后利用判别 函数 判断测试样本 的 类属 。 该 方法的最大优势在于进行分类决策 时 , 不仅考虑样 本的类间信息和分布特征 ,而且还保持 了各类 的 局部流形结构 。S DS S恒星光谱数据上 的比较 实验表明该方法的有效性 。
适应增强方法 实现 实现 光谱 自动分类 [ 1 妇;蔡 江辉 等提 出 的 基于谓词逻辑 的分类 规则后处理方法在保证分类准确率不降
低的前提下大 幅提 高了 自动分类的效率_ 1 。 由于人类对宇 宙的认识 还相对匮乏 ,如何 利用 面向光谱
射算法 , 其 最大特色在于不需要训练数据 便可直 接对光谱进 行分类_ _ 5 ] ;N a v a r r o 等提 出的人 工神经网络系统通过 在温度 、
基于广义判别 分析的光谱分类方法 , 该方 法通过非 线性映射 将样本 映射 到高维空间并利用线性判别分析方法实现光谱分
类 ;杨金福等提 出核覆盖算法 ,该方法 将核技 巧与覆 盖算法
相结合 ,通过在特征空 间抽 取支 持 向量 实现 光谱 自动分 类 ;
赵梅芳等针对 活动星系核光谱 中发射线 的不 同特征 ,采用 自
2 .中北大学信息 与通信工程学 院, 山西 太 原 0 3 0 0 5 1
0 3 0 0 3 1
摘 要
尽 管经 典的分类 方法支持 向量机 S VM 在 天文学领域广泛应用 , 但其 只考 虑类 间的绝对间隔而忽略
类 内的分布性状 , 因而分类性能有待 于进一步提升 。 鉴 于此 , 提 出一种新颖 的基于流形判别分析和支持 向量 机 的恒星光谱数据 自动分类方法 。 该 方法 引入流 形判别 分析 的两个 重要概念 : 基 于流 形 的类 内离散度 Mw
关键词 自动分类 ;恒星光谱数据 ;流形判别分析 ;支持 向量机 中图分类号 :T P 3 9 1 文献标识码 : A D O I : 1 0 . 3 9 6 4 / j . i s s n . 1 0 0 0 — 0 5 9 3 ( 2 0 1 4 } 0 1 — 0 2 6 3 — 0 4 光谱 分类 方法 , 其最大优势 在于无需 对分类器训 练便可实现