主成分分析法与核主成分分析法在机械噪声数据降维中的应用比较_梁胜杰
合集下载
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
PCA 方法与 KPCA 方 法 已 广 泛 应 用 于 特 征
提 取 、数 据 压 缩 、图 像 降 噪 、分 类 识 别 、综 合 评 价 以
及过程监视等诸多领域。
2 双 层 圆 柱 壳 体 机 械 噪 声 数 据
在获取某双层圆柱壳体的机械噪声数据时, 设 定 8 个 不 同 工 况 ,如 表 1 所 示 。
KPCA 方法是 一 种 非 线 性 主 元 分 析 方 法 。 [4] 其主要思想是通过某种事先选择的非线性映射Φ 将输入矢量X 映射到一个高维线性特征空间F 之 中,然 后 在 空 间 F 中 使 用 PCA 方 法 计 算 主 元 成 分。在高维线性特 征 空 间 中 得 到 的 线 性 主 元 实 质 上就是原始输入空间的非线性主元。
3 PCA 方法与 KPCA 方法的主元数目
对上述噪声数据首先选择 PCA 方法降维,并 依据累积贡献率 大 于 0.85 的 门 限 值 选 择 主 元 个 数[3]。8种工况下,每 一 通 道 上 噪 声 数 据 的 PCA 主元计算结果如表2所示。
表2 PCA 方法降维后的主元个数
工况 通道
1 2 3 4 5 6 7 8 1 2 2 3 2 3 3 3 2 2 3 3 2 2 3 2 3 3 3 2 3 3 3 3 3 3 2 4 2 3 3 3 2 2 3 3 5 3 3 3 3 3 3 3 3 6 3 3 3 2 2 3 3 2 7 3 2 3 3 3 3 3 3 8 3 3 3 2 3 3 3 3 9 3 2 3 3 2 3 2 3 10 3 3 3 2 4 3 2 3 11 4 3 3 3 3 3 3 2 12 2 3 3 2 3 3 3 2 13 3 3 2 3 3 3 3 2 14 3 3 3 3 3 3 2 2 15 3 1 2 2 2 3 2 2 16 2 2 3 3 3 3 3 2 17 2 2 2 2 3 3 2 3 18 3 3 3 3 3 3 3 3 19 3 2 2 2 3 3 3 2
圆柱壳体在不同工况下的机械噪声数据进行降维;然后 使用神经网络 和支 持 向 量 机 两 种 方 法 分 别 计 算
噪 声 数 据 在 降 维 前 后 的 正 确 识 别 率 ,以 比 较 不 同 降 维 方 法 的 降 维 效 果 ,从 而 确 定 适 合 于 某 双 层 圆 柱 壳 体
机械噪声数据的降维方法。
声 数 据 。 采 样 时 间 为 8s,采 样 频 率 为 2048Hz。 由于在同一个 通 道 下 的 采 样 点 较 多,且 特 征
单 一 ,不 易 分 析 其 规 律 特 点 ,因 此 对 样 本 点 进 行 预
处理:
(1)选 定 信 号 处 理 中 常 用 的 10 个 特 征 量,即 波 形 因 数 、峰 值 因 数 、脉 冲 因 数 、振 动 加 速 度 总 级 、
中 国 机 械 工 程 第 22 卷 第 1 期 2011 年 1 月 上 半 月
主成分分析法与核主成分分析法 张志华 崔立林
海 军 工 程 大 学 ,武 汉 ,430033
摘 要 :依 据 线 性 降 维 与 非 线 性 降 维 的 分 类 原 则 ,分 别 选 择 主 成 分 分 析 法 和 核 主 成 分 分 析 法 对 某 双 层
本文重点是比较 PCA 方 法 与 KPCA 方 法 的 降维 效 果,故 只 选 取 10 个 常 用 的 特 征 量 作 为 例 子,实际上可以 选 择 更 多 的 特 征 量 以 更 全 面 地 表 征噪声数据。
预处理后,在 每 一 工 况 下 的 每 一 通 道 上 可 得 到一个10×200(10 是 维 数,200 是 样 本 量)的 噪 声数据,则在8种工况下,每一 条 通 道 上 可 得 到 8 个 10×200 的 噪 声 数 据 。
期望、方 差、标 准 差、三 阶 累 量、四 阶 累 量 和 有
效值。 (2)以2048个 相 邻 样 本 点 为 一 个 样 本 段,并
以70 个 样 本 点 为 步 长,将 样 本 段 逐 步 向 后 平 移, 即 可 在16 384个 样 本 点 内 得 到 约 205 个 样 本 段 。
(3)取 前 200 个 样 本 段 ,在 每 个 样 本 段 内 计 算 选 定 的 10 个 特 征 量 。
由表 2 可 知,8 种 工 况 下,在 19 条 通 道 上 的 噪声数据经 PCA 方 法 降 维 后 的 主 元 个 数 为 3 的 情 况 占 67.1%,主 元 个 数 为 2 个 的 情 况 占 30.9%,两种 情 况 合 计 占 98%。 因 此,为 保 证 降 维后的数 据 能 够 保 留 原 始 噪 声 数 据 足 够 多 的 信 息,使用 PCA 方法降维时统一取3个主元。
1 PCA 方法与 KPCA 方法的基本原理
PCA 方法是 一 种 基 于 二 阶 统 计 的 数 据 分 析 方法,该方法在 各 个 变 量 之 间 相 关 关 系 研 究 的 基 础 上 ,用 一 组 较 少 的 、互 不 相 关 的 新 变 量 (即 主 元 ) 代替原来较多的 变 量,而 且 使 这 些 新 变 量 尽 可 能 多地保留原来复 杂 变 量 所 反 映 的 信 息,具 体 计 算 步 骤 见 文 献 [3]。
目前,数据降维方法主要分为两大类[2]:线 性 降 维 和 非 线 性 降 维 。 主 成 分 分 析 法 (PCA)因 为 其 概 念 简 单 、计 算 方 便 、线 性 重 构 误 差 最 优 等 优 良 的 特性,成为数据 处 理 中 应 用 最 广 泛 的 线 性 降 维 方 法之一。核主 成 分 分 析 法 (KPCA)作 为 PCA 方 法在处理非线性 问 题 时 的 扩 展,近 年 来 得 到 了 快 速发展。
表 1 工 况 设 置
工况名称
工况1 工况2 工况3 工况4 工况5 工况6 工况7 工况8
泵
未开启 未开启 未开启 未开启 未开启 全开启 半开启 未开启
工况设置
电机
未开启 未开启 未开启 未开启 未开启 未开启 未开启
开启
激振器发生 信 号 频 率 (Hz)
60 80 120 180 360
在壳体的不 同 位 置 布 置 19 个 加 速 度 传 感 器 (每个传感器称 为 一 通 道),测 定 不 同 工 况 下 的 噪
关 键 词 :主 成 分 分 析 法 ;核 主 成 分 分 析 法 ;核 函 数 ;神 经 网 络 ;支 持 向 量 机 ;机 械 噪 声 ;降 维
中 图 分 类 号 :TB53;O212.4 文 章 编 号 :1004—132X(2011)01—0080—04
Comparison between PCA and KPCA Method in Dimensional Reduction of Mechanical Noise Data Liang Shengjie Zhang Zhihua Cui Lilin
本文将 PCA 方 法 和 KPCA 方 法,应 用 于 某 双层圆柱壳体机 械 噪 声 数 据 的 降 维 之 中,然 后 使 用神经网络(NN)和支持向量机(SVM)两 种 方 法
收 稿 日 期 :2010—01—15 基 金 项 目 :国 家 自 然 科 学 基 金 资 助 项 目 (50775218)
Naval University of Engineering,Wuhan,430033 Abstract:According to the classification principle of linear and non-linear dimensional reduc- tion,this paper dealt with mechanical noise data under different working- modes through PCA and KPCA.Lastly,the paper computed the right recognition percentage of noise data,including had been reduced and not,by NN method and SVM method,and compared the excellence for PCA and KPCA in dimensional reduction.Consequently,a better method of dimensional reduction is selected for rib- bed cylindrical double-shells according to the results. Key words:PCA(principal components analysis);KPCA(kernel PCA);kernel function;NN (neural network);SVM(support vector machine);mechanical noise;dimensional reduction
0 引 言
双层圆柱壳体的水下噪声主要来源于自身的 机械设备[1],此 类 噪 声 属 于 机 械 噪 声。 为 了 全 面 分析此类噪声的 特 点 及 规 律,需 要 采 用 尽 可 能 多 的特征量进 行 表 征。 由 于 特 征 量 很 多,且 特 征 量 之间往往存在相 关 关 系,因 此 很 难 直 接 抓 住 它 们 之间的主要关系,这 就 需 要 一 种 简 化 数 据 的 方 法 使 高 维 数 据 降 维 ,以 便 获 得 噪 声 数 据 的 主 要 信 息 。 通过降维可以有效去除机械噪声数据中的冗余信 息 ,从 而 降 低 数 据 分 析 处 理 的 难 度 。
(5)
F 中的样本点记作φ(xi)。
非线性映射 Φ 往 往 不 容 易 求 得,KPCA 方 法
通过使用核函数来完成从输入空间到特征空间的
非 线 性 映 射。定 义 核 函 数 k(xi,xj)= 〈φ(xi), φ(xj)〉,这样特征 空 间 中 两 向 量 的 内 积 可 以 用 输 入空间中的两变量的核函数来表示。
设xi ∈Rd(i=1,2,…,n)为输入空间的d维 样 本点。通过非线性映射Φ 将 Rd 映射到特征空间 F,即
主 成 分 分 析 法 与 核 主 成 分 分 析 法 在 机 械 噪 声 数 据 降 维 中 的 应 用 比 较 ——— 梁 胜 杰 张 志 华 崔 立 林
Φ:Rd → F,x →φ(x)
核函数是满 足 Mercer条 件 的 任 意 对 称 函 数
(实 正 定 函 数 ),常 用 核 函 数 的 特 性 如 下 :
(1)高 斯 径 向 核 :
k(xi,xj)=
exp(-
‖xi -xj‖2 2a2
)
(2)多 项 式 核 :
k(xi,xj)= (b·s(xi,xj)+c)d
(3)Sigmoid 核 :
k(xi,xj)=tanh(e·s(xi,xj)+f)
其 中,a、b、c、d、e、f 为 选 定 的 参 数,通 常 取s(xi, xj)=xiTxj。
KPCA 方法只需要在原空 间 中计算用 作 内 积
的核函数,无需知道非线性映射函数φ(x)的形式, 也无需计算非线性变换,具体计算步骤见文献[5]。
· 80 ·
分别计算噪声数 据 降 维 前 后 的 正 确 识 别 率,通 过 正确识别率比较 PCA 方法 和 KPCA 方 法 的 降 维 效果,从而选择 更 适 合 于 这 种 双 层 圆 柱 壳 体 机 械 噪声数据的降维 方 法,并 由 此 初 步 分 析 出 噪 声 数 据的线性或非线性特点。