Relief算法最佳数学降维过程的程序实现

合集下载
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
泛 的应 用 。 同时 。 e e 算法 在 解决 大量 数据 集 的特征 Rlf i 在 计 算得 到 每一 个样 本 点 的距 离 向量 后 .可 以将 选 择 、 服冗 余 数据 量过 大 等方 面也 具 有一 定 的优势 。 其 应 用到 整个 数据集 中 .利用 下 面的线 性规 划模 型进 克 但 在 大部 分 的程 序 设计 语 句 中 . e eF算 法要 求 读 者 行 计 算 : Rlf i
从 而影 响 最终结 论 的得 出 1 R l f 法定义 及数 学解 释 、 ei 算 e
结 合 R l f 法 的计 算原理 . 以得 到该算法 的数 ei 算 e 可 学公 式推 理[ 对 于数 据集 中的每一个 样本 点 x 定义下 4 1 。 ; 面 的距离 向量 :

最 基 础 的 R l f 法 是 由科 学 家 K r ee 算 i i a和 R n e edl 在 19 9 2年 首先 提 出来 的【 该 算法 作 为基 于类 内 、 间 2 】 。 类
得 研究 人 员无法 有效 、 观 的获 取第 一 手 的研究 资料 。 点 x异 类 别 样 本 中距 离 样 本 点 X最 近 的样 本 点 N 直 M 因此 .需 要对数 量 巨大 的原 始 数据 集 进行 特征 信 息量 ( ) x 。在 找 到所 有 的样本 点 的邻域集 合后 , 每一 维 的 对
他 语 句编 写的 Ree 算 法进行 对 比 。 i lf 为该 算法 的进 一 步 改进 提供 一 定 的参 考。 【 关键词 】 Re e; 阵列 ; 维 : lf微 i 降
0、 l 弓 言
计算 样本 的特 征分类 权 重 的过 程 中 。需 要 找 出每 一个
伴 随着 计 算科 学 、 物科 学 的 不 断发 展 . 学研 究 样 本 X的 2个 邻域集 合 :一个 为样 本点 X同类 别 样本 生 科 Hx。 所 涉及 的基 础数 据量 与 E俱 增 庞 大 的原始 数 据集 使 中距 离 样本 点 X最 近 的样 本 N ) 另 一 个 为 与样 本 t
11 eif 法 的定 义 . R 1 算 e
s 2l > . t _w 0 . ,
R l f 法 是一 种重 要 的特 征选 择 算 法 . 为机 器 ei 算 e 作 我 们 可 以通过 定 义 向量 z 对 上述 线 性 规划 模 型 来 学 习算 法 的重要 组成 部分 .主要 用 于对 大 量数 据 构成 进行 简化 : 的集 合 同 时进行 分解 、降低 数据 量 、分类 等方 面 的任 务 。 主要 计算 方法 是针 对训 练样 本 中 的每一个 样 本 。 其
2=
lห้องสมุดไป่ตู้ 一N ) )—1l H x ), ( M( l ) —N ( 1 1 c , )
最 终 通 过拉 格 朗 日变换 .得 到 原始 的数据 集 的权 在该 训 练样 本 中搜 索和 它最 相 似 的 1个 同类别 的 样本 和 1 异类 别 的样本 。 于 样本 中的特 征属 性 。 其与 重 排序 向量 W为 : 个 对 若
自行设 定 阀值 , 而该 阀值 的 恰 当与 否 。 直接 关 系到 最终 结 论 的准 确性 。 因此 , 算法 在 实际 的操 作 中存 在 一定 该
的人 为误 差 。




( ∑ =
一 。 )- u-H () ( I ∑ “ N m I I )
21 0 2年第 1 期

建 电

11 4
R 1 f 法最佳数 学降维过程的程序 实现 e e算 i
朱 坤 ,李 金 铭 ,张 敬 华
福 建 福 州 300 5 0 2) (福 建农 林 大 学计算机 与信 息学 院
【 摘 要 】 从 Ree 算法 的基 本计 算原理 出发 ,着重研 究 了 Ree 算法在数 学层 面上 的解释 及运 算 公式 。 : i lf lf i 用・ XC L中的 V A宏设 计 语 句 自动 实现 Re e 算法 . 出满足 定 义要 求 的所 有的特 征值 。并 结合 由 4 E E B lf i 得 0 个 样 本组 成 的 胃癌 的原 始 分 类数 据 。 算 出该数 据 经过 VB 程序 运 算后 得到 的 完整 的特 征 向量 , 由其 计 A 与
在 实 际问题 的研 究 中不 断 的被 改进 .以适应 不 同 的研 征权 重进 行排 序 ”1 [ 3 究 领域 。 改 进算法 往往 忽 略 了算 法 本身 最基 础 、 重 1 R l f 法 的数学解 释 但 最 . ee算 2 i 要 的数 学 释义 。 造成 得到 的 结果 出现 一 定 的信息 丢失 .
( 一
( ) ( 一N lx) )一 t(.)
其中 :H () N x 表示样本点 x同类别中最近的样本 i i
距 离 进 行 属 性 重 要 性 评 判 的一 种 重 要 的 机 器 学 习方 点 , M(i 示 异类 别 中最 近 的样本 点 ,( 为 距 离计 N x) 表 d) 法 。 高通 量数 据 的特征 选 择 、 类 等 方面 有着 十分 广 算 函数 。 在 分
的有效 提 取 。使经 过提 取得 到 的少 量 数据 能够 代 表原 特征 的权 重依 据如下 的计算 方 式进行更 新 : 始 数据 的大部分 信息 内容 。 因而 。 在现代 的模式识 别 、 智 = + N ) l一 H(l l一 M (I N x x- 能计算 等 研究 领域 .特 征选 择 算法 逐 渐 的发展 起 来『 1 】 。 其 中 :i x 表示 样本 点 X i 的特征 值 ,i 示第 i 第 维 x表 R l f 法 就是一 种 十分典 型 的特 征选 择算法 . 算法 维 特 征 的分 类 权 重 . 最 终利 用 计算 得 到 的 w 来对 特 ei 算 e 该 “ i
相关文档
最新文档