知识表达系统中条件属性与决策属性关系的分析
合集下载
相关主题
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
统 中条件属性的重要性和系统控制参数的简化 , 给出了利用主分量分析的方法研究知识 系统中属性的相关性 , 并 进行 系统参数简 化的算法 。理论分
析和实例计算结果证明了本文提出的方法的可行性 和有效性。 关键词 : 特征提取 ; 主分量分析 ; 粗糙 集
在 一个 知识 表 达 系统 中 , 析 衡 量各 个 属 性 对 于决 分 策 的重要 程 度 , 释各 个属 性 的作用 , 解 这些 分 析 内容 都有
1 属性 之 间相 关性 的度 量
图 l 图 2
3 计 算主 分量 的方法
首先 设 属 . x 和 属 性 y, 属 性数 值 分 别 为 x( ) 陛 其 是
和 Y( ) k 。则 X 和 y 的相关 函数 和协方 差 函数分别 为 :
R k , 2 =E{ k ) ( 2 } ( l 走 ) z( 1 Y 足 )
李伟光 : 识表达 系统 孛奈件属性与决策属性关 系的分哲 知
知 识 表 达 系统 中条 件 属 性 与 决 策 属 性 关 系 的 分 析
An lsso lt n ew e tiue n cso s ayi fReai sB t enAt b t a dDeiin o r s
一
首 先求第 一个 主分 量 F1F X 的线性 组合 : , 为
F】 =∑n ( ) =a X 1i X 】 其 中 a =( ( ) & ( ) a ( ) . , 1p) 。 l 口11 , 12 , l3 . .口 ( )
为数 据 分布 示 意图 ) 。设 其数据 的重 心 为 g 。显然 , 盘l 沿
相关 性 的数 据 会 造 成 数 据 的冗 余 , 降低 计 算 的 有 效 性 。 如果 在分 析计 算 中考 虑这 种 相关 性 , 使 数据 的分 析变 会 得复杂 , 以在进行数据 计算处理 之前 , 所 首先去处数据 的相 关 f可 以有效的方便 以后数据 的分析处理 。本 文介 绍的主 生 分量提取的办法可 以有效的去 除各个属性的相关 陛。
的随机 部分 , 乘积 和平 均 的运 算后 , 于相 互 “ 消 “ 在 趋 抵 。
X =[ 1 , . . X , X3 . . j 为 了推导方 便且 不 失 一 般性 , 将 知识 表 达 系 统 中 先
的数据进 行 标 准 化 处 理 , 称 为 白化处 理 。( E( ) 也 即 X =0 V r X, =1 。标 准化 过程 如下 : ; ( ) )
方法 和步骤 。
相 关 系数 为 阳 ( ) r
Jy Z , / x - k
设 X 为一 个有 个 样本 和 P 个变量 的数据表 。 在这 里我 们对 互 协 方 差 的解 释如 下 : 协 方差 涉及 互
两个 不 同属 性 的数 据 x( ) y( ) 均值 差 之 间 的乘 k和 k于 积 。这样 这 两个 属性 的共 性部 分就得 到加 强 。而属性 中
如 果将知 识表达 系统 的 属性 值 看 作 一个 线性 空 间 ,
主分量 分析实 质上 就是分 析该 线性 空间 的秩 和基 。基 于
( 1k ) k , 2 :E{ ( 1 一 ] Y( 2 一 ] } [ k) [ k) =
R ( ) r一
t , 弋 /一、
该思路 , 分析 主分量 可 以直 接 分 析矩 阵 的秩 和 最 大 无关 组 。也 可 以使用 主 分 量 分 析 的 主 要 方 法 : 小 二 乘 法 。 最 本文基 于该思 路 , 出 了分 析 知 识 表达 系统 的详 细计 算 提
i n wld e Ex r s i n S se n a K o e g p e s o y tm
李 伟 光
( 四川理工学院 自动化与电子信息学 院, I 四J l自贡 6 3 0 ) 4 00
摘 要: 本文利用了最优化理论 , 讨论主分量分析 ( c 的原理 , P A) 提出利用主分量分析的方法研究知识表达系统 中条件属性的相关性 , 进而讨论决策系
Xi 、 / I xi =( —x S
进而 , 过 对 协 方 差 系数 做 归一 化 处 理 , 到 了相 关 系 通 得 数 。所 以 , 用协 方差 系数 来衡 量 属 性 之 间 的相 关 性 是合
理的。
其 中 为第 个 属性 的数 学 期望 , , 第 个 属性 s为
方 向上 , 数据 离散 度 最 大 , 方 向 上数 据 变 异 最 大 , 该 根据
易证 V r( )= a F1
a 1 1 V
lF I = 盘1 a : 】 1I X X l
香农 信息 理 论 的 原 理 , 所 携 带 的信 息 量 也 最 多 , 以 其 所
a
称 为 第 一 主分 量 。第 二 主 分 量 、 三 主分 量 依 次 类 第
《 计量与痢试技 术》 0 0 第 3 21年 7卷第 1 期
着重 要 的意 义 。但是 在 一 个 知 识 表达 系统 中 , 于选 取 对
推 。如 果将 坐标原 点平移 到 g点 , 做旋转 , 到一 正 交 并 得
坐标 系 a g 2 如 图 2所 示 。显然 , 2较之 图 1在分 1a 。 图
析计算 上更 容易处 理 。
的各 个属 性 常常 相互 之 间 存 在 一定 的相 关 性 , 些具 有 这
的方差 。现在 假设 知识表 达 系统 中的数据 都经 过 了上 面 的标准 化过程 , 然 以 X, 仍 表示 。
Βιβλιοθήκη Baidu
2 主 分量 分析 的原 理
主分 量 的方 向是 代表 输入 数据 矢量具 有最 大方 差 的 方 向 , 主 分量来 表示 数 据矢 量称之 为 主分 量 ( c ) 以 用 P A, 个 二 维数 据表 为例 子 , 中样 本 如 图 1所示 ( 中椭 圆 表 其