知识表达系统中条件属性与决策属性关系的分析

合集下载

基于免疫算法的粗糙集知识约简

基于免疫算法的粗糙集知识约简
( .重庆大学 自动化学 院, 1 重庆 4 0 3 ;.湖北民族学院理学院 , 0002 湖北 恩施 4 50 4 00)
摘要 : 于粗糙集理论 的知识发现过程 中, 在基 减小属性约简复杂度问题是重要研究 内容之一 , 是在保持信息 系统分类能力不
变的基础上 , 删除冗余知识 。通过在 知识表达 系统中的决策属性支持度来描述 由条件属性所提 供的知识对整 体决策 的支持 程度 , 通过相对重要程度来 描述条件属性 对决策属性 的重要性 。然后利用免疫 网络机理 和约简算法融合 , 构造免疫 网络约 简算法 , 把相对核加入初始种群加快收敛速 度。最后 , 以经 典 的实例分析 表明 , 该方 法是求解 知识约简 问题 的快 速有效方
X A G C ag hn , U N i u Y N u—ya Q A n —y a I N hn —ceg H A G X —y e, A G Z u n , U N Hog u n
( .A t t nC l g fC og i nvr t,C ogig 0 00 C ia 1 uo i ol eo hnqn U i sy hn qn 0 3 , hn ; moo e g ei 4
2 eat n f te t s u e Istt f a oaie ,nh H bi 4 0 0 C ia .D pr met hma c,H b intueo t nli E si u e 4 50 , h ) o Ma i i Ni ts n
ABS TRACT: o e g e u t n i o e o e i o tn su so o e g ic v r a e n r u h s t h o , Kn wld e r d ci s n ft mp r tis e f o h a Kn wld e D s o ey b s d o o g e e r t y a d i i t e v u e f o s k o l d efo if r t n s s msw i rs r ig t e c n itn y o l si c t n . n t s or mo e s p r u u n w e g m no mai y t h l p e e vn o ss c f a s ia i s l r o e e h e c f o T e s p o d g e f e k o l d e s p l d b o dt n at b t o ewh l e i o a e c b d b e d c— h u p  ̄ e r e o n w e g u p i y c n i o t u ef rt o ed cs n w sd s r e y t e i h t e i i r h i i h so t b t u p r d g e p l d i n w e g x rs y tm ,a d r lt e i ot n e d g e s d s r e . in at u e s p ot e e a p i n k o ld e e p e s s se i r r e n ea i mp r c e e wa e c b d v a r i T e , eh b d I h n t y r mmu e n t r e u t n Al o t m r p s d , n er lt e c r sa d d t e i i a o u h i n ewo k r d ci g r h i p o o e a d t e ai o e i d e t t l p — o i s h v oh n i p lrt mp o e t e c n e g n e s e d A a t n e a l r v st a h g rt m f cie a i rv o v r e c p e . tl s ,a x mp e p o e h t e a o h i e e t . o h t l i s v KEYW ORDS: o g e ; o e g e r s n ain s se ; d c in o n w e g ;mmu e n t o k ag r h R u h s t Kn wld e rp e e tt y t m Re u t fk o ld e I o o n ew r o t m l i

基于粗集的代建制项目风险因素模糊聚类研究

基于粗集的代建制项目风险因素模糊聚类研究

个 知 识 表 达 系 统 S可 以表 示 为 S=( CUD, U,

式 中
U={ X, , 为对象 的非空有限 , X, … X } 也称论域 ;
A={1 a , , } a ,2 … a 表示 属性 的非 空有 限集合 , A=CU D, C称为条件属性集 , D为决策属性集 ;
第2 7卷
V0 . 7 12
第 4期
N . o4
中州大学学报
J RNAL 0F Z OU HONG ZH0 U UNI RS T VE I Y
21 00年 8月
Au . 0 0 g 2 1
基于 粗 集 的代 建制 项 目风 险 因素 模 糊聚 类研 究
王 爱领
( 州大 学 管理 工程 系, 州 4 0 0 ) 郑 郑 5 0 1
f U× — 为一信息函数 , : A 表示 Va , EA ∈U,( a , ,)E

具有条件属性和决策 属性 的知识表达系统称为决策表 。
2 1 、 近似 和正 域 .上 下
影响 。本文提出一种对风险因素评价中 , 利用粗集原理给 出 风险 因素 的组合权重 , 同时结合 聚类分析法对风险 因素进行 分类 , 为代建制项 目成 功实施提供决 策依据 。

入巨大 、 参与主体众多 、 建设周期长 以及开发阶段多等特点 ,
因此出现风险的机率会 比一般项 目高。因此代建 制项 目本 身的风险相对于常规建设项 目来说要 大得 多, 代建 制项 目本
身的风险承受能力较低 , 对代建制项 目实施进行准确的风险
评 价 有 利 于 代 建 制 项 目在 我 国 的健 康 发 展 。传 统 的风 险 评 价方 法 主 要 包 括层 次 分 析 法 、 家 打 分 法、 征 向 量法 、 专 特

第七章多属性决策分析

第七章多属性决策分析
第七章 多属性决策分析
属性(attribute) 指备选方案的特征、品质或性能参数。
社会经济系统的决策问题,往往涉及不同属 性的多个指标—多属性决策。
实际问题常常有多个决策目标,每个目标的 评价准则往往也不是只有一个,而是多个— 多目标、多准则决策问题。
多目标决策和多属性决策统称多准则决策 (multi-criterion decision making)。
xij
m
x2 ij
11
im jn
i 1
称矩阵Y=(yij)m×n为向量归一标准化矩阵。矩
阵Y的列向量模等于1,即
m
y2
1 1
j
n
注:向量归一标准化后 i1 ij
① 0≤yij≤1; ② 正、逆向指标的方向没有发生变化。
7.1.3 决策指标的标准化
2. 线性比例变换法
在决策矩阵X中,对于正向指标fj,取:
x* j
max
1 i m
xij
0
令:yij
xij 1 i m x*
j
对于负向指标fj,取:
x* j
min
1 i m
xij
令:yij
x* j
x
1
i
m
ij
称矩阵Y=(yij)m×n为线性比例标准化矩阵。 注:经线性比例变换后① 0≤yij≤1;② 所有指 标均化为正向指标;③最优值为1。
§7.1 多属性决策指标体系
7.1.3 决策指标的标准化 将不同量纲的指标,通过适当的变换,化为 无量纲的标准化指标。
决策指标的变化方向 ❖效益型(正向)指标:越大越优 ❖成本型(逆向)指标:越小越优 ❖中立型指标 :在某中间点最优
(如人的体重)

基于粗糙集理论学习效果分析方法的研究

基于粗糙集理论学习效果分析方法的研究

信息值 , n ,CUAx血 V 。 即v x _ ,) 来代替 . ( , 厂。 S , ) =
1 决策表 . 2
决策表是一类特殊而重要的知识表达系统 , 设 .( , S U A)是一个知识表达系统 , {。1, 1 } = 1 , …, , ,, , A {。a, } 中的元素称为属性 , = U =血 , …, 。 2 A C D, Cq = C称为条件属性集 , fD  ̄, D称为决策属性集。 同 时具有条件属性集和决策属性集的知识表达系统称
基于粗糙集理论学习效果分析方法的研究
杜 关萍
( 苏州市职业大学 教务处,江苏 苏州 2 50 ) 1 14
摘 要 :利 用基于粗糙 集理论的评价模 型, 通过对学生学 习影响因素与学习效果的分析 实验研 究, 挖掘 出影响 学生
学习效果的主要 因素 , 为学生的管理及教学提供 了理论支持 。 关键词 :粗糙集 ;知识表 示;影响 因素 ;属性约简 中图分类号 :T 2 42 文献标识码 :A 文章编号 :10 — 45 2 0 ) — 0 5 0 P 7。 0 8 5 7 ( 0 70 0 8 — 3 4
14 核 .
值约简, 最后提取决策规则。
1 知识表达系统 . 1
设 . ( , V 厂是一个知识表达系统 , 中: S UA, ) = 其 U
令 C和 D为 等价关 系族 , R∈P若 p -1D) , 0C ) = t(
收稿日期 :20 — 3 1 07 0 — 6
作者简介 :杜美萍(90 )女 , 17一 , 江苏如皋人, 师, 究方 向: 讲 研 群集智能、 神经 网络和信息系统 。
0 引 言
为对象的非空有限集合 , 称为论域; 为属性的非空 有限集合 ; = V是属性的值域 UV ,o

决策的概念和要素功能

决策的概念和要素功能

决策的概念和要素功能在日常生活和工作中,我们经常需要做出各种各样的决策。

决策是指在多种选择方案中,明晰目标、评估选择并做出最佳动作的过程。

决策涉及到各种因素和要素,下面我们将探讨决策的概念和要素功能。

概念解析决策是指在面对不同选择时,通过分析和比较,最终确定采取的行动或选择的过程。

决策通常是基于信息和目标来做出的,目的是为了达成某种目标或解决问题。

决策的质量直接关系到结果的好坏,因此在决策过程中需要谨慎权衡各种因素。

决策要素功能1. 目标明确决策的第一步是明确目标。

只有清晰地知道要达到的目标是什么,才能有效地选择合适的方案。

目标的明确性能帮助决策者快速筛选出符合要求的方案,避免盲目选择。

2. 信息收集决策过程中需要收集相关信息,以便做出理性的选择。

信息的来源可以包括数据分析、专家意见、市场调研等。

充分的信息有助于降低决策的风险,提高决策的准确性。

3. 方案比较在收集到足够信息后,需要对各个可选方案进行比较和评估。

这包括分析各个方案的优劣势,风险和成本,以便选择最适合的方案。

比较方案时需要考虑各种变量和可能的结果。

4. 风险评估决策过程中存在一定的风险,需要对风险进行评估。

决策者需要考虑可能面临的风险和不确定性,以及应对措施。

风险评估有助于决策者更好地权衡利弊,选择最适合的方案。

5. 实施和监控决策只有在实施和监控的过程中才能发挥作用。

决策者需要跟踪决策的执行情况,及时调整方案和策略。

监控可以帮助决策者发现问题并采取措施解决,确保最终的结果符合预期。

结语决策是一个复杂的过程,需要考虑多个要素和因素。

明确目标、信息收集、方案比较、风险评估以及实施和监控都是决策过程中必不可少的功能。

只有全面考虑这些要素,才能做出明智的决策,达到预期的目标。

希望以上内容能帮助读者更好地理解决策的概念及要素功能。

多属性决策理论基础和分析方法

多属性决策理论基础和分析方法

多属性决策理论基础和分析方法多属性决策理论的基本概念是属性和决策。

属性是用于描述决策对象特征的变量或准则,例如价格、质量、服务等。

决策是选择一个方案或行动来达到一些目标的过程。

多属性决策就是根据各个属性的重要性和得分来进行综合评价和选择。

多属性决策分析方法包括加权求和法、启发式法、模糊数学法和层次分析法等。

其中,加权求和法是最简单和常用的方法,它通过为每个属性分配权重,然后将属性得分与权重相乘再求和,得到决策对象的综合评分。

启发式法是基于经验和直觉的方法,根据决策者的意愿和偏好来进行决策。

模糊数学法是一种处理不确定性和模糊性的方法,它将属性的得分表示为模糊数并进行运算,得到决策对象的模糊评价。

层次分析法是一种层级结构分析的方法,它将决策问题划分为不同层次的准则和子准则,并通过专家判断和比较来确定权重和评价。

多属性决策理论的核心思想是考虑多个属性的影响,避免片面和主观的决策。

它能够全面系统地评估决策对象的特征和优劣,提供更准确和科学的决策依据。

然而,多属性决策也存在一些挑战和局限性,如权重设定和属性评价的主观性、数据不确定性和决策者意愿的影响等。

在实际应用中,多属性决策理论广泛用于工程、经济、环境和管理等领域。

例如,在工程领域,可以利用多属性决策理论来选择最佳供应商或材料,考虑价格、质量、交货期等属性。

在环境领域,可以利用多属性决策理论来评估不同的治理方案,考虑环境效益、经济成本、社会接受度等属性。

综上所述,多属性决策理论是一种处理多个属性的决策方法,通过权重设定和属性评估来进行综合评价和选择。

它能够提供科学和全面的决策支持,但也需要注意主观性、不确定性和意愿性等因素的影响。

在实际应用中,可以根据具体情况选择适合的分析方法,并结合实际经验和专家判断来进行决策。

模糊C均值聚类算法在识别中的应用研究

模糊C均值聚类算法在识别中的应用研究
Oc . 01 t 2 O
模 糊 C均值 聚类算法在识别 中的应用研究
孙 英娟 ,孙 英 慧2 ,蒲 东兵。
( . 春师 范学 院计算 机 科学 与技 术学 院 , 1长 吉林 长春 103 ;. 3022 吉林 师 范大学 计算 机学 院 , 吉林 四平 160 ; 300
3东北师范大学计算机科学与信息技术学院 , . 吉林长春

,, ) d( , d ( . c( 一 1 )…, ) 在值域 V =[ , ] a 上的任意一个断点集合{ a c)( , ) …,a c) 定义 ( , ,a c , ( ,£ )
P ={ , ,c, , ,C , +) . L8 c)L{c)… L 2 c I} c a
于第 i 聚类 中心 的属 性度 . 糊 c一均 值 的 目标 函数 定义 为 : i ( , ) 一 r2 其 中 ,) O [,] i 个 模 mn C = ,  ̄ n , N u 3 1 u- 0 1 , E
∈[, ] ∈[ , ]2 ∑ =1 ∑ E( , ) 1c , 1n ;) , 0n .
0 引言
在 自然科 学 和社会 科 学 中 , 在着 大量 的分类 问题 . 存 所谓 的类 , 就是 指相 似元 素 的集合 . 聚类 分 析又 称 群
分析 , 它是 研究 分 类 问题 的一种 统 计分 析 方 法 . 聚类 分 析 是无 监 督学 习 的一 种重 要 方法 L . 1 聚类 分 析 的 目的 J
是将 给定 的数 据划 分 为若 干有意 义 的组 , 使得 同个 组 内 的对 象 之 间尽 量相 似 , 不 同组 中 的对象 尽 量 相 异 【 . 而 2 J
聚类 技术 被广 泛应 用在 数 据挖掘 、 式识别 、 模 图像处 理 等领域 . 聚类分 析 内容非 常 丰富 , 系统 聚类 法 、 序样 有 有 品聚类法 、 动态 聚类 法 、 模糊 聚类 法 、 聚类 预报 法等 .

英文作文自动评分系统的研究

英文作文自动评分系统的研究

英文作文自动评分系统的研究英语写作是学习英语时必须具备的能力之一.更是大规模语言考试中的一种必备题型.随着科学技术的发展,英文作文自动处理系统的建立也逐渐成为现实。

对于英文自动评分系统的建立,首先我们考察的作文评判因素,主要包括词汇句子、错误、发展、词频、例子方面。

其次是对因素的分类与量化,主要运用到了正态标准化、聚类分析、TF词频等方法,得到每项特征因子对应的分数。

并列表展示了出来。

最后就是对每项特征因子权重的赋值,我们主要基于模糊聚类分析技术和粗糙集理论的信息熵原理,对多因素权重分配进行了研究。

标签:自动作文评分正态标准化特征提取TF词频模糊聚类分析信息熵原理一、国内外研究现状.Page是最初几个在自动作文评分领域进行研究的人,他在1966年开发了Project Essay Grader(PEG)系统。

1990年,自然语言处理与信息提取技术取得了很大的进展。

到90年代末,三个新的自动评分系统面世:其一是Intelligent Essay Assessor(IEA ),是在潜在语义分析的基础上开发的一款主要面向文章内容的自动评分系统;另一个是Electronic Essay Rater(E-rater),它结合了自然语言处理和统计技术,能够综合衡量篇章组织、句子结构和内容;还有一个是IntellMetric,是第一套基于人工智能的能够对文章形式与内容进行评分的自动作文评分系统。

另一条研究路线是基于文本分类技术、文本复杂性特征、以及线性回归方法。

类似的还有Rudner and Liang (2002:3-21 )建立的基于统计分析的Bayesian Essay Test Scoring sY stem(BETSY )系统。

与此同时,PEG 在很多方面也得到改进,整合了很多分析器、词典与各种资源,评分效果也得到很大改善。

国内自动作文评分研究仍然不够完善。

其中梁茂成在05年进行了初步的研究。

他以提取浅层文本特征为主,结合针对内容的潜在语义分析,进行线性回归,得到了与人工评分较高的相关度。

序贯属性约简算法在发动机故障诊断中的应用

序贯属性约简算法在发动机故障诊断中的应用

2009年6月三门峡职业技术学院学报J un.,2009第8卷第2期Joum a l of San m enx i a Po l yt echni c V01.8,N02技术与应用序贯属性约简算法在发动机故障诊断中的应用鲁晓辉刘丰年(三门峡职业技术学院信息工程系,河南三门峡472000)摘要:属性约简是粗糙集理论研究的关键问题之一.为了解决传统分明矩阵属性约简算法在处理高维数据时占用大量的存储空间、效率低的问题.根据决策表信息系统的分明矩阵及序贯思想,提出了序贯属性约简算法,并将其应用于发动机故障诊断系统中.对诊断特征参数表进行约简处理,以减少数据维数,提高诊断效率。

该算法避免了大量的逻辑运算.实现了高维数据的高效属性约简。

理论分析和实验结果表明该算法具有更高的运行效率。

关键词:粗糙集;分明矩阵;序贯属性约简;故障诊断中图分类号:T K407文献标识码:A文章编号:167l一9123(2009)02—0096—03收稿日期:2009—03一15作者简介:鲁晓辉(1980一),男。

河南三门峡人,三门峡职业技术学院教师。

0引言粗糙集理论I l l(r a91)是一种研究不精确、不确定性知识的数学工具.由波兰科学家Z.Paw l ak于1982年首先提出。

其主要思想是在保持分类能力不变的情况下.通过知识约简.导出问题的决策或分类规则。

该理论已经在决策与分析、模式识别、机器学习、知识发现与人工智能等方面得到了广泛的应用12孵1)。

属性约简是粗糙集理论中研究较多的一个分支。

也是粗糙集理论研究的核心内容之一。

所谓信息系统的属性约简.就是保持信息系统分类能力不变的前提下,删除其中的冗余属性。

一个信息系统的属性约简通常不唯一.人们希望能找到具有最少属性的约简,即最佳约简.S.K.M W ong和W.Zi ar ko已经证明了找到一个最佳约简是一个N P—har d问题.解决这类问题通常采用启发式搜索算法,求出最佳或次最佳约简[21(m3)。

一种基于Rough sets生成决策树的算法改进

一种基于Rough sets生成决策树的算法改进

的非空有限集合 , 称为论域 ; A为属性的非 空有 限集合 ; U … 是属 = V V
d E^
为综合信息提供商 , 同样这给气象科技信息服务带来 了很好的机遇和巨
大的挑战。
的关键。 只要手机和网络支持统一标准 , 气象 WA 业务发展是不可限量 P 的。我们看好移动增 值业务 日益增 长的明晰 的市场 潜力 ,看 好 3 D在 WA P上的广泛应用。机不可失 , 时不再来 , 开通气象信息 WA P业务刻不
20 年 第 l 20 - 1 l

种基 于 R uh e 生成决策树 的算法 改进 og t ss
王志强, 王 萌 , 海燕 操
( 广西大学 电气工程学院 , 广西南 宁,30 4 500 )
摘 要: 介绍 了决策树算法的含 义和构 筑方法, 对基 于加权平均粗糙度构造决策树算
法进行改进 , 通过 实例说明 了改进算法的优势。 关键词 : 粗糙集; 决策树 ;45算法 ; C. 加权平均粗糙 度 中图分类号: P7 1I4 ]2 文献标识码 : A
性a 的值域 x — 是一个信 息函数 ,它为每个对象 的每个属性赋予 A

决策树算法是一种常用 的数据挖掘算法 , 它是从机器学 习领域 中逐 渐发展起来 的一种分类函数逼近方法 , 基本算法是贪心算 法 , 即采用 自
广泛适 用性 。
a() JXI其中X , 表 R =R X 兰斗 , ≠ I 示集合X I 的基数。
近似精度反映了我们对 于了解集合 的知识 的完全程度 。
2 属性选择原理及生成决策树算法
1 粗糙 集理 论相关概 念 [ s 】
11 知识表达系统 .
构造决策树 时, 我们往往希望选择能够把实例尽 可能正确划分到相

粗糙集理论在机械故障诊断中应用

粗糙集理论在机械故障诊断中应用

粗糙集理论在机械故障诊断中的应用摘要:作为处理模糊和不确定知识的工具,粗糙集理论能够有效地确定知识系统中有用知识和冗余知识,从而对知识系统进行浓缩,有效地减少训练集,它很好地弥补了人工智能的不足之处。

因此,传统的机械故障诊断技术已从人工智能领域转向以粗糙集理论为代表的计算智能领域。

本文以某型机械故障诊断为例,运用粗糙集理论对故障数据加以分析处理,得到了简明的故障诊断规则,取得了良好的诊断效果。

关键词:粗糙集;属性约简;故障诊断中图分类号:tp751目前,机械设备发展迅速,特别是人工智能技术的应用使机械设备的工作效率大大提高。

但是,机械设备的实时监控却相对滞后,这也大大地制约了农业现代化的发展。

一个小的故障若不及时处理,可能引起放大效应,从而导致更大的财产损失。

因此,如何在机械故障发生后第一时间及时进行诊断进而保证机械设备持续高效运转已成为提高生产效率的关键。

粗糙集理论是波兰数学家z.pawlak于1982年提出的一种能够定量分析处理不精确、不一致、不完整信息与知识的数学工具[1]。

该理论最大的优势是无需提供除问题所需处理的数据集以外的任何先验信息。

此外,该理论还能够有效地去除冗余,对所给信息系统进行分析处理,找出其中的隐含知识,揭示潜在的规律[2]。

本文对粗糙集理论在机械故障诊断中的应用进行研究,以丰富故障诊断知识。

1粗糙集理论的基本概念定义1:设是我们感兴趣的对象组成的有限集合,称为论域[3–4]。

称为中的一个概念或范畴。

中任何概念族称为关于的抽象知识,简称知识。

为规范起见,我们认为空集也是一个概念。

上的一个划分可定义为:;其中,,且,对于;。

定义2:设为上的一个等价关系,表示的所有等价类(或者上的分类)构成的集合,表示包含元素的等价类。

定义3:设是上的一族等价关系,若,且,则中所有等价关系的交集称为上的不可区分关系,记为,且有定义4:信息系统被定义为如下的四元组:。

其中:知识表达系统;:对象的非空有限集合,也称论域;,是属性的值域;为一信息函数,它为每个对象的每个属性赋予一个信息值,即,。

基于融合面积谱和粗糙集理论的旋转机械故障诊断

基于融合面积谱和粗糙集理论的旋转机械故障诊断
低 的 途 径

S 2 w — lk) INk) ・ Ik) lN k) ( ) RR= ・ Z 2+Z —2 ] Z 2l Z —2 ] k= }【 ( l ( 1÷[ ( — ( _

} l k l lN k ljk=,2 N —) 【 ( )一z —2 ( 0 ,…,21 Z 2 ( ) 2 】. /
科技信息
工 程 技 术
基 于融 合 面积 i g m| 粕糙 集理 i 的 旋 转 相 瓣 故 瞠 i 断 仑 全
中 国核 电工程 有 限公 司郑 州分公 司 李利娟 肖 赞
[ 摘 要] 本文提 出了基于融合面积谱 和粗糙 集理论 的旋转机械故障诊断 方法, 通过 对四种 常见故障数 据的分析 , 出结论 : 得 相对 于 单截面数据 , 基于融合面积谱和 粗糙 集理论 的故 障诊断方法大 大地提 高了诊 断的速度 和正确 率。 [ 关键词 ] 融合面积谱 粗糙 集 故 障诊 断
是 “ 。 m! 二 、 糙 集 理 论 粗 粗 糙 集 理论 是 一 种 新 的用 以处 理 模 糊 和 不 确 定 知识 的数 学 工 具 , 其
主 要 思 想 就 是 存保 持 分 类 能 力 不 变 的 前 提 下 , 过 知 识 约 简, 出 问 题 通 导
的决策分类规 则。它从新的角度对知识进行了定义, 把知识看成是荚于
论 域 的 划 分

融 合 面 积谱 的计 算 方 法
假 定 【k (K 别 是 x y 向 上 的 离 散 序 列 , {k f } 成 一 x 和 y】 】 分 、方 用 x和 y 构 ) 复
数序列㈨ , 其做 Fui 变换得 { 。 据矢谱 分析技术 可求得谐波轨 对 or r e z}根 迹 椭 圆 的 长半 轴 R 和 短 半 轴 矢 量 R 即谐 波 运 动矢 量 的 主 振 矢 和 副

基于遗传算法的粗糙集知识约简

基于遗传算法的粗糙集知识约简
技 经 济市场
基于遗传算法的粗糙集知识约简
刘 伟伟
( 西北 民族 大学数 学与计算机科 学 学院 , 肃 兰 州 703 ) 甘 300
摘 要 : 知识约简是粗糙集理论的核心内容之一。本文通过知识表达系统中条件属性对决策属性的重要性, 来描述由条件
属性所提供 的知识对整体决策 的重要程度 , 利用遗传算法 , 出一种基于遗传算法的粗糙集知识约简方法。 提
为个体对应 的条件属性关于决策属性 D的重要性 :a r a。 ) ) :o 3 . 3遗传算法的操作 选择采用轮盘赌选择法。设种群大小为 n 对种群中的个体 ,
膏 ( I , QI I 我们称知识Q ( k ) 依赖 = = o )u ̄, pA / I 是k ≤ ≤1 0 度
于知 识 P的 , 记作 P = Q 。 = > 定 义 6 设 s ( ,, = U f)为一 个 知识 表 达 系 统 , = UD, A AC C ≠ , 中 C和 D分 别 条 件 属 性 集 和 决 策 属 性 集 , 性 子 ND 其 属 集 C cC关 于 D 的重要 性 为 ’
idR)idR {1, n ( =n ( 一R )
鉴生物界 自然选择和 自然遗传机制的概率搜索方法。因为它既 不要求 目标 函数连续 , 也不要求可微 , 仅要求 问题 可计算 , 且 并 它的搜索始终遍及整个解空间, 因此易得到全局最优。 遗传算法的一般流程如下 图所示
则称 R为 R中不必要的; 否则 R为 R中必要的。 定义 3 如果每一个 RE R都为 R中必要 的,则称 R为独 立的; 否则称 R为依赖的。 定 义 4 设 Q P 如果 Q是 独 立 的 , id Q) id P , , 且 n( = n( ) 则 称 Q 为 P的一个 约 简 。显 然 , 以有 多种 约 简 。P中所 有 必要 P可 关系组成的集合称为 P的核 , 记作 cr( ) oeP 。 核 与约 简 有如 下 关 系

基于矩阵的最简决策规则获取

基于矩阵的最简决策规则获取
LUO ip n , U - e , ANG a g c a La - e g LI Erg n W Gu n h o ( c o l f a i S i c s E s C i a ioo gUnv ri , n h n 3 0 3 S h o o s ce e , at h n a t n iest Na c a g 3 0 1 ) B c n J y
中 圈分类号: P9 T31
基 于矩 阵的最简决策规则获取
罗来 鹏 ,刘二根 ,王广超
( 华东交通大学基础科 学学院 ,南 昌 3 0 1 ) 3 0 3

要: 获取决策表规则 时 , 通常 需要进 行属性约简和属性值 约简。该文分析属 性值约简 ,针对协调决策表提 出一 种通 过构造决策矩阵直
第 3 卷 第 l 期 4 9
VL 4 o3






20 0 8年 1 O月
Oc o r2 0 t be 0 8
No. 9 1
Co put rEng ne r ng m e i ei
软件 技 术 与数 据库 ・
文章编号:10- 48 08 9- 4-0 文献标识码: 00 32( 0) - 01-3 - 2 1 0 A
属性 约简 和规则提取是粗糙集应 用研究 中的 2 个核心问 题【 j 。规则提取是最终 目标 ,分为 2步 ,即属性约简和属性 。 值约 简。它们共 同 目的是尽量获取 最简洁的规则知识 。各属
性对决策 的重 要性 不同,一 些属性 是否存在 不会影响决策表 中固有知识 的蕴涵 关系。属性约 简即根据 上述概念 寻求最小
整数据、不精确知识的表达、学 习、归纳等方法 。该理论从

纹理分析

纹理分析

附件一:遥感影像云识别方法综述国内外对云的检测与分类研究较多,有较多的研究成果报道。

其方法大致可以分为两类,一类是基于光谱的方法,主要利用云在不同的光谱波段有不同反射特征,大部分以灰度阈值或灰度聚类的方法实现,主要用于多光谱影像,早期研究较多。

如用于A VHRR的ISCCR 法(ROSSOW,1989)、CLA VR法(STOWE,1991)和用于的C02法(WGLIE,1994),近期亦研究用于MODIS的一些云识别与分类的方法,主要为以前方法的改造。

另一类是基于纹理的方法主要应用云影像的灰度空间分布特征。

纹理特征常以统计模型法、结构法、场模型法或频域/空域联合分析法来度量。

其中尤以传统的统计模型研究较多,如灰度共生矩阵(GLCM)、灰度差分矩阵(GLDM)、灰度差分矢量(GLDV)、和差直方图(SADH)等,新近提出的一些方法如场模型法中的分形分维、马尔可夫随机场方法,频域/空域联合分析法中的Gabor变换、小波变换等,有不少的研究成果报道。

1. 基于光谱特征的方法:主要有ISCCP方法、APLOOL方法、CO薄片法、CLAVR方法等。

ISCCP方法主要由Rossow(1989)Seze和Rossow(1991a)及RossowG和arder(1993)和等开发研制,检测方法中公用到窄的可见光波段(0.6)和红外窗区波段的资料。

它假定观测辐射办一自晴空和云两种情况(这两种大气状况相联系的辐射值变化并不相互重叠),把每一个像元的观测辐射值与晴空辐射值比较,若两者的差大于晴空辐射值本身的变化时,定该像元点为云点。

因此算法依赖于阈值,阈值勤的大小就确定了晴空计值中不确定性的大小,当像元的车射值明显有别于晴空像元时,认为像元被云覆盖,但当像元部分被云覆盖时,会发生误判。

算法主要由有五部分组成:1 单一红外图像的空间对比试验。

2 三个连续红处图像的时间对比试验。

3可见光和红外图像的空间/时间的累计统计合成。

条件属性决策属性

条件属性决策属性

分类模型的建模思想
分类建模的步骤 线性分类器 非线性分类器
分类建模的步骤
训练分类器 将数据集分成训练集和测试集
用训练数据集训练分类模型 用测试集测试分类器的性能
线性分类器
线性判别函数和决策超平面 支持向量机
线性判别函数和决策超平面
支持向量机
硬间隔支持向量机
特征选择与属性约简
特征选择: 评价函数+搜索策略+停止准则
属性约简: 约简集的评估值与原始属性集的评估值相等 评价函数+搜索策略
评价函数
相关性计算:线性相关性和非线性相关性
线 性:
Sw (W ,W ')
N
(wi W )(wi 'W ')
i1
N
N
(wi பைடு நூலகம்W )2 (wi 'W ')2
Weka简介
数据导入 算法使用
weka数据格式
在matlab中将每一列加上一个标号 使用matlab将‘.mat’数据转换成‘.csv’格式
csvwrite(‘data2.csv’,data1) data1是’.mat’格式的数据文件 使用weka将‘.csv’格式的数据打开——>另存为 ‘.arff’格式 使用ultraedit将‘.arff’格式文件打开,修改决策属 性的数据类型。 修改后的数据即可用于weka软件。
流感 否 是 是 否 是 是 是 是
病人 x1 x2 x3 x4 x5 x6 x7 x8
条件属性
a1
a2
1
1
1
1
1
1
0
1
0
0
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
Xi 、 / I xi =( —x S
进而 , 过 对 协 方 差 系数 做 归一 化 处 理 , 到 了相 关 系 通 得 数 。所 以 , 用协 方差 系数 来衡 量 属 性 之 间 的相 关 性 是合
理的。
其 中 为第 个 属性 的数 学 期望 , , 第 个 属性 s为

首 先求第 一个 主分 量 F1F X 的线性 组合 : , 为
F】 =∑n ( ) =a X 1i X 】 其 中 a =( ( ) & ( ) a ( ) . , 1p) 。 l 口11 , 12 , l3 . .口 ( )
为数 据 分布 示 意图 ) 。设 其数据 的重 心 为 g 。显然 , 盘l 沿

称 为 第 一 主分 量 。第 二 主 分 量 、 三 主分 量 依 次 类 第
《 计量与痢试技 术》 0 0 第 3 21年 7卷第 1 期
i n wld e Ex r s i n S se n a K o e g p e s o y tm
李 伟 光
( 四川理工学院 自动化与电子信息学 院, I 四J l自贡 6 3 0 ) 4 00
摘 要: 本文利用了最优化理论 , 讨论主分量分析 ( c 的原理 , P A) 提出利用主分量分析的方法研究知识表达系统 中条件属性的相关性 , 进而讨论决策系
统 中条件属性的重要性和系统控制参数的简化 , 给出了利用主分量分析的方法研究知识 系统中属性的相关性 , 并 进行 系统参数简 化的算法 。理论分
析和实例计算结果证明了本文提出的方法的可行性 和有效性。 关键词 : 特征提取 ; 主分量分析 ; 粗糙 集
在 一个 知识 表 达 系统 中 , 析 衡 量各 个 属 性 对 于决 分 策 的重要 程 度 , 释各 个属 性 的作用 , 解 这些 分 析 内容 都有
1 属性 之 间相 关性 的度 量
图 l 图 2
3 计 算主 分量 的方法
首先 设 属 . x 和 属 性 y, 属 性数 值 分 别 为 x( ) 陛 其 是
和 Y( ) k 。则 X 和 y 的相关 函数 和协方 差 函数分别 为 :
R k , 2 =E{ k ) ( 2 } ( l 走 ) z( 1 Y 足 )
相关 性 的数 据 会 造 成 数 据 的冗 余 , 降低 计 算 的 有 效 性 。 如果 在分 析计 算 中考 虑这 种 相关 性 , 使 数据 的分 析变 会 得复杂 , 以在进行数据 计算处理 之前 , 所 首先去处数据 的相 关 f可 以有效的方便 以后数据 的分析处理 。本 文介 绍的主 生 分量提取的办法可 以有效的去 除各个属性的相关 陛。
的随机 部分 , 乘积 和平 均 的运 算后 , 于相 互 “ 消 “ 在 趋 抵 。
X =[ 1 , . . X , X3 . . j 为 了推导方 便且 不 失 一 般性 , 将 知识 表 达 系 统 中 先
的数据进 行 标 准 化 处 理 , 称 为 白化处 理 。( E( ) 也 即 X =0 V r X, =1 。标 准化 过程 如下 : ; ( ) )
方 向上 , 数据 离散 度 最 大 , 方 向 上数 据 变 异 最 大 , 该 根据
易证 V r( )= a F1
a 1 1 V
lF I = 盘1 a : 】 1I X X l
香农 信息 理 论 的 原 理 , 所 携 带 的信 息 量 也 最 多 , 以 其 所
着重 要 的意 义 。但是 在 一 个 知 识 表达 系统 中 , 于选 取 对
推 。如 果将 坐标原 点平移 到 g点 , 做旋转 , 到一 正 交 并 得
坐标 系 a g 2 如 图 2所 示 。显然 , 2较之 图 1在分 1a 。 图
析计算 上更 容易处 理 。
的各 个属 性 常常 相互 之 间 存 在 一定 的相 关 性 , 些具 有 这
方法 和步骤 。
相 关 系数 为 阳 ( ) r
Jy Z , / x - k
设 X 为一 个有 个 样本 和 P 个变量 的数据表 。 在这 里我 们对 互 协 方 差 的解 释如 下 : 协 方差 涉及 互
两个 不 同属 性 的数 据 x( ) y( ) 均值 差 之 间 的乘 k和 k于 积 。这样 这 两个 属性 的共 性部 分就得 到加 强 。而属性 中
如 果将知 识表达 系统 的 属性分析实 质上 就是分 析该 线性 空间 的秩 和基 。基 于
( 1k ) k , 2 :E{ ( 1 一 ] Y( 2 一 ] } [ k) [ k) =
R ( ) r一
t , 弋 /一、
该思路 , 分析 主分量 可 以直 接 分 析矩 阵 的秩 和 最 大 无关 组 。也 可 以使用 主 分 量 分 析 的 主 要 方 法 : 小 二 乘 法 。 最 本文基 于该思 路 , 出 了分 析 知 识 表达 系统 的详 细计 算 提
李伟光 : 识表达 系统 孛奈件属性与决策属性关 系的分哲 知
知 识 表 达 系统 中条 件 属 性 与 决 策 属 性 关 系 的 分 析
An lsso lt n ew e tiue n cso s ayi fReai sB t enAt b t a dDeiin o r s
的方差 。现在 假设 知识表 达 系统 中的数据 都经 过 了上 面 的标准 化过程 , 然 以 X, 仍 表示 。
2 主 分量 分析 的原 理
主分 量 的方 向是 代表 输入 数据 矢量具 有最 大方 差 的 方 向 , 主 分量来 表示 数 据矢 量称之 为 主分 量 ( c ) 以 用 P A, 个 二 维数 据表 为例 子 , 中样 本 如 图 1所示 ( 中椭 圆 表 其
相关文档
最新文档