动态朴素贝叶斯网络分类器的特征子集选择

合集下载
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

5 8
计 算机应 用 与软件
21 02皋
D T N 1 , [ ] …, 是对应数据集 中的例子数量 。 [ ], [ ]N 2 , Ⅳ[
是 Dl 一1 中 C1 t J J= [ 一1 ( ≤ ≤t ) Ct 0 J 一1 的情 况 数 量 。
( )属性条件 密度估计 2
Ab t a t sr c C a sf ain a c r c St e mo t mp ra t ef r n ei d c t r fca sf r.F au e s b e s lci n i a f cie me h d l s i c t c u a y i h s ot n roma c n iao l si e s e tr u s t ee t S n ef t t o i o i p o i o e v



[ ) z l
( ,v ]I, ]
图 1 D B N N分 类 器 结 构
12 D N 分类 器表 示形 式 . I
基 于贝叶斯 网络理论 和贝 叶斯公式 , 据图 1中所 体 现 的 依 条件独立性关系可得 : P( []I [ ] … ,[ 一1 ,。0 , , [ ] C t O , C t ] [ ] … 0 , c DB N N分类 器分类准确性估计是衡量分 类器分类 准确性 的 个标准 , 静态分类器 的分 类准确 性评价标 准是 基于例 子之 间 独立 同分 布的假 设 , 时序例子数据之 间强 调时序依 赖 , 因此需要
中图分类号
动态朴 素贝叶斯网络
T 11 P 8
分 类器
特征子集选择 高斯核 函数

文献标识码
F EATL E S BS T E CⅡ oN 瓜 U E S LE
I NA C N M
E BAY L 】S N] v) 圈 IRK a
;I S

Y n e・ Wa gS u n c eg・ D u i uMi i j n h agh n uR ie j
态朴素贝叶斯网络 D B 8 N N_9分类器 是其 中的一种 较实用 的分 ,
技术是使用计算机对人类分类能力 的模拟 , 已成 为机器学 习、 模
式识别和数据采掘等领域研究 的核心 内容之一 。这种模拟是通
类器。这种分类器 简单 高效 , 但分 类预 测 的准确 性有 待提 高 。
本 文首先给出具有连续属性 的动态朴素 贝叶斯 网络分类器和动
态分类准确性评 价标 准 , 在此基 础上建 立动态朴 素贝 叶斯 网络 分类器的特 征子集选择方法 , 以提高分类器的分类 准确性 , 并使 用真实宏观经济时序数据进行 实验 与分 析。
分别 用 [ ] [ ]… , [ 1 , 2 , ]( 1≤ i /) C 1 , ≤ ' 和 [] t
余民杰 , 王双成 , 杜瑞杰
( 上海立信会计学院数学与信息学院 上海 2 12 ) 0 60 上海 2 12 ) 06 0 ( 云南财经大学信息学 院 云南 昆明 6 0 2 ) 5 2 1 ( 上海立信会计学 院开放经济与贸易研究 中心


分 类准确性是分类器最重要 的性能指标 , 特征子集选择是提高分 类器 分类准确 性的一种有效 方法。现有的特征子 集选
( colfMahmai n fr ai , h n h i ii U iri o ec, h nh i 06 0 C ia Sho o te ts dI om t n S ag a Lxn nv syo C mm r S ag a 12 , hn ) ca n o e tf e 2 。 Sho o I om t n u nn U i rt f FnleadE oo c, u mn 5 2 1 Y n a C ia ( col n r i ,Y n a nv syo ia n cnmi K n ig6 02 ,u nn,hn ) f fa o ei s
c2 , , T [ ] … C[ ]表示 随机 属性 和类 变量序列 , [ ] [ ] …, 1, 2 ,
练和分类 , 多领域都 有对 向量时 间序 列分类 预测 的实际需 而许 求 。在 向量时间序列 中的例子之间不再满足独立同分布的假 设
( 例子之间强调 时序依赖) 动态 贝叶斯 网络分 类器可满足 这一 ,
( pnE oo ca dTaeR s rhC ne, h nh i i nU i rt o m r ,Sa g a 0 60,C ia O e cnmi n rd e ac et ' ag a x nv syo C m c h n h i 1 2 e rS Li ei f e e 2 hn )
rs ac n d n mi l si e e tr u s tsl cin i r r . I h sp p r h y a c n i e B y sa ew r ls i e i o t u u e e rh o y a c ca sf rf au e s b e ee t s a e n t i a e ,te d n mi a' a e in n t o k ca sf rw t c n i o s i o v i h n at b t sa d t e a c r c v l ain c i ro rd n mi l si c t n ae p e e td f s. A s lcin meh d o au e s b e fd n mi t i u e n h c u a y e a u t r e n f y a c ca sf a i r rs ne r t ee t t o f e tr u s t y a c r o ti o i o i o f o
需求 。
[ 和 C 1 ,E ]… , T 是具体 的取值 ; [ ]D 2 , ] [ ]c2 , c ] [ D 1 ,[ ] …, D 7 是到 达不 同时 间片 的数据 集 , [ ]c D 2 [1 ] D 1 []c, , … c
收稿 日期 :00—1 2 。国家 自然科 学基金( 0 7 06 教 育部 21 1— 2 6 6 5 3 ); 人文社科基金 (9 J 60 9 );上海市 教委 重点学 科建 设项 目(57 0 Y A 30 9 J10

2 分 类准确 性估计
了时间特征 功能 , 可用于多变量 网络时间序列 的因果分析 、 概率
0 引 言
分类能力是人类经过 学习得到 的重要 而基本 的能力 , 类 分
推理和预测 等 , 已在语音识别 、 图像处理 、 信号 过滤 与检测 、 工业 控制 、 因分析 、 基 气象分析 与预测等许多领域得到广泛应用 。用 于预测的动态贝叶斯 网络一般称 为动态 贝叶斯 网络分类器 , 动
I] v,
() 3
1 1 D N 分 类器 结构 . NB
D B N N分类器结构 是建立分类器的基础 , 在结 构 中, 类变量
其 中 N( [ 一1 ) C t ] 是时序数据集 中 c ]=C t ( ≤ ≤£ ) [ [] 1 一1 的 情 况数量 ,
时间序列构成马尔科夫链 , 给定类变量时 , 所属的属性变量之 间 条件独 立 , 与其 它时 间片 内的变 量也 条件独 立 , 1给 出的是 图 DB N N分类器结构 。
合 , 有效利用类变量 的动态时 间序列 信息和属 性变 量的静 能够 态依赖信息 , 网络 时 间序列 预测 的有 力工具 。D B 是 N N分 类器 由结构和参数两部分构 成 , 根据结构和例子集 可估计 出参 数。
币 sne ]g i (l )( g
[ s 1) f []
f ri r vn h l si c t n a c r c fca sf r .Exsi g meh d ffau e s b e ee t n a e man y fr s t ls i e s h l h o mp o ig t e c a sf a i c u a y o l s i e s i o i i n to so t r u s t lci r il t i ca s ir ,w i te t e s o o ac f e
过建立分类器和使用分类器进行分类推理预测来实现。构建 分 类器是一个归纳学习 的过程 , 需要 依据训 练数据归 纳 出属性 变 量和类变量之间 的函数关 系或规则 , 而分 类是对 给 出的属性 变 量值 , 根据函数关系或则 通过推理 确定类变 量值 的过程 。现 已发展 了众多 的分类器 。j它们各有特点 , , 在许多 领域 得到了 广泛的应用 。但这些分类器一般使用独立同分布的例子进行训
动 态贝叶斯 网络 是 贝叶斯 网络 的扩展 , 将时 间片间 的
动 态依赖 与时间片内的静 态依赖 有机结 合在一起 , 承了贝 在继 叶斯 网络多功能性 、 有效性和开放性等方面优势的同时 , 又增加
2; ) 上海市教委科研创新 重点项 目( 9z0 ) 0 z 2 。余 民杰 , 士生 , 2 硕 主研 领 域: 贝叶斯网络分类 器。
第2 9卷 第 2期
21 0 2年 2 月
计 算机 应 用与软 件
Co u e p ia in n ot r mp trAp l t s a d S f c o wa e
Vo. 9 No 2 12 .
Fe .2 2 b 01
动 态 朴 素 贝 叶 斯 网络分 类器 的特 征 子 集 选 择
n Ye Ba e in n t r ls i e S d v lp d b s d O h s w i h c u l ma r e o o c t ei s d t r s d t ar u h av y sa ewok ca s r i e eo e a e n t i . h l t e a t a co c n mi i i f e me s re aa a e u e o c r o t t e y
e p r n s a d a ay e . x ei me t n n l s s Ke wo d y rs Dy a c n ' e b y sa ew r Cls i e F au e s b e s l cin G u sa e n lf n t n n mi av a e in n t o k i a s ir f e t r u s t e e t a si n k r e u ci o o
择方 法主要针对静 态分类器 , 缺少 动态分 类器特征子集选择方面 的研究。首先给 出具 有连续属 性的动态朴 素贝叶斯 网络分 类器和 动态分类准确性评价标准 , 此基 础上建 立动态朴 素贝 叶斯 网络分类器 的特征子集选择方法, 在 并使用真实宏观经济时序数据进行实
验 与分 析 。
关键词
1 D N分类器 NB
DB N N分类 器是朴 素 贝 叶斯 网络 分 类器 与 时 间序 列 的 结

采用高斯核函数估计条件密度 , 即用 ( [] []D[] t I t, t, C
( []I []D[]S t ) t t , t , [] C
S t )估计 p xI]Ic t ,i] [] ( t [] s t )。
相关文档
最新文档