基于改进朴素贝叶斯算法的垃圾邮件过滤器的研究

合集下载
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

反冲洗过滤器的特点

/

电力驱动,不锈钢刷式清洗,系统承压能力强;

高精度压差控制设计、时间控制、手动控制清洗;

钢刷拆卸、安装、维护简便易操作;

相邻两次清洗,电机正反转交替运转,使不锈钢转刷寿命更长;设有电机过载保护,可有效保护电机。

控制显示界面人性化设计,操作非常简便;

外表面无外露接线,安全可靠。

控制界面:数显、旋钮、开关

滤网类型:金属楔型网

电力驱动,不锈钢刷式清洗排污;

控制方式:压差、时间、手动控制设计;

控制方式:时间、手动控制设计;

特殊过滤单元结构设计,坚固耐用;

独特的清洗设计实现低负载、低水头、均匀排污;

电控箱面板方向可满足用户要求随意调节;

/product.asp?Pone=12

基于改进朴素贝叶斯算法的垃圾邮件过滤器的研究

作者:郑炜, 沈文, 张英鹏, Zheng Wei, Shen Wen, Zhang Yingpeng

作者单位:郑炜,沈文,Zheng Wei,Shen Wen(西北工业大学软件与微电子学院,陕西,西安,710072), 张英鹏,Zhang Yingpeng(西安财经学院信息学院,陕西,西安,710072)

刊名:

西北工业大学学报

英文刊名:JOURNAL OF NORTHWESTERN POLYTECHNICAL UNIVERSITY

年,卷(期):2010,28(4)

被引用次数:0次

1.Zhang H Exploring Conditions for the Optimality of Naive Bayes 2005(2)

2.Vangelis Metsis.Ion Androutsopoulos.Georgios Paliouras Spam Filtering with Naive Bayes--Which Naive Bayes 2006

3.Mehran Sahami.Susan Dumais.David Heckerman.Eric Horvitz A Bayesian Approach to Filtering Junk E-Mail 1998

4.Johan Hovold Naive Bayes Spam Filtering Using Word-Position-Based Attributes 2005

5.Zhang I E.Zhu Jingbao.Yao Tianshun An Evaluation of Statistical Spare Filtering Techniques 2004(4)

6.Aris Kosmopoulos.Georgios Paliouras.Ion Androutsopoulos Adaptive Spam Filtering Using Only Naive Bayes Text Classifiers 2008

1.学位论文蒋良孝朴素贝叶斯分类器及其改进算法研究2009

分类是数据挖掘中一项非常重要的任务,在现实生活中有着广泛的应用。例如,根据电子邮件的标题和内容判断其是否为垃圾邮件。构造分类器的方法很多,常见的有贝叶斯网络、决策树、基于实例的学习、人工神经网络、支持向量机、遗传算法、粗糙集、模糊集等等。其中,贝叶斯网络正以其独特的不确定性知识表达形式、丰富的概率表达能力、综合先验知识的增量学习特性等成为众多方法中最为流行的方法之一。

鉴于学习最优的贝叶斯分类器如同学习贝叶斯网络是一个NP难问题,学习朴素贝叶斯分类器得到了广大学者的重视。朴素贝叶斯分类器基于一个简单而不现实的假设:在给定类标记时属性值之间相互条件独立。可最近的有导师学习表明:即便是这样一个惊奇简单且具有很强的属性条件独立性假设的贝叶斯分类器,简称为朴素贝叶斯分类器,其分类性能仍然可与决策树算法、k-近邻算法等经典算法相当。

一个自然的问题是:释放朴素贝叶斯分类器的属性条件独立性是否可以使得它的分类性能更好?为回答这个问题,学者们提出了许多改进朴素贝叶斯分类器的方法,概括起来主要可以分为三类:1)结构扩展,这一类方法用有向边来表达属性之间的依赖关系;2)属性选择,这一类方法在属性空间搜索一个属性子集;3)局部学习,这一类方法在测试实例的局部构建一个朴素贝叶斯分类器。

本文以朴素贝叶斯分类器为基本对象,研究朴素贝叶斯分类器的各种改进方法,提出了隐藏扩展的朴素贝叶斯分类器、演化选择的朴素贝叶斯分类器、动态局部的朴素贝叶斯分类器三种算法。在许多现实的数据挖掘应用中,排列也非常重要。因此,本文调查研究了朴素贝叶斯分类器的排列性能,并提出了一种局部克隆的朴素贝叶斯排列算法。此外,本文还调查研究了改进朴素贝叶斯分类器的一些其他方法:属性加权方法、实例加权方法、组合学习方法,提出了一种基于相似度的实例加权的朴素贝叶斯分类算法和一种基于C4.5和NB的组合分类算法。最后,探讨了新算法在若干实际问题的应用价值。

本文的最主要的贡献包括:

1)给出了学习扩展的朴素贝叶斯分类器的算法框架、综述了改进朴素贝叶斯分类器的结构扩展方法、提出了一种隐藏扩展的朴素贝叶斯分类算法(HANB)。HANB为每个属性结点产生一个隐藏的父亲结点,该结点对其几子结点的影响为其他所有属性结点对该属性结点影响的加权平均,其中权值的大小为属性变量之间的条件相互信息。

2)给出了学习选择的朴素贝叶斯分类器的算法框架、综述了改进朴素贝叶斯分类器的属性选择方法、提出了一种演化选择的朴素贝叶斯分类算法(ESNB)。ESNB的适应度函数为当前朴素贝叶斯分类器的分类精度。编码方式为二进制编码方式,二进制串的长度为原始属性的个数,二进制位“1”或者“0”分别代表属性被选择或没有被选择的状态,停止搜索的条件为演化的代数。

3)给出了学习局部的朴素贝叶斯分类器的算法框架、综述了改进朴素贝叶斯分类器的局部学习方法、提出了一种动态局部的朴素贝叶斯分类算法(DLNB)。DLNB在训练实例集上利用留一交叉验证法来动态地选择一个最能拟合训练实例集的k值,一旦最佳的k值被学习到,它就可以被用来分类所有的测试实例。

4)综述了排列算法的研究状况、调查了朴素贝叶斯分类器的排列性能、提出了一种局部克隆的朴素贝叶斯排列算法(LCNB)。LCNB首先运用k-近邻算法发现最接近测试实例的k个邻居,然后根据测试实例和每个邻居之间的相似度对每个邻居进行克隆,最后在增加了克隆实例后的训练实例集上构建朴素贝叶斯分类器。

5)给出了学习属性加权和实例加权的朴素贝叶斯分类器的算法框架、综述了构造组合分类器的四类方法、提出了一种基于相似度的实例加权的朴素贝叶斯分类算法(IWNB-S)和一种基于C4.5和NB的组合分类算法(C4.5-NB)。

6)探讨了新算法(HANB、ESNB、DLNB)在若干实际问题的应用价值。

2.期刊论文高俊山.郎平.孙真和.GAO NG Ping.SUN Zhen-he基于粗糙集理论和朴素贝叶斯分类算法

的汽轮发电机振动故障诊断-热力发电2010,39(2)

汽轮发电机组结构及振动的复杂性使其故障具有多层次性和随机性,以及故障信息不完整性等特点.对此,提出了一种基于粗糙集理论与朴素贝叶斯分类算法的汽轮发电机组振动故障诊断方法.通过粗糙集理论求取最小属性约简集,并在此基础上利用朴素贝叶斯分类算法诊断出故障概率最大的区,最后针对具体的故障设定值对该方法进行验证.实际算例结果表明,该方法能在故障信息不完整甚至丢失核心属性的情况下得到较好的诊断结果,提高了系统诊断

相关文档
最新文档