基于TF-IDF改进聚类算法的网络敏感信息挖掘

合集下载
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

基于TF-IDF改进聚类算法的网络敏感信息挖掘
孟彩霞;陈红玉
【期刊名称】《现代电子技术》
【年(卷),期】2015(38)24
【摘要】In the mining process of objectionable Internet information,the sensitive information is different from normal in⁃formation and has high shadowing property. When the traditional method is taken to excavate the sensitive information,the sensi⁃tive information can not be mined accurately because the inherent sensitive information is obscured. The objectionable Internet information excavation algorithm is proposed,in which clustering algorithm is improved on the basis of TF⁃IDF. It uses
TF⁃IDF algorithm to obtain objectionable Internet informative text,in which valuable features of the sensitive information are got. This in⁃formation is used to complete the clustering algorithm,and all the sensitive information features are clustered and analyzed,so that the network sensitive information is mined completely. The experimental results show that the proposed method has high effi⁃ciency and precision for objectionable network information excavation.%网络敏感信息挖掘过程中,敏感信息和正常信息的特征不同,具有较高的遮蔽性。

利用传统敏感信息挖掘方法时,固有的敏感信息被遮蔽,无法进行敏感信息的准确挖掘。

提出基于TF⁃IDF改进聚类算法的网络敏感信息挖掘方法,通过TF⁃IDF方法获取网络敏感信息文本,在网络敏感信息文本中获取有价值的敏感信息特征,采用该信息完成聚类算法,对全部敏感信息特
征进行聚类分析,完成网络敏感信息的挖掘。

实验结果说明,所提方法进行网络敏感信息挖掘,具有较高的挖掘效率和精度。

【总页数】4页(P44-46,49)
【作者】孟彩霞;陈红玉
【作者单位】铁道警察学院公安技术系,河南郑州 450053;铁道警察学院公安技术系,河南郑州 450053
【正文语种】中文
【中图分类】TN911-34;TP33
【相关文献】
1.一种基于网络敏感信息挖掘的量化社会稳定分析技术框架 [J], 王伟;李佳静;瓮佳佳
2.基于TF-IDF改进算法的聚焦主题网络爬虫 [J], 王景中;邱铜相
3.复杂网络社区挖掘——改进的层次聚类算法 [J], 郑浩原;黄战
4.基于TF-IDF和改进BP神经网络的社交平台垃圾文本过滤 [J], 王杨;王非凡;张舒宜;黄少芬;许闪闪;赵晨曦;赵传信
5.基于改进深度学习的网络敏感信息快速过滤研究 [J], 朴承哲
因版权原因,仅展示原文概要,查看原文内容请购买。

相关文档
最新文档