基于主成分分析和KNN混合方法的文本分类研究
合集下载
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
基于主成分分析和KNN混合方法的文本分类研究
郭新辰;李成龙;樊秀玲
【期刊名称】《东北电力大学学报》
【年(卷),期】2013(000)006
【摘要】特征选择和分类算法是文本分类中的两个关键技术,提出了基于主成分分析和KNN相结合的文本分类方法。
该方法利用主成分分析对文本向量的高维空间进行特征选择,为克服因类别特征选择不当带来的不利影响,使用KNN算法进行分类可以最大程度地减少分类过程中的误差。
为了验证方法的有效性,针对UCI标准数据集进行仿真实验。
实验结果显示,PCA-KNN方法优于主成分分析和随机森林相结合的方法,能在一定程度上提高文本分类的精度。
【总页数】4页(P60-63)
【作者】郭新辰;李成龙;樊秀玲
【作者单位】东北电力大学理学院吉林吉林132012;东北电力大学理学院吉林吉林132012;东北电力大学理学院吉林吉林132012
【正文语种】中文
【中图分类】TP391
【相关文献】
1.基于卷积神经网络和KNN的短文本分类算法研究 [J], 殷亚博;杨文忠;杨慧婷;许超英
2.基于TextRank的KNN文本分类算法研究 [J], 景永霞; 苟和平; 孙为
3.基于KNN模型的藏文文本分类研究与实现 [J], 苏慧婧; 群诺; 贾宏云
4.基于改进ML-KNN算法的文本分类研究 [J], 邢娟韬; 白金牛
5.基于相对熵的KNN文本分类方法的研究 [J], 崔东虎;赵亚慧;崔荣一
因版权原因,仅展示原文概要,查看原文内容请购买。