简述向量空间模型的优缺点
合集下载
相关主题
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
简述向量空间模型的优缺点:
优点在于:
(1)该模型的权重计算方法能够提高系统的检索性能;
(2)模型中使用的部分匹配方法能检索出与用户的查询输入条件“近似”的文档;
(3)在模型中可以根据检索出的结果与查询条件的相关程度对结果进行排序。另外,向量空间模型计算简单,检索速度快。
缺点在于:
维度独立性:向量空间模型假设词与词是相互独立的,但实际应用中,很多词汇语义上都是相互关联的(所以事实上这也就是无法解决一词多义、同义词的问题)。
内容层次浅:向量空间模型不考虑词的顺序,这种方法也叫词袋法,就是把所有词一股脑都放在一个袋子里,但事实上不考虑词的顺序,词汇集合能够提供有价值的信息非常有限。
向量维度高:向量空间模型中,维度和我们所建立的词表的规模一致。也就是说,有多少个词,就有多少个维度。现实应用中,通常词表的规模非常大,所以模型的维度非常高,但有些词的价值根本不大,这就浪费了巨大的计算空间和时间。