基于SQLite的中文全文检索研究与实现

合集下载
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

基于SQLite的中文全文检索研究与实现

摘要:随着手机、平板电脑等移动智能设备的快速发展,曾经在PC 上运行的各种应用系统需要同时在移动智能设备上实现,从而带动了移动智能设备上的数据存储、数据检索等方面的需求。SQLite作为轻量的嵌入型数据库具有更好的实时性、系统开销小、底层控制能力强等优点。探讨并实现了使用SQLite作为数据存储方案并实现中文全文检索的原理与实现方案,为在移动智能设备上基于SQLite的中文信息检索应用探索了一条新途径。

关键词:中文全文检索;SQLite;MMSEG

纵向比较,LIKE检索的耗时增加百分比基本与记录数的增加百分比一致。MATCH检索的耗时增加百分比只有记录数增加百分比的一半左右;横向比较,在同等实验数据下,LIKE检索的耗时是MATCH 检索耗时的5~10倍以上。随着数据量的进一步增加,MATCH检索在耗时上的优势愈加明显。

4 结语

SQLite的小巧、快速与稳定的特点,使得其在需要数据库支持的嵌入式设备、手机软件、中小型CMS(Content Management System)站点等方面成为最佳的选择,同时此类应用中硬件设备的性能提升伴随着数据量的高速增长,因而研究基于SQLite的中文全文检索具有广阔的应用前景。

参考文献:

[1] 刘小春,柴育梅,张彦丽.SQLite嵌入式数据库的应用研究[J].情报学报,2006(10):419.

[2] SQLite database engine[EB/OL].http://.

[3] 张劲松,袁健.回溯正向匹配中文分词算法[J].计算机工程与应用,2009(22):133.

[4] CHIHHAO TSAI. A word identification system for mandarin chinese text based on two variants of the maximum matching algorithm[EB/OL].http:///mmseg.

相关文档
最新文档