基于Lucene的全文检索系统设计研究

合集下载
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

L u c e n e的 校 内 资 源 搜 索 引擎 系 统 进 行 了 设 计 与实现, 以期 为 此 类 研 究 与应 用 提供 有 益参 考 。
据,尽可能减少系统在磁盘操作上的消耗。此
外 ,在 I o c方 面 ,在 需 要 效 率 的 地 方 应 该 考 虑
参考文献
[ 1 ] 陈立. 全 丈检 素 i l 擎 的设 计 研 究 … . 现
通 过 比 对 线 程 数 的 效 率 , 测 试 结 果 显
示 查询速 度 快,但 也存 在一 一 定 的 问题 ,比如
L u c e n e 对 索 引 做 了 大 量 的 优 化 和 改 善 , 但 涉
功能实现上 ,应着 眼于效率 问题 。本文就基于
9 4 ・电子技 术与 软件 工程
E l e c t r o n i c T e c h n o l o g y &S o f t w a r e E n g i n e e r i n g
4 系 统 性 能测 试
4 . 1测 试 环 境 ( L )主 要 硬 件 环 境 :I n t e l P e n t i u m D 2 . 8 G
wi t h 2 Co r e s :2 G DDR 2
及 到磁 盘操 作 仍 是 整 个 系 统 最 慢 的环 节 , 因此 , 在运用 L u c e n e的 时 候 , 应 该 尽 可 能 的 首 先 将 索 引 写 到 内 存 中 , 然 后 再 写 到磁 盘 上 , 其 次 , 在 写 磁 盘 的 时 候 , 应 该 尽 可 能 一 次 性 写 大 量 数
不 需 要 太 多 效 率 的 地 方 应 该 考 虑 使 用 这 些 依 赖
注入框架。
[ 2 ] 朱 学昊 . 基于 L u c e n e 的站 内搜 索设 计 与
实现 [ J ] . 计算机应 用与软件 , 2 0 0 8 ( 1 O ) .
( 3 )测 试 工 具 :E c l i p s e T P T P与 Ne t B e a n s
Pr o il f e
作者单位
广 州 体 育 职 业 技 术 学 院 广 东省 广 州 I 市
5 1 0 6 5 0
ห้องสมุดไป่ตู้
4 . 2 测 试 结 果
5 结 束 语
在 系 统 设 计 中 , 框 架 的 选 择 只 有 选 择 最 合 适 的才 有 助 于 设 计 出来 的 系统 运 行 流 畅 。在
代情报 , 2 0 0 7 ( 1 0 ) .
( 2 ) 软件环境 : Wi n d o w s 2 0 0 3 R 2 E n t e r p r i s e
E d i t i o n SP 2: J DK 5 . 0
直接创建对象或者用反射的方式来获取实例。 增加模块的灵活性会降低系统的运行效率 。在
软件开发 ・ S o f t wa r e D e v e l o p me n t
C r a wl 模 块是 整 个 系 统 中 的核 心模 块 。 C r a wl 模 块 作 用 是 组 织 网络 爬 虫 , 获 取 网络 资
图 4 :C r a w l 工 作 流程 图
源 ,维持网络链接 ,统计信息作用 。
相关文档
最新文档