毕业设计软件使用说明书(WEB上基于内容的搜索引擎)

合集下载
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

WEB上基于内容的搜索引擎
软件使用说明书
系别名称:
专业班级:
学生姓名:
指导教师:
目录
第1章环境要求 (1)
1.1 数据库环境要求 (1)
1.1.1硬件要求 (1)
1.1.2软件要求 (1)
1.1.3Internet要求 (2)
1.1.4网络软件要求 (3)
1.2 Tomcat环境要求 (3)
1.3 JDK环境要求 (3)
第2章数据库安装及配置 (4)
2.1 数据库系统安装 (4)
2.1.1 系统安装 (4)
2.1.2 SP4安装 (4)
2.2 配置 (6)
2.2.1 系统管理员账号配置 (6)
2.2.2 信息系统数据库配置 (7)
第3章Java环境安装与配置 (8)
3.1 Java环境安装 (8)
3.2 Java环境配置 (8)
第4章WEB服务器(Tomcat)安装与配置 (10)
4.1 安装 (10)
4.2 配置 (10)
第5章系统使用说明 (11)
5.1 网页抓取 (11)
5.2 主界面 (12)
5.3 查询结果 (12)
第1章环境要求
1.1 数据库环境要求
本系统数据库采用Microsoft 公司大型关系数据库SQL Server 2000 企业版+SP4;WEB服务器采用Tomcat6.0,运行环境需要Sun Java JDK1.5以上。

1.1.1硬件要求
表1-1说明安装Microsoft SQL Server 2000 或SQL Server 客户端管理工具和库的硬件要求。

表1-1 硬件要求
硬件最低要求
计算机Intel® 或兼容机
Pentium 166 MHz 或更高。

内存(RAM)1企业版:至少64 MB,建议128 MB 或更多
硬盘空间数据库引擎要求有95 到270 MB 可用硬盘空间;典型安装要求有250 MB 可用空间。

Analysis Services 最小安装要求有50 MB 可用硬盘空间;典型安装要求有130 MB 可用空间。

English Query 要求有80 MB 可用硬盘空间。

监视器VGA 或更高分辨率SQL Server 图形工具要求800x600 或更高分辨率
指针设备Microsoft 鼠标或兼容的指针设备CD-ROM 驱动器需要
1.根据操作系统的要求,可能需要额外的内存。

2.实际的要求因系统配置和选择安装的应用程序和功能的不同而异。

1.1.2软件要求
表1-2 SQL Server 2000软件环境要求说明为使用Microsoft SQL Server 2000 企业版本或组件而必须安装的操作系统。

表1-2 SQL Server 2000软件环境要求SQL Server 2000 版本或组件操作系统要求
企业版Windows Server 2003,标准版1
Windows Server 2003,企业版1
Windows Server 2003,Datacenter 版1
Windows 2000 Server
Windows 2000 Advanced Server
Windows 2000 Datacenter Server
Microsoft Windows NT Server 4.0 Service Pack 5 Windows NT Server 4.0 SP5 或更高版本(企业版)
客户端工具支持Windows 953/98/Me
Windows NT Workstation 4.0
Windows 2000 Professional
Windows XP Professional
Windows XP Home Edition
Windows Server 2003,标准版1
Windows Server 2003,企业版1
Windows Server 2003,Datacenter 版1
UNIX、Apple Macintosh 和OS/2 客户端需要第三方厂商提供的开放式数据库连接(ODBC) 客户端软件。

仅连接Windows 95
Windows 98
Windows Me
Windows NT Workstation 4.0 Windows 2000(所有版本)Windows XP Professional
Windows XP Home Edition
Windows Server 2003,标准版1 Windows Server 2003,企业版1 Windows Server 2003,Datacenter 版1
1.Windows Server 2003 要求应用SQL Server 2000 Service Pack 3 或更高版本。

2.SQL Server 2000 个人版用于桌面和移动环境。

个人版未包含标准版的全部功能。

像联机分析处理(OLAP)、数据挖掘和其他数据仓库功能等Analysis Services 包括在个人版中,但这些功能不能在Windows 98 或Windows Me 上安装。

3.仅在客户端连接中支持;不包括图形工具支持。

1.1.3Internet要求
表1-3说明与使用Microsoft SQL Server 2000 相关的Internet 要求。

表1-3 SQL Server 2000 Internet环境要求组件要求
Internet 软件Microsoft SQL Server 2000 所有安装都需要Microsoft Internet Explorer 5.0。

Microsoft 管理控制台(MMC) 和HTML 帮助也需要Microsoft Internet Explorer 5.0。

最小安装已足够,而且Internet Explorer 不必是默认浏览器。

Internet Explorer 5.0 要求的例外情况:如果使用"仅连接"选项而且不连接到要求加密的服务器,则带Service Pack 2 的Microsoft Internet Explorer 4.01 就足够了。

1.1.4网络软件要求
Microsoft Windows XP、Windows 2000、Windows 98、Windows 95、Windows Me 和Windows NT 都具有内置网络软件。

只有在使用Banyan VINES 或AppleTalk ADSP 时,才需要其它网络软件。

Novel NetWare IPX/SPX 客户端支持由Windows 网络的NWLink 协议提供。

1.2 Tomcat环境要求
在本系统中,要求微软Windows操作系统、Sun JDK环境。

1.3 JDK环境要求
在本系统中,Microsoft Windows 操作系统。

第2章数据库安装及配置
本系统数据库采用Microsoft 公司大型关系数据库SQL Server 2000 企业版+SP4。

2.1 数据库系统安装
本章介绍Microsoft SQL Server 2000 中文企业版的安装与配置情况。

2.1.1 系统安装
在系统满足Microsoft SQL Server 2000 中文企业版的系统软件、硬件要求环境的基础上,可以实施安装。

将Microsoft SQL Server 2000 安装盘放入光驱如果没有自动安装请双击光盘根目录中的Autorun.exe 选择安装SQL Server 2000 组件。

如图2-1所示。

在图2-1中,选择“安装SQL Server 2000 组件”按照提示信息进行安装。

图2-1 SQL Server 2000第一个安装界面
安装过程结束后,还需要对数据库系统进行配置,并进行补丁的修补。

这些内容可以参见以后的各个章节说明。

2.1.2 SP4安装
由于Microsoft SQL Server 2000数据库管理系统推出时间较长,系统发现一些漏洞,为了保证系统数据库的安全,建议用户必须尽快进行补丁修补。

目前,微软提供的最新补丁为SP4。

下再地址为:
/downloads/details.aspx?FamilyID=8e2dfc8d-c20e-4446-99a9-b7 f0213f8bc5&DisplayLang=zh-cn。

下载后文件名为:SQL2000-KB884525-SP4-x86-CHS.EXE。

安装时,首先运行此文件,首先出现如图2-2所示画面。

在图2-2中,需要选择补丁文件的解压路径。

在选择好合适的解压路径后,按照提示要求,选取【下一步】,继续安装过程。

图2-2 选择文件解压路径
注:在SP4安装完成后,如图2-3所示。

要尽快重新启动计算机,使得所作的补丁生效。

图2-3 安装完毕
2.2 配置
在数据库系统安装全部完毕后,需要对数据库进行各种配置。

2.2.1 系统管理员账号配置
管理员账号是对数据库管理操作的最大权限用户,其安全性是极其重要的。

管理员账号的修改试用企业管理器。

在【开始】菜单上,选取【程序】、【Microsoft SQL Server】、【企业管理器】,如图2-4所示,启动企业管理器,出现如图2-5所示窗口。

在图2-5中,选择【SQL Server 组】-〉【数据库服务器】,打开当前数据库服务器。

接着,在如图2-5所示的窗口中选择【安全性】-〉【登录】。

图2-4 启动企业管理器
图2-5 选择服务器
在如图2-5所在窗口中,选择管理员用户【sa】,并单击鼠标右键,选择【属性】,出现如图2-6所示窗口输入新的密码,并【确定】,就更改了管理员的密码。

图2-6 密码修改
2.2.2 信息系统数据库配置
在系统交付使用时,提供的是一个完整的数据库,将这个数据库添加到实际使用环境中,需要在数据库服务器上利用企业管理器将这个数据库添加到数据库系统中。

添加信息系统数据库的方法是在如图2-5所示的画面中,选中【SQL Server 组】-〉【〈数据库服务名〉】,并单击鼠标右键,选中【所有任务】-〉【附加数据库】,出现如图2-7所示的窗口。

选择【】,选择数据库文件名“db_BlodMay_Data.MDF”,单击【确定】,之后,若系统正确的附加了数据库,完成数据库的配置。

若出现错误信息,可参见错误提示,进行改正,再附加此数据库。

图2-7 附加新数据库
第3章Java环境安装与配置
Java是Sun Software 公司提出的一种面向对象的程序设计语言,由于其具有跨平台的特点,得到了广泛的应用。

在本系统中,需要安装Sun Java 5版以上(设计环境为J2SE Development Kit 5.0 Update 5中文版,简称JDK5)。

此软件环境可以从Sun的Java网站免费下载。

3.1 Java环境安装
本系统介绍的为J2SE Development Kit 5.0 Update 7中文版安装过程。

安装程序名为:jdk-1_5_0_07-windows-i586-p.exe。

从文件名中可以看出,其适用于Windows操作系统。

双击如上安装程序,启动安装界面,如图3-1所示。

在稍后的时间后,会出现准备安装界面。

在准备安装界面后出现Sun公司对本软件的许可证协议窗口,在此界面中选择“我接受该协议许可协议中的条款”,并点击【下一步】按钮,开始自定义安装过程。

在安装过程中,按照提示信息进行相关的操作。

图3-1 JDK5 安装向导
在图3-1所示的安装过程完成后,选择【下一步】,出现jre安装窗口,可以选择自己jre路径,也可按照默认的路径进行安装。

Jre安装完毕,出现浏览器注册窗口,一般选择默认浏览器即可,直接选择【下一步】,继续安装。

接着出现复制文件窗口,安装文件复制完成后,提示安装完毕。

单击【完成】,则完成整个的Java安装。

3.2 Java环境配置
一般情况下(特别是新安装的操作系统)不需要对Java环境做出额外的设置,但有些情况下需要的环境变量进行设置。

为了稳妥起见,建议在安装JDK后,进行环境变量的配置。

JDK设置主要有三部分:JA V A_HOME、PATH、CLASSPATH。

设置方法为在桌面上选择“我的电脑”,单击鼠标右键,选择【属性】,出现系统属性设置的窗口。

在此窗口中,
选择“高级”页-〉【环境变量】,选择【系统变量】-〉【新建】,在图3-2中的变量名位置填入“JA V A_HOME”,变量值位置填入JA V A SDK 安装的路径。

采用同样的方法,在变量名位置输入“CLASS PATH”,变量值输入“.;%JA V A_HOME%\lib; %JA V A_HOME%\jre\lib;”如图3-3所示。

再选择【系统变量】-〉path-〉【编辑】,如图3-4所示,在变量值的最前面插入“%JA V A_HOME%\bin;”。

完成以上设置,则将JA V A的环境配置完成了,请选择【确定】按钮,保存此设置,返回到设置前的窗口状态。

图3-2 JA V A_HOME设置
图3-3 CLASSPATH设置
图3-4 PA TH设置
第4章WEB服务器(Tomcat)安装与配置
Tomcat软件是一个开源项目,可以从Tomcat网站免费下载。

本系统由于采用JDK及J2EE最新技术,需要5.5以上版本支持。

本系统在现场首次安装时,将采用Tomcat 6.0版本。

其可以从Apache网站下载。

下载时,需要注意的是选择Windows平台支持的相应包。

Tomcat软件包有两个安装版本,一个为安装程序型,一个为ZIP压缩文件型。

4.1 安装
在信息管理系统服务器中,对于压缩文件型Tomcat软件包,可以直接解压到某一个文件夹中,如“d:\tomcat60”中,若安装文件型,则执行相应的安装文件,并选择合适的路径安装。

注:信息管理系统在首次现场调试安装时默认的安装路径为“D:\apache-tomcat-6.0”。

如图4-1所示。

4.2 配置
在Tomcat系统安装完毕后,其对外提供的WEB服务端口默认为“8080”,为了系统中使用的方便性,将8080端口更改为80端口。

更改的方法为用文本编辑器打开如图4-1所示的server.xml文件,找到“<Connector port="8080"”,将8080改为80,更改后,存盘保存即可。

图4-1 Tomcat安装路径与配置
第5章系统使用说明
所有环境配置好以后,将光盘中的程序拷入到Tomcat下,如D:\apache-tomcat-6.0\ webapps下。

启动Tomcat服务器,D:\apache-tomcat-6.0\bin\startup.bat。

启动SQL server2000服务器。

5.1 网页抓取
网页抓取是通过系统后台管理来实现的。

网页抓取主要有三个方面:搜集新出现的网页;搜集上次出现有所改变的网页;发现上次发现现在不存在的网页,并从库中删除。

网页的抓取需要进入系统后台管理进行。

步骤如下。

⑴打开浏览器,在地址栏中输入“http://localhost:8080/luceneSearch/admin/index.jsp”,系统会进入登陆界面,在本系统中系统管理员的用户名为“admin”,密码为“111”,登陆后台管理界实现网页的抓取和和保存。

后台管理界面如图5-1所示。

图5-1 登录页面
⑵选择“导航菜单”下的爬虫配置,选择右边导航“爬虫管理”,填写相应信息。


“网页抓取种子”后输入所要抓取的网页地址,如“”,设置好网页保存的目录以及索引存放目录,其他默认。

按“抓取网页”按钮。

⑶如果中途想暂停抓取请点“暂停抓取”按钮即可。

⑷查看当前抓取的所有网页地址,请点击导航菜单中的“网址管理”下的“查看网址”选线即可。

5.2 主界面
完成网页抓取和保存的工作后,就可以进入搜索界面进行搜索了。

进入搜索界面请打开浏览器,在地址栏中输入“http://localhost:8080/luceneSearch/ index.jsp”。

前台搜索结果提供类似百度和Google的效果,实现了网页内容摘要、关键字的高亮显示、网页的URL信息、分页、以及网页的简单快照等功能。

输入关键字,点击“搜索一下”按钮即可进行查询。

搜索界面如图5-2所示。

图5-2 搜索界面
5.3 查询结果
当用户输入查询关键字以后,查询结果变会返回给用户。

查询结果显示了分页、网页快照、URL导航、内容摘要、中文分词,以及相关搜索等。

查询结果界面如图5-3所示。

图5-14后台企业页面。

相关文档
最新文档