蜘蛛功能说明

  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

军长蜘蛛搜索系统使用说明

产品名:军长搜索—蜘蛛系统

开发语言: 2.0

运行平台:Microsoft winXP,win2000,win2003,Vista, win2008

运行环境:Microsoft .NET Framework v2.0或Microsoft .NET Framework v3.5

推荐环境: win2003(更新补丁)+.NET Framework v2.0

1、产品简介 (1)

2、产品安装 (1)

3、系统面板介绍 (1)

3、功能说明 (2)

4、操作说明 (4)

一,产品简介

军长搜索是一款基于Microsoft .NET 2.0 开发的垂直搜索引擎。系统有着强大的文件和数据库引索能力,支持中英文分词,文件相似度分析排序,文件数据时实监控与更新,恐龙级的引索速度和毫秒级的搜索速度,搜索结果高亮显示,系统分两部分组成第一部分是C/s的搜索蜘蛛,第二部分是B/s的WEB用户搜索显示界面,其整个系统的工作过程完全模仿了超级搜索引擎的工作原理。系统支持对站内和全网的引索。

产品适用范围:

行业垂直搜索引擎、大型新闻门户网站站内搜索、大型行业门户网站站内搜索、校园网搜索、企业网搜索、企业内部文件搜索。

二,产品安装

准备windows系列操作系统(推荐win2003版操作系统),下载安装Framework v2.0(已安装用户无需重复安装)。

解压蜘蛛程序压缩包,本软为绿色软件无须安装,解压后请直接打开运行JZbaidu.EXE。

三、系统面板介绍

四、功能说明

1,菜单---系统---隐藏到托盘

该功能主要作用:将软件最小化到托盘运行。

2,菜单---系统---退出

该功能主要作用:退出系统,点击后先执行清理线程和任务,然后退出。

3,菜单---系统设置—数据类型

该功能主要作用:设置可识别数据的MIME类型。可以自定义修改。一般情况下无须改动。

4,菜单---系统设置—输出目录

该功能主要作用:后期图片,网页快照或其它文件引擎须下载文件时预留功能。目前该功能暂时没有用到。

5,菜单---系统设置—连接设置

该功能主要作用:设置蜘蛛线程、线程、工作时间、全局采集等相关参数。

该面板的设置对蜘蛛有重大影响。

6,菜单---系统设置—排除相关

该功能主要作用:对于全网抓智能抓取时,可以除排相关后缀的域名。

(如:.org:.gov多个域名格式之间用分号隔开)。

7,菜单---系统设置—风格皮肤

该功能主要作用:美化软件,提供了七种不同风格的软件皮肤,可根据喜好自由设定。

8,快捷菜单---清空日志

该功能主要作用:清理采集时的错误日志,合理应用可以优化软件内存占用。

9,快捷菜单---系统设置

该功能主要作用:同菜单项系统设置。

10,快捷菜单---分类管理

该功能主要作用:数据源分类设置,默认分类:本地搜索、站内搜索、全网搜索。可根据应用行业自由设定。

11,快捷菜单---规则管理

该功能主要作用:设置要抓取的数据源。支持多网址批时导入。

12,快捷菜单---多引擎合并

该功能主要作用:当多个蜘蛛或机器同时工作时,最后可以将多个引索文件合并成打包成一个文件提供搜索使用。

13:指定引索保存目录

功能位置,该功能主要作用:根据需求将抓取引索文件存放指向本机任意合适磁盘位置。

14:定时任务

功能位置,该功能主要作用:自由周期性的设定采集任务。启用监控后到达您指定的时间,蜘蛛会重新对所有设定网站进行二次抓取。并自动跳转任务周期到下一个时间。

15:报告

功能位置,该功能主要作用:当用户采集所有

网站时,该功能详细记录已引索的网站记录,在群采所有网址时可以设定从第几个开始引索。

16:规则管理—批量网址导入

该功能主要作用:可以批量导入多个网址,可以设网址预先写入本地txt文档,网址格式采用(网易)。每一行网站名和网址用空格符分开,第二个网址另起一行。建议一次只导入1-3000个网址。

相关文档
最新文档