蜘蛛功能说明
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
军长蜘蛛搜索系统使用说明
产品名:军长搜索—蜘蛛系统
开发语言: 2.0
运行平台:Microsoft winXP,win2000,win2003,Vista, win2008
运行环境:Microsoft .NET Framework v2.0或Microsoft .NET Framework v3.5
推荐环境: win2003(更新补丁)+.NET Framework v2.0
1、产品简介 (1)
2、产品安装 (1)
3、系统面板介绍 (1)
3、功能说明 (2)
4、操作说明 (4)
一,产品简介
军长搜索是一款基于Microsoft .NET 2.0 开发的垂直搜索引擎。系统有着强大的文件和数据库引索能力,支持中英文分词,文件相似度分析排序,文件数据时实监控与更新,恐龙级的引索速度和毫秒级的搜索速度,搜索结果高亮显示,系统分两部分组成第一部分是C/s的搜索蜘蛛,第二部分是B/s的WEB用户搜索显示界面,其整个系统的工作过程完全模仿了超级搜索引擎的工作原理。系统支持对站内和全网的引索。
产品适用范围:
行业垂直搜索引擎、大型新闻门户网站站内搜索、大型行业门户网站站内搜索、校园网搜索、企业网搜索、企业内部文件搜索。
二,产品安装
准备windows系列操作系统(推荐win2003版操作系统),下载安装Framework v2.0(已安装用户无需重复安装)。
解压蜘蛛程序压缩包,本软为绿色软件无须安装,解压后请直接打开运行JZbaidu.EXE。
三、系统面板介绍
四、功能说明
1,菜单---系统---隐藏到托盘
该功能主要作用:将软件最小化到托盘运行。
2,菜单---系统---退出
该功能主要作用:退出系统,点击后先执行清理线程和任务,然后退出。
3,菜单---系统设置—数据类型
该功能主要作用:设置可识别数据的MIME类型。可以自定义修改。一般情况下无须改动。
4,菜单---系统设置—输出目录
该功能主要作用:后期图片,网页快照或其它文件引擎须下载文件时预留功能。目前该功能暂时没有用到。
5,菜单---系统设置—连接设置
该功能主要作用:设置蜘蛛线程、线程、工作时间、全局采集等相关参数。
该面板的设置对蜘蛛有重大影响。
6,菜单---系统设置—排除相关
该功能主要作用:对于全网抓智能抓取时,可以除排相关后缀的域名。
(如:.org:.gov多个域名格式之间用分号隔开)。
7,菜单---系统设置—风格皮肤
该功能主要作用:美化软件,提供了七种不同风格的软件皮肤,可根据喜好自由设定。
8,快捷菜单---清空日志
该功能主要作用:清理采集时的错误日志,合理应用可以优化软件内存占用。
9,快捷菜单---系统设置
该功能主要作用:同菜单项系统设置。
10,快捷菜单---分类管理
该功能主要作用:数据源分类设置,默认分类:本地搜索、站内搜索、全网搜索。可根据应用行业自由设定。
11,快捷菜单---规则管理
该功能主要作用:设置要抓取的数据源。支持多网址批时导入。
12,快捷菜单---多引擎合并
该功能主要作用:当多个蜘蛛或机器同时工作时,最后可以将多个引索文件合并成打包成一个文件提供搜索使用。
13:指定引索保存目录
功能位置,该功能主要作用:根据需求将抓取引索文件存放指向本机任意合适磁盘位置。
14:定时任务
功能位置,该功能主要作用:自由周期性的设定采集任务。启用监控后到达您指定的时间,蜘蛛会重新对所有设定网站进行二次抓取。并自动跳转任务周期到下一个时间。
15:报告
功能位置,该功能主要作用:当用户采集所有
网站时,该功能详细记录已引索的网站记录,在群采所有网址时可以设定从第几个开始引索。
16:规则管理—批量网址导入
该功能主要作用:可以批量导入多个网址,可以设网址预先写入本地txt文档,网址格式采用(网易)。每一行网站名和网址用空格符分开,第二个网址另起一行。建议一次只导入1-3000个网址。