信息检索与利用期末复习
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
第一章
1、IP地址:网络协议地址,是分配给主机的一个32位地址,由4个字节组成。分为动态IP地址和静态IP地址两种。
动态IP地址指的是每次连线所取得的地址不同;
静态IP地址是指每次连线均为同样固定的地址。如目前教室的无线上网就是动态IP地址,每次所取得的地址不同。
2、IP地址的分类:
(1)A类地址第1字节为网络地址,其它3个字节为主机地址。网络地址的最高位必须是“0”
A类地址范围:1.0.0.1—126.255.255.254
私有地址和保留地址:
①10.X.X.X是私有地址(所谓的私有地址就是在互联网上不使用,而被用在局域网络中的地址)。
范围(10.0.0.0-10.255.255.255)
②127.X.X.X是保留地址,用做循环测试用的。
(2)B类地址第1字节和第2字节为网络地址,其它2个字节为主机地址。网络地址的最高位必须是“10”
B类地址范围:128.0.0.1—191.255.255.254。
B类地址的私有地址和保留地址
①172.16.0.0—172.31.255.255是私有地址
②169.254.X.X是保留地址。如果你的IP地址是自动获取IP地址,而你在网络上又没有找到
可用的DHCP(动态主机设置协议)服务器。就会得到其中一个IP。
(3)C类地址第1字节、第2字节和第3个字节为网络地址,第4个个字节为主机地址。另外第1个字节的前三位固定为110。
C类地址范围:192.0.0.1—223.255.255.254。
C类地址中的私有地址:192.168.X.X是私有地址。(192.168.0.0-192.168.255.255)
(4)D类地址不分网络地址和主机地址,它的第1个字节的前四位固定为1110。
D类地址范围:224.0.0.1—239.255.255.254
(5)E类地址也不分网络地址和主机地址,它的第1个字节的前五位固定为11110。
E类地址范围:240.0.0.1—255.255.255.254
3、DNS(域名服务系统):是一种基于分布式数据库的系统,采用客户/服务器模式完成主机名称与IP地址之间的转换。通过建立DNS数据库,记录主机名称与IP地址的对应关系。DNS驻留在服务器端,为客户端的主机提供IP地址解析服务。
4、网址:域名前加上传输协议信息及主机类型信息就构成了网址(URL),例如我校www主机的URL就是:
“http:// ”。
网址的组成:URL由三部分组成:协议类型,主机名和路径及文件名。
<协议:>//<主机名>:<端口号>/<文件路径>/<文件名>
5、服务器标识符(协议类型)
通过选择服务器标识符能够确定将要访问的服务器的类型,URL中的服务器标识符可以有:
HTTP:// 采用超文本传输协议连接
FTP:// 采用文件传输协议连接
GOPHER:// 与GOPHER服务器连接
TELNET:// TELNET会话连接
NEWS:// USENET新闻组相连接
6、域名后缀:
7、DNS域名结构:国家级顶级域名(地理模式)和通用顶级域名(组织模式)
8、网络信息资源:是指信息资源以电子数据的形式存放在非印刷型的介质中,并通过网络通信手段,在计
算机等终端上再现的信息的总和。
广义:是网络信息活动中所有要素的总和,包括与网络相关的信息内容、信息网络、信
息人才、信息系统、信息技术等资源。
狭义:是“数字化形式记录的、以多媒体形式表达的、存储在网络计算机磁介质、光介质以及各类通信介质上、并通过计算机网络通信方式进行传递的信息内容的集合。”
分类:信息内容的表现形式和内容划分可分为
按信息加工层次分:网络零次信息;网络一次信息;网络二次信息;网络三次信息;
按所采用的网络传输协议分为:WWW网络资源;FTP信息资源;TELNET信息资源;
用户服务组资源;Gopher:一种基于菜单的网络服务;
RSS信息资源:RSS是一种起源于网景的技术;
P2P应用:允许主机之间通过互联网直接进行相互通信。
网络信息资源的特点:复杂性;信息安全和信息质量的不均衡性;信息资源管理和利用的难度;
信息发布具有很大的自由性和任意性,质量良莠不齐;正式出版物和非正式信息
交流交织在一起;使用成本低;共享程度高;是信息资源的宝库。
网络信息资源的优点:价廉;新颖、深入;广泛、直接交流;非正式和自由发表园地
网络信息资源的评价与选择:
(1)评价网络信息资源的必要性
第一,网络上信息资源量的爆炸式增长,使得人们从中淘取有用信息的难度越来越大。
第二,因特网的松散、开放性等特点,决定了网络信息空间秩序混乱,网上信息良莠不齐、真伪混杂、整体质量水平下降,人们选择信息更加困难。
另外,在互联网上,信息不仅很容易被出版、传播,而且也极容易被篡改。
(2)网络信息资源的评价与选择主要是针对信息源:
内容因素(核心和重点):权威性、完备性、可靠性、原创性、新颖性、稳定性等
形式因素:美观性、条理性、查检性、帮助性、快捷性、低耗性等
定量的评价:Google的pagerank,星数评价等级
网络信息资源的评价方法:
(1)定性评价方法:根据评价标准和指标体系对网络信息资源进行评价的方法。
(2)定量评价方法:按照数量分析方法,利用网络自动搜集和整理网站信息的评估工具。
第二章
1、网络信息检索工具:当已经知道地址时直接通过地址访问。
当不知道地址的时候,需要借助检索工具,进行关键字检索
搜索引擎
网络资源指南(门户)
专门数据库
2、网络信息检索工具的组成:由自动索引程序、数据库和检索代理软件组成的。
3、网络信息检索工具的类型和特点:
(1)目录型检索工具:又被译为专题指南,或列表查询引擎,它实际上是人工建立的、结构化的因特网网址主题类目和子类目,按照字母、时间、地点、主题等顺序进行排列,使用户
通过浏览网络站点列表,检索有关信息。较为典型有Yahoo!、InfoMine等。
主要适用于:a.用户进行笼统或较笼统的主题浏览和检索。它允许用户从等级类目中任意选择检索范围,以对这些不同深度的主题类目进行浏览或检索;
b.当用户尚未形成很精确的检索概念时,采用主题指南作为检索起始点非常有效。
网络资源指南:是由人工采集网上信息,然后按照一定分类标准,比如学科类型、主题等,建立网站分类目录,并将筛选后的信息分门别类放入各类目中供用户进行浏览。
优点:1)信息组织的专题性较强,满足族性检索要求;
2)使用简单,只要选择相关类目,依照页面之间的超链接指引很快就能到达目
的信息,适于检索不熟悉的领域或建议不熟悉网络的用户使用.
缺点:1)人工采集信息的收录范围小,更新慢;
2)受主观因素影响,类目设置不够科学,缺少规范
主要有三种类型:1)学科信息门户GEM()
2)搜索引擎目录[目录索引]:新浪目录/
/(Phil Bradley's websiteMaking the net easier)
3)开放目录[ODP] /
中国艺术开放目录/
中国分类信息网/
(2)搜索引擎:也叫关键词检索工具,其实就是定期搜索因特网(以WWW为主)并收集新网页信息的计算机程序。每个搜索引擎都有自己独有的搜索系统和一个包容因特网资源站点的独