信息组织学第1章信息组织工作的背景和意义.ppt
合集下载
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
用户输入关键词进行检索,搜索引擎从索引数据 库中找到匹配该关键词的网页;为了用户便于判断,除 了网页标题和URL外,还会提供一段来自网页的摘要以 及其他信息。
1.2.1 信息组织实施的必要性(续)
③不断变化的信息检索环境需要信息组织工作与之相适应 搜索引擎工作原理 ⑶提供检索服务功能实现 检索器:其功能是根据用户的查询在索引库中快 速检索文档,进行相关度评价,对将要输出的结果排序, 并能按用户的查询需求合理反馈信息;
搜索器( “蜘蛛” ): 其功能是在互联网中漫游,发现和搜集信息。
1.2.1 信息组织实施的必要性(续)
③不断变化的信息检索环境需要信息组织工作与之相适应 搜索引擎工作原理 ⑵处理网页
搜索引擎抓到网页后,还要做大量的预处理工作, 才能提供检索服务。其中,最重要的就是提取关键词, 建立索引文件。其他还包括去除重复网页、分析超链接、 计算网页的重要度。
用户接口:其作用是接纳用户查询、显示查询结 果、提供个性化查询项。
1.2.1 信息组织实施的必要性(续)
1.2.1 信息组织实施的必要性(续)
②日益显著的差异化信息需求需要实施信息组织 文献信息需求:文献收藏处,相关文献出处,原文
信息 ,涉及某一主题,学科,著者,文种,年代。 数据信息需求:数值或图表数据 事实信息需求:文献中抽取的事项
1.2.1 信息组织实施的必要性(续)
②日益显著的差异化信息需求需要实施信息组织
Veronica不是一个独立的程序,没有专门的Veronica客户程 序,她附属于Gopher,与Gopher客户程序一起工作。
1.2.1 信息组织实施的必要性(续)
③不断变化的信息检索环境需要信息组织工作与之相适应
WAIS (Wide Area Information System 1993) 在多个服务器上创建专用主题数据库,该系统可以通过服务
1.1.1 信息社会的到来(续)
① 当今社会已是信息社会
信息社会与传统的农业社会和工业社会有显著的不同: ⑴ 农业社会
依靠原始的劳动力并从自然界获取初级资源,土地 资源成为当时最重要的资源,劳动为财富之父,土地为 财富之母。
以手工编撰书目的信息组织形式为主流 一书目录,群书目录,国家书目,联合目录 以数序,音韵,类名,语词为排列方式的类书
器目录对各个服务器进行跟踪,并且允许用户通过WAIS客户端 程序对信息进行查找。WAIS用户可以获得一系列的分布式数据 库,当用户输入一个对某一个数据库进行查询的信息时,客户端 就会访问所有与该数据库相关的服务器。访问的结果提供给用户 的是满足要求的所有文本的描述,此时用户就可以根据这些信息 得到整个文本文件了。
1.1.1 信息社会的到来(续)
① 当今社会已是信息社会
⑴ 农业社会 以个人或统治集团个体劳动为主
未形成长期固定的专门机构
着眼于文献的收藏管理
并非着眼于文献检索和利用
主要对象是图书和档案文献 多采用分门别类的方法
辩章学术,考镜源流
1.1.1 信息社会的到来(续)
① 当今社会已是信息社会
⑴综合化:内容与形式 ⑵社会化:社会生活 ⑶网络化:在网上能共享 ⑷高效化:节约时间成本
1.2.1 信息组织实施的必要性(续)
②日益显著的差异化信息需求需要实施信息组织
用户上网最主要的目的:
-获取信息: 39.1%
-学习: 8.4%
-学术研究: 0.4%
-休闲娱乐: 35.7%
-情感需要: 1.1%
1.2.1 信息组织实施的必要性(续)
③不断变化的信息检索环境需要信息组织工作与之相适 应 搜索引擎工作原理 ⑴自动信息搜集---抓取网页 每个独立的搜索引擎都有自己的网页抓取程序 (spider)。Spider顺着网页中的超链接,连续地抓取 网页。由于互联网中超链接的应用很普遍,理论上,从 一定范围的网页出发,就能搜集到绝大多数的网页。
⑵ 工业社会
工业社会是围绕生产和机器这个轴心并为制造商品 而组织起来的,金融资源成为最重要的资源。
文献管理机构普遍开展了文献信息活动 信息组织技术与方法逐步完善
索引﹑文摘出现
1.1.1 信息社会的到来(续)
① 当今社会已是信息社会
⑵ 工业社会
机械化和半机械化信息组织手段发展
出现穿孔卡片和缩微胶片存取系统
1.2.1 信息组织实施的必要性
① 信息的激增和泛滥需要实施信息组织
科学文献增长与时间成指数函数关系 随着上网人数的增长,网上资源将呈几何级数的增长。 创造信息的能力已经远远超过寻找,组织和报道能力。 信息污染严重:垃圾信息,虚假信息,有害信息。 信息筛选成本日益增大,用户时间成本大于信息服务价值。
索工具Archie的影响,开发了一个类似Archie的Gopher工具,这 就是Veronica。她是Gopher系统中不可缺少的重要组成部分。 Veronica服务器定期与每个已知的Gopher服务器联系,请求所有 菜单的复本,并把这些菜单存于一数据库中,这样用户只要输入 检索词,Veronica程序在该库中满足条件的菜单项即检索结果以 Gopher菜单的形式显示。
第一章 信息组织工作的背景和意义
1.1 信息社会中信息的作用
1.1.1 信息社会的到来
● ① 当今社会已是信息社会
1963年,日本的社会学家Tadao mesao(梅棹忠夫) 在
Hoso Asahi(《朝日放送》)杂志上发表的《论信息产业》中,提 出了“信息社会”和“信息产业”的概念。
1980年,美国未来学家阿尔温·托夫勒《第三次浪潮》 。
1.2.1 信息组织实施的必要性(续)
③不断变化的信息检索环境需要信息组织工作与之相适 应
Archie (1990年,加拿大麦吉尔大学University of McGill) 定期搜集并分析FTP服务器上的文件名信息,提供
查找分别在各个FTP主机中的文件。用户必须输入精确 的文件名进行搜索,Archie告诉用户哪个FTP服务器能 下载该文件。
1.2.1 信息组织实施的必要性(续)
③不断变化的信息检索环境需要信息组织工作与之相适 应 搜索引擎工作原理 ⑴自动信息搜集
定期搜索:即每隔一段时间(比如Google一般是28 天),搜索引擎主动派出“蜘蛛”程序,对一定IP地址 范围内的互联网站进行检索,一旦发现新的网站,它会 自动提取网站的信息和网址加入自己的数据库。
1.2.1 信息组织实施的必要性(续)
③不断变化的信息检索环境需要信息组织工作与之相适应 搜索引擎工作原理 ⑴自动信息搜集 提交网站搜索:即网站拥有者主动向搜索引擎提交网址,它 在一定时间内(2天到数月不等)定向向你的网站派出“蜘蛛” 程序,扫描你的网站并将有关信息存入数据库,以备用户查询。
1.2.1 信息组织实施的必要性(续)
③不断变化的信息检索环境需要信息组织工作与之相适应
Gopher (1991年,Minnssota U ) 基于菜单驱动的Internet信息查询工具 ,Gopher的菜单项可
以是一个文件或一个目录,分别标以相应的标记。是目录则可以 继续跟踪进入下一级菜单;是文件则可 以用多种方式获取,如 邮寄、存储、打印等。
1.2.1 信息组织实施的必要性(续)
③不断变化的信息检索环境需要信息组织工作与之相适 应 搜索引擎(search engine)是指根据一定的策略、运 用特定的计算机程序搜集互联网上的信息,在对信息进 行组织和处理后,为用户提供检索服务的系统。
互联网发展早期,以雅虎为代表的网站分类目录查 询非常流行。网站分类目录由人工整理维护,精选互联 网上的优秀网站,并简要描述,分类放置到不同目录下。 用户查询时,通过一层层的点击来查找自己想找的网站。
信息组织对象从载体单元逐渐转向知识单元 主题揭示与分类组织相辅相成 “用户中心论”在信息组织过程中得到认同与贯彻 信息组织各类产品的生产与开发成为独立职业
1.1.1 信息社会的到来(续)
① 当今社会已是信息社会
⑶信息社会
信息社会(或者说后工业社会、知识社会)则是围绕 着知识组织起来的,其目的在于进行社会管理和指导革 新与变革,这反过来又产生新的社会关系和新的结构。 知识成为获取财富、权力和地位的重要手段。
-交友: 6.2%
-获得各种免费资源
(如免费邮箱、个人主页空间、各种免费资源下载等): 2.5%
-对外通讯、联络(如收发邮件、短信息、传真等): 1.7%
-网上金融(如炒股 、网上支付等): 1.2%
-网上购物: 0.1%
-商务活动: 0.3%
-追崇时尚、赶时髦、好奇: 0.2%
由于近年来搜索引擎索引规则发生了很大变化,主动提交网 址并不保证你的网站能进入搜索引擎数据库,因此目前最好的办 法是多获得一些外部链接,让搜索引擎有更多机会找到你并自动 将你的网站收录。
1.2.1 信息组织实施的必要性(续)
③不断变化的信息检索环境需要信息组织工作与之相适 应 搜索引擎工作原理 ⑴自动信息搜集功能实现
1.1.1 信息社会的到来(续)
②信息化和全球化是信息社会的两大特征 信息化的过程是一个渐变的过程。
“信息产业化”Hale Waihona Puke “产业信息化”→“国民经济信息 化”
1.2 信息组织实施的必要性和可能性
信息社会是建立在知识的生产、消费、使用上的 社会。然而,信息的开发、使用离不开信息组织活动。
只有从大量的信息(如文献、资料、记录、数据)中 抽取有价值的信息,并按照某种标准组织起来,才能为 信息社会提供源源不断的生产资源。 信息组织是通过一定的工具和技术将无序的信息 组织成一个有序系统的方法。信息组织活动是随着信息 数量规模的增长和信息检索需求的变化而不断产生和发 展的。
信息组织活动产业化趋势日趋明显
数据库产品逐步应用于企业,政府机构,金融机构;大型联 机存取系统投入运营
信息组织标准化进一步深化
信息组织的手段与方式对现代信息技术依赖性加强
1.1.1 信息社会的到来(续)
②信息化和全球化是信息社会的两大特征 信息社会的特征:
(1)信息社会是人类社会发展的一个新阶段 (2)信息科技的高度发达和高度普及 (3)产业结构的巨大变化 (4)信息和知识成为财富和力量 (5)人类生活质量不断提高,社会可持续发展 (6)信息化和全球化是信息社会的两大鲜明特征
在一级一级的菜单指引下,用户通过选取自己感兴趣的信息资源, 对Internet网上远程联机信息系统进行实时访问,这对于不熟悉 网络资源、网络地址和网络查询命令的用户是十分方便的。
1.2.1 信息组织实施的必要性(续)
■③不断变化的信息检索环境需要信息组织工作与之相适应
Veronica Nevada大学的Steven Foster和Fred Barrie受到FTP文件搜
以现代信息技术为工具,以自动化信息存取系统建 设为主要特征,信息组织的目标从微观文献整序扩展到 宏观社会信息流控制。
1.1.1 信息社会的到来(续)
① 当今社会已是信息社会
⑶信息社会
信息组织活动逐步社会化
集中编目:由一个全国中心机构负责统一编制书目记录,以 便为多个文献情报单位提供书目信息。
-其它: 3.1%
1.2.1 信息组织实施的必要性(续)
③不断变化的信息检索环境需要信息组织工作与之相适 应 手工检索:目录,题录,索引 机械检索: 穿孔卡片 联机检索: 联机系统 网络检索: 搜索引擎
1.2.1 信息组织实施的必要性(续)
③不断变化的信息检索环境需要信息组织工作与之相适 应 数据检索机制: 检索型 目录型 混合型
1.2.1 信息组织实施的必要性(续)
③不断变化的信息检索环境需要信息组织工作与之相适应 搜索引擎工作原理 ⑵处理网页功能实现
索引器: 其功能是理解搜索器所搜索到的信息,从中抽取
出索引项,用于表示文档以及生成文档库的索引表。
1.2.1 信息组织实施的必要性(续)
③不断变化的信息检索环境需要信息组织工作与之相适应 搜索引擎工作原理 ⑶提供检索服务
1.2.1 信息组织实施的必要性(续)
③不断变化的信息检索环境需要信息组织工作与之相适应 搜索引擎工作原理 ⑶提供检索服务功能实现 检索器:其功能是根据用户的查询在索引库中快 速检索文档,进行相关度评价,对将要输出的结果排序, 并能按用户的查询需求合理反馈信息;
搜索器( “蜘蛛” ): 其功能是在互联网中漫游,发现和搜集信息。
1.2.1 信息组织实施的必要性(续)
③不断变化的信息检索环境需要信息组织工作与之相适应 搜索引擎工作原理 ⑵处理网页
搜索引擎抓到网页后,还要做大量的预处理工作, 才能提供检索服务。其中,最重要的就是提取关键词, 建立索引文件。其他还包括去除重复网页、分析超链接、 计算网页的重要度。
用户接口:其作用是接纳用户查询、显示查询结 果、提供个性化查询项。
1.2.1 信息组织实施的必要性(续)
1.2.1 信息组织实施的必要性(续)
②日益显著的差异化信息需求需要实施信息组织 文献信息需求:文献收藏处,相关文献出处,原文
信息 ,涉及某一主题,学科,著者,文种,年代。 数据信息需求:数值或图表数据 事实信息需求:文献中抽取的事项
1.2.1 信息组织实施的必要性(续)
②日益显著的差异化信息需求需要实施信息组织
Veronica不是一个独立的程序,没有专门的Veronica客户程 序,她附属于Gopher,与Gopher客户程序一起工作。
1.2.1 信息组织实施的必要性(续)
③不断变化的信息检索环境需要信息组织工作与之相适应
WAIS (Wide Area Information System 1993) 在多个服务器上创建专用主题数据库,该系统可以通过服务
1.1.1 信息社会的到来(续)
① 当今社会已是信息社会
信息社会与传统的农业社会和工业社会有显著的不同: ⑴ 农业社会
依靠原始的劳动力并从自然界获取初级资源,土地 资源成为当时最重要的资源,劳动为财富之父,土地为 财富之母。
以手工编撰书目的信息组织形式为主流 一书目录,群书目录,国家书目,联合目录 以数序,音韵,类名,语词为排列方式的类书
器目录对各个服务器进行跟踪,并且允许用户通过WAIS客户端 程序对信息进行查找。WAIS用户可以获得一系列的分布式数据 库,当用户输入一个对某一个数据库进行查询的信息时,客户端 就会访问所有与该数据库相关的服务器。访问的结果提供给用户 的是满足要求的所有文本的描述,此时用户就可以根据这些信息 得到整个文本文件了。
1.1.1 信息社会的到来(续)
① 当今社会已是信息社会
⑴ 农业社会 以个人或统治集团个体劳动为主
未形成长期固定的专门机构
着眼于文献的收藏管理
并非着眼于文献检索和利用
主要对象是图书和档案文献 多采用分门别类的方法
辩章学术,考镜源流
1.1.1 信息社会的到来(续)
① 当今社会已是信息社会
⑴综合化:内容与形式 ⑵社会化:社会生活 ⑶网络化:在网上能共享 ⑷高效化:节约时间成本
1.2.1 信息组织实施的必要性(续)
②日益显著的差异化信息需求需要实施信息组织
用户上网最主要的目的:
-获取信息: 39.1%
-学习: 8.4%
-学术研究: 0.4%
-休闲娱乐: 35.7%
-情感需要: 1.1%
1.2.1 信息组织实施的必要性(续)
③不断变化的信息检索环境需要信息组织工作与之相适 应 搜索引擎工作原理 ⑴自动信息搜集---抓取网页 每个独立的搜索引擎都有自己的网页抓取程序 (spider)。Spider顺着网页中的超链接,连续地抓取 网页。由于互联网中超链接的应用很普遍,理论上,从 一定范围的网页出发,就能搜集到绝大多数的网页。
⑵ 工业社会
工业社会是围绕生产和机器这个轴心并为制造商品 而组织起来的,金融资源成为最重要的资源。
文献管理机构普遍开展了文献信息活动 信息组织技术与方法逐步完善
索引﹑文摘出现
1.1.1 信息社会的到来(续)
① 当今社会已是信息社会
⑵ 工业社会
机械化和半机械化信息组织手段发展
出现穿孔卡片和缩微胶片存取系统
1.2.1 信息组织实施的必要性
① 信息的激增和泛滥需要实施信息组织
科学文献增长与时间成指数函数关系 随着上网人数的增长,网上资源将呈几何级数的增长。 创造信息的能力已经远远超过寻找,组织和报道能力。 信息污染严重:垃圾信息,虚假信息,有害信息。 信息筛选成本日益增大,用户时间成本大于信息服务价值。
索工具Archie的影响,开发了一个类似Archie的Gopher工具,这 就是Veronica。她是Gopher系统中不可缺少的重要组成部分。 Veronica服务器定期与每个已知的Gopher服务器联系,请求所有 菜单的复本,并把这些菜单存于一数据库中,这样用户只要输入 检索词,Veronica程序在该库中满足条件的菜单项即检索结果以 Gopher菜单的形式显示。
第一章 信息组织工作的背景和意义
1.1 信息社会中信息的作用
1.1.1 信息社会的到来
● ① 当今社会已是信息社会
1963年,日本的社会学家Tadao mesao(梅棹忠夫) 在
Hoso Asahi(《朝日放送》)杂志上发表的《论信息产业》中,提 出了“信息社会”和“信息产业”的概念。
1980年,美国未来学家阿尔温·托夫勒《第三次浪潮》 。
1.2.1 信息组织实施的必要性(续)
③不断变化的信息检索环境需要信息组织工作与之相适 应
Archie (1990年,加拿大麦吉尔大学University of McGill) 定期搜集并分析FTP服务器上的文件名信息,提供
查找分别在各个FTP主机中的文件。用户必须输入精确 的文件名进行搜索,Archie告诉用户哪个FTP服务器能 下载该文件。
1.2.1 信息组织实施的必要性(续)
③不断变化的信息检索环境需要信息组织工作与之相适 应 搜索引擎工作原理 ⑴自动信息搜集
定期搜索:即每隔一段时间(比如Google一般是28 天),搜索引擎主动派出“蜘蛛”程序,对一定IP地址 范围内的互联网站进行检索,一旦发现新的网站,它会 自动提取网站的信息和网址加入自己的数据库。
1.2.1 信息组织实施的必要性(续)
③不断变化的信息检索环境需要信息组织工作与之相适应 搜索引擎工作原理 ⑴自动信息搜集 提交网站搜索:即网站拥有者主动向搜索引擎提交网址,它 在一定时间内(2天到数月不等)定向向你的网站派出“蜘蛛” 程序,扫描你的网站并将有关信息存入数据库,以备用户查询。
1.2.1 信息组织实施的必要性(续)
③不断变化的信息检索环境需要信息组织工作与之相适应
Gopher (1991年,Minnssota U ) 基于菜单驱动的Internet信息查询工具 ,Gopher的菜单项可
以是一个文件或一个目录,分别标以相应的标记。是目录则可以 继续跟踪进入下一级菜单;是文件则可 以用多种方式获取,如 邮寄、存储、打印等。
1.2.1 信息组织实施的必要性(续)
③不断变化的信息检索环境需要信息组织工作与之相适 应 搜索引擎(search engine)是指根据一定的策略、运 用特定的计算机程序搜集互联网上的信息,在对信息进 行组织和处理后,为用户提供检索服务的系统。
互联网发展早期,以雅虎为代表的网站分类目录查 询非常流行。网站分类目录由人工整理维护,精选互联 网上的优秀网站,并简要描述,分类放置到不同目录下。 用户查询时,通过一层层的点击来查找自己想找的网站。
信息组织对象从载体单元逐渐转向知识单元 主题揭示与分类组织相辅相成 “用户中心论”在信息组织过程中得到认同与贯彻 信息组织各类产品的生产与开发成为独立职业
1.1.1 信息社会的到来(续)
① 当今社会已是信息社会
⑶信息社会
信息社会(或者说后工业社会、知识社会)则是围绕 着知识组织起来的,其目的在于进行社会管理和指导革 新与变革,这反过来又产生新的社会关系和新的结构。 知识成为获取财富、权力和地位的重要手段。
-交友: 6.2%
-获得各种免费资源
(如免费邮箱、个人主页空间、各种免费资源下载等): 2.5%
-对外通讯、联络(如收发邮件、短信息、传真等): 1.7%
-网上金融(如炒股 、网上支付等): 1.2%
-网上购物: 0.1%
-商务活动: 0.3%
-追崇时尚、赶时髦、好奇: 0.2%
由于近年来搜索引擎索引规则发生了很大变化,主动提交网 址并不保证你的网站能进入搜索引擎数据库,因此目前最好的办 法是多获得一些外部链接,让搜索引擎有更多机会找到你并自动 将你的网站收录。
1.2.1 信息组织实施的必要性(续)
③不断变化的信息检索环境需要信息组织工作与之相适 应 搜索引擎工作原理 ⑴自动信息搜集功能实现
1.1.1 信息社会的到来(续)
②信息化和全球化是信息社会的两大特征 信息化的过程是一个渐变的过程。
“信息产业化”Hale Waihona Puke “产业信息化”→“国民经济信息 化”
1.2 信息组织实施的必要性和可能性
信息社会是建立在知识的生产、消费、使用上的 社会。然而,信息的开发、使用离不开信息组织活动。
只有从大量的信息(如文献、资料、记录、数据)中 抽取有价值的信息,并按照某种标准组织起来,才能为 信息社会提供源源不断的生产资源。 信息组织是通过一定的工具和技术将无序的信息 组织成一个有序系统的方法。信息组织活动是随着信息 数量规模的增长和信息检索需求的变化而不断产生和发 展的。
信息组织活动产业化趋势日趋明显
数据库产品逐步应用于企业,政府机构,金融机构;大型联 机存取系统投入运营
信息组织标准化进一步深化
信息组织的手段与方式对现代信息技术依赖性加强
1.1.1 信息社会的到来(续)
②信息化和全球化是信息社会的两大特征 信息社会的特征:
(1)信息社会是人类社会发展的一个新阶段 (2)信息科技的高度发达和高度普及 (3)产业结构的巨大变化 (4)信息和知识成为财富和力量 (5)人类生活质量不断提高,社会可持续发展 (6)信息化和全球化是信息社会的两大鲜明特征
在一级一级的菜单指引下,用户通过选取自己感兴趣的信息资源, 对Internet网上远程联机信息系统进行实时访问,这对于不熟悉 网络资源、网络地址和网络查询命令的用户是十分方便的。
1.2.1 信息组织实施的必要性(续)
■③不断变化的信息检索环境需要信息组织工作与之相适应
Veronica Nevada大学的Steven Foster和Fred Barrie受到FTP文件搜
以现代信息技术为工具,以自动化信息存取系统建 设为主要特征,信息组织的目标从微观文献整序扩展到 宏观社会信息流控制。
1.1.1 信息社会的到来(续)
① 当今社会已是信息社会
⑶信息社会
信息组织活动逐步社会化
集中编目:由一个全国中心机构负责统一编制书目记录,以 便为多个文献情报单位提供书目信息。
-其它: 3.1%
1.2.1 信息组织实施的必要性(续)
③不断变化的信息检索环境需要信息组织工作与之相适 应 手工检索:目录,题录,索引 机械检索: 穿孔卡片 联机检索: 联机系统 网络检索: 搜索引擎
1.2.1 信息组织实施的必要性(续)
③不断变化的信息检索环境需要信息组织工作与之相适 应 数据检索机制: 检索型 目录型 混合型
1.2.1 信息组织实施的必要性(续)
③不断变化的信息检索环境需要信息组织工作与之相适应 搜索引擎工作原理 ⑵处理网页功能实现
索引器: 其功能是理解搜索器所搜索到的信息,从中抽取
出索引项,用于表示文档以及生成文档库的索引表。
1.2.1 信息组织实施的必要性(续)
③不断变化的信息检索环境需要信息组织工作与之相适应 搜索引擎工作原理 ⑶提供检索服务