计算机信息检索技术(1)

合集下载
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

















排名的国际上高校和研究所依 据
(1)目前国内的226(以前的386) (2)排名的国际上高校和研究所依据论文标准是: EI(Engineering Index) SCI(Science Citation Index) SR(Science Review) ISTP(International Science and Technology Proceeding ) (3)国际著名的刊物有Science,Nature (4)在管理上和科研中的应用
(3)情报检索学习之困难第二为似曾相似之干 扰 情报检索学习过程中,可遇到多种检索系统如 SCi (Science Citation Index) Ei (Engineering Index) MA(Matal Abstract) WPI(World Patent Index) SA(Science Abstract)

③检索表达方式和效率不同: Sohu、Sina、Chinaren、altarista本身有搜索 窗口,并能执行简单的分类检索,其搜索窗 口主要是输入关键字,而分类检索则是层级 分类只能进行简单运算,当然还有它检索途 径但较简单,从检索过程看,如果要对内容 表达较复杂之课题进行检索只有进行二次检 索,较难进行一步复合检索. 而在Dialog STN等信息资源库,可进行复合检 索式之检索,可执行Boll代数,截词算法, 位置算法及限定算法等,使一个内容的课题 可以用复合检索策略表达出来,并且使之运 行,各执行步骤和检索词及结果均有相应的 子集合,且可随时调用,因此运行检索表达 方式效率肯定较高,这是在使用中两种检索 工具最主要差别之一。

检索课的教学模型
购买化妆品的属性可对应所有文献课 的各索引系统:
A前提:买什么东西?哪个厂家生产?该产品叫什么?是 否有批准文号(法定)?使用该产品的市场反馈如何? 产品的发明人或生产者是谁? 该厂家的地理位置在 哪里?是否含有特殊的有效成分? B模型化的具体对应与索引: 买 什 么 东 西 ---------- 分 类 索 引 ( CLASSIFICATION INDEX) 该 产 品 叫 什 么 --- 主 题 索 引 或 轮 排 索 引 ( SUBJECT INDEX,PERMUTERM INDEX ) 哪 个 厂 家 生 产 ----- 单 位 索 引 或 团 体 索 引 ( UNIT INDEX,CORPORAT INDEX) 是 该 厂 家 的 哪 地 方 的 分 厂 生 产 ----- 地 理 索 引 ( GEOGRAPHIC INDEX)
(1)工业革命 (2)信息化革命 (b) 统计数据: (1)每一分钟产生一本书 (2)每30秒产生一篇专利 (3)每15-16秒产生一篇论文 (4)每年全世界的图书总量: 图书近百万种 论文近数十万 专利近百万
论文近五百万 说明信息爆炸的事实 (c)科技文献 的有效期在缩短 一般文献的平均寿命为3-5年 一般经济类寿命较短只有1-4周 有些经济类信息的寿命仅90秒 (d)例:美国因信息不灵每年造成损失在30 亿以上,科技的成果的重复量达35% b科技文献分布异常分散 (a)体现在三个领域:分支学科,边缘学科 交叉学科 (b)体现在学科 的发展上: (1)传统学科的应用技术50%来自 别的学科 。 (2)新兴学科 的80%来自别的学科
非情报专业情报学习思维的难点:
(1)情报学习模式是一种有别于其它学科学 习的思维模式 数学思维要求严密 诗歌思维要求想象力 信息检索思维要求(著录)格式学习和联结
(2)情报检索学习之困难在于: 局部文字描述整 体,静止文字描述联结和运动之困难。 a 主观:情报检索学习之困难在于调整至与之相应 的思维方式,其学习过程实际上是要求了解不 同的著录格式和构成之信息,并根据已有信息 和目标直接或间接地通过操作,使各个部分联 结起来,这会使著录格式之学习很枯燥, b客观:学习联结各著录格式之操作时,则显示文 字描述操作的局部性,文字描述图示之低效性, 尤其较复杂之著录格式在隔离不同之时空进行 讲解时,则更显困难。
(4)情报检索学习另一障碍为语言障碍 不少文献系统是以英文的形式出版 世界上70%的著名系统是英文的 五、情报检索思维之形成和巩固 用以下方式较有效: 学习--介绍--著录介绍--使 用与巩固—(尽快)实习(自己兴趣与课题 相关)
2计算机信息检索的的产生和发 展过程

A计算机联机检索产生的时代背景: a文献的数量急剧增长: (a)目前的处于科技的高速发展阶段:
计算机信息检索参考书
计算机情报检索 同济大学出版社 慎金花编 计算机信息检索 机械工业出版社 李莹(浙大) 电子信息资源检索教程 南开大学出版社 何翠花 计算机情报检索 北京大学出版社 赖茂生编 实用光盘检索技术 上海科技出版社 郑燕华 计算机信息存储和检索 科大出版社 高星 科技查新教程 机机械工业出版社 国际联机检索原理与技术 湖北科技出版社 龚国伟 现代信息检索 东南大学出版社
虽然是不同出版商出版,其彼此系统应有的 区别,但其检索功能和特性又使彼此似曾 相似,或者冠以不同名称,但功能相似。 如 : Ei 中 Subject Index 和 Sci 中 之 Permaterm Index 如: CA中GENERAL Subject Index和Chemical SubStance. 又如:WPI中的employee Index与 SCI中Source Index 与 MA和EI中Author Index等



c文献的寿命在缩短:
苏联:图书寿命:10-20年 科技报告 : 10年 学位论文:5—7年 期刊等连续出版物:3—5年 西方学者一般的观点: 80%-90%的文献周期在3-5年 B计算机通讯和高密度存储技术的发展为联 机信息检索的产生 和发展提供了物质基础。 3联机发展的四个阶段: a联机产生阶段: (1)50年代中期计算机处于电子管 阶段 (2)1954年美国海军军械中心(NOTS) 研制了计算机检索系统(雏形). (3)1961年美国化学文摘社在世界上第一

公共搜索引擎的信息搜索与dialog等 专业信息库之信息检索的比对分析

随着计算机的普及和计算机技术的发展,电子手段进 行信息需求之检索成为一种非常重要的手段与工具。 然而由于计算机对各种计算机系统的了解不同和使用 不同,尤其在信息检索方面,如果严格用信息检索之 算标准,(如查全实、查准率等)看,则在使用效果 之差别较大,因此对不同检索工具予以了解,并且知 道彼此差异,将对检索大有裨益,目前信息检索中, 可以通过搜索引擎辅助定位,或者直接进入知名信息 资源系统,如国家图书馆,Dialog、STN等,虽然都可 以检索,但不具备地同等替代性,但是在检索效果和 性能上有较大区别。主要体现在以下几个方面:

当代信息检索 张曼玲 哈工大出版社 电脑网络信息 王云 国防工业出版社 网络信息资源搜集和利用 张厚生 东南大学出版社
计算机信息检索

课时安排:
2 3 4 5 6 7 8 9 10
检索 检索 检索 检索 检索 检索 复习 策略 技术 指令 案例 系统 修正 使用 技巧
1
概要, 信息 计算 序, 基础 机休 知识 息源自文库 索应 意义 用



个 公开将计算机用于检索。
(4)1965年美国医学图书馆用计算机编 制 医学文献检索刊物(医学索引)月度索 引。 b国际联机检索阶段:(1965—1972) (1)由于集成电路和计算机技术的产生和发展和数字通讯 技术的进步,促进了联机检索的发展。 (2)美国的LECKHEAD公司(洛克希德)于1965-1966年 建立了DIALOG系统(当时主要用电话联结)。 c 国际联机检索的发展和普及:(1973-1985) (1)卫星通讯: (2)光纤通讯: 使可通过联机终端,检索几年或几十年的各国资料。 一般以DOS专用软件较多。 d光盘版数据库的出现和WEB版数据库的出现: (1)1985年世界上首次出现了光盘数据库。 (2)1998年以后出现了WEB版数据库。





案例: 前日大学生参军的访谈 中关村老总的谈话 全世界的成功者的持续十年的成功者概率是低 于10% 去年的中国富豪的命运 大学生的就业的基本的条件与学习内容 西方 的MAB和各国企业文化的不同与中国的 一致性 丁磊和张朝阳等,李嘉诚及其儿子的实例
为什么要学习计算机信息检索
第一:从内容分析看: (1)学生学习的本质: (2)学习内容的本质和作用 : (3)学习的原则: 由厚到薄---由薄到厚 (4)学习的自我延伸: (5)学生的自我社会延伸:A能力: B角色:心理与惯性 C再学习的角色和素质 要求 D学习的社会变通性
是否有批准文号(法定)------专利号索引(PATENT INDEX) 使 用 该 产 品 的 市 场 反 馈 如 何 ? ------- 引 文 索 引 ( CITATION INEDEX) 产品的发明人或生产者是谁?-------作者索引或来源索引 (AUTHOR INDEX,SOURCE INDEX) 是 否 含 有 特 殊 的 有 效 成 分 ? ----- 化 学 物 质 索 引 ( CHEMICAL SUBSTRANCE INDEX,ALLOY INDEX ) 通过上面的变化,可将非常复杂枯燥的内容变得非常易 记且没有任何记忆负担,同时众多变化多样的系统变 成一个简单的模型,从学习指导和使用来说都使之变 得非常易懂,易学。 上述模型的核心是将许多的系统变成一个系统然后再变 成生活中易记的模型。该模型较宜非情报专业的学习 和初学者的学习。
从案例看: (1)广州标致的引进与生产 (2)关于非典的知识产权(美国疾病控制中 心) (3)王选的策略及其经验 (4)中国目前的西药的局面和原由 (5)中国的中药的局面 (6)日本的发展和策略 (7)中国的手机的引进和电视机的发展 -----------------------袁隆平的分析 项目失败:永康厂,电池厂,健特生物 项目 成功:美菱,丰原生化,



课程安排的原则是: A理论结合实际: (1)理论部份是的检索基础知识和技巧 (2)实践部份是一些国际上较权威的检索系 统包括中文库:VIP,万方, 期刊网, 英文库: EI,Sci,Sa,WPI,CA DIALOG,STN B部分资源的教学是通过网络链接来实现的
为什么学习

①收费与否: Sohu、Sina、Chinaren、Google、Yahoo等搜索 引擎均是免费使用,而一些商业信息资源库发 dialog、STN等,维普、万方等则有偿使用,即 只有授权用方才可以使用。 ②信息专业程度不同: 从内容上看,Sohu、Sina、Google等提供综合性 较强的大量信息,其中不少信息是属于时效性 较短之公共信息,其中不少信息是属于时效性 较短之公共信息,而其本身信息的更新频率较 快,而对于针对性较强之专业信息需求和检索, 则是用与专业网站链接方式提供 dialog,STN,BRs等信息资源库则是以权威性而著 名,能提供方向性极强的专业需求,其本质的 资源和容量查一般较全面,这是一般搜索引擎
国际上著名 的计算机检索系统:
(1)DIALO系统:是目前世界上计算机中信息总量的75% 是世界上最大的商业数据库,至2000年有800多个数 据库,用户达120多国家。 (2)BRS 美国文献题录检索服务公司,经营达100多个 公用 数据库和40多个私人数据库。 (3)STN美国化学文摘社,德国卡尔斯鲁厄能源,物理, 数学情报中心和日本情报信息中心,三家联合经营,有 150多个数据库,内容以建筑,纺织,能源,化学为最具 特色。 (4)ESA/IRS 意大利弗拉斯卡蒂的欧洲航天局情报中心, 有120多个数据库,内容涉及各方面。 (5)ORBIT 美国系统发作公司。
相关文档
最新文档