Lesson 02 常用的中文信息检索系统PPT课件

合集下载

第2章--信息检索PPT课件

第2章--信息检索PPT课件

经济
文化、科学、教育、体育 语言、文字 文学 艺术 历史、地理
S
T U V X Z
农业科学
工业技术 交通运输 航空、航天 环境科学、安全科学 综合性图书
《中国图书馆分类法》
中国图书馆分类法分类表共分22个大类,再分17个 二级目录,医药卫生属于R大类。 《中图法》采用汉语拼音字母和阿拉伯数字组成的 混合制号码作类目标识,用一个字母标记一个基本
的问题;
另一方面是特定原始文献的查找,即在查找特定
的文献线索后,找出原始文献的过程。
第一节 信息检索基础
一、信息检索概念
(二)信息检索的意义和作用 信息检索 有助于知识更新 ,有助于同学们扩大视野 ,了解和把握有关学科中出现的新思想、新观点与 新知识。掌握信息检索技术是快速、准确地获取和 利用最新信息的有效途径。 信息检索有助于科学研究,了解和把握有关学科的 起源和发展过程。 有助于独立自主地解决自己在学习、生活和工作中 所遇到的疑难问题。 是接受终身教育的必要手段。 节省时间,提高效率。
第二节 信息检索语言
二、检索语言的种类
(一)分类检索语言 分类检索语言又称分类法,是用分类号(字母、数 字或它们的组合)来表达各种概念的,并将各种概 念按学科性质进行分类和系统排列的信息检索语言。 它以树状结构的形式,按知识门类的逻辑次序反映事物 的从属、派生关系,构成具有上位类和下位类隶属、同 位类并列的概念等级体系。 能较好体现概念的族性关系,从学科专业的角度检索资 料,比较方便,扩大、缩小检索范围方便。
(一)按信息检索的对象划分
数据信息检索 利用数据库、工具书等以数值或数据为对象的检 索,也称为数值检索。检索包含分子式、分子量 、公式 、图表等特定数据的信息。

常用的中文信息检索系统

常用的中文信息检索系统

学术搜索
谷歌学术搜索是专门为学术研究人员提供的 搜索服务,能够方便地查找学术文献。
必应搜索引擎
微软旗下
必应是微软公司推出的搜索引擎,与 Windows操作系统深度集成。
搜索技术
必应的搜索技术也非常先进,能够提 供高质量的搜索结果和快速的响应速 度。
多元化服务
除了网页搜索外,必应还提供图片、 视频、新闻、学术等多元化搜索服务。
移动端信息检索的优化与创新
移动设备特性
移动设备屏幕尺寸有限、计 算能力相对较弱,需要针对 这些特性对信息检索系统进 行优化。
ቤተ መጻሕፍቲ ባይዱ
语音搜索
利用语音识别技术,用户可 以通过语音输入查询请求, 提高移动设备上信息检索的 便捷性。
位置感知服务
结合移动设备的定位功能, 可以提供基于位置的信息检 索服务,如附近的餐厅、景 点等。
概率模型
03
基于概率统计的检索模型,通过计算文档与查询相关的概率来
排序文档。
中文分词技术
基于词典的分词方法
利用预先构建的词典,将待分词的文本与词典中的词条进行匹配, 实现分词。
基于统计的分词方法
利用机器学习等统计方法,对待分词的文本进行建模,通过训练得 到分词模型。
基于深度学习的分词方法
利用神经网络等深度学习技术,对大量文本进行训练,得到分词模 型。
对于某些非通用语言,相关语料库和训练 数据相对匮乏,制约了跨语言信息检索技 术的发展。
机器翻译技术
多语言嵌入表示
随着机器翻译技术的不断进步,可以将不 同语言的文档翻译成同一种语言,便于进 行统一的信息检索和处理。
通过学习多语言的嵌入表示,可以实现不 同语言之间的语义对齐和匹配,为跨语言 信息检索提供有力支持。

信息检索课件第2章

信息检索课件第2章
学术评价与评估
信息检索还可以用于学术评价与评估,通过对学术论文的 发表数量、被引次数等指标进行统计和分析,评价研究者 的学术水平和影响力。
信息检索在商业领域的应用
市场调研与竞争情报
企业通过信息检索技术收集市场和竞争对手的信息,了解市场需求、 竞争态势和行业趋势,为制定营销策略和产品开发提供支持。
品牌监测与管理
信息检索课件第2章
contents
目录
• 信息检索概述 • 信息检索技术 • 信息检索系统 • 信息检索的实践应用 • 信息检索的伦理与法律问题
01 信息检索概述
信息检索的定义
信息检索是利用计算机和人工 手段,从大量信息中查找和获 取特定信息的过程。
信息检索涉及对信息资源的组 织、标识、评价和检索等方面。
信息检索的目的是为用户提供 准确、及时和有用的信息。
信息检索的原理
信息检索基于信息需求, 通过特定的检索方式,从 信息源中获取相关信息。
信息检索的原理包括信息 标引、信息存储和信息检 索三个主要环节。
信息标引是对信息进行分 类、主题分析等处理,以 便于信息存储和检索。
信息检索是根据用户的信息需 求,利用特定的检索工具和策 略,从信息源中获取相关信息 。
网络搜索引擎、学术搜索引擎、特定领域搜索引擎等。
基于检索技术的分类
基于关键词的检索、基于内容的检索、基于知识的检索等。
信息检索系统的评价
查全率
检索系统返回的相关结果数量 与总相关结果数量的比值。
查准率
检索系统返回的相关结果中, 真正相关的结果数量与返回的 相关结果数量的比值。
响应时间
检索系统对用户查询的响应时间 ,即从用户提交查询请求到检索 系统返回结果所需的时间。

《中文信息检索专题》PPT课件

《中文信息检索专题》PPT课件

十、信息检索的评测
❖ 召回率(Recall,又称查准 率)和准确率(precision, 又称查全率)。
❖ 准确率是一个给定被检索 文档的相似度的概率。
❖ 召回率是一个给定相关性 文档的被检索的概率。
十、信息检索的评测(续)
❖ 其中,E(效率)用来指定 准确率和召回率重要性。
❖ P代表准确率,R表示召回 率,α是变量,值为0-1。 如果取值是0,表示召回率 更重要;取值1/2表示召回 率和准确率同等重要;取 值1表示准确率更重要。
十一、信息检索的模型
❖ 一般而言,有两种信息检索的模型:基于统计的 模型和基于语义的模型。
❖ 基于统计的模型是应用某些统计的手段从被检索 文档和高标注等级文档中查询与用户需求匹配程 度最好的文档;
❖ 而基于语义的模型则尝试对需求实现一定程度语 法和语义的分析,即对用户输入的自然语言文本 进行一定程度的理解并重新生成查询。
十三、信息检索系统介绍(续)
❖ Topic ❖ 与上面三个商业文本检索系统不同,Topic
并不是利用自己拥有的文本集合提供信息 服务而是一个单独的文本检索工具。用户 购买Topic,然后装载自己的信息,利用 Topic提供自己的信息服务。
十三、信息检索系统介绍(续)
❖ SMART
❖ SMART是由康奈尔大学的Gerard Salton开发的,是 最早的文本检索系统之一。它具有以下特点:(1) 自动建立索引;(2)自动生成聚类层次计算聚类 中心;(3)进行查询/文档相似度计算并且根据 文档与查询的相似程度对文档排序;(4)将文档 以基于词汇的向量空间表示;(5)根据用户反馈 自动提高对查询的处理。
14030903 王莉
……
……
性别

第二章 常用的中文信息检索系统

第二章 常用的中文信息检索系统
11 of 20
第二章
常用的中文信息检索系统
六、中国专利文献检索
/sipo2008/zljs/
Beijing Institute of Petro-chemical Technology
12 of 20
第二章
常用的中文信息检索系统
美国专利局:
/
第二章
常用的中文信息检索系统
一、全国期刊联合目录 二、万方数据资源系统
三、中文科技期刊数据库
四、国家科技图书文献中心 五、中国期刊全文数据库 六、中国专利文献检索 七、标准文献检索
八、科技报告检索
Beijing Institute of Petro-chemical Technology
1 of 20
Beijing Institute of Petro-chemical Technology
17 of 20
第二章
常用的中文信息检索系统
美国国家技术情报局网站
/
Beijing Institute of Petro-chemical Technology
18 of 20
Beijing Institute of Petro-chemical Technology
13 of 20
第二章
常用的中文信息检索系统
欧洲专利局:

Beijing Institute of Petro-chemical Technology
14 of 20
第二章
常用的中文信息检索系统
七、标准文献检索-中国国家标准
/standard_plan/search_stand.asp
Beijing Institute of Petro-chemical Technology

中文文献检索精品PPT课件

中文文献检索精品PPT课件

特 色
《中国优秀硕士学位论文全文数据库》(CMFD) 文

中 《中国重要会议论文全文数据库》(CPCD)

国 《中国重要报纸全文数据库》(CCND) 学
据 库
术 《中国年鉴网络出版总库》(CYBD)
文 《中国工具书网络出版总库》(CRFD)
献 网
合作数据库
络 《中国专利数据库》 (CSPD)
出 《国家科技成果数据库》 (SNAD)
年份Leabharlann 发表杂志三、 维普数据库简介
维普资讯公司推出的《中文科技期刊数据库》(全 文版)(简称中刊库)是一个功能强大的中文科技 期刊检索系统。数据库收录了1989年至今的8000 余种中文科技期刊,涵盖自然科学、工程技术、 农业科学、医药卫生、经济管理、教育科学和图 书情报等七大专辑。
检索方式:一般检索、传统检索、分类检索、高 级检索、期刊导航。

总 《国内外标准数据库》 (SCSD、SOSD) 库 《国学宝典数据库》 (GXBD)
知 识
《哈佛商业评论数据库》 (HBRD)
仓 库
《外文期刊库(NSTL)》
《中国经济信息期刊文献总库》(CJFY) 《中国政报公报期刊文献总库》(CJFZ) 《中国党建期刊文献总库》(CJFX) 《中国基础教育期刊文献总库》(CFED) 《中国精品科普期刊文献库》(CJFT) 《中国精品文化期刊文献库》(CJFU) 《中国精品文艺作品期刊文献库》(CJFV)
专业版网站首页
新版网站首页 旧版网站首页
三、 维普数据库简介
三、 维普数据库简介
页面导航
检索方式
检索条件
三、 维普数据库简介
可以对检索历史进行“与”、“或”、 “非”的运算进行二次检索

信息检索课件-中文数据库检索

信息检索课件-中文数据库检索

常用的中文数据库
中文数据库
常用的中文数据库
中文数据库
各类CNKI数据库在主题选项 方面有所区别
常用的中文数据库
中文数据库
万方期刊数据库
常用的中文数据库
中文数据库
三大中文数据库检索方式基本相同
主题检索
作者检索 关键词检索 期刊检索 时间检索
………….
中文数据库检索方法
检索步骤
中文数据库检索应分四个步骤:
审核数据库是否合适
中文数据库检索方法
结果分析
文献太多
限定检索词的检索区域,如只检索标题
提高检索词的专指度
增强检索式的专指度,如用“和”而不用“或”
文献太少
检查检索词的拼法
提高检索词的泛指度,如去掉非常规词语等
检索其他数据库
中文数据库检索方法
扩大检索
确定切题的文献,以便发现其他的相关文献和方法,
学位论文或优秀硕士学位论文?
去进一步检索
浏览你查到的文献中所用的主题词,以便发现其他的
检索词
用作者姓名进行检索,以便发现其他的文章和论文的
作者
检查文章所列的参考文献,以便发现其他的相关文献
检索实例
实例
实例一 超声波处理对渣油胶体稳定性的改善作用初步研究 实例二 检索中国石油大学2010年中文论文发表情况 实例三 检索石油大学刘晨光教授有关 “催化剂”的文献 实例四 检索有关“渣油加氢裂化”的博士论文
实例三
检索实例
实例三
检索实例
实例三
检索实例
实例三
检索实例
实例三
检索实例
实例四
检索有关“渣油加氢裂化”的博士论文
检索实例
实例四

信息检索与利用2常用中文检索系统

信息检索与利用2常用中文检索系统
第2章 常用中文检索系统
第2章 常用中文检索系统
2.1 主要中文数据库分类概况
• 中文数据库的种类繁多,按照文献类型可将中文 数据库分为电子期刊、学位论文、会议论文、专 利、年鉴、电子图书等数据库。本章主要针对常 用中文检索数据库以及事实数据检索数据库进行 介绍。
第2章 常用中文检索系统
2.2 综合类全文数据库
• 2.2.1CNKI中国知网
• 1.数据库简介 • 中国知识基础设施工程(China National Knowledge Infrastructure,简称CNKI工程) 于1995年建成,经过十年 努力,启动建设《中国知识资源总库》以及CNK知识发现 网络平台。CNKI数据库涵盖理工、社会科学、电子信息技 术、农业、医学、经济管理等领域的公共知识信息资源, 数据每日更新。 • 图2-1所示为中国知网知识资源总库(CNKI)主页。
第2章 常用中文检索系统
• 2.检索方法 • 万方数据知识服务平台的主页面提供了统一检索平台,输 入检索词即可同时检索多个数据库中的各种文献类型资源 的检索结果,并可进一步得到详细记录并下载全文,与此 同时,用户也可选择单个数据库,针对某一种类型的文献 资源进行个性化检索。 • 3.检索结果处理 • 在检索结果列表中,勾选需要导出的文献前的方框,再点 击“导出”,即可将选中的文献的题录信息按选中的格式 导出并保存,完成检索结果的处理。参考文献导出。
第2章 常用中文检索系统
万方数据知识服务平台导航界面
第2章 常用中文检索系统
• • • • • • • • • • • 万方数据资源系统的主要数据库: (1)中国学位论文全文数据库; (2)数字化期刊群; (3)学术会议论文全文数据库; (4)中技信息子系统; (8)商务信息子系统; (9)外文文献数据库; (10)地方志数据库。

文献检索 第二章 常用中文数据库.ppt

文献检索 第二章 常用中文数据库.ppt
23
句子检索过程及结果
24
文献检索方式七:文献来源检索
主要通过的文章出处(如期刊名)来检索文献的一种 方式。
25
文献来源检索过程及结果
26
期刊导航进入
多渠道快速定位期刊,可以做年卷期的内容浏览及相关 期刊或文献的漫游
点击数据库名 进入
27
3.其它导航 方式
期刊导航
1.查找《计算 机科学》期刊
2000:100-120.
80
读秀学术搜索
/
超星开发的一个新产品
是一个海量全文数据及元数据组成的超大型数据库。它 能够为读者提供200万种图书、8亿页全文资料、5000万条 期刊元数据、2000万条报纸元数据、100万个人物简介、 1000万个词条解释等一系列海量学术资源。
导出题录:符合“文后参考文献著录”标准
46
期刊文献检索方式二:传统检索
检索有关“企业信贷融资”方面的文献
检索结果数太多 可二次检索
47
二次检索
输入检 索词
执行二次 检索
48
检索结果处理
2.下载题录
1.勾选序号 前的复选框
49
点击篇名下 载全文
题录格式采用“参考文献格式”
选择参考文献格式
5
第一节 中国知网学术期刊数据库
中国知网学术期刊数据库简介
简 介:中国学术期刊网络出版总库是世界上最大的连续动态更新 的中国学术期刊全文数据库,是“十一五”国家重大网络出版工程 的子项目,是《国家“十一五”时期文化发展规划纲要》中国家 “知识资源数据库”出版工程的重要组成部分。 出版内容:以学术、技术、政策指导、高等科普及教育类期刊为 主,内容覆盖自然科学、工程技术、农业、哲学、医学、人文社 会科学等各个领域。 专辑专题:产品分为十大专辑:基础科学、工程科技Ⅰ、工程科 技Ⅱ、农业科技、医药卫生科技、哲学与人文科学、社会科学Ⅰ、 社会科学Ⅱ、信息科技、经济与管理科学。十大专辑下分为168 个专题。 收录年限:1915年至今出版的期刊(部分刊物回溯至创刊)。

信息检索2章 PPT课件.ppt

信息检索2章 PPT课件.ppt
检索工具是人们用来存储和查找各类信息的工具。 1.按所收信息的学科内容划分: 综合性、专科和专题 2.按著录信息的特征划分 1)目录型检索工具 2)题录型检索工具 3)文摘型检索工具 4)索引型检索工具
• 目录型检索工具 • 一般以整本的图书、期刊等作为报道单元,仅著
录出版物的外表特征,不著录具体篇章。仅提供检 索线索,主要用于了解出版物的出版或收藏单位。
2.2.3.2检索工具的选择
4.考虑检索工具的检索功能 5.检索工具的检索费用 返回目次
2.3 检索方法及检索途径
2.3.1 检索方法 2.3.2 检索途径
2.3.1检索方法
1.常规法 利用常规检索工具查找有关文献。 分为顺查法、倒查法、时间抽样法
• 顺查法
• 以所检索课题研究的发生时间为检索起点,按 事件发生、发展的时序,由远及近,由旧到新的 顺序查找。
• 特点:所查得的文献较为系统全面,基本上可反 映某学科专业或某课题发展的全貌;缺点是费时 费力,工作量较大。一般在申请专利的查新调查 和新开课题时采用这种方法。
• 逆查法
• 与顺查法相反,由近及远,由新到旧的查找。
• 多用于查找新课题,在基本上获得所需信息时 即可终止检索。可保证文献信息的新颖性,也可 提高查准率。但由于这种方法不太关注历史渊源 和全面系统性,影响检索的全面性。
• 报道内容:文献篇名.著者.刊名.出版年,月 (卷,期),页码
• 实例:下
【实例】 在《中文科技期刊数据库》的期刊论文著录格式如下: 【题 名】 辽宁老工业基地振兴与发展中的生态产业研究 【作 者】 张军涛 【机 构】 东北财经大学公共管理学院,辽宁大连116025 【刊 名】 社会科学辑刊.2004(1).-74-78 【ISSN号】 1001-6198 【C N 号】 21-1012 【馆藏号】 80414X 【关键词】 生态产业 循环经济 环境—经济协调发展
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

2020/11/16
科技信息检索与论文写作
2
全国期刊联合目录首页
2020/11/16
科技信息检索与论文写作
3
万方数据资源系统:
万方数据资源系统是基于Internet的大型中文科技平台及庞大的数据库群,内容 涉及自然科学和社会科学各个领域,数据资源丰富。万方数据资源系统分为九大子 系 统:中国学位论文全文数据库、中国学术会议论文全文数据库、中国数字化期 刊群、中国标准全文数据库、科技信息子系统、中国专利全文数据库、外文文献家法定学位论文收藏机构:中国科技信息 研究所提供,并委托万方数据加工建库,收录了自1980年以来我国自然科学领域 博士、博士后及硕士研究生论文,其中全文60余万篇,每年稳定新增15余万篇, 是ቤተ መጻ级学会、协会、研究会组织、部委、 高校召开的全国性学术会议及国家性会议论文全文,每年涉及上千个重要的学术 会议。收录会议级别高、数量多、扩容速度快,是目前国内收集学科最全、数量 最多的会议论文数据库,便于用户及时掌握科研、生产最新进展 中国数字化期刊群:作为国家“九五”重点科技攻关项目,目前集纳了理、工、 农、医、哲学、人文、社会科学、经济管理与教科文艺等8大类100多个类目的近 5500余种各学科领域核心期刊,实现全文上网,论文引文关联检索和指标统计。 从2001年开始,数字化期刊已经囊括我国所有科技统计源期刊和重要社科类核心 期刊,成为中国网上期刊的第一大门户
科技信息检索与论文写作
1
全国期刊联合目录:
全国期刊联合目录数据库创建于1983年,是由中科院文献情报中心牵头 研建、中科院长期支持的项目 主要特点: 数据库是一个全国性、多学科、多文种的综合性数据库,能揭 示542家图书馆的期刊收藏情况的联合目录;是网上外文期刊的目次文摘及 部分免费全文期刊的导引库;同时支持馆际互借和原文传递。用户在检索 到某刊目次文摘或全文的同时可清楚了解到我国哪家图书馆收藏了此刊 收录范围: 收录印刷版的期刊、各种连续出版的会议录、年鉴、报告、指 南、学会会志、备忘录以及连续出版的光盘和网上电子期刊等。共收录西 文期刊5.4万种,馆藏26.8万条,收录日文期刊7000余种,馆藏2.5万条;收 录俄文期刊6500余种,馆藏1.8万条;收录中文期刊1.9万种,馆藏8.3万余 条; 2000年开始增收了连续出版的光盘版和95000多种网上电子期刊 涉及文种: 中、西、日、俄等多文种 涉及学科: 覆盖理、工、农、林、医、军事和社会科学,可全方位满足不 同学科用户的需要 时间跨度:收录的西文馆藏可追溯至17世纪,收录的日文和俄文馆藏可追 溯到18世纪
2020/11/16
科技信息检索与论文写作
4
万方数据资源系统:
中国标准全文数据库:标准是在一定地域或行业内统一的技术要求。本库收录 了国内外的大量标准,包括中国国家发布的全部标准、某些行业的行业标准以及 电气和电子工程师技术标准;收录了国际标准数据库、美英德等的国家标准,以 及国际电工标准;还收录了某些国家的行业标准,如美国保险商实验所数据库、 美国专业协会标准数据库、美国材料实验协会数据库、日本工业标准数据库等 科技信息子系统:中国唯一完整的科技信息群。他汇集中国学位论文文摘、会 议论文文摘、科技成果、专利技术、标准法规、各类科技文献、科技机构、科技 名人等近百个数据库,其上千万的海量信息资源,为广大科研单位、公共图书馆、 科技工作者、高校师生提供最丰富、最权威的科技信息 中国专利全文数据库:收录从1985年至今授理的全部发明专利、实用新型专利、 外观设计专利数据信息,包含专利公开(公告)日、公开(公告)号、主分类号、分类 号、申请(专利)号、申请日、优先权等数据项 外文文献数据库:主要收录了1995年以来世界各国出版的12000多种重要学术期 刊;“外文会议论文”主要收录了1985年以来世界各主要学协会、出版机构出版 的学术会议论文,部分文献均有少量回溯。每年增加论文约献(如图书),在本馆用户需要时,根据CALIS统一的制度、协议和办法,向 其他馆借入;反之,在其他馆用户提出互借请求时,借出本馆所拥有的文献,满足用户的文献需求。
文献传递
对于本馆没有的文献(如期刊文章或学位论文),在本馆用户需要时,根据CALIS统一的制度、 协议和办法,向其他馆获取;反之,在其他馆用户提出请求时,将本馆所拥有的文献传递给对方。
Lesson 02 常用的中文信息检索系统 及数字图书馆
中国期刊全文数据库:
全国期刊联合目录:
万方数据资源系统:
CALIS数据库:
中国高等教育文献保障系统(China Academic Library and Information System)
国家科技图书文献中心:
超星数字图书馆:
书生之家:
2020/11/16
2020/11/16
科技信息检索与论文写作
5
万方数据资源系统首页
2020/11/16
科技信息检索与论文写作
6
CALIS数据库:
中国高等教育文献保障系统,China Academic Library & Information System。依托CERNET(中国
教育科研网),提供信息服务,实现资源共享,提高投资效益。 已引进数据库:OCLC FirstSearch、 Ei Village、UnCover、ScienceOnline…; 自建数据库 :中外文书刊联合目录、中文现刊目次报导、高校研究生学位论文、高校学术会议论文、
重点学科文献数据库、重点学科网上信息导航库及所需软件及其实现。
CALIS服务功能
信息检索 用户可以按照本校-本地区-邻近地区-北京-国外的顺序,在网上查找全国性或地区性的书刊
联合目录数据库,了解所需文献是否有及在哪里收藏。也可以通过联机(或委托)检索CALIS国内
外各种类型的文献数据库,得到某一学科或专题的详尽的文献线索乃至电子版全文。
相关文档
最新文档