武汉大学黄如花信息检索3.1 搜索引擎

合集下载

武汉大学信息检索教材

武汉大学信息检索教材
《信息检索》
《信息检索》
☞ 信息检索工具
是人们用来存储、报道和检索文献信息的系统化文字描 述工具,是目录、索引、指南等的统称。 检索工具的要素:详细而又完整地记录了文献的外部特 征或内容特征;具有既定的检索标识;按照某种可检顺序组 织和排列起来;提供多种检索途径。 检索工具的作用:提高查全率和查准率;提高检索速度; 根据需要从多角度检索。
复制;成本高;不能直接阅读
《信息检索》
按出版形式分 图书 期刊 报纸 年鉴 会议文献 专利文献 标准文献 学位论文 政府出版物 科技报告 产品样本
连续出版物
特种文献
《信息检索》
按加工级次划分: 零次文献:未经出版发行或未进入社会交流的最原始的文献; 如论文草稿、谈话记录等。 一次文献:也称原始文献,是作者在科学研究、生产实践中以 自己的研究成果为基础创作或撰写的文献;具有创 造性;如学术论文、科技报告等。 二次文献:也称检索性文献,是对一次文献进行加工整理而成 的具有报道和检索作用的文献;如目录、题录、文 摘等检索工具。 三次文献:又称参考性文献,是指利用二次文献的线索,系统 地检索出一批相关文献,对其内容进行比较分析, 综合述评而编撰的文献。如综述、手册、字典、百 科全书、学科总结等。 《信息检索》
信 息 检 索
武汉大学资源与环境科学学院 游涟
概 述
《信息检索》
目的
培养和强化信息意识,了解文献检索与利用的基础知 识和检索原理,成为一个具有信息素质能力的人(能够充 分认识到何时需要信息,并有能力去有效地发现、检索、 评价和利用所需要的信息)。
基本内容
信息资源的基础知识;信息检索的基本理论知识;计
《信息检索》
文献 主题分析
情报 工作 人员

信息检索作业及答案

信息检索作业及答案

一、简答题:1、什么是信息、知识、情报、文献?并用图表示四者之间的关系。

信息是与物质、能量并列构成人类所生存的环境的三大基本因素之一是音讯、通讯、消息、通知、情报,是一切消息、讯号、知识的总称。

知识是人类社会实践经验和认识的总结,是人的主观世界对于客观世界的概括和如实反映。

知识是人类通过信息对自然界、人类社会以及思维方式与运动规律的认识,是人的大脑通过思维加工、重新组合的系统化信息的集合。

因此,人类不仅要通过信息感知世界,认识和改造世界,而且要将所获得的部分信息升华为知识。

也就是人们在认识和改造世界的过程中,对信息认知的那部分内容就是知识,可见知识是信息的一部分。

情报是指被传递的知识或事实,是知识的激活,是运用一定的媒体(载体),越过空间和时间传递给特定用户,解决科研,生产中的具体问题所需要的特定知识和信息。

史价值和研究价值的知识。

文献的基本要素是:1.有历史价值和研究价值的知识;2.一定的4.一定的意义表达和记录体系。

人们通常所理解文献是指图书、载体;3.一定的方法和手段;文频等技术手段记录人类知识的一种载体。

因此,根据不同载体形式和读取方式,文献大体可分为印刷型、缩微型、机读型和视听型等四种主要形式。

由上述可见,知识是信息中的一部分,情报是知识中的一部分,文献是知识的一种载体。

文献不仅是情报传递的主要物2、本校图书馆购买的与你所学专业相关的电子期刊全文数据库有哪些?请列举其中3。

答:图书馆购买的与心理学有关的电子期刊有心理科学、心理科学进展、心理学报二、实践操作题(30分*2题)治疗急性支气管炎的药物1、用中国知网的全文数据库进行检索,把病名限制在题名字段,治疗放在关键词字段,检索最近三年的相关文章,查看该病的治疗方法与药物,并给出具体检索结果的截图。

2、用百度搜索治疗该病的其中一种药品的名称、价格以及生产厂家,并找出该厂家的地址。

名称:阿莫西林价格:阿莫西林片剂12片装每盒为27.3元,6片装每盒14元厂家:广州白云山制药股份有限公司地址:广东省广州市白云区云祥路88号三、写出三个与你学习相关的MOOC、公开课、微课堂网址,写出你选择的理由并截图。

武汉大学信息检索整理

武汉大学信息检索整理

名词解释1.信息检索(Information Retrieval)是指将信息按一定的方式组织和存储起来,并根据信息用户的需要找出有关信息的过程。

2.引文索引是一种将科技期刊、专刊、专题丛书等文献资料所发表的论文后所附的参考文献的作者、题目、出处等项目,按照引证与被引证的关系进行排列而编制的索引。

3.CALIS:China Academic Library and Information System中国高等教育文献保障系统。

4.邻近检索是用一些特定的算符(位置算符)来表达检索词与检索词之间的关系,并且可以不依赖叙词表而直接使用自由词的检索方法。

5.搜索引擎(Search Engine)是一种Web 上应用的软件系统,它以一定的策略在Web 上搜集和发现信息,在对信息进行处理和组织后,为用户提供Web信息查询服务。

用户可以通过主题浏览和关键词检索的方式搜索所需信息。

6.截词检索:是指在检索标识中保留相同的部分,用相应的截词符代替可变化部分。

检索中,计算机会将所有含有相同部分标识的记录全部检索出来。

截词符一般用“?”或“*”表示,但不同的数据库中有所差别。

7.查准率:是指检出文献中合乎需要的文献数量占检出文献全部数量的比例。

8.查全率:是指检出的文献数量占数据库中全部相关文献数量的比例。

9.文献及其要素“文献”是泛指“有历史价值或参考价值的图书资料。

”要素:1、构成文献内核的信息、知识、数据、事实.2、载体信息、知识、数据、事实的物质载体。

3、记录信息、知识、数据、事实的符号系统。

10.专利文献:专利文献是实行专利的国家、地区及国际专利组织在批审专利过程中产生的官方文件及出版物,包括专利说明书、专利权利要求书、专利公报、专利分类表、专利检索工具等。

11.三大检索系统:SCI(《科学引文索引》,EI是美国《工程索引》(TheEngineeringIndex)的简称,ISTP是IndextoScientific&T echnicalProceedings的缩写。

网上法律信息的检索

网上法律信息的检索

网上法律信息的检索
黄如花
【期刊名称】《图书馆建设》
【年(卷),期】2001(000)004
【摘要】文章介绍了网上法律信息检索的途径,包括利用搜索引擎、官方网站、法律检索系统、法律法规网、法学主题指南或法学虚拟图书馆以及其它来源渠道.【总页数】3页(P79-81)
【作者】黄如花
【作者单位】武汉大学信息管理学院,430072
【正文语种】中文
【中图分类】G252.7
【相关文献】
1.网上农业空间信息资源检索工具及检索方法 [J], 黄静
2.网上农业信息资源检索工具及检索方法 [J], 黄静
3.专业化网络信息资源检索工具——网上农业空间信息资源检索 [J], 黄静
4.法律法规信息资料的网上检索 [J], 孔敏
5.从专业信息的网上检索看互联网信息检索的不足 [J], 刘玉敏
因版权原因,仅展示原文概要,查看原文内容请购买。

国内高等学校数据素养教育问题及对策研究

国内高等学校数据素养教育问题及对策研究

国内高等学校数据素养教育问题及对策研究作者:李迎斌思金华来源:《电脑知识与技术》2021年第24期摘要:数据素养是大数据时代信息素养的重要表现形式之一,受到广大学界的关注,通过国内学者对数据素养相关文献的研究,归纳总结数据素养的内涵,指出国内高校数据教育存在的若干问题,并针对教育课程、评价体系、教育队伍等方面提出对策,旨在为我国数据素养教育的研究方向提供指引,为开展实践提供借鉴。

关键词:高等学校;图书馆;数据素养;数据素养教育Abstract:Data literacy is one of the important forms of information literacy in the era of big data, which attracts the attention of the majority of academic circles. This paper summarizes the connotation of data literacy, points out some problems existing in domestic university data education, and puts forward countermeasures for education curriculum, evaluation system and education team, aiming at providing reference for our country's data literacy, and to provide reference for the practice.Key words: University ; Library ; Data Literacy; Data literacy education1 引言隨着科学技术的快速发展,大数据时代已然来临,人类社会业已悄然步入信息化社会,联合国于2012年发布的《大数据促进发展:挑战与机遇》白皮书指出:“社会各个领域都会因大数据的出现而产生深远影响”。

图书情报专硕参考书

图书情报专硕参考书

图书情报专硕参考书1.辽宁大学《电子文件管理基础教程》丁海斌、汴昭玲,辽宁大学出版社《档案学概论》丁海斌、方鸣、陈永生,辽宁大学出版社《档案逻辑管理》华林、倪丽娟、苏晓轩,辽宁大学出版社《档案物理管理与保护》赵淑梅、侯希文,辽宁大学出版社2.华中师范大学2021年更换为《信息资源管理》马费成,第三版3.东北师范大学未指定参考教材,建议参考书目如下:《图书馆情报学概论》于良芝《信息资源建设》马费成《信息检索》黄如花4.云南大学《信息资源管理》马费成、赖茂生,武汉大学出版社《档案管理学基础》陈兆武5.福州大学《信息资源管理》马费成、赖茂生,武汉大学出版社,第三版6.苏州大学2021新增院校,目前没有公布复试参考书,建议参考书目如下:《信息管理学基础》《信息检索》《信息资源管理》《图书馆管理》7.上海大学《信息检索》黄如花,武汉大学出版社8.南京理工大学无官方指定参考书目,建议参考书目如下:《数据库基础与应用》王珊、李盛恩,人民邮电出版社,第二版,2009年6月9.河海大学《信息管理学》杜栋10.南京农业大学《信息资源管理概论》孙建军,东南大学出版社,第二版,2008年《信息资源管理》张凯,清华大学出版社,第三版,2013年《科技文献检索》赖茂生,北京大学出版社,第二版,2004年11.安徽大学没有指定教材,笔试不专业,建议参考教材如下:《图书馆情报学概论》于良芝《图书馆学基础》吴慰慈12.南昌大学《信息管理学基础》马费成,武汉大学,第三版13.郑州大学《信息资源建设》肖希明《信息检索》焦玉莹,武汉大学。

信息检索概述武大黄如花专业知识讲座

信息检索概述武大黄如花专业知识讲座

科技报告
学位论文
编辑出版形式
标准文献 技术档案
产品资料
武汉大学信息管理学院 黄如花
本文档所提供的信息仅供参考之用,不能作为科学依据,请勿模仿。文档如有不 SCIENTIFIC SOLUTIONS 当之处,请联系本人或网站删除。 3 信息检索的原理
• 狭义的信息检索
• information storage • information retrieval
• information retrieval
武汉大学信息管理学院 黄如花
本文档所提供的信息仅供参考之用,不能作为科学依据,请勿模仿。文档如有不 SCIENTIFIC SOLUTIONS 当之处,请联系本人或网站删除。 信息检索的常用术语 • 检索词:用户输入的字、词、字符或短语 • 检索式:检索提问表达式 • 检索策略:是对查询的全面策划,在操作上主要指数据库的选择和检索 式的编制 • 前者选择数据库资源,后者实现检索目标 • 一般也直接将检索式视为搜索策略
Student Assessment( PISA)项目
武汉大学信息管理学院 黄如花
本文档所提供的信息仅供参考之用,不能作为科学依据,请勿模仿。文档如有不 SCIENTIFIC SOLUTIONS 当之处,请联系本人或网站删除。 • PISA蕴含的意义 • 在这个迅速变化的时代,学生不可能在学校里学到将来所需的每一种知 识和技能,必须在具备阅读、数学、科学等方面基础的前提下,努力培 养自己的学习能力。学会如何学习(learn how to learn),将比学会事 实(learn to know)更为重要。
Wisdom
Knowledge
Information Data
Information Hierarchy

1 信息检索概述 武大黄如花

1 信息检索概述  武大黄如花

S C I E N T I F I C
S O L U T I O N S
评价信息检索系统效果的指标
• 查全率(Recall Factor,R) • 查准率(Precision Factor, P)
• 漏检率(Omission Factor)
• 误检率(Noise Factor) • 新颖率
• 检索速度
三级类目 四级类目
O13 …… 高等数学 O124 三角 O123
初等数学
初等代数
初等几何
武汉大学信息管理学院 黄如花
S C I E N T I F I C
S O L U T I O N S
• 国内外常用的叙词表:
• 我国的《汉语主题词表》
• 美国国会图书馆主题词表(LCSH)
• 英国《科学文摘》使用的《INSPEC叙词表》 • 美国《工程索引》使用的《COMPENDEX叙词表》
武汉大学信息管理学院 黄如花
S C I E N T I F I C
S O L U T I O N S
信息资源的有关概念
• 文献(literature,document) • 信息资源(information resource)
• electronic resources(电子资源) • virtual resources(虚拟资源) • digital resources(数字资源 ) • networked resources, WWW resources, resources on the Internet(网络资源) • online resources(联机资源) web-based resources,
S C I E N T I F I C
S O L U T I O N S
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
2006年1月份开通 免费提供中国古代文化典籍在线搜索及阅读服务 收录上起先秦、下至清末两千多年的以汉字为载
体的历代典籍,内容涉及经、史、子、集各部。 内容进行严格校对,对一些生僻字特别进行造字 提供目录浏览和关键词检索
检索结果:依据相关度排序
相关度主要与关键词和链接两个基本因素 相关
前者主要考虑检索词的位置和出现频率
一个网页被其他网页参考或链接得越频繁,其 排序就越靠前
提问:还有哪些学术搜索引擎?
如:
Sear000年1月 李彦宏和徐勇创立于中关村 全球最大的高级检索页面提供的众多产品的检索技巧
参见的帮助中心的检索功能和特点 快照 拼音提示功能 支持繁简中文查询 相关搜索 支持:-、| 、“”、filetype、inurl 、
北大天网
CNKI知识搜索/
6 使用搜索引擎要注意的问题
各个搜索引擎的功能有别 同一种运算在不同搜索引擎中使用的符号
不同 各引擎结果排名的计算方法不同 优先选用好的搜索引擎 选择有针对性的搜索引擎 搜索引擎不是万能的 竞争激烈 ,要留意变化
提问:你使用过Google哪些功能?
谷歌提供了多样化的服务和功能
Google的检索技巧
一般不区分英文大小写 缺省值 AND(and) 支持site、inurl、allinurl、intitle、
allintitle、filetype、link、define、 related等 filetype字段: pdf,doc, ppt, xls, rtf,swf等 13种非HTML文件 filetype:pdf AND “英语四级模拟试题”
5.3 Scirus
/ 荷兰爱思唯尔公司(Elsevier Science)于2001年4月
推出 专为搜索科学信息而设计的 网上最全面、综合性最强的科技文献门户网站之一 信息来源:大学网站、科学工作者的个人站点、学术会
议等; 文献类型:研究报告、同行评审期刊论文、专利文献、
按照要求检索索引数据 库
返回相关记录
• 以网页链接形式提供 • 通过链接指向用户所需
网页
2 搜索引擎的分类
按信息内容组织方式划分
Web Directory Keyword search
人工参与,主题目录 engine
数据有限,专指性强 Yahoo!Directory
无人工控制,由系统完 成
source: /article/search-ranking-factors
3 搜索引擎的选择与评价
SEOMOZ(2009)的调查结果
•前5位的负面影响因素为: •恶意隐藏作弊(68%,非常非 常重要) •从链接中介购买链接(56%, 非常重要) •指向搜索引擎作弊的站点或网 页的链接(51%,比较重要的服务器故障或站点无法 访问(51%,比较重要)
1.2 工作原理
网页采集
网站拥有者主动向搜索 引擎提交网址
蜘蛛(Spider)扫描 网站的所有网页并将相 关信息存入数据库
预处理
关键词的提取 重复网页或转载网页
的消除 链接分析 网页重要程度的计算
用户输入检索式 提交检索要求
搜索引擎提供查询
接受用户提交的查询请 求
intitle、allintitle、site等。的结果处理 检索结果排序规则
通过超链接分析技术、词频统计和竞价排名相 结合的方式对网页进行相关度评价。
每词检索提示
4.2 Google( )
谷歌:/ 1998年9月由斯坦福大学博士生 Larry
Page ,Sergey Brin创立
全球使用最广泛的搜索引擎 获得30多项奖项,如Outstanding Search
Service,Best News Search Engine,Best Image Search Engine,Best Design,Most Webmaster Friendly Search Engine
谷歌的首页-简洁明快
谷歌的高级检索页面
对多个检 索字段进 行限定
Google的结果处理
排序规则:按相关性排序。
相关性的评判以网页评级为基础,在全面 考察检索词的频率、位置、网页内容(以 及该网页所链接的内容)的基础上,评定 该网页与用户需求的匹配程度,并确定排 序优先级。
将独创的网页评级系统(PageRank)作为 网络搜索的基础
2 搜索引擎的分类
按功能划分
独立搜索引擎
具有独立的数 一次检索多个数据库
有的提供结果去重等功 能
通常不具有独立的数据 库
提供多个搜索引擎的统 一检索界面
Metacrawler
独立搜索引擎与元搜索引 擎的集成,如万维搜索
特色功能:
显示被引用信息:揭示文献之间的引用与被引用关系
显示图书馆链接,用户可搜索参加这一计划的图书馆 馆藏资源目录,查看可供访问的资源链接,国家图书 馆等多家图书馆参与了该项计划
使用偏好设置:用户可以对界面语言、搜索语言、图 书馆链接、结果显示数量和方式以及文献管理软件等 项目进行个性化定制
Google的结果处理
每条检索结果显示标题、摘要、网址、网 页大小,有的还提供“cached(网页快照 )”、“similar pages(相关网页)”、 “note this(标记该网页)”以及网页翻 译等链接
提示可能存在安全风险的网站
自动对关键词的相关词进行分析并给出相 关链接,提供”百宝箱“功能
第三章 搜索引擎
Outline
搜索引擎概念(定义、工作原理、特征) 搜索引擎的分类 搜索引擎的选择与评价 常用综合性搜索引擎 常用学术搜索引擎 使用搜索引擎要注意的问题 跟踪搜索引擎的变化
1 搜索引擎概述
你最常用的搜索引擎 有哪些?
你认为搜索引擎是什 么?
1.1 概念
预印本 覆盖各个学科:农业、天文、生物、化学、计算机、经
济、工程、数学、医学、社会学等 与图书馆合作推出“图书馆链接”功能
Scirus的检索功能
布尔逻辑检索、精确检索和字段限制检索 检索途径:篇名、作者、期刊名称等 高级检索:可设置信息发布时间、信息类
型、文件格式、信息来源、学科领域等多 个选项
3 搜索引擎的选择与评价
SEOMOZ(2009)的调查结果
•最重要的5个影响因素为: •关注关键词锚文本的外部链接 (73%,非常非常重要) •链接所在页面的热门程度( 71%,非常非常重要) •链接资源的多样性(67%,非 常非常重要) •标题标签中关键词的使用( 66%,非常重要) •链接域名的可信度(66%,非 常重要)
数据量大,更新及时
Open Direc范围划分
综合性搜索引擎
涵盖各学科 涉及生活的各领域 Google Yahoo! Bing 专业性搜索引擎
特定的功能 特定的学科 特定的用户 特定的信息类型 特定的地域 Lawcrawler,Sciseek Askjeeves for kids IP search
4 综合性搜索引擎选介
国 >搜搜(3.1%)>搜狗(2.4%) >雅虎(1.6%)
source:CNNIC. 2009年中国搜索引擎用户行为研究报告 (2009年9月) ./img/h000/h11/attach2 00911241026520.doc
因素? 谈一谈搜索引擎发展的趋势
检索练习
请通过某一综合性搜索引擎,分别找出1个你感 兴趣问题的PDF文件与PPT文件,并从中挑选最 符合你要求的一条记录。
分为14个大类,每个大类又分小类
检索结果处理:按相关度排序
实现网页、图片、博客、视频等资源的整 合检索
显示人物关系
提问:
还有哪些常用的综合性搜索引擎?
以”信息检索“为关键词,分别使用、谷 歌、雅虎中国进行搜索,并分析其异同点
5 中外文学eb上应用的软件系统 以一定的策略在Web上搜集、发现和组织信息 使用者的角度:提供一个网页界面供用户输入词
语或者短语,系统将返回一个可能和用户输入内 容相关的信息列表
Source: 李晓明,闫宏飞,王继民著.搜索引擎——原理、技术与系统. 北京:科学出版社,2005:2
1.2工作原理
source: /article/search-ranking-factors
3 搜索引擎的选择与评价
收录范围 分类 检索功能与效果 检索结果的处理方式 页面组织 其他功能与服务
4 综合性搜索引擎选介
全球主要搜索引擎份额(2009.7) Google(67.5%)新动态
讨论:通过哪些途径可以更好地了解搜索 引擎发展的最新动态?
搜索引擎主页的介绍与帮助页面 搜索引擎的集合与评价站点
• 中文搜索引擎指南 • 搜索引擎跟踪 • 搜索引擎列表
思考题
什么是搜索引擎?请谈谈其工作原理。 搜索引擎有哪些种类?各有什么特点? 对搜索引擎进行选择与评价主要考虑哪些
Google的结果处理
4.3 Yahoo!( )
雅虎中国: 1994年4月由杨致远和David Filo创立
最早的目录式搜索引擎之一 提供两种检索方式
关键词检索 分类目录浏览和检索
分类目录(/dir )
万维搜索 初级检索界面:独立搜索引擎 支持关键词检索
万维搜索 高级检索界面:元搜索引擎 集合了多个独立搜索引擎 结果可以按照多种方式排序

搜索引擎优化网站(SEOMOZ)通过SEO 领域多位世界级专家的调查,发布两年一 度的搜索引擎排名影响因素调查结果。
相关文档
最新文档