信息检索概论PPT幻灯片
合集下载
相关主题
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
双月刊、季刊、半年刊等 有连续编号,如年份、卷号(Vol)、期号(No) 公开发行的期刊都有国际标准连续出版物号
(International Standard Serial Number,ISSN)
构成信息资源的基本要素
➢ 信息:组成信息资源的原料; ➢ 人:信息资源的生产者和利用者; ➢ 符号:生产信息资源的媒介和手段; ➢ 载体:存储和利用信息资源的物质形式。
就本课程而言,将信息资源等同于文献
信息资源的类型
按表达方式和载体划分 口语信息资源 讲演、授课、讨论 体语信息资源 表情、手势、姿态、表演、舞蹈 实物信息资源 样品、模型、雕塑 文献信息资源
图书的内容一般比较成熟、系统、全面。 图书的著录特征(外部特征)有:书名、作者、版次、出
版社、出版年、国际标准书号(International Standard Book Number,简称ISBN)、图书定价等。 超星电子源自文库书馆、读秀图书搜索
参考工具书,简称工具书
作为工具使用的一种特殊类型的图书 用特定的编制方法,将大量分散在原始文献中的知识、理
论、数据、图表等,用简明扼要的形式,全面、系统地组 织起来,供人们迅速查检资料线索和解决疑难问题。 类型很多,主要有字典、词典、手册、百科全书、名录 (人名录、地名录、机构名录)等。
➢ 词典:汇集各科名词和术语,进行科学的解释,作出恰当的定义。 ➢ 手册:汇集某一范围内的基本知识和数据。 ➢ 百科全书:又称大全,系统地汇集一定领域范围内的全部知识的大
优点:直观性强,易于接受,在传递信息知识方面有着不 可替代的优势。
缺点:需要借助一定的设备。
4. 电子型
采用电子手段,利用计算机及现代通信方式提供 信息的一种新型文献。
电子出版物内容丰富,类型多。
➢ 按信息存储介质划分,主要有软磁盘与光盘两大类; ➢ 按出版物类型划分,主要有电子期刊、电子图书、电子
报纸、电子名录、电子地图、各种联机信息库和光盘数 据库或磁带、软盘等产品; ➢ 按媒体的信息结构组织形式划分,主要有文本型出版物、 超文本出版物、多媒体出版物以及超媒体出版物等。
电子出版物的问世是信息时代的重要标志,极大 地提高了信息的传递速度,加速了社会信息化的 进程。
优点:信息容量大、出版周期短、易更新、方便 检索、易复制、可交互性、可共享。
知识
人类通过信息对自然界、人类社会及思维方式与 运动规律的认识与概括,是人的大脑通过思维重 新组合和系统化了的信息,是信息中最有价值的 部分。
知识来自于信息,知识是信息的一部分。 知识一经产生,就以声像信息、实物信息、文献
信息的形式加以传播。
信息资源
经人类开发与重新组织后的信息称信息资源。信 息资源是信息世界中对人类有价值的那一部分信 息,是附加了人类劳动的、可供人类利用的信息。
2. 信息的特征
可量度 可采用某种度量单位进行度量,并进行信息编码。 可识别 可采取直观识别、比较识别和间接识别等多种方式来把
握。 可转换 可以从一种形态转换为另一种形态。 可存储 人脑、人类发明的文字、摄影、录音、录像以及计算机。 可处理 人脑、计算机。 可传递 语言、表情、动作、报刊、书籍、广播、电视、电话等。 可再生 信息经过处理后,可以其他形式再生。 可压缩 可以用不同的信息量来描述同一事物。 可利用 具有一定的实效性和可利用性。 可共享 可以被多个用户共同享用。
信息
1. 信息的概念
在不同的学科领域中其概念不同
➢ 《辞海》:信息是指对消息接受者来说预先不知道的报 道。
➢ 《简明自然辩证法词典》:信息一般泛指我们听说的消 息、情报、指令、数据、信号等有关周围环境的知识。
➢ 一些专家:信息是可供人们参考的事实和思想。
可以理解为:信息是指信息资源(各种载体)中 所包含的事物事件的事实、思想或知识,即信息 载体中传递的内容,信息系统传输和处理的对象。
是传统文献的基本形式,也是目前文献的主要形式,包括 各种图书资料、连续出版物(期刊、报纸等)、学位论文、 专利、标准、会议文献、政府出版物及其复印品等。
优点:阅读方便,流传广泛,价格便宜。 缺点:信息存储密度低,占据空间较大,笨重,不易保存。
2. 缩微型
以感光材料为载体,以印刷型文献为母体,采用光学摄影 技术,将文字、图形、图像按规定比例缩小记录的文献形 式。如缩微卡片、平片、胶卷等。
型参考工具书。将搜集到的专门术语、重要名词分列条目,加以详 细的叙述和说明,并附有参考文献。综合性百科全书(如《大英百 科全书》)和专业性百科全书。
2. 连续出版物(Searial Publication)
(1)期刊(Periodical)
又名杂志(Journal或Magazine),刊名一般不变 定期出版的汇集许多个著者论文的连续出版物 出版频率较短,有周刊、旬刊、半月刊、月刊、
优点:信息存储密度高,体积小,平均可以节约存储空间 95%以上,易于传递,并且保存期较长,不易损坏和变质。
缺点:必须借助缩微阅读机阅读,不便携带。
3. 声像型
以磁性材料或感光材料为存储载体,借助特定的设备采用 磁录技术和光录技术直接记录声音信息和图像信息所形成 的文献,如录音带、录像带、唱片、幻灯片等。
缺点:阅读需要一定的设备,其长期保存问题以 及版权问题等还没有得到解决。
二、按照文献的出版形式划分
1. 图书(Book)
将文字、图画或其他符号书写或印刷于纸张上的具有完整 装帧形式的非连续出版物。图书是文献中最古老、最重要 的一类。
图书范围较广,包括专著、科普读物、教科书、丛书、文 集、工具书等。
人类用文字、数据、图像、声频、视频等方式记录在一定 载体上的信息资源。只要这些载体不损坏或消失,文献信 息资源就可以跨越时空无限循环地为人类所利用,还可以 按人类的需求整理成具有优化结构的文献信息资源体系。
本门课程研究的主体
文献信息资源的类型
一、按照载体材料、存储技术和传递方式划分
1. 印刷型
以纸张为载体,通过手写、油印、铅印、胶印、影印、静 电复印等手段,将文字固化在纸张上所形成的文献。
(International Standard Serial Number,ISSN)
构成信息资源的基本要素
➢ 信息:组成信息资源的原料; ➢ 人:信息资源的生产者和利用者; ➢ 符号:生产信息资源的媒介和手段; ➢ 载体:存储和利用信息资源的物质形式。
就本课程而言,将信息资源等同于文献
信息资源的类型
按表达方式和载体划分 口语信息资源 讲演、授课、讨论 体语信息资源 表情、手势、姿态、表演、舞蹈 实物信息资源 样品、模型、雕塑 文献信息资源
图书的内容一般比较成熟、系统、全面。 图书的著录特征(外部特征)有:书名、作者、版次、出
版社、出版年、国际标准书号(International Standard Book Number,简称ISBN)、图书定价等。 超星电子源自文库书馆、读秀图书搜索
参考工具书,简称工具书
作为工具使用的一种特殊类型的图书 用特定的编制方法,将大量分散在原始文献中的知识、理
论、数据、图表等,用简明扼要的形式,全面、系统地组 织起来,供人们迅速查检资料线索和解决疑难问题。 类型很多,主要有字典、词典、手册、百科全书、名录 (人名录、地名录、机构名录)等。
➢ 词典:汇集各科名词和术语,进行科学的解释,作出恰当的定义。 ➢ 手册:汇集某一范围内的基本知识和数据。 ➢ 百科全书:又称大全,系统地汇集一定领域范围内的全部知识的大
优点:直观性强,易于接受,在传递信息知识方面有着不 可替代的优势。
缺点:需要借助一定的设备。
4. 电子型
采用电子手段,利用计算机及现代通信方式提供 信息的一种新型文献。
电子出版物内容丰富,类型多。
➢ 按信息存储介质划分,主要有软磁盘与光盘两大类; ➢ 按出版物类型划分,主要有电子期刊、电子图书、电子
报纸、电子名录、电子地图、各种联机信息库和光盘数 据库或磁带、软盘等产品; ➢ 按媒体的信息结构组织形式划分,主要有文本型出版物、 超文本出版物、多媒体出版物以及超媒体出版物等。
电子出版物的问世是信息时代的重要标志,极大 地提高了信息的传递速度,加速了社会信息化的 进程。
优点:信息容量大、出版周期短、易更新、方便 检索、易复制、可交互性、可共享。
知识
人类通过信息对自然界、人类社会及思维方式与 运动规律的认识与概括,是人的大脑通过思维重 新组合和系统化了的信息,是信息中最有价值的 部分。
知识来自于信息,知识是信息的一部分。 知识一经产生,就以声像信息、实物信息、文献
信息的形式加以传播。
信息资源
经人类开发与重新组织后的信息称信息资源。信 息资源是信息世界中对人类有价值的那一部分信 息,是附加了人类劳动的、可供人类利用的信息。
2. 信息的特征
可量度 可采用某种度量单位进行度量,并进行信息编码。 可识别 可采取直观识别、比较识别和间接识别等多种方式来把
握。 可转换 可以从一种形态转换为另一种形态。 可存储 人脑、人类发明的文字、摄影、录音、录像以及计算机。 可处理 人脑、计算机。 可传递 语言、表情、动作、报刊、书籍、广播、电视、电话等。 可再生 信息经过处理后,可以其他形式再生。 可压缩 可以用不同的信息量来描述同一事物。 可利用 具有一定的实效性和可利用性。 可共享 可以被多个用户共同享用。
信息
1. 信息的概念
在不同的学科领域中其概念不同
➢ 《辞海》:信息是指对消息接受者来说预先不知道的报 道。
➢ 《简明自然辩证法词典》:信息一般泛指我们听说的消 息、情报、指令、数据、信号等有关周围环境的知识。
➢ 一些专家:信息是可供人们参考的事实和思想。
可以理解为:信息是指信息资源(各种载体)中 所包含的事物事件的事实、思想或知识,即信息 载体中传递的内容,信息系统传输和处理的对象。
是传统文献的基本形式,也是目前文献的主要形式,包括 各种图书资料、连续出版物(期刊、报纸等)、学位论文、 专利、标准、会议文献、政府出版物及其复印品等。
优点:阅读方便,流传广泛,价格便宜。 缺点:信息存储密度低,占据空间较大,笨重,不易保存。
2. 缩微型
以感光材料为载体,以印刷型文献为母体,采用光学摄影 技术,将文字、图形、图像按规定比例缩小记录的文献形 式。如缩微卡片、平片、胶卷等。
型参考工具书。将搜集到的专门术语、重要名词分列条目,加以详 细的叙述和说明,并附有参考文献。综合性百科全书(如《大英百 科全书》)和专业性百科全书。
2. 连续出版物(Searial Publication)
(1)期刊(Periodical)
又名杂志(Journal或Magazine),刊名一般不变 定期出版的汇集许多个著者论文的连续出版物 出版频率较短,有周刊、旬刊、半月刊、月刊、
优点:信息存储密度高,体积小,平均可以节约存储空间 95%以上,易于传递,并且保存期较长,不易损坏和变质。
缺点:必须借助缩微阅读机阅读,不便携带。
3. 声像型
以磁性材料或感光材料为存储载体,借助特定的设备采用 磁录技术和光录技术直接记录声音信息和图像信息所形成 的文献,如录音带、录像带、唱片、幻灯片等。
缺点:阅读需要一定的设备,其长期保存问题以 及版权问题等还没有得到解决。
二、按照文献的出版形式划分
1. 图书(Book)
将文字、图画或其他符号书写或印刷于纸张上的具有完整 装帧形式的非连续出版物。图书是文献中最古老、最重要 的一类。
图书范围较广,包括专著、科普读物、教科书、丛书、文 集、工具书等。
人类用文字、数据、图像、声频、视频等方式记录在一定 载体上的信息资源。只要这些载体不损坏或消失,文献信 息资源就可以跨越时空无限循环地为人类所利用,还可以 按人类的需求整理成具有优化结构的文献信息资源体系。
本门课程研究的主体
文献信息资源的类型
一、按照载体材料、存储技术和传递方式划分
1. 印刷型
以纸张为载体,通过手写、油印、铅印、胶印、影印、静 电复印等手段,将文字固化在纸张上所形成的文献。