中文信息检索
信息检索 第3章 中文主要信息资源检索系统
![信息检索 第3章 中文主要信息资源检索系统](https://img.taocdn.com/s3/m/756b32ce0c22590102029d7c.png)
轻工 纺织
建筑 建材
环境 《环境科学文摘》
《馆目:环境污染与保护》
《汽车文摘》 《公路运输文摘》 《水陆运输文摘》 《造船文摘》 《中目:船舶工程》 《外目:造船工程》 交通 《中目:公路、水陆运输》 《铁道文摘》 运输 《中目:铁路》 《专利文献通报:汽车 》 《专利文献通报:包装、搬运、储存》 《外目:航空与航天》 《航空发动机文摘》 航天 《馆目:交通运输、航空航天》
WEB版(网上包库)、镜像站版、光盘版、流量计费。
四川农业大学图馆网站简介
◆
点击
各种类型的电子文献资源: 中外文期刊、图书及特种文献
读者查询 点击:
四、中国期刊全文数据库信息检索
1. 登录检索系统
鼠标接触
点击: 外网或本地镜像
CNKI中国知识资源总库
点击
选择单一数据库 或选择多个数据库进行跨 库检索
《电工文摘》 《中目:电力电工、原子能》 水利 《外目:电力》 《中目:水利水电》 电力 《外目:水利水电》 《中文电子科学文摘》 《电子科技文摘》 电子 《中国无线电电子科技文摘》 《计算机应用文摘》 学 《国外电子科学文摘》 《专科文献通报:电子技术》 《馆目:无线电电子学与自动化技术》
计算 《专利文献通报:计算机和信息存储》 机 《计算机应用文摘》 《中国纺织文摘》 《纺织文摘》 《皮革文摘》 《造纸文摘》 《中目:轻工、纺织》 《外目:轻工业》 《外目:粮油食品》 《外目:制糖工业》 《馆目:轻工、纺织》 《专利文献通报:纺织》 《专利文献通报:生活日用》 《专利文献通报:造纸、印刷、装帧》 《建筑机械文摘》 《中目:建筑工程》 《中目:建筑材料》 《外目:建筑材料》 《外目:建筑水利工程》 《馆目:建筑水利工程》 《城市文献通报》
常用的中文信息检索系统
![常用的中文信息检索系统](https://img.taocdn.com/s3/m/9a1c3ba3541810a6f524ccbff121dd36a32dc40d.png)
学术搜索
谷歌学术搜索是专门为学术研究人员提供的 搜索服务,能够方便地查找学术文献。
必应搜索引擎
微软旗下
必应是微软公司推出的搜索引擎,与 Windows操作系统深度集成。
搜索技术
必应的搜索技术也非常先进,能够提 供高质量的搜索结果和快速的响应速 度。
多元化服务
除了网页搜索外,必应还提供图片、 视频、新闻、学术等多元化搜索服务。
移动端信息检索的优化与创新
移动设备特性
移动设备屏幕尺寸有限、计 算能力相对较弱,需要针对 这些特性对信息检索系统进 行优化。
ቤተ መጻሕፍቲ ባይዱ
语音搜索
利用语音识别技术,用户可 以通过语音输入查询请求, 提高移动设备上信息检索的 便捷性。
位置感知服务
结合移动设备的定位功能, 可以提供基于位置的信息检 索服务,如附近的餐厅、景 点等。
概率模型
03
基于概率统计的检索模型,通过计算文档与查询相关的概率来
排序文档。
中文分词技术
基于词典的分词方法
利用预先构建的词典,将待分词的文本与词典中的词条进行匹配, 实现分词。
基于统计的分词方法
利用机器学习等统计方法,对待分词的文本进行建模,通过训练得 到分词模型。
基于深度学习的分词方法
利用神经网络等深度学习技术,对大量文本进行训练,得到分词模 型。
对于某些非通用语言,相关语料库和训练 数据相对匮乏,制约了跨语言信息检索技 术的发展。
机器翻译技术
多语言嵌入表示
随着机器翻译技术的不断进步,可以将不 同语言的文档翻译成同一种语言,便于进 行统一的信息检索和处理。
通过学习多语言的嵌入表示,可以实现不 同语言之间的语义对齐和匹配,为跨语言 信息检索提供有力支持。
中文期刊信息检索
![中文期刊信息检索](https://img.taocdn.com/s3/m/4c25871e52d380eb62946d59.png)
中国博士学位论文全文数据库 收录了全国404家博士培养单位的博士学位论文,其中380 家单位是由CNKI独家收录的。截至2012年10月,累计学位论文 全文文献18万篇 中国优秀硕士学位论文全文数据库 收录了全国621家硕士培养单位1984年至今的优秀硕士论 文,其中508家为独家授权单位。截至2012年10月,累计收录 论文全文文献150多万篇。
中国重要会议论文全文数据库 重点收录1999年以来,中国科协、社科联系统及 省级以上的学会、协会、高校、科研机构、政府机关 等举办的重要会议上发表的文献。部分重要会议论文 回溯至1953年。截至2012年10月,累计会议论文140 多万篇。 中国重要报纸全文数据库 收录了2000年以来中国国内重要报纸刊载的学术 性、资料性的文献,累计报纸全文文献1000多万篇。
快速检索
高级检索
刊名检索
字母顺序检索
学科分类检索
推荐—中国国家图书馆之维普 不受IP限制,可以下载全文
/
①注册并登陆
②进入数据库
③检索并下载
实名认证读者馆外下载限额 调整为每人每日10篇
PA R T
其他中文电子期刊库
4
其他中文电子期刊库
读秀——期刊频道 全国报刊索引(未购买)
如果需要进一步鉴定,可登陆中国新闻出版总署的政 府网站——扫黄打非网 或者登 陆中国知网“中国期刊全文数据库”校对
核心期刊
某学科(或某领域)的核心期刊,是指那些发表 该学科(或该领域)论文较多、使用率(含被引率、 摘转率和流通率)较高、学术影响较大的期刊。 国内7大核心期刊遴选体系
文献检索实验报告(一)中文数据库信息检索实验
![文献检索实验报告(一)中文数据库信息检索实验](https://img.taocdn.com/s3/m/6ca5733e376baf1ffc4fad75.png)
文献检索实验报告(一)实验名称中文数据库信息检索实验姓名实验日期学号专业班级实验地点指导老师评分一.实验目的:1.熟悉与专业有关的中文数据库信息检索系统的基本情况;2.熟悉相应中文数据库信息检索系统的浏览器使用;3.掌握常用中文数据库信息检索系统的检索方法以及检索结果的处理;4.掌握提高查全率和查准率的方法。
二.实验环境:连接到因特网的实验室局域网环境,并能通过学院图书馆入口访问以下数据库系统:1.万方数据资源系统2.维普信息资源系统3.中国知网数据库4.人大《复印报刊资料全文数据库》5.超星数字图书馆6.试用数据库三.实验要求:先选检索课题:1.分析课题主题,写出课题所属领域、背景、拟解决的技术问题、采用的技术方案等相关技术内容。
(限200字左右)2.给出中外文检索词(包括主题词、关键词、同义词、缩写及全称等,限15个以上)及检索式,按要求检索数据库,写出检索过程,并按题录形式选择给出相关文献2-3篇。
3.中文数据库4种类型8个库:任选两个馆藏目录、联合目录、中文期刊数据库、事实与数值数据库进行检索。
4.外文数据库2个:5.学位论文库2个:万方学位论文库、中国知网。
6.会议论文库2个:万方学术会议库、中国知网。
7.标准、专利、注:结果页面截图:(用键盘Pr Scrn SysRq键截图,要求显示检索条件窗口)四.实验内容:1.从图书馆网站上安装CNKI阅览器和PDF格式全文阅览器。
从CNKI(即中国期刊网)的“进入总库平台”中的“中国学术期刊网络出版总库”检索2005年出版、EI来源期刊、篇名中包含“信息管理”的文献,任意下载一篇检索出的论文,分别下载CAJ格式和PDF格式,体验两种阅览器的各自功能。
2.利用中国知网的“中国博士学位论文全文数据库”检索,文献题名中包含“机群”的华中科技大学的博士学位论文。
记录结果数,并记录其中一篇的论文题名、作者、导师姓名及学科专业名称。
3.利用读秀的“报纸全文数据库”检索今年内关于“亚太经合组织”的新闻报道,共有记录多少条,记录时间最新一篇的新闻标题、刊登报纸、报纸日期、版号、分类号。
基于搜索引擎的网络中文信息检索工具评价
![基于搜索引擎的网络中文信息检索工具评价](https://img.taocdn.com/s3/m/5b94c491c67da26925c52cc58bd63186bceb92d3.png)
基于搜索引擎的网络中文信息检索工具评价搜索引擎是我们日常生活中经常用到的网络工具,它是一种能够从海量信息中快速检索出用户想要的内容的软件系统。
当我们在搜索引擎中输入关键词进行搜索时,搜索引擎就会根据搜索算法对网络上的信息进行匹配和排序,最终呈现出来的搜索结果就是用户所需的信息。
而基于搜索引擎的网络中文信息检索工具,就是一种利用搜索引擎的搜索算法开发的中文信息检索工具。
这种工具可以帮助用户从海量的网络中文信息中快速、准确地检索出自己需要的信息。
基于搜索引擎的网络中文信息检索工具具有以下优点:首先,它能够快速地检索出用户需要的信息。
由于搜索引擎能够将海量的网络信息进行分类、排序,因此基于搜索引擎的网络中文信息检索工具可以更加快速地从大量信息中检索出用户所需的信息,同时还能够自动为用户推荐相关内容。
其次,它可以提供准确的搜索结果。
搜索引擎本身已经具备信息过滤和自动分类的功能,因此基于搜索引擎开发的工具天生具备比较准确的搜索结果。
用户只需要输入正确的关键词,就能够快速地找到所需的信息。
再次,它具有可定制性。
基于搜索引擎的网络中文信息检索工具可以根据用户的需求进行个性化调整和优化,例如用户可以针对某个特定领域进行搜索,或者在搜索过程中加入自己的优先排序策略。
然而,基于搜索引擎的网络中文信息检索工具也存在一些缺点。
最大的缺点就是受搜索引擎本身的限制。
由于搜索引擎系统的蒸蒸日上,竞争也越来越激烈,这导致搜索引擎的广告化越来越严重,影响了信息的检索质量,因此基于搜索引擎的网络中文信息检索工具的准确性也受到一定的影响。
除此之外,基于搜索引擎的网络中文信息检索工具还存在着一些信息安全的隐患。
例如,搜索引擎会将用户的搜索历史、数据、位置信息等进行收集和汇总,这也可能暴露用户的隐私。
总的来说,基于搜索引擎的网络中文信息检索工具在大部分情况下都是十分实用的,可以帮助大家更加快速、准确地检索出所需的信息,同时还支持个性化调整和优化。
中文信息检索实习报告
![中文信息检索实习报告](https://img.taocdn.com/s3/m/49a0cd87b04e852458fb770bf78a6529647d3597.png)
中文信息检索实习报告一、实习目的和意义随着互联网的迅速发展,中文信息检索已经成为信息时代不可或缺的一项技术。
本次实习旨在让实习生了解中文信息检索的基本原理和方法,掌握相关技术和工具的使用,提高中文信息处理和检索的能力。
通过实习,我们可以更好地了解中文信息检索在实际应用中的重要性,为未来的学习和工作打下坚实的基础。
二、实习内容和过程1. 实习前的准备在实习开始前,我们首先学习了中文信息检索的基本原理和相关概念,了解了中文分词、词性标注、索引构建等基本技术。
同时,我们还学习了使用一些常用的中文信息检索工具,如搜索引擎、中文数据库等。
2. 实习过程在实习过程中,我们主要进行了两个任务:中文分词和索引构建。
(1)中文分词中文分词是将中文文本切分成有意义的词语序列的过程。
我们在实习中使用了基于规则的分词方法和基于统计的分词方法。
通过对比实验,我们发现基于统计的方法在处理大规模文本数据时具有更好的性能。
(2)索引构建索引构建是信息检索系统的核心部分,它将文本转换为可以快速检索的数据结构。
在实习中,我们学习了倒排索引的概念和构建方法。
我们使用Python编写代码,实现了倒排索引的构建和查询功能。
通过实验,我们了解到倒排索引在查询速度和准确性方面具有较好的表现。
3. 实习成果通过实习,我们成功地构建了一个简单的中文信息检索系统,可以实现对给定文本的搜索功能。
我们使用一些实际的数据进行了测试,发现该系统在处理中文文本方面具有一定的准确性和效率。
三、实习收获和体会通过本次实习,我们对中文信息检索的基本原理和技术有了更深入的了解,掌握了相关工具的使用方法。
同时,我们也意识到中文信息检索在实际应用中的重要性,以及在处理中文文本时面临的挑战。
在实习过程中,我们学会了如何将理论知识应用到实际问题中,提高了动手能力和解决问题的能力。
同时,我们也学会了如何进行团队合作,共同完成实习任务。
总之,本次实习让我们对中文信息检索有了更全面的了解,为我们未来的学习和工作打下了坚实的基础。
第4章 国内常用信息检索工具(系统)
![第4章 国内常用信息检索工具(系统)](https://img.taocdn.com/s3/m/881b64af284ac850ad0242ef.png)
4.1 文献检索-全国报刊索引
《全国报刊索引》:由上海图书馆编辑出版, 一种题录类综合性的检索工具,月刊分为:哲 学社会科学版和自然科学版两种。目前提供网 络版检索 《全国报刊索引》综合数据库从1993年开始编 辑发行 为了全面报道国内中文报刊资源,2004年起推 出了《全国报刊索引数据库-目次库》,收录 各类报刊近万种,几乎包括了国内(包括港台 地区)所有的中文报刊资源
4.2 常用系统-中文常用系统简介
这里主要介绍的是综合性检索系统
中国知网 万方数据 维普期刊 国家科技图书文献中心(外刊、外文资源)
4.2 常用系统-中国知网简介
中国知网:由清华大学、清华同方发起,始建于 1999年4月。以实现全社会知识资源传播共享与增 值利用为目标 /index.htm 经过十几年的发展,中国知网已经成为目前中国常 用的检索系统平台 它的检索功能与界面也几经更新,目前最新的知识 发现网络平台(简称KDN) /help/AssistDocument/KDN/ht ml/main.htm 知网概览:资源、导航、数字化学习研究以及个人 /机构图书馆
目前年鉴总计2000种
按行业分成二十一类行业,同时按照地方年
鉴按照区域分成34个省和区域 1949年至今 提供年鉴整刊导航
4.2 常用系统-中国知网工具书及知识元检索
除了上述常见文献及年鉴的数据库,知网还
提供工具书及知识元的检索。
4.2 常用系统-中国知网概念知识元检索
4.2 常用系统-中国知网其他服务
新版知网提供更多服务,例如数字图书馆系
4.1 文献检索-人大报刊复印资料
信息检索课件 复习精华版04 中文图书信息的检索
![信息检索课件 复习精华版04 中文图书信息的检索](https://img.taocdn.com/s3/m/ba31e90abed5b9f3f90f1c30.png)
类号、主题词等全部详细项目。款目按《中国图书馆图书分
类法》分类顺序排列。该书目还有题名、著者、主题等三种 索引,均依汉语拼音顺序排列。 国家书目的特点:
收录对象:以收录一个国家出版的所有文献为基本特征。 收录范围:一般贯彻“领土—语言”原则。 著录方法:强调标准化与规范化。
十五史纪传人名索引》为代表。
揭示相应史书中三类人物的传记资料出处:有专传的、 有附传的、附见人物。 ——“专史人名索引”。以中华书局出版的与点校本单种史书 配套的人名索引为代表 。
揭示每一部史书中所有人物的所有传记资料出处。
地名索引
揭示对象主要是“二十六史”中的“地理志”。
书志索引 主要是哈佛燕京学社引得编纂处编纂的《艺文志二十 种综合引得》和《食货志十五种综合引得》。
第四章 中文图书信息的检索
第一节 图书概述 第二节 古籍图书信息的检索 第三节 近代以来图书信息的检索 第四节 阅读2.0
第一节 图书概述
一、什么是图书
二、图书的构成
三、图书的特点 四、图书的出版情况
一、图书
根据联合国教科文组织对图书的定义:凡由出版社 (商)出版的不包括封面和封底在内49页以上的印刷品, 具有特定的书名和著者名,编有国际标准书号,有定价 并取得版权保护的出版物称为图书。 “图书”一词最早出现于《史记· 萧相国世家》,刘 邦攻入咸阳时,“何独先入收秦丞相御史律令图书藏之。 沛公为汉王,以何为丞相。…汉王所以具知天下厄塞,户 口多少,强弱之处,民所疾苦者,以何具得秦图书也”。 这里的“图书”指的是地图和文书档案,它和我们今天所 说的图书是有区别。进一步探求“图书”一词的渊源,可 追溯到《周易· 上系辞》记载的“河出图、洛出书”这个 典故上来,它反映了图画和文字的密切关系。
中文期刊信息检索
![中文期刊信息检索](https://img.taocdn.com/s3/m/4c25871e52d380eb62946d59.png)
分类
• • • • 广义上:非正式期刊和正式期刊 按内容:一般期刊、学术期刊、行业期刊、检索期刊 按学术地位:核心期刊和非核心期刊 按学科:以《中国图书馆图书分类法.期刊分类表》为 代表,将期刊分为五个基本部类
期刊出版周期 根据期刊的出版周期可将期刊分为: • 旬刊:出版周期为10天; • 半月刊:出版周期为15天; • 月刊:出版周期为30天; • 双月刊:出版周期为两个月; • 季刊:出版周期为一个季度,即3个月; • 半年刊:出版周期为6个月; • 年刊:出版周期为1年。
家信息化重点工程,它于1995年正式立项,是现今世 界上全文信息量规模最大的数字图书馆。涵盖了各个 领域的知识信息资源。 CNKI系列产品提供:WEB版(网上包库)、镜像站版、
光盘版、流量计费等服务方式
更新频率:每日更新 全文浏览格式:CAJ格式和PDF格式
中国知网 CNKI
CNKI 中国学术文献网络出版总库 (本馆购买的):
如:《读者》杂志的CN为 CN62-1118/Z
地区号 顺序号 分类号
CN
省、自治区、直辖市地区号
中国标准连续出版物号
中国标准连续出版物号(GB/T 99992001)由国际标准连续出版物号和国内统一 连续出版物号两部分组成。 中国标准连续出版物号结构: ISSN ××××-×××× CN ××-××××/×× 如《读者》 ISSN 1005-1805 CN 62-1118/Z
检索结果分析阅读
检索结果下载
期刊,可以直接点绿色下载钮直接下载,CAJ格式 学位论文,建议点题名进入详细页里下载
学位论文点题名进 入详细页面下载
期刊下载
PDF/CAJ两种格式
学位论文下载
分页/分章/整本下载
2.1中文期刊检索:CNKI+维普+人大+万方
![2.1中文期刊检索:CNKI+维普+人大+万方](https://img.taocdn.com/s3/m/b31cd4e5f8c75fbfc77db209.png)
中 国 期 刊 全 文 数 据 库(CJFD)
简 介:该库是目前世界上最大的连续动态更新的中国期刊 全文数据库,收录国内8200多种重要期刊,以学术、技术、 政策指导、高等科普及教育类为主,同时收录部分基础教育、 大众科普、大众文化和文艺作品类刊物,内容覆盖自然科学、 工程技术、农业、哲学、医学、人文社会科学等各个领域, 全文文献总量2200多万篇。 专辑专题:产品分为十大专辑:理工A、理工B、理工C、 农业、医药卫生、文史哲、政治军事与法律、教育与社会科 学综合、电子技术与信息科学、经济与管理。十专辑下分为 168个专题和近3600个子栏目。 文献来源:中国国内8200多种综合期刊与专业特色期刊的 全文,数据完整性达到98%。 第二批数据库回溯年限:创刊——1993年。目前还不太完 整。
维普中文科技期刊数据库
李晋瑞 主讲 28
简介
《中文期刊数据库》创建于1989年,由国家科技部 西南信息中心重庆维普资讯公司研究开发。因为当 时 数据库主要收录科技期刊,所以命名为《中文科 技期刊数据库》。它是我国自建的第一个CD-ROM光 盘数据库。 8大专辑:社会科学、经济管理、教育科学、图书 情报、自然科学、农业科学、医药卫生、工程技术 收录1989年 以来8000余种期刊400种中文报纸, 5000种外文期刊。 该库收录自1989年以来所有的自然科学和 社会科 学期刊。目前共收录中文期刊12000余种,是国内最 大的综合性文献数据库。
专业检索
提供一个按照自己需求来组合逻辑表达式以便进行精确检索 的功能入口。 逻辑运算符:AND\OR\NOT或者用 * + -代替。 字段代码:TI=篇名;AU=作者;KY=关键词;AF=机构; AB=中文摘要;RF=引文;FU=基金;JN=中文刊名; SN=ISSN号;TO=主题词;TS=篇名/关键词/摘要.
中文信息检索工具
![中文信息检索工具](https://img.taocdn.com/s3/m/4646fd27178884868762caaedd3383c4bb4cb4ef.png)
2024/10/11
2
综合性检索工具
《全国报刊索引》 《中国科学引文索引》 《全国总目录》 《全国新书目》
2024/10/11
3
《全国报刊索引》
《全国报刊索引》是报道全国主要报刊资料旳综合性 题录式检索刊物。1951年创刊,原名《全国主要期刊 主要资料索引》,1980年开始分为“哲学社会科学版” ,“自然科学技术版”两分册出版(其中科技版刊号为 ISSN1005-670X/CN31-1126/N)。它是我国连续出 版时间最长、搜集报刊最多、最全旳题录型检索工具.
2024/10/11
14
《自动化仪表中文文件文摘》
1984年创刊,双月刊,由重庆工业自动化仪表 研究所编旳。
《环境科学文摘》
1984年创刊,月刊,中国环境科学研究院情 报所编辑,报道国内外有关环境方面旳各类文 件。
2024/10/11
15
《中国生物学文摘》
月刊,由中国科学院文件情报中心,中国科学院上 海文件情报中心和中国科学院生物文件情报网主办 ,1987年创刊。是国家科委同意旳国家一级检索期 刊。该刊报道旳是我国生物科学领域旳研究成果与 进展,收录范围涉及我国科技人员(涉及港台学者 ),在国内公开刊登旳有关生物学方面旳期刊论文 、专著、会议录及在国外刊登旳论著,选题结合我 国科研、生产、教学旳实际,并选择能开阔生物科 学专业人员思绪旳,带启迪性旳有关科技文件。
2024/10/11
8
《中国化工文摘》报道旳内容遍及与化学化工有 关旳各个领域,也涉及:化工机械设备及仪器仪 表自动化、化工经济管理,化工设计、施工、安 装、能源化工、材料科学等与化工有关领域。经 过它能够了解全国化工技术旳新动向及化工新产 品、新成果。
《中国化工文摘》除月刊外,每年还有年度主题 索引和年度著者索引两册。该刊旳文摘基本是按 《中国图书资料分类法》旳类号顺序排列,在大 类编排上采用化工(TQ类)在前,其后是化学( O6类),三废处理(X类),在每一期前面有文 摘编排目录,不了解分类号旳可经过目录检索。
第四章_中文文献信息检索
![第四章_中文文献信息检索](https://img.taocdn.com/s3/m/bf6827afdd3383c4bb4cd209.png)
(7)OPAC书目数据库系统
• OPAC(Online Public Access Catalogue)即联
机公共检索目录,是供图书馆用户查询馆藏的联机 目录检索系统。 • 检索字段说明 • 题名--包括正题名、并列题名、从属题名、其它题 名、丛书名等等。责任者—即文献的编者、著者、 译者、撰者、校注者等。既包括个人责任者,也包 括团体责任者,出版者--是指文献的出版或印刷机 构。分类号--文献的学科属性标识。如:红楼梦, 分类号为I242.47。 • 查询古籍文献时,在“分类号”中输入部和类,中 间加间隔号“·”,例如“经部· 易类”,在检索时所 有“经部· 易类”的古籍或“易类”下各细类的古籍, 都为符合条件的书目信息。具体参见“中文古籍分 类简表”。
数据库检索
•
键入网址, 登录到CALIS联机公共数据库查询系统主页, 选择中文、英文或 日文联合目录数据库。 检索方式 高级查询界面: a.在第一个列单中选择检索字段:包括题名、著者、丛编题名、主题、 订购号、ISBN、ISSN等或在所有字段里进行全面检索。 b.确定检索词的匹配模式:选择开头为表示前方一致,选择结尾为表示 与检索词后方一致, 选择包含表示检索词出现在检索字段的任意位臵,严格 等于表示与检索词精确匹配,模糊匹配是指与检索词基本相同但不完全等于 的一种匹配方式。 c.在输入框里输入检索词。 d.如果要进行多个检索条件的复合检索,根据检索条件的逻辑关系,在第 四个选择框里选择并且、或者、非 e.点击查询按纽。 高级查询可以从更多选项进行进一步限制。 a.限定资料类型: • b.限定语言: • c.限定出版年 • 显示结果 点击想要查看的记录,系统显示详细书目信息,并显示CALIS院校的馆藏信 息。
• ISBN—International Standard Book Number国
中文信息检索的挑战和机遇在哪里
![中文信息检索的挑战和机遇在哪里](https://img.taocdn.com/s3/m/cb22963224c52cc58bd63186bceb19e8b8f6eceb.png)
中文信息检索的挑战和机遇在哪里在当今信息爆炸的时代,中文信息检索成为了人们获取所需知识和信息的重要手段。
然而,随着信息量的不断增长和用户需求的日益多样化,中文信息检索面临着诸多挑战,但同时也蕴含着巨大的机遇。
中文信息检索所面临的挑战是多方面的。
首先,中文语言的复杂性就是一个显著的难题。
中文有着丰富的词汇、多样的语法结构以及大量的同音字、多音字和形近字,这使得中文文本的理解和处理变得相当困难。
例如,“意思”这个词在不同的语境中可能有完全不同的含义,“这篇文章的意思很明确”和“你真有意思”中的“意思”就截然不同。
其次,中文信息的语义理解存在很大的挑战。
与英文等语言相比,中文的语序和虚词的使用在很大程度上影响着语义的表达,但这种影响往往较为微妙和复杂,难以通过简单的规则和算法来准确把握。
比如,“中国队大胜美国队”和“中国队大败美国队”,虽然表述不同,但意思却是一样的。
再者,信息的海量和冗余也是中文信息检索的一大障碍。
互联网上充斥着大量重复、相似甚至错误的中文信息,如何从这些繁杂的信息中准确筛选出有价值、高质量的内容,对于信息检索系统来说是一个艰巨的任务。
另外,用户需求的模糊性和不确定性也给中文信息检索带来了困扰。
很多时候,用户自己可能都不太清楚自己真正想要的是什么,他们的搜索表述可能不够准确、全面,这就要求检索系统能够具备一定的智能理解和推测能力。
然而,挑战往往与机遇并存。
在面对这些挑战的过程中,中文信息检索也迎来了许多发展的机遇。
技术的不断进步为中文信息检索提供了强大的支持。
随着人工智能、机器学习、自然语言处理等技术的迅速发展,中文信息检索系统能够更加智能地理解和处理中文文本。
例如,通过深度学习算法,可以对大规模的中文语料进行训练,从而提高对中文语义的理解能力。
移动互联网的普及也为中文信息检索带来了新的机遇。
如今,人们越来越多地通过手机等移动设备进行信息检索,这就要求检索系统能够适应移动设备的特点,提供更加便捷、个性化的服务。
中文信息检索 复旦大学图书馆
![中文信息检索 复旦大学图书馆](https://img.taocdn.com/s3/m/708466f6aeaad1f346933f6a.png)
如:舌根癌
– CBM查近2年文献应结合自由词检索
2017/2/20 复旦大学图书馆文献检索教研室 31
自由词检索肾衰竭饮食疗法
输入(肾衰竭 or 肾衰 or 肾功能衰 竭) and (饮食 or 膳食 or 营养)
14
1、CBM 检索运算符
逻辑运算符:
– AND 表示逻辑“与” – OR 表示逻辑“或” – NOT 表示逻辑“非”
运算次序:NOT>AND>OR
– 如果要调整运算次序,应用括号把需要优先 运算的部分括起。 – 例:禽流感 and (防治 or 预防 or 治疗)
2017/2/20
复旦大学图书馆文献检索教研室
2017/2/20
复旦大学图书馆文献检索教研室
43
搜数
2017/2/20
复旦大学图书馆文献检索教研室
44
中资行
2017/2/20
复旦大学图书馆文献检索教研室
45
中资行
2017/2/20
复旦大学图书馆文献检索教研室
46
中资行
2017/2/20
复旦大学图书馆文献检索教研室
47
中文数据库检索小结
自由词检出结果0609年
2017/2/20
复旦大学图书馆文献检索教研室
32
(3)期刊检索
提供“分类导航”或“首字母导航”逐 级查找浏览期刊 提供用户从刊名、出版地、出版单位、 期刊主题词或者ISSN直接查找期刊 期刊表列出了数据库中收录的期刊名称 及其有关编辑部的详细信息
2017/2/20
信息检索名词解释
![信息检索名词解释](https://img.taocdn.com/s3/m/753c2e44bed5b9f3f90f1c6f.png)
1)信息检索(information retrieval) 是指将信息按一定的方式组织和存储起来,并根据信息用户的需要找出有关信息的过程。
所以,它的全称又叫信息存储与检索(information storage and retrieval), 这是广义的信息检索。
狭义的信息检索则仅指该过程的后一步,即从信息集合中找出所需要信息的过程。
相当于我们所说的信息查询(information search)。
2)零次文献:也叫灰色文献,未经公开发表或未交流于社会的文献。
如私人笔记,设计草图、实验记录、文章草稿、会议记录、书信文书、以及档案等。
其主要特点是内容新颖,但不成熟,不公开交流,难以获得。
3)一次文献(Primary Document): 以著者本人的研究或研制成果为依据而创作或撰写的文献,习惯上称做原始文献。
如期刊论文、科技报告、专利说明书、会议论文、学位论文等。
体现创作性。
其主要特点是内容新颖丰富,叙述具体详尽,参考价值大,但数量庞大、分散。
4)二次文献(Secondary Document):就是检索工具。
是将大量分散的无组织的一次文献经浓缩,整序的加工整理,编辑成目录、题录、文摘、索引等检索工具或数据库。
如文摘,目录、索引等。
它有存贮、检索、报道的功能。
体现高度的浓缩性。
其主要功能是检索、通报、控制一次文献,帮助人们在较少时间内获得较多的文献信息。
二次文献具有汇集性、工具性、综合性、交流性等特点。
5)三次文献(Tertiary Document):在一、二次文献的基础上,经过综合分析而编写出来的文献,如专题述评、动态综述、学科年度总结,进展报告以及数据手册、百科全书等参考工具书。
三次文献是情报研究的产物和成果。
具有很强的的综合性。
总之,一次文献(创造性),二次文献(有序化),三次文献(高度浓缩,提炼,再创造)。
6)以上四个级别的文献中,零次文献由于没有进入出版、发行和流通这些渠道,收集利用十分困难,一般不作为我们利用的文献类型。
文献信息检索中文检索工具书
![文献信息检索中文检索工具书](https://img.taocdn.com/s3/m/15fd2b52be23482fb4da4c2b.png)
12
结构
文献检索工具书的内容,一般有前言、凡例、正文、辅助 索引和附录五个部分构成 1.前言:也称序言或序。 2.凡例:也称例言或使用说明.
13
结构
3.正文:正文是检索工具的主体部分,是由描述文献外表特征 (题名、著者、出处等)和内容特征(分类号、主题词和文摘) 的各种具体文献条目按照一定规则组成的,是存储和检索文献 的对象,包括题录和文摘。 4.辅助索引:包括主题索引、分类索引、著者索引、机构索引、各 种号码索引及特殊途径等。 5.附录:附在检索工具后面的有关参考资料。
19
文献检索工具的编排
期刊论文著录格式: 分类号 顺序号 中文题名=外文题名 [刊,文种] / 著者 // 刊名(国别或地名) -年,卷(期).-所在页码 提要。图X表X参X (文摘员) 主题词 索取号
20
文献检索工具的编排
图书专著著录格式: 分类号 顺序号 中文书名=外文书名 卷(册、编)次:卷(册、编)的书名 [著,文种] / 著者或编者 -版本 /与版本有关的责任者.-出版地 出版者, 出版日期 -总页码;开本.-(从书项).-附注项 -文献标准书号 提要。图X表X参X (文摘员) 主题词 索取号
书刊检索工具书
《全国总书目》的发展:
建国初,由新华总店负责编纂,主要收录新华书店发行和 经销的图书,同时选录部分私营书店图书,出版了1949 – 1954年和1955年两部。 从1956年起,由中国版本图书馆负责编辑工作,文革期间 曾一度中断,1985年改为编辑部自办发行。 20世纪80年代以后,编辑更加趋于科学化、标准化、规范 化。90年代起,由于出版物增多,《全国总书目》篇幅加 大,每年以上下两册形式出版。
27
文摘:是系统著录、报道、积累和揭示文献外表特征和内容 特征的检索工具,是二次文献的核心。 其结构与内容及出版发行方式都类似于篇目索引(题录), 只是增加了论文的内容摘要。
利用中文数据库进行文献信息检索示例
![利用中文数据库进行文献信息检索示例](https://img.taocdn.com/s3/m/4ca7390f14791711cc7917cb.png)
5、简述检索策略调整的过程: 1)在 CNKI 中国期刊全文数据库中(CNKI 数据库镜像): a、为保证查全率,使用“(通风与安全)*矿井”检索运算式,检索范 围选择:所 有专辑、全文中检索,检索出记录 57443 条。 b、上述检索策略得到的检索结果 57443 条过多,考虑缩小检索范围。 改全文检索项为篇名检索。 使用“(通风与安全)*矿井”检索运算式,检索范围选择:所有专辑, 篇名中检索,检 索出记录 37 条,数量适中。 c、检索结果的满意度,可根据检索者的需要不断调整。检索字段的 选择,可单一,也可以混编,直至满意。 2)万方数据库(会议论文): a、由于“万方数据库(会议论文)”收录的文献比较单一,为保证查全率, 使用“(通风与安全)*矿井”检索运算式,检索范围选择:全字段中 检索,不限定年代,检索出记录 175 条。 b、上述检索策略得到的检索结果 175 条。考虑检索算式复杂,可简 单一些。由于本课题的主体是“通风与安全”,改用“通风与安全”单一 算式检索,检索出记录 577 条。 C、对于数据库收录的文献少、品种单一的情况,目标文献的相关度 可适当放宽,以便获得更多的参考文献。 3)维普资讯网(《中文科技期刊数据库》(全文版)):
(一)利用中文数据库进行文献信息检索示例: 1、检索课题名称:矿井通风与安全 2、课题分析:“通风与安全”属于本课题中的主体,其应用目标是“矿 井”,由此得出如下检索词(按其对课题影响程度排序): 中文关键词:1 通风与安全 2 矿井 英文关键词: (1)Ventilation and safety (2)mine 3、选择检索工具:本课题检索目标为中文各类相关文献。根据本图 书馆的资源情况选择如下数据 库: (1)CNKI 数字图书馆:中国期刊全文数据库 (2)万方数据库(会议论文) (3)超星数字图书馆(图书检索)、书生之家数字图书馆等。 4、构建检索策略:因“通风与安全”为课题的主体,应优先检索,“矿 井”应在 检索结果中同时存在。故制定如下检索策略。“()”表示优先、“*” 表示并且。 检索算法:(通风与安全)*矿井 时间范围:19992011 文献范围:期刊论文、会议论文、专著 为了保证查全率可考虑使用全文检索途径和高级检索方式。
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
浅析《红楼梦》中的“哭态”班级:10级汉语言文学(1)班姓名:胡圣凤学号:51003011028一.课题分析1.知识背景我的中文信息检索的课题名称是《浅析<红楼梦>中的“哭态”》,主要研究的是在鸿篇巨著《红楼梦》中人物的各种不同的“哭态”,以及其所体现的性格特征。
该课题的学科范畴是属于文学类。
作为一部经典巨著,《红楼梦》可谓一部百科全书,具有极高的欣赏价值和研究价值。
《红楼梦》中有言道:“满纸荒唐言,一把辛酸泪。
都云作者痴,谁解其中味?”品红楼之味,尽在这一“言”一“泪”之中。
研究《红楼梦》却忽视曹雪芹的“泪”,不可能更好地理解作家及其作品。
用“一把辛酸泪”哭成此书的曹雪芹十分重视人物“哭态”的描写,故书中人物的哭态描写,出现频繁,表现细腻,具有重要的艺术价值。
然而,相对于红学研究的其他领域,对《红楼梦》中人物“哭态”的研究少之又少,且不够系统和深入,是红学研究中尚待探讨的重要课题。
异彩纷呈的情态,是人物内心的情绪、情感的外部流露,作者以“哭态”从不同侧面、不同层次上反映了人物的性别、年龄、身份、地位和文化修养。
而读者则可从这些不同的情态中去认识、理解人物的个性,乃至对他们命运及其结局的关怀。
2.概念分析和扩展主要检索词为:《红楼梦》;哭态可以进一步拓展为:《红楼梦》;哭态;人物性格二.检索过程1.构建检索策略1).首先确定要检索的没内容,核定正确的检索词:《红楼梦》中的“哭态”。
2).输入合理的计算机检索式:《红楼梦》并含“哭态”或含人物性格3).确定本课题的学科范围是文学类学科。
4).熟知各种检索工具的特点,选择恰当的检索工具。
5).选择合适的检索途径,恰当运用检索方法。
6).检查检索结果是否符合本课题研究的需要。
7).根据需要调整检索策略,在检索中获取所需要的信息。
记录检索信息。
2.具体检索记录1).全文数据库中国知网(1)张晓娟.浅谈《红楼梦》中的“哭”.山西财经大学学报,2009,01(2)刘泽权,赵烨.《红楼梦》人物“哭态”探析.河北学刊2005,03(3)陈家生.《红楼梦》中的“哭”.泉州师范学院学报,2003,03(4)张娟娟.《红楼梦》中哭的情感表达.山西煤炭管理干部学院学报,2013,01(5)常辅相,常铁砚,王中秋.浅析《红楼梦》展现的“哭态”学术交流,1999,03万方数据库(1)肖燕立.泪雨悲风中的艺术天地—谈曹雪芹写哭.红楼梦学刊,1985,02(2)王启忠.喜哭怒骂总关性情—论《红楼梦》人物情态描写.学术交流,1986,01(3)吴明东.“欲天下人共来哭此‘情’字”—谈脂砚斋对《红楼梦》情的主题揭示.齐齐哈尔大学学报,2010,02(4)哭与笑的艺术辩证法—《红楼梦》艺术辩证法浅探.[J]赣南师范学院学报,1984,01(5)张淑媛.千红一哭,万艳同悲——从《红楼梦》中的诗歌浅析人物命运.[J]文学界,2010,05维普(1)吴宝成.隔帘消息风吹透捧心西子“泪”为魂——林黛玉之哭浅析芜湖职业技术学院学报-2009年4期(2)张国荣.千人一哭万艳同悲─—从《红楼梦》看中国人的悲剧意识.[J]广西右江民族师专学报,1998,042).图书国家图书馆:(1)俞平伯《红楼梦研究》[M]上海古籍出版社2005年(2)周邵良《红楼梦研究论集》[M]陕西人民出版社1983年3).有关核心期刊(1)韩进廉.千红一哭万艳同悲——试论“金陵十二钗”的典型意义河北大学学报1984年02期(2)金蓓蓓.析宝钗的哭红楼梦学刊1992年02期4).网络学术信息资源:(1)高小康.领悟悲剧——王国维《红楼梦评论》研究论文网(2)梁归智.《红楼梦》研究的意义——世纪之交检讨“红学”论文网(3)王蒙.《红楼梦》的研究方法—中国化的一门学问.论文网三.总结报告通过对《红楼梦》中“哭态”检索,只发现为数不多的鉴赏性研究。
研究《红楼梦》却忽视曹雪芹的“泪”,不可能更好地理解作家及其作品。
用“一把辛酸泪”哭成此书的曹雪芹十分重视人物“哭态”的描写,故书中人物的哭态描写,出现频繁,表现细腻,具有重要的艺术价值。
然而,相对于红学研究的其他领域,对《红楼梦》中人物“哭态”的研究少之又少,且不够系统和深入,是红学研究中尚待探讨的重要课题。
异彩纷呈的情态,是人物内心的情绪、情感的外部流露,曲沐从林黛玉的“葬花词”入手,对林黛玉的“哭”作了欣赏性评价,揭示了人物性格,但该研究并没有引起学人的关注。
胡文彬评析了黛玉的“哭态”,重点分析了黛玉“哭”的原因。
陈家生对《红楼梦》中人物的“哭态”作了总体比较,遗憾的是他仅仅从修辞的角度举了几个例证,泛泛地谈了曹雪芹对“哭态”描写的艺术表现技巧,未得出规律性的发现。
马云娟认为,《红楼梦》的“哭”透视了人物的爱情、亲情和友情等。
以上对《红楼梦》中人物“哭态”的研究,皆为定性分析和论述,定量数据论证很少。
《红楼梦》长达一百二十回,多达七十余万字,共描述了四百四十八个有形有肉的人物的各种“哭态”。
如果只是去图书馆通过手阅来完成对“哭态”数量的统计是很困难的,但是通过计算机网络搜索就会达到事半功倍的效果。
笑,有各种各样的表现形式。
法国学者让诺安写了一部《笑的历史》,专门研究“笑”这种情态。
哭,也是一样,情态各异,饶有滋味。
据统计,曹雪芹描写《红楼梦》中人物的“哭态”多达六百余次。
面对作者洋洋大观的“哭态”描写,如何进行分类,这是一个首要的问题。
《现代汉语分类词典》将“哭”归属于“感觉、情感”类,又细分为“哭类”、“号类”、“流泪类”和“泣类”。
“哭类”一般指“出声地哭或者大声地哭喊”,而“号类”更是大声地哭喊;“流泪类”,区别于出声地大哭,而是描绘泪流的各异情态;“泣类”,一般指“小声或无声地哭”,“抽噎”、“哽咽”、“呜咽”等词汇都属于此类,一般是指极度悲伤而致。
基于此,我们将同为“出声哭喊”的“哭类”和“号类”合并为“哭号类”,把《红楼梦》中的“哭态”归纳分类为“哭号类”、“流泪类”和“泣类”三类,并分别统计如下表:分类频数典型例证哭号类182大哭;啼哭;痛哭;干哭;号哭;哭个死去活来;哭声遥山振岳;狼嚎鬼叫;泼哭泼闹流泪类165洒泪;含泪;堕泪;落泪;抹泪;垂泪;滴泪;滚泪;潸然泪下;满面泪痕;泪如雨下;暗自垂泪;临风洒泪泣类35悲泣;掩面涕泣;自叹自泣;呜咽对泣;悲悲切切的呜咽;哽咽难言;哽咽难鸣;呜呜咽咽以上是分别以“哭”、“号”、“泪”、“泣”等关键词进行二次检索,归纳总结得出的三类“哭态”及其出现的次数。
从表中可以看出,曹雪芹用了丰富的词汇分别表达不同的哭状,在“哭号类”中多为出声或者大声地哭,甚至“哭声摇山振岳”。
作者表达“流泪”的动词千变万化,有“洒”泪、“含”泪、“堕”泪、“落”泪、“垂”泪、“滚”泪等,而流泪动词的微妙变化也使哭者伤心流泪的场面跃然纸上。
“呜呜咽咽”、“哽咽难言”等“泣类”词汇,声形并茂地描绘了哭者极度伤心的哭态。
通过对《红楼梦》中“哭态”用词的统计,我们注意到,曹雪芹描写人物“哭态”用到“哭号类”的词汇频数与“流泪类”的频数基本持平,而“泣类”的使用量微小,只有上述前两类的五分之一左右。
哭是一种情感宣泄的方式,通过这次的课题检索使我对《红楼梦》中的“哭态”有了全面的把握,更加的了解了其中人物的性格和形象。
四.心得体会通过对这次课题的检索,我发现中文信息检索这门课程并不是自己想像中的那么容易,在检索过程中总是会遇到这样或那样的问题。
比如我的检索课题是浅析《红楼梦》中的“哭态”,刚开始的时候把匹配控制设为精确,却只搜到三篇相关的结果,后来经过分析。
调整搜索策略,才使得检索成功。
信息虽然给我们提供了很多方便,但是想要熟练地使用它还是要进行认真学习的,因为我们在查找有用信息的同时还要摒弃那些无用的信息。
经过了这次课题检索,我认识到利用检索信息是要了解很多具体内容的。
要知道各个数据库都有自己的那些特点,要抓准关键词,主题,文献时间,作者信息等等。
其中关键词是最重要的,因为输入不同的关键词检索出来的文献会相差很大,关键词选正确会大大提高检索的速度和质量,因此要快速而准确地找到自己想要的文献就一定要选好关键词,所以选好关键词是使用数据库首先应该学会的。
我通过对课题的检索了解到不同的数据库具有不同的特点,在中文检索中,维普中文数据库范围要小一些,主要就是期刊;万方数据库中的论文质量都比较高,检索结果也十分详细,包括:论文题目、作者、专业、导师、单位、分类号、关键词、文摘等等;超星图书馆非常有用,很多经典的图书,在其上找到;三大索引分别为SCI、EI、ISTP,它们分别收录了国际上基础科学与应用科学领域科技期刊、工程领域期刊及会议、国际会议上发表的论文。
中国期刊网,即中国知网,它的最大特色就是可以直接获取原文,其针对性地获取全文,检索效果好,速度快。
当今时代是一个科学技术高速发展的信息时代,也是一个竞争、充满挑战的知识经济时代,大学生如何立足于信息社会,在激烈的社会竞争中处于优势地位,除了应该具有广博的人文素质、深厚的科技素质、理性的思维和创新素质、健康向上的思想政治素质和身体素质外,还必须具有一定的信息素养,这是大学生拥有高水平综合素质的基本要求,也是信息化社会的迫切要求。
所以学好信息检索这们课,对于以后走入社会都会让我们更具有实力和竞争力在黎老师的指导下学习这门课程,在提高信息意识的基础上,我培养和提高了自己的信息素养能力,提高了获取信息资源的能力,锻炼解决具体问题的能力,推进专业信息素养的能力和培养采用新型学习方式的能力。
具体到实际学习中,可以独自检索所需文献、信息和知识,受益匪浅。