中国知网的数据采集攻略

合集下载

中国知网文献快速检索方法.doc

中国知网文献快速检索方法.doc
3、没有账户的用户请自己申请创建个人账户,创建账户时,请老师注明部门和真实姓名。请学生注明班级和真实姓名。(请查看中国知网个人用户创建方法)
4、读者必须正确安装中国知网的阅读软件才能正常打开文章,请注意。
如:点击存盘按钮,会弹出如下页面,用户可以选择直接打开或者保存、取消
如:点击文章题名,会弹出如下界面
期刊界面和博硕界面略有不同,用户可以直接点击下载,整本下载、分页等方式
说明
1、适用于校园网内用户和校园网外漫游账户。
2、漫游账户全校总计50个,名额已经分配到各个部门,如紧急需要,请联系(黄老师),做临时调配.不可能长期开通漫游。不足之处请原谅.
中国ห้องสมุดไป่ตู้网文献快速检索方法
第一步:进去中国知网首页;在地址栏中输入:。
(如下图上方紫色矩形区域)
第二步:点击主页面上的链接:学术文献总库.(如上图中间紫色矩形区域)
第三步:进入文献总库页面,点击右上角“登陆”,用自己的账户登陆(紫色区域)
第四步:进入用户登陆界面,输入账号密码登陆。
(提示,没有注册个人账户的用户请先在中国知网首页创建自己的账户)
第五步:登陆成功,会在页面右上角显示个人账户,我的个人馆
第六步:登陆页面中间有各种检索方式,请选择合适的方式检索,下面以标准检索为例:
(如:在标准检索界面中,检索主题为“图书馆”的文献,输入检索词,点击“检索文献”,会在下方显示出具体检索篇目、内容。如下图)
第七步:点击序号前方的存盘按钮直接保存文献,或者点击题目查看更详细信息

知网文献检索的方法步骤

知网文献检索的方法步骤

进行工作、学习与研究,少不了要出于不同目的进行文献检索。

它只是信息检索中的一种,就像使用“baidu”等检索工具进行信息搜索一样。

与这些公开检索工具所不同的是,大量的文献检索工具都是有不同等级权限要求的,即对公众开放的程度不同,权限不同,收取费用也就不同。

不同文献检索资料有各自的特点,但均是大同小异,我们在此以国内影响最大的清华同方所有的中国知网为例,作一简要介绍。

第一步:进入“中国知网”主页,网址是“”第二步:进行登录。

有两种情况:(1)需要登录的。

如果是集体包户网,就用单位提供的用户名和密码;如果是个人用户,就用自己的用户名和密码进行登录。

(2)不需要登录的。

如西安电大所购买03-04年的资料,就是利用网址链接的,只需要按学校提供的“图书馆——EBOOK——清华同方‘学术期刊数据’”就可以进入了。

根据情况不同,后续操作会有一些不同,我们先讲利用登录方式进行的情况。

登录界面请点击以下文本,文本的左上角就是登录填写处:中国知网.rar (点击打开查看)第三步:登录成功后会进入操作界面,见:中国知网1.rar(点击打开查看)第四步:选择你要检索的文献数据库。

在操作界面上,中国知网将其文献分成了不同的库,我们根据自己的文献范围属性进行选择。

当然,我们可以全部选择,但是选择越多的数据库类别,系统在检索时,肯定会多一点时间的,不过,如果网络通信较好的话,等的时间不很长,可能就几秒时间。

我们建议大家根据自己的特点,进行个性化选择。

对库别的说明:操作界面的分类,有两个维度:其一是按文献出处的载体形式分了报纸、博士论文、期刊等等;其二是按文献的领域分了教育、建筑、医卫等等。

一般地,选择时,将主流的载体选中,如期刊,再将自己要检索的文献的领域选中。

第五步:检索参数设置。

在操作界面的上部,有搜索参数设置对话框。

我们最好逐一填写。

(1)检索项,系统对文献进行了检索编码,每一个文献都有一一对应的编码,一个编码就是一种检索项。

中国知网CNKI的检索与使用技巧

中国知网CNKI的检索与使用技巧
中国知网/CNKI的检索 与使用技巧
中国知网/CNKI
中国知网,是国家知识基础设施(National Knowledge Infrastructure,简称NKI)的概念,由世界银行于1998年提出 。CNKI工程是以实现全社会知识资源传播共享与增值利用为目 标的信息化建设项目,由清华大学、清华同方发起,始建于 1999年6月。 通过与期刊界、出版界及各内容提供商达成合作,中国知 网已经发展成为集期刊杂志、博士论文、硕士论文、会议论文 、报纸、工具书、年鉴、专利、标准、国学、海外文献资源为 一体的、具体国际领先水平的网络出版平台。中心网站的日更 新文献量达5万篇以上。基于海量的内容资源地增值服务平台, 任何人、任何机构都可以在中国知网建立自己个人数字图书馆 ,定制自己需要的内容。越来越多的读者将中国知网作为日常 工作和学习的平台。
2
3
知识检索 文献搜索:精确完整的搜索结果、独具特色的文献排序与聚类 翻译助手:文献、术语中英互译的好帮手,词汇句子段落应有 尽有。 专业主题:168个专业主题数字图书馆,各领域学者均有属于 自己的专业知识搜索引擎大众热点特色热点话题, 帮助了解大众关心的热点知识。 学术资源:全面的学术资源网站导航 学术统计分析:对学术文献进行绩效评价及统计分析
注:试用时间为:20资源总库 提供CNKI源数据库、外文类、工业类、农业类、医药卫生类 经济类和教育类多种数据库。其中综合性数据库为中国期刊全 文数据库、中国博士学位论文数据库、中国优秀硕士学位论文 全文数据库、中国重要报纸全文数据库和中国重要会议文论全 文数据库。 数字出版平台 数字出版平台提供学科专业数字图书馆和行业图书馆。个 性化服务平台由个人数字图书馆、机构数字图书馆、数字化学 习平台等。
账号为学号 密码默认0000

中国知网(CNKI)检索方法

中国知网(CNKI)检索方法

2021/4/9
34
2021/4/9
35
4.作者检索
2021/4/9
36
5.句子检索
通过用户输入的两个关键词,查找同时 包含这两个词的句子。由于句子中包含了大 量的事实信息,通过检索句子可以为用户提 供有关事实的问题的答案。
2021/4/9
37
2021/4/9
结果看出,这两个症状可能是由颈椎病、高血压等疾病
8

2021/4/9
9
文献资源统一导航
2021/4/9
统一检索平台
总库文献出版报表
10
跨库检索
2021/4/9
11
2021/4/9
12
来源数据库 结果排序
2021/4/9
13
选择“被引频次”对结果进行排序:
2021/4/9
14
中国期刊全文数据库
目前世界上最大的连续动态更新的中国期刊全文 数据库,收录国内8200多种重要期刊1994年至今的 文摘索引和全文信息,以学术、技术、政策指导、高 等科普及教育类为主,同时收录部分基础教育、大众 科普、大众文化和文艺作品类刊物,内容覆盖自然科 学、工程技术、农业、哲学、医学、人文社会科学等 各个领域,全文文献总量2200多万篇。 产品分为十 大专辑:理工A、理工B、理工C、农业、医药卫生、 文史哲、政治军事与法律、教育与社会科学综合、电 子技术与信息科学、经济与管理。十专辑下分为168 个专题和近3600个子栏目。
2021/4/9
16

2021/4/9
17
学术期刊库
2021/4/9
18
2021/4/9
19
检索体系
标准检索 快速检索 专业检索 作者发文检索 科研基金检索 句子检索 期刊检索

CNKI检索技巧

CNKI检索技巧

CNKI数据库使用方法一、简单检索点击检索方式选择区的“简单检索”按钮,进入简单检索界面。

简单检索提供了类似搜索引擎的检索方式,检索者只需要输入所要找的检索词,点击“简单检索”进行检索,就可查到与检索词相关的文献。

二、标准检索点击检索方式选择区的“标准检索”按钮,进入标准检索界面。

系统提供了检索范围与文献内容特征两部分的检索控制,另外通过分类导航区与数据库选择区的内容选择,能够精确地检索到相关文献。

(一)检索范围控制条件该部分可对发表时间、文献来源、国家及各级科研项目、作者四部分进行限定与选择。

所有检索框在未输入关键词时默认为该检索项不进行限定,即如果所有检索框不填写时进行检索,将检出库中的全部文献。

1、发表时间提供了具体时间、最近一周、一月、半年、一年选项,能够精确地对时间范围进行限定;具体时间输入可通过日历表进行选择,将光标移至输入框时,系统自动弹出日历表。

2、文献出版来源就是指在检索中限定文献的来源范围、出版媒体、机构或提供单位等。

可直接在检索框中输入出版媒体、机构的名称关键词,也可以点击检索框后的“文献来源列表”按钮,跳转至“文献出版来源”检索界面进行检索,在检索结果中选择文献来源输入检索框中。

此项限定功能提供了精确与模糊检索。

3、国家及各级科研项目就是指在检索中可限定文献的支持基金,可直接在检索框中输入基金名称的关键词,也可以点击检索框后的“基金列表”按钮,跳转至“科研基金检索”界面进行检索,在检索结果中选择基金输入检索框中。

此项限定功能提供了精确与模糊检索。

4、发文作者控制就是指在检索中可限定文献的作者与作者单位。

可通过点击“+”图标增加多个作者与作者单位(最多可增加至4个),扩大检索范围,提高查准率。

此项限定功能提供了精确与模糊检索以及逻辑运算(并且、或者、不含)选项。

(二)文献内容特征部分提供了基于文献的内容特征的检索项:全文、篇名、主题、关键词、中图分类号。

可通过点击“+”图标增加多个条件(最多可增加至4项),提高查准率。

通过图书馆知网获取某一专题文献资料的步骤

通过图书馆知网获取某一专题文献资料的步骤

通过图书馆知网获取某一专题文献资料的步骤把“以《通过图书馆知网获取某一专题文献资料的步骤》为标题,写一篇3000字的中文文章”这一提示告诉我们,本文将专注于介绍如何通过图书馆知网获取某一专题文献资料的步骤。

知网(China National Knowledge Infrastructure,CNKI)是国家信息中心推出的一项大型社会学科资源整合服务,为用户提供检索、浏览和下载中文与外文资源的综合性知识服务平台。

了解如何使用知网获取某一专题文献资料是很有必要的。

首先,要使用知网获取相关资料,必须先去注册知网账号,这是第一步。

第二步,打开知网官网,点击顶部的“检索”,输入你想要查找的专题词。

如果你想搜索更加精细的信息,可以使用知网提供的高级检索,可以根据不同的搜索条件设置,更精确地搜索所需的信息。

第三步,根据搜索结果,打开你想要查看的文献,并在文献页面点击“全文下载”,这有可能是付费下载,而且不同文献具体付费标准也不一样。

第四步,完成付费后,便可以开始阅读或下载文献,这样就可以从知网获得某一专题文献资料了。

总而言之,从知网获取某一专题文献资料的步骤主要有以下几点:建立知网账号,访问知网官网,使用知网提供的检索工具搜索希望获取的文献,根据搜索结果选择所需的文献,支付费用,开始阅读或下载文献。

此外,你还可以根据你的实际需求,从知网中获取你所需的资料,可以据你的实际需求,设置搜索条件,找到更加精确而细节化的资料,这样就可以获得更加详细、准确的文献资料,以达到你的期望效果。

以上就是从图书馆知网获取某一专题文献资料的一般步骤,知网可以提供很多有价值的文献资料,希望大家可以积极使用,提升自身学习效率。

通过上述介绍,大家对从知网获取某一专题文献资料的步骤已经有所了解,希望能够帮到大家。

CNKI《中国期刊全文数据库》使用指南

CNKI《中国期刊全文数据库》使用指南

CNKI《中国期刊全文数据库》使用指南一、简介CNKI即 China National Knowledge Infrastructure简称,意为中国知识基础设施。

CNKI数据库包括以下内容:中国期刊全文数据库、中国期刊全文数据库题录库、中国优秀博硕士论文全文数据库等。

我馆目前可使用的数据库为中国期刊全文数据库。

中国期刊网全文库是目前世界上最大的连续动态更新的期刊全文库,收录1994年至今的5300余种核心与专业特色期刊全文,累积全文600多万篇,题录600多万条。

分为理工A(数理科学)、理工B(化学化工能源与材料)、理工C(工业技术)、农业、医药卫生、文史哲、经济政治与法律、教育与社会科学综合、电子技术与信息科学9大专辑,126个专题数据库,网上数据每日更新。

二、中国期刊网全文库的使用方法1、入口:直接输入http://172.16.102.113/kns50/或由学院图书馆主页的“电子资源”栏目下链接《中国学术期刊网》,进入《中国期刊网》镜像主页,系统以默认用户名“cnki”自动登录。

见下图:2、选择数据库:由于我们学院目前只有全文数据库,所以选定全文数据库直接跨库检索或者进入全文数据库的单库检索界面,如下图所示,在界面的左边,是导航选区,在界面的右面是检索区。

3、检索条件:选择检索项,输入检索词,词频及扩展内容根据所要查询的内容选择合适的导航分类及选项,可以更快地精确命中记录。

选择完导航选项后,开始输入基本的检索条件信息,检索信息界面如下图所示:1)选择检索项。

点击检索项的下拉列表框,选择按哪一个字段(篇名,关键词,作者,机构等字段名)来检索。

2)输入检索词。

在文本框中输入您所需的检索词。

例如:计算机3)输入词频。

在词频的文本框里,输入检索词在检索到结果里的文章中要出现的次数。

4)扩展检索词。

点击扩展按钮,弹出与检索词“计算机”相关的交叉相关词的扩展选框(如下图所示),选择你想要扩展的内容确定即可。

知网检索步骤及报告

知网检索步骤及报告

“中国知网“的4种检索途径:高级检索、专业检索、作者发文检索、句子检索。

高级检索基本流程:●进入高级检索主界面●选择检索项(主题、篇名、关键词、摘要等)●选择十个学科领域●限制词频,选择逻辑关系●输入检索词●选择精确或模糊匹配●输入时间范围●结果排序●检索●检索结果(题录、文摘、全文)专业检索基本流程:➢进入专业检索主界面➢选择十个学科领域➢输入检索式➢选择时间范围➢结果排序➢检索结果作者发文检索;◆进入作者发文检索主界面◆选择十个学科领域◆填写作者姓名和时间范围◆结果排序◆检索结果句子检索;⏹进入句子发文检索主界面⏹选择十个学科领域⏹选择同一句或同一段⏹输入在同一句或同一段中要共同出现的词⏹结果排序⏹检索结果文献检索检索报告学院:专业:学号:姓名:一、检索课题:中文:查化学气相沉积有关氮化碳薄膜的文献中文检索词:化学气相沉积,氮化碳薄膜二、检索系统(或数据库)中文:《中国知网》三、查找文献(如果检索结果少于五条,全部列出,多于五条,列出其中五条即可)数据库:《中国知网》检索式:SU=化学气相沉积*氮化碳薄膜发表时间:不限结果排序方式:被引检索结果,共69条:[1]陈光华,吴现成,贺德衍.氮化碳薄膜的结构与特性[J].无机材料学报,2001,16(2): 377-380.[2]马志斌.氮化碳晶体的研究进展[J].新型碳材料,2006, 21(3): 277-284.[3]宋银,侯明东,王志光,赵志明,段敬来.氮化碳薄膜的制备及研究现状[J].高压物理学报,2003, 17(4): 311-318.[4]于威,王淑芳,任国斌,李晓苇,张连水,傅广生.等离子体增强化学气相沉积氮化碳薄膜过程中的光学发射谱研究[J].光谱学与光谱分析,2002, 22(1): 79-82.[5]于威,王淑芳,丁学成,韩理,刘志强,张连水,傅广生.直流辉光放电等离子体增强化学气相法制备金刚石及氮化碳薄膜[J].河北大学学报(自然科学版),2000, 20(1): 78-82.。

中国知网查找文献使用方法

中国知网查找文献使用方法

中央级、北京市、天津市、上海市、河北省、山西省、江苏省、浙江省 中国生产力发展研究报告、中国物价年鉴、中国市场统计年鉴、中国城市年鉴、中国企业并购年鉴、中国知识产 地方分类 权年鉴、重要经济贸易法规资料选编、北京经济普查年鉴、北京市房地产年鉴、北京科技年鉴、天津财政年鉴、 2115种 天津市对外经济贸易年鉴、天津统计年鉴、河北经济年鉴、河北金融年鉴、浙江统计年鉴
产品体系
产品名称 专业技术类
《中国学术期刊网络出版总库》(CAJD) 《中国博士学位论文全文数据库》(重要会议论文全文数据库》(CPCD) 《中国重要报纸全文数据库》(CCND)
产品名称 经营管理类
《哈佛商业评论数据库》 《中国经济信息文献总库》
能源服务平台
《煤炭科技生产信息服务平台》 《电力科技创新服务平台》
科技信息类
《国家标准全文数据库》 《中国行业标准全文数据库》 《国内外标准数据库》 (SCSD、SOSD) 《中国专利数据库》 (CSPD) 《国家科技成果数据库》 (SNAD)
个性化知识管理系列软件
《CNKI机构数字图书馆》 《CNKI个人数字图书馆》 SDIP自建库整合发布服务系统 K-Spider网络信息资源采集系统 TPI信息资源建设与管理系统
一、为什么进行知识管理 二、数据库的特点 三、数据库内容介绍
四、科技信息检索方法 五、CAJ找到别人千方百计想隐 藏起来的一些内容,严格来说这些搜索引 擎提供的检索结果仅仅是信息而已,并不 是知识。 • 但是,检索“策略”“方法”存在着 共性,并不会轻易随着内容的变化而改变。
国家科技成果数据库
• 《国家科技成果数据库》 1978年以来所有正式 登记的中国科技成果 • 按行业、成果级别、学科领域分类; • 每条成果包括成果概念、立项情况、评价情况、 知识产权状况及成果应用情况、成果完成单位情 况、成果完成人情况、单位信息等完整的基本信 息; • 与国家科技成果管理项目组(中国化工信息中心) 共建共享,内容权威、准确。

CNKI系列数据库

CNKI系列数据库
建立在web服务基础上的信息资源共享平台知识传播和数字化学 习平台 • 学术定义搜索 • 学术趋势搜索 • 翻译助手搜索 • 工具书搜索 • 数字搜索
学术定义搜索
• 学术定义搜索也称为概念知识元库,不同于一般的网页搜索新完善的知识元数据库词典。
精确短 语 检索
知网节
• 知网节以一篇文献作为其节点文献,构成一个知识网络,知识网 络的内容包括节点文献的题录摘要和相关文献链接。 • 这些扩展信息通过概念相关、事实相关等方法揭示知识之间的关 系,达到知识扩展的目的,有助于新知识的学习和发现。 • 知网节的基本信息:完成了文献检索的基本功能
相关文献链接
CNKI系列数据库
文献检索方法与技巧
计算机检索过程
中国知网CNKI简介
• • • • • • • • • “中国知识基础设施工程” (CNKI:China National KnowledgeInfrastructure) 由清华大学发起,清华同方知网技术产业集团承担建设; 学科范围:涵盖了自然科学与工程、人文与社会科学的全学科领域; 文献类型:期刊论文、博硕士论文、工具书 、会议论文、报纸等; 以实现全社会知识信息资源传播共享与增值利用为目标; 该项目的重要成果是CNKI系列数据库资源; “中国知网”() 是CNKI系列数据库的出版网站和信息服务网站。
主题=题名+关键词+摘要
• B、二次检索 在前一次检索的结果中进行另一概念的检索
所有文章 经过一次检索后 所有文章
2
在上一次检索的结果的范 围内,进行再次检索
词组检索
通常用“”或{}来表示两词是作为一个词组来检索的。如“profit and loss”将查找…profit and loss… 否则将出现……profit……loss…… 或者…… loss ………… profit 常用在搜索引擎和外文数据库中

2.中国知网的使用方法

2.中国知网的使用方法
在选择数据库栏下点击相应的数据库,即可进入该数据库的单库检索页面,点击旁边的“简介”按钮,可以查看对该数据库的介绍。这里选择“中国期刊全文数据库”,点击进入中国期刊全文数据库(下图)。
1)检索控制项
首先看检索控制项。
单库检索提供以下13个检索控制项:逻辑检索行、逻辑组合、词频、最近词、扩展词、词间关系、起止年份、数据更新、期刊范围、匹配、排序、每页、中英文扩展。
①单库快速检索
单库快速检索是系统提供的一种便捷功能。在任何检索页面上,用户只需要在检索页面点击“检索”按钮,就可检索出当前数据库中的全部文献数据。单库快速检索有助于用户快速了解数据库文献收录情况,以便判断该数据库能否满足检索需求。
②单库初级检索
在CNKI主页点击数据库名称或在其他检索方式的检索界面下点击页面右上方的“初级检索”按钮即可进入初级检索界面,我们现在所在的就是初级检索界面。初级检索是一种简单检索,只需要选择检索项,输入一个检索词,点击“检索”按钮即可获得结果。本系统所设初级检索还具有逻辑组合检索的功能,逻辑组合检索可选择多个检索项,通过点击“逻辑”下方的 增加逻辑检索行,并为每个检索项输入一个检索词;每一检索项之间可使用并且(逻辑与)、或者(逻辑或)、不包含(逻辑非)进行各项检索词的组合。
⑿每页
检索结果页面所要显示的记录条数,提供5种指供选择:10、20、30、40、50.
⒀中英文扩展
中英文扩展是由所输入的中文检索词,自动扩展检索相应检索项中英文语词的一项检索控制功能。前提条件是检索项中同时以中英文两种文字形式提供内容。仅在选择“匹配”中的“精确”时,“中英文扩展”功能才可使用。
2)检索方式:
全部期刊:库中收录的全部期刊;
EI来源期刊:库中收录的期刊中被EI(The Engineering Index,工程索引)收录的期刊;

中国知网系列数据库使用技巧

中国知网系列数据库使用技巧
息进行全、专、快、新的发现;
“采购难”——国内的外文资源订购渠道分散,完整的版权保障与 灵活多变的订购方案和价格难以兼顾; “应用难”——各外文数据库与同类中外文产品之间难以共用、互 补,缺乏统一的查询和使用平台;同时,外文产品的用户需求跟踪、 技术服务、产品培训等售后工作无法达到高满意度;
标准检索:内容控制条件
在检索框中输入一个关键词后,点击检索框后的扩展按钮,系统会推 全文:在文献的全部文字信息中检索。 荐中心词为该关键词的一组扩展词。例如:输入“信息”后点击此按 对于内容检索项,输入检索词后,可勾选“中英文扩展检索”功能,系统 钮弹出如下页面: 可控制该检索项的关键词的匹配方式。按精确匹配或者模糊匹配。 题名:文献名称,包括书名、刊名、篇名等。 可控制该检索词在检索项中出现的次数要大于等于选择的次数,得到检索 将自动使用该检索词对应的中文扩展词和英文扩展词进行检索,帮助用户 结果。 主题:在题名、关键词、摘要三个字段检索。 精确匹配:输入关键词进行查询,查询结果是精确包含这一词串的结果。 查找更多更全的中英文文献。 模糊匹配:输入关键词进行查询,查询结果可能包含这一词串和其中的切 可选择的范围为:2、3、4、5、6、7、8、9、20、50、100。 关键词:从论文的题名、提要和正文中选取出来的,是对表述论文 分词。 的中心内容有实质意义的词汇。 中图分类号:采用《中国图书馆分类法》对文献进行主题分析,并依 照文献内容的学科属性和特征,分门别类地组织文献,所获取的分类 代号。 在其中选择一个感兴趣的词,点击确定,可将其添加到检索框中。
• 让不同来源的学术资源实现统一存储、馆藏、检索和使用 • 基于互联网搜索技术和数据库出版模式,形成对学术资源的专业搜索 引擎
基于题录摘要数据的版权合作,实现规范的数字出版

中国知网CNKI系列全文数据库使用说明

中国知网CNKI系列全文数据库使用说明

中国知网CNKI系列全文数据库使用说明(一)访问方式:江海职业技术学院对中国知网主站的访问时包库访问,校园网用户可以直接免费访问。

(二)注意事项:一、我院购买的是该数据库的包库使用权,并发用户数的限制为20。

如果用户数满将无法进行检索,请稍后再试。

建议使用者避开使用高峰期(下午和晚上),查询完毕,请点击“退出”按钮退出系统,以方便其他用户使用。

二、全文采用CAJ格式和PDF格式阅读,CAJ格式必须用CAJ Viewer阅读,而PDF 格式可以用Acrobat Reader和CAJ Viewer阅读。

所以推荐读者使用CAJ Viewer。

请在中国知网(/)主页点击“常用软件下载”下载并安装阅读器。

“CAJ全文浏览器”已更新多版本,如果版本太旧,打开全文时可能会出现乱码等现象,请关注并下载安装最新版“CAJ全文浏览器”软件。

三、数据库使用年限为2010年整年,数据库用户名/密码为sy jhzy/syjhzy。

并发用户数:20(注意:在线用户数超过20时,就只能检索而无法下载全文;当在线用户数在20的基础上超过一定的数目时,数据库就无法登录,并提示“对不起,最大登陆数已满,请稍后再试”。

)(三)数据库简介:《中国学术期刊网络出版总库》简称CAJD(China Academic Journal Network Publishing Database),是中国知识基础设施简称 CNKI 工程的重要组成部分,是目前世界上最大的连续动态跟新的中国学术期刊全文数据库,收录了国内7000多种学术期刊,内容覆盖自然科学、工程技术、农业、哲学、医学、人文社会科学等各个领域,全文文献总量2200多万篇。

总库共分为8个专业文献总库(基础科学、工程科技Ⅰ、工程科技Ⅱ、哲学与人文科学、社会科学Ⅰ、社会科学Ⅱ、信息科技和经济与管理科学),168个专题数据库。

收录年限从1915年至今。

CNKI中心网站及数据库交换服务中心每日更新,各镜像站点通过互联网或者卫星传送数据可实现每日更新,专辑光盘每月更新。

中国知网CNKI的检索与使用技巧

中国知网CNKI的检索与使用技巧

中国知网CNKI的检索与使用技巧
中国知网(CNKI)是一个面向全球提供学术资源和知识服务的综合性
高端平台。

它是中国高等教育出版社旗下的一家在线数据库,提供包括期刊、学位论文、会议论文、报纸文章等多种学术资源的检索与获取。

中国知网作为一个重要的学术数据库,提供了大量的学术资源,对于
进行学术研究、论文撰写以及获取学术信息都非常有帮助。

下面将介绍一
些中国知网的检索与使用技巧,以便更好地利用它进行学术研究。

1.精确检索词:在进行检索时,使用精确的检索词可以提高结果的精
确性。

可以使用具体的关键词或者词组进行检索,尽量避免使用泛泛的词汇。

2.使用逻辑运算符:中国知网支持使用逻辑运算符进行检索。

常用的
逻辑运算符有与(AND)、或(OR)、非(NOT)。

使用逻辑运算符可以更
精确地定位所需要的资源。

4.使用专业分类:中国知网的资源被分为不同的专业分类,如文史哲、工程技术、社会科学等,可以根据自己的需要选择相应的分类来进行检索。

这样可以更快地找到相关领域的学术资源。

5.使用检索历史:中国知网提供了检索历史功能,可以记录用户之前
的检索记录,方便用户查找之前的检索内容。

检索历史可以帮助用户对自
己的研究过程进行回顾和总结。

中国知网检索方法cnki

中国知网检索方法cnki

2.下载全文浏览器
点击进入
在下载中心可以分别下载 CAJViewer浏览器
或AdobeReader工具
中国知网使用方法 3.选择检索方式检索
点击进入跨库检索
中国知网使用方法 3.选择检索方式检索
• 跨库检索功能:在中国学术文献网络出版总库页面,通过 构造一个检索表达式,一次即可同时检出多个数据库的多 种类型文献,比如期刊论文,会议论文、学位论文、科技 成果、报纸、标准、专利、年鉴、专著等等。
筛选出吉大的影响力大的文章:被引125次
点击可看这些引证文献
点击查看吉大影 响力最大的文章
中国知网使用方法 4.浏览分析检索结果
例三:某作者发文情况检索结果:119篇
可按分组方式筛选文献,此处省略
可按不同排序方式筛选文献
筛选出该作者影响力大的文章: 被引132次
单击可看这些引证文献 单击浏览 这些文章
水资源
关于水资源的相关 知识与参考(1)
关于水资源的相关 知识与参考(2)
关于水资源的相关 知识与参考(3)
关于水资源的相关 知识与参考(4)
污水处理设施 检索结果(1)
中国知网更多功能 3. 创建个人数字图书馆
填写相关注册信息
个人数字图书馆创建成功 1/3 注册时所选的关注学科与每日推送的文献
中国知网更多功能 1. 学科专业数字图书馆
• 《中国学术文献网络出版总库》收录的所有文献, 均按《中国图书分类法》分成168个学科数字图书 馆和3000多个子专业数字图书馆,各学科专业数 字图书馆均是该学科专业的学术文献总库。
• 读者根据自己的研究领域,选择进入某学科专业 领域的数字图书馆,既可纵览本学科全部文献内 容,又可涉猎本学科的相关领域。各馆可向您一 目了然地详细揭示本学科及其边缘和交叉学科的 重要研究成果、进展与动态,并可使您了解、掌 握重要项目和相关研究人员与机构的研究历史和 最新动向。

知网五种检索途径基本流程

知网五种检索途径基本流程

知网五种检索途径基本流程The process of searching for information on CNKI involves five different methods, each with its own unique characteristics and benefits. These methods include subject retrieval, document retrieval, author retrieval, citation retrieval, and knowledge mapping retrieval. Each of these options allows users to access specific types of information and find relevant resources for their research needs.在知网上检索信息的过程包括五种不同方法,每种方法都有其独特的特点和优势。

这些方法包括主题检索、文献检索、作者检索、引文检索和知识图谱检索。

每种选项都可以让用户访问特定类型的信息,找到符合他们研究需求的相关资源。

Subject retrieval is a useful tool for narrowing down search results based on specific topics or subjects. By entering keywords related to a particular area of interest, users can quickly locate relevant information and access articles, papers, and other resources that are focused on that subject. This method is particularly helpful for researchers who need to find resources within a specific field or discipline.主题检索是一个有用的工具,可以根据特定主题或学科来缩小搜索结果范围。

Python爬取中国知网文献、参考文献、引证文献

Python爬取中国知网文献、参考文献、引证文献

Python爬取中国知⽹⽂献、参考⽂献、引证⽂献前两天⽼师派了个活,让下载知⽹上根据⾼级搜索得到的来源⽂献的参考⽂献及引证⽂献数据,⽹上找了⼀些相关博客,感觉都不太合适,因此特此记录,希望对需要的⼈有帮助。

切⼊正题,先说这次需求,⾼级搜索,根据中图分类号,年份,来源类别条件共检索得到5000多条⽂献信息。

需求⼀:获取这5000多篇⽂献的基本信息需求⼆:获取这5000多篇⽂献的参考⽂献信息需求三:获取这5000多篇⽂献的引证⽂献信息这⼏个需要其实也⽐较明确,下⾯⼏张图是本次需求涉及到的⼏个页⾯。

⾸先看⼀下需求⼀,在知⽹中的⾼级检索输⼊检索条件,获取检索出来的⽂献信息。

通过点击检索按钮,发现浏览器检索框内的url并未发⽣变化,因此采取第⼆种⽅式,打开开发者⼯具->network,点击检索按钮,发现浏览器发送了两次请求,第⼀次是根据检索条件发送了⼀次post请求,返回⼀些参数,第⼆次携带参数再次发送请求获取数据。

通过点击翻页按钮,可以找出变化的url信息,通过观察,发现两个重要的参数:curpage和RecordsPerPage,分别代表当前页和每页数据个数,最⼤个数为50,我们可以采取两次请求的⽅式,但显然⼀次检索的话直接复制浏览器中第⼀次请求返回的参数就可以了,只需模拟第⼆次请求。

另外重要的⼀点就是,请求的时候需要携带cookie信息,否则也⽆法返回正确的数据。

分析完成,可以开始写代码了。

def download_search_page(self):headers = {'Accept': 'text/html,application/xhtml+xml,application/xml;q=0.9,image/webp,image/apng,*/*;q=0.8,application/signed-exchange;v=b3','Accept-Encoding': 'gzip, deflate, br','Accept-Language': 'zh-CN,zh;q=0.9','Cache-Control': 'max-age=0','Connection': 'keep-alive','Cookie': 'Ecp_ClientId=2200630175601165678; cnkiUserKey=d6737e43-6a79-d00c-9a04-a03c2c11ee30; Ecp_IpLoginFail=200701183.202.194.16; _SessionId=edraumuckd12e2nqz3tywjsk; SID_kns=123113; SID_klogin=125141 'Host': '','Upgrade-Insecure-Requests': '1','User-Agent': 'Mozilla/5.0 (Windows NT 6.3; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/73.0.3683.75 Safari/537.36'}page = 70while page < 104:try:url = f"https:///kns/brief/brief.aspx?curpage={page}&RecordsPerPage=50&QueryID=2&ID=&turnpage=1&tpagemode=L&dbPrefix=CJFQ&Fields=&DisplayMode=listmode&PageName=ASP.brief_result_aspx&isinEn=2&response = requests.get(url, headers=headers)with open(f'{self.search_html_dir}/{page}.html', mode='w', encoding='utf-8') as f:f.write(response.text)print(f'{page} 下载完成')if self.get_file_size(f"{self.search_html_dir}/{page}.html") < 50:raise Exception("cookie失效")page += 1except Exception as e:print(f'{page}下载失败\t正在睡眠请耐⼼等待', )time.sleep(30)def parse_search_article_info(self):for file in os.listdir(self.search_html_dir):file_path = os.path.join(self.search_html_dir, file)items = []try:text = self.read_html(file_path)response = HTML(text)tr_list = response.xpath('//table[@class="GridTableContent"]/tr[@bgcolor]')for tr in tr_list:item = {}item['title'] = tr.xpath('td[2]/a/text()')[0]href = tr.xpath('td[2]/a/@href')[0]params = parse_qs(urlparse(href).query)dbcode = params['DbCode'][0]dbname = params['dbname'][0]filename = params['filename'][0]item['filename'] = filenameitem['article_url'] = f'https:///KCMS/detail/detail.aspx?dbcode={dbcode}&dbname={dbname}&filename={filename}'item['authors'] = '; '.join(tr.xpath('td[@class="author_flag"]/a/text()'))item['journal'] = tr.xpath('td[@class="cjfdyxyz"]/a/text()')[0].strip()item['publish_time'] = tr.xpath('td[5]/text()')[0].strip().split()[0]try:item['cited_num'] = tr.xpath('td[6]/span[@class="KnowledgeNetcont"]/a/text()')[0]except IndexError:item['cited_num'] = 0try:item['download_num'] = tr.xpath('td[7]/span[@class="downloadCount"]/a/text()')[0]except IndexError:item['download_num'] = 0items.append(item)df = DataFrame(data=items)df.set_index(keys='filename', inplace=True)df.to_sql("paper_info", con=self.conn, if_exists='append')print(f'{file_path}\t解析完成')except Exception as e:print(f'{file_path}\t插⼊失败')traceback.print_exc()下载和解析⾼级检索⽂献信息 另外,这些信息还不够全⾯,⽐如关键词,摘要这些还需要通过详情页⾯获取,我们可以通过第⼀次获取的⽂章url来得到其他信息。

中国知网CNKI文献检索和使用技巧ppt课件

中国知网CNKI文献检索和使用技巧ppt课件

简单检索
标准检索能进行快速方便的查询,适用于 不熟悉多条件组合查询的用户,该查询的 特点是方便快捷,效率高,但查询结果有 很大的冗余。
如果在检索结果中进行二次检索则可以大 大提高查准率。
高级检索
利用高级检索系统能进行快速有效的组合查 询,优点是查询结果冗余少,命中率高。对 于命中率要求较高的查询, 建议使用该检索 系统。
单击文章名打开该 篇文章的知网节
打开CAJ格式全文
知网节
知网节——推
知网节分为“单库知网节”和“跨库知网 节”,单库知网节只能链接到同一库内的 相关文献,跨库知网节实现多库相关文献 的各种超链接。
实现各种知识链接:知网节目前支持的扩 展信息包括知识元链接、参考文献、引证 文献、相似文献、读者推荐文献、作者与 机构的链接以及分类导航等。
深入研究的
行业领域的
前沿问题
最新动向
连续出版的
博硕
会议
特定主题的
专题文献 期刊
报纸 最新报道
CNKI知识资源总库
工具书
学习研究的
最佳参考
统计年鉴
年度更新的 原始资料
二 CNKI文献检索方法
2.1数据库检索 2.2数据库导航 2.3CAJ浏览器功能与下载
2.1 数据库检索
登陆数据库 简单检索 高级检索 检索结果处理
高级检索中包含着三种逻辑运算符, 不同的 表示方法为:
中文:并且 或者 不包含
英文:and or
ห้องสมุดไป่ตู้not
符号: * +
-
例如查询:
A 并且 B:查询结果中既有A也有B A 或者 B:查询结果中或有A,或有B,或
同时有A和B A 不包含B:查询结果中有A但不包含B
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

通过对知网数据的采集和分析,集搜客数据分析实验室得到两篇分析文章。

第一篇文章是《学生群体关于大数据毕业论文发展趋势——以中国知网为例》学生群体在研究大数据时都在研究些什么呢?集搜客数据分析实验室对此展开调研分析。

第二篇文章是《毕业论文写什么,集搜客告诉你——微博数据挖掘篇》采集了2010年至2015年11月有关微博数据挖掘的相关论文并对其进行分析,总结了微博数据挖掘论文的九大研究方向供学子们的选题做参考。

知网数据采集攻略
在中国知网通过高级检索,输入关键词后抓取相关文章的标题、作者、摘要、关键词等信息。

但是中国知网在输入关键词搜索后网址并不会发生变化,所以在抓取的时候我们需要爬虫自动输入目标关键词搜索后,开始抓取数据。

要抓取到标题、作者、摘要、关键词等信息,我们一共需要做四个规则:
第一个规则“知网_搜索”负责输入关键词并搜索;
第二个规则“知网_搜索结果”用来抓取第一个规则“知网_搜索”输入关键词后搜索到的数据,抓取的是每篇文章详情页的链接,作为第三个规则“知网_文章数据_更多”的线索,但是第二级规则直接抓取下来的链接不能像层级抓取那样直接给第三个规则使用,需要使用Excel统一修改一下链接参数才能作为第三个规则的线索,下文会为大家提供具体操作方式;
Tips:有些文章的摘要需要点击“更多”才能显示全部,为了抓取完整的摘要我们需要做一个规则来点击这个“更多”.
第三个规则“知网_文章数据_更多”负责模拟点击展开完整摘要。

第四个规则“知网_文章数据”抓取点击“更多”后的文章摘要、标题、作者、关键词等信息。

图1
一、第一个规则——知网_搜索
1.以中国知网高级检索文献文章为例,将文献高级检索的链接:
/kns/brief/result.aspx?dbPrefix=scdb&
action=scdbsearch&db_opt=SCDB 粘贴到谋数台中。

第一个规则的主要工作是为了搜索关键词,但是为了规则有效执行,在一个规则中我们抓取文章类型,在这里以文献为例我们抓取的内容就是“文献”并且勾上关键内容。

图2
如图2所示,具体操作如下:
#1.将目标抓取网页粘贴到谋数台网址栏处,并回车。

#2.看到网页加载完成。

#3.将抓取内容“文献”映射到整理箱中。

#4.将文献勾选关键内容。

2.跳转到连续动作工作台输入关键词及其动作
自动输入关键词的要点是要建立两条步骤,第一条步骤通过输入框的定位表达式来找到输入框后输入关键词。

第二条步骤则是通过定位表达式找到搜索按钮然后爬虫自行点击按钮。

2.1建立输入步骤
图3
如图3所示,具体操作如下:
#1.输入目标主题名也就是第二个规则主题名,表示搜索关键词后由第二个规则来执行抓取
#2.点击谁在用查看输入的主题名是否有被别人占用,如果被别人已经占用则需要更换别的主题名。

#3.新建一条输入步骤,上文已经提到首先是进行输入动作,所以这里是新建一条输入步骤。

#4.输入要搜索的关键词。

#5.根据网页结构填写输入框的定位表达式也就是能够在网页上定位到输入框的XPath表达式,写好一个表达式后,可以利用MS谋数台的搜索功能,验证一下是否定位准确,具体参看搜索网页内容的使用方法。

2.2建立提交步骤
gong
图4
如图4所示,具体操作如下:
#1.根据网页结构填写检索的定位表达式也就是能够在网页上定位到输入框的XPath表达式,写好一个表达式后,可以利用MS谋数台的搜索功能,验证一下是否定位准确,具体参看搜索网页内容的使用方法。

存规则后知网_搜索这个规则就完成了。

二、第二个规则——知网_搜索结果
这个规则负责来抓取由知网_搜索进行关键词搜索后的页面,该规则和定义普通规则操作相同。

将要抓取的内容映射到整理箱中,我们要抓取每篇文章的详细数据摘要作者等,则需建立层级抓取,在当前规则抓取每篇文章的详细数据页面的网址来为知网_文章数据生成线索。

图5
如图5所示,具体操作如下:
#1.将要抓取的下级链接映射到整理箱中
#2.勾关键内容
#3.点击整理箱顶节点做样例复制,要抓取当前页面所有文章的下级链接就需要做样例复制,详细参看教程:样例复制
#4.跳转到爬虫路线工作台做翻页线索,要抓取翻页后的文章就要做翻页线索,详细参看教程:翻页抓取
存规则后知网_搜索结果规则就完成了,接下来就需要做文章详细页面的抓取规则。

三、第三个规则——知网_文章数据_更多
1.将网页上的“更多”按钮做内容映射映射到整理箱中,并勾选关键内容。

2.在爬虫路线工作台做模拟点击,即为将“更多”作为记号做一条记号线索。

图6
如图6所示,具体操作如下:
#1.新建一条记号线索,并勾选连贯抓取,表示在执行抓取任务时,爬虫可以在同一个DS打数机窗口内抓取完当前页面后直接跳转到下一个页面进行抓取。

#2.点击“更多”按钮,自动定位到网页标签节点,展开节点,找到包含“更多”的text节点。

#3.右击text节点,线索映射→记号线索,可以看到“更多”自动填入到记号值。

#4.将节点做线索范围映射,右击翻页区块节点,选择线索映射→定位→线索1。

完成后定位编号会显示翻页区块节点的定位编号。

存规则后知网_文章数据_更多规则就完成了,接下来就需要做点完“更多”知网来执行抓取的规则——知网_文章数据。

Tips:第三个、第四个规则演示的就是模拟点击,如果有不明白的同学可以参看教程:模拟点击
四、第四个规则——知网_文章数据。

这个规则是最简单的类型,将需要抓取的内容映射到整理箱中即可。

图7
如图7所示,具体操作如下:
#1.将要抓取的内容做内容映射到整理箱中。

五、修改文章详细页面网址参数,构造出新的网址,为第三个规则——知网_文章数据_更多生成线索
将第二个规则采集到的详情页链接导入excel。

图8
可以发现不是完整的网址,DS打数机也无法构造网址直接生成可访问的网址,所以需要用excel手动修改。

对比详情页的完整网址,如下所示:
/KCMS/detail/detail.aspx?QueryID=2&CurRec=1&recid= &filename=GGYY201410012&dbname=CJFDLAST2015&dbcode=CJFQ&pr=&urlid=&yx =&v=MTY1NDFyQ1VSTCtlWnVkc0Z5emhXcnJBSWlyU2Q3RzRIOVhOcjQ5RVpvUjhlWDFMd XhZUzdEaDFUM3FUcldNMUY=
可以发现采集到的链接少了前面的域名,并多了“/kns”这部分,可用函数修改链接,
图9
在单元格J2输入公式="/KCMS"&RIGHT(I2,LEN(I2)-4)得到可访问的网址,并往下填充,这样得到的网址就可以批量添加作为第三个规则的线索。

相关文档
最新文档