一种学术期刊论文作者信息挖掘方法及系统

合集下载

基于Python语言的学术论文数据挖掘与分析——以医疗人工智能相关学术论文为例

基于Python语言的学术论文数据挖掘与分析——以医疗人工智能相关学术论文为例

22 新媒体研究 nmrmagz@
MEDIA TECHNOLOGY 媒体技术
关键词、基金的属性也进行拆分 ,写入相应的表进 行保存。见表 2。
表 2 机构、关键词、基金拆分表格
表名
描述t_auຫໍສະໝຸດ hor作者t_orgm
机构
t_keyword
关键词
t_fund
基金
1.6 数据统计 使用 Python 的 pymysql 模块读取 MySQL 的表 ,
据挖掘及分析 ,寻找热门选题 ,指导期刊的选题策 划。在已有的研究中 ,期刊编辑领域利用 Python 来进行数据挖掘及分析的报道较少 ,本文提出利用 Python 语言对近年来的热点话题医疗人工智能相关 的学术论文进行挖掘和分析 ,为期刊编辑从事学术 研究提供新思路。
1 研究方法
1.1 系统架构 基于 Python 3.7 的医疗人工智能相关学术论
利 用 中 国 知 网 数 据 库(https://ki. net)对医疗人工智能相关题材发文情况进行大数 据挖掘和数据分析。本文从中国知网数据库旧版入
基金项目:广东省卫生厅项目(A2020624)。 作者简介:刘焕英,广州市第一人民医院《广州医药》编辑部。
nmrmagz@ 新媒体研究 21
第 5 步 :在循环完当前检索结果页后 ,便进入 下一页 ,方法如下 :
# 循环结果集页面 for i in range(fpage,lpage):
# 当前页 if i == 1:
url =
str(driver.find_element_by_id(’Page_next’). get_attribute(’href’)).replace(’curpage= 2’,’curpage=1’)

一种论文作者重名消歧方法7篇

一种论文作者重名消歧方法7篇

一种论文作者重名消歧方法7篇第1篇示例:论文作者重名消歧是当前学术领域中一个十分重要的问题,随着学术研究的不断发展,存在着大量同名作者的情况,这给学术界的信息传播和学术评价带来了诸多困难。

同名作者可能导致学术成果无法准确归属,造成学术资源的浪费和信息的混乱,给学术界和读者带来了不便。

解决同名作者问题,进行作者重名消歧是学术界急需解决的难题之一。

为了解决同名作者问题,许多学者和研究人员投入了大量的时间和精力进行研究,提出了各种各样的作者重名消歧方法。

这些方法主要可以分为基于姓名、机构、著作、合作者等多种信息的方法。

下面将介绍一种基于多维信息的论文作者重名消歧方法。

我们可以根据作者的姓名、发表论文的机构、发表的文章内容等多维信息进行综合分析。

在进行作者重名消歧时,可以先从姓名入手,采用姓名拼音首字母、姓名缩写等方式将不同的同名作者进行区分。

然后,可以结合作者的机构信息,通过机构名称、科研领域等信息将不同作者进一步区分开来。

在这个基础上,还可以通过发表的论文数量、发表的刊物类别、发表的研究内容等信息进行分析,进一步提高作者重名消歧的准确性和效率。

可以利用合作者信息来辅助进行作者重名消歧。

由于不同作者往往有着不同的合作者,通过分析作者的合作关系,可以更加准确地将不同作者进行区分。

有些同名作者可能在学术界有着不同的合作团队,有着不同的研究方向和独特的学术贡献,通过分析合作者信息可以更好地鉴别不同作者。

通过综合考虑姓名、机构、论文内容等信息以及合作者信息,可以更全面地进行作者重名消歧,提高准确率和效率。

还可以利用其他辅助信息来进一步提高作者重名消歧的准确性。

通过分析作者的研究领域、发表的论文时间、引用网络等信息来进行判断,这些额外信息可以为作者重名消歧提供更多参考依据。

综合考虑各种信息,可以更加全面地进行作者重名消歧,避免漏判和误判的情况发生。

作者重名消歧是一个复杂而又重要的问题,需要综合考虑多种信息并采用多种方法来进行解决。

WOS数据库的检索技巧与方法

WOS数据库的检索技巧与方法

Wildcards 通配符
符号
*
$
?
意义
零个或多个字符 gene* gene, genetics, generation
零或一个字符 colo$r color, colour
只代表一个字符 en?oblast entoblast, endoblast
Search Fields 检索字段
Topic
主要内容
• SCIE 数据库检索技巧与方法 • Biosis Previews数据库的检索方法 • ISTP数据库检索技巧与方法 • SCIE 源期刊的查找方法 • JCR-期刊影响因子的检索方法
一、SCIE 数据库检索技巧与方法
• WOS 数据库简介 • WOS数据库的检索技巧 • WOS数据库的登录 • WOS数据库的检索途径
信息
例:虾类基因免疫学研究
输入检索表达式: (shrimp$ or prawn$)and immu* and gene$
Refine 精确检索
检索式 检索结果
快速锁定高影响力的论文 Sort排序功能: Times Cited被引频次
Refine - 精确检索功能 Refine - 快速检索到高影响力的综述
• 在一个检索式中出现多个运算符时,可用圆括号决 定优先顺序
• 一个检索提问式中最多可使用50个运算符
() same not and or
1.3 Web of Science数据库的登录
图书馆主页 所有数据库列表 WOS(SCI SSCI A&HCI)数据 库
• 检索功能 • 分析功能 • 管理功能
ISI Web of Knowledge
• SCIE、 SSCI、 A&HCI数据库收录9000多种

中国期刊论文数据库检索概览

中国期刊论文数据库检索概览
中文三大中文期刊库
中国知网
中国 万方-中国学位论文全文数据库 万方-会议论文全文数据库、法律法规、中国专利 数据库etc
维普资讯
维普资讯-中文科技期刊数据库
复旦大学图书馆参考咨询部
三大中文期刊库PK(1)
中国知网(CNKI) 收录年限 期刊数量 全文数量 检索项 19799114种 3230多万篇 16个:主题、篇名、关键词、 摘要、作者、第一责任人、单 位、刊名、参考文献、全文、 年、期、基金、中图分类号、 ISSN、统一刊号 每日 100 万方数据 19825053种 1343万篇 维普(VIP) 198911474种 1306万篇
初级检索、高级检索、一般检索 专业检索 Caj、pdf全文,部 分没有全文 检索词中英文拓展、 跨库检索、词频控制 期刊全文 学位论文 重要报纸资源 知网节,总库平台 Pdf全文 跨库检索
学位论文数据库 无 学术会议数据库 部分法律和专利数据库 整合了学位论文、会议 科技期刊数量多,更新 论文专利等的多库检索 速度快 平台
复旦大学图书馆参考咨询部
数据库火热试用!
美国历史文档系列数据库 RESSET金融研究数据库 CCER经济金融研究数据库 国泰安数据库 全国报刊索引数据库 World Scientific电子期刊 Euclid(欧几里得)数据库 MyiLibrary电子图书 IMF 国际货币基金组织数据库 (即将订购) 月旦法学知识库 World Bank系列数据库 (即将订购) 阿帕比电子报纸
按文献来源分组获得的情报信息: 1.发现高品质的期刊 2.帮助投稿
复旦大学图书馆参考咨询部
按来源数据库筛选
按来源数据库分组: 列出文献集合在不同资源类型之间的分 布,有期刊文献、学位论文、会议论文、 报纸文献、国家科技成果、专利、标准、 外文文献、年鉴等学术文献总库包含的 所有数据库。 这些数据库具有不同的文献出版特点和 学术情报支持作用。

科技文献信息抽取方法浅析

科技文献信息抽取方法浅析

本文系深圳市哲学社会科学“十三五”规划课题“深圳智慧图书馆联盟设计研究”(SZ2018B030)研究成果之一。

【资源·共享】科技文献信息抽取方法浅析●敖 龙 谢海先 (深圳职业技术学院 广东深圳 518055)[摘 要]文章在WebofScience等影响力较大的国际数据库中检索内容与“科技文献”和“信息抽取”相关的文献,经设定条件筛选后获得63篇相关文献。

回顾相关文献,从抽取的信息与抽取的方法两个角度进行分类与分析,总结该领域已有的研究成果和存在的不足。

从科技文献中抽取的信息主要为结构化信息、显式信息和隐式信息,最新最先进的抽取方法主要集中在机器学习、自然语言处理和统计学中。

语义信息的抽取有一定的进步空间及挑战性,灵活结合机器学习和自然语言处理方法是处理此领域问题的未来趋势。

[关键词]信息抽取 科技文献 语义信息 机器学习 自然语言处理[中图法分类号]G253 [文献标识码]A [文章编号]1003-7845(2022)02-0024-04[引用本文格式]敖 龙,谢海先.科技文献信息抽取方法浅析[J].高校图书馆工作,2022(2):24-271 引言科技文献记录了最新的科学研究进展和成果,在科研工作中发挥着至关重要的作用。

随着自然科学、技术、管理、人文、社会科学等学科研究的迅速发展,越来越多的科技文献形成了庞大的研究信息群体,提供了丰富的原始研究工作信息,是研究人员交流最新知识的载体。

学者们需要捕捉其中的重点,对它们进行有效的检索,找到相似或相关的文献并迅速获得它们的具体内容。

因此,有必要开展信息抽取工作。

信息抽取是指从特定领域的结构化和非结构化数据中提取具有特定目标、有意义的知识,它为获取科技文献中的信息内容提供了新的途径。

从科技文献中抽取信息的主要任务是对文献内容进行结构化处理,将其转化为满足用户需求并能被用户有效利用的信息。

简而言之,这是一个将各种原始科技文献转化为特定格式的、独特的信息的过程。

information sciences tex模板

information sciences tex模板

information sciences tex模板Information Sciences是一本知名的学术期刊,在信息科学领域享有很高的声誉。

该期刊发表了许多重要且有影响力的论文,涵盖了广泛的研究领域,包括但不限于信息检索、数据挖掘、人工智能、机器学习、图像处理等。

为了更好地撰写和提交论文,该期刊提供了一个模板供作者使用。

Information Sciences的模板是基于TeX排版系统设计的。

TeX是由Donald Knuth教授开发的一种强大的排版系统,用于生成高质量的科技文档。

Information Sciences的模板使用了TeX语言的一些特性和功能,以确保论文的排版效果和质量。

模板的使用方法如下:1. 下载和安装TeX系统:首先,需要下载和安装TeX系统,例如TeX Live或MiKTeX。

TeX Live是一个全功能的TeX系统,可在Windows、Mac和Linux上使用。

MiKTeX则是一个只适用于Windows的TEX实现。

2. 下载Information Sciences模板:在Information Sciences期刊的官方网站上,可以找到模板的下载链接。

模板通常以一个压缩文件的形式提供,包含了模板文件和一些示例文件。

3. 解压缩模板文件:下载完成后,打开压缩文件,将其中的文件解压缩到一个目录中。

可以选择将其放置在任意位置,但最好是在一个易于访问和管理的文件夹下。

4. 编辑论文内容:使用任何文本编辑器,打开main.tex文件。

这是一个示例文件,包含了论文的整体结构和格式。

根据自己的实际需要,编辑和填写论文的标题、摘要、关键词等信息,并按照模板中的示例对论文内容进行组织。

5. 编译论文:保存并关闭main.tex文件后,打开命令行终端,并导航到包含main.tex文件的目录。

在命令行中运行命令"pdflatex main.tex"以编译论文。

这将生成一个PDF版本的论文。

一种基于网络分析的学者学术影响力计算方法

一种基于网络分析的学者学术影响力计算方法

此糊究锖報科#第39卷第3期 2021年3月一种基于网络分析的学者学术影响力计算方法徐菁1,程冕2,王绍兰、明书旭\邵洲3,唐杰1(1.清华大学计算机科学与技术系,北京100084 ; 2.国家计算机网络与信息安全管理中心,北京100029;3.南京理工大学计算机科学与工程学院,江苏南京210094)摘要:【目的/意义】学术影响力评价方法的客观性和合理性对科技人才、学术团体、国家等科研实力的评估具有重要作用。

【方法/过程】传统方法一般根据学者的论文发表量和总被引频次等来度量,这些方法虽然计算简便,但是比较粗糙,使得评议结果暗含不公平、不合理等现象,备受争议。

为了解决以上问题,本文通过构建学者论文关系网络,从学者发表论文的数量和质量,以及论文引用者等多角度,设计了一种自动计算学者学术影响力的方法 (简称A C S A I)。

【结果/结论】该方法综合利用了?|文分析和同行评议等方法的优势,并消除了人们主观感受等因素的制约。

并且相比h-index方法,本文不仅提高了区分性,还打破了论文发表量的局限性,使得计算结果更合理,且易于实施。

【创新/局限】本文方法同等对待论文合作者对论文的学术贡献,在后续研究中将区别合作者对论文的不同贡献度量,以便更符合论文作者的真实贡献情况。

关键词:学术影响力;学者论文关系网络;量化评价;h-index;网络分析中图分类号:G250.2;G31 D O I:10.13833/j.issn.1007-7634.2021.03.0151引言目前,学术影响力没有统一定义。

大部分研究者认为学 术影响力基于同行对学术研究成果的认可程度和影响力,即学术研究成果对相同研究领域内的其他学者及其科研活动 产生影响的范围和深度nl。

学者是科技创新的主要力量,而 科技创新是一个国家兴旺发达的不竭动力。

学术影响力反 映了学者在科研领域的学术水平和做出的贡献。

客观合理 的学者学术影响力评价结果可以真实反映学者的学术能力,对科技人才、学术团体、国家等科研实力的评估至关重要,对 科技人才的选拔、培养、引进和管理具有重大意义。

中国学术期刊网检索方法介绍

中国学术期刊网检索方法介绍

中国引文数据库 (2)
该库文献来源:中国学术期刊(光盘版)电子 杂志社出版的所有源数据库产品的参考文献。源 数据库包括:中国期刊全文数据库、中国博士学 位论文全文数据库、中国优秀硕士学位论文全文 数据库、中国重要会议论文全文数据库、中国重 要报纸全文数据库、中国图书全文数据库、中国 年鉴全文数据库等。
中国博士学位论文全文数据库
《中国博士学位论文全文数据库》简称 CDFD, 是国内内容最全、质量最高、出版周期最短、数 据最规范、最实用的博士学位论文全文数据库。
覆盖基础科学、工程技术、农业、医学、哲学、 人文、社会科学等各个领域。截止2011年06月, 收录来自397家培养单位的博士学位论文15万多 篇。收录全国985、211工程等重点高校,中国 科学院、社会科学院等研究院所的博士学位论文。 从1984年至今的博士学位论文。
中国年鉴网络出版总库(2)
专辑专题:
1.年鉴内容按行业分类可分为地理历史、政治军事外交、法律、 经济总类、财政金融、城乡建设与国土资源、农业、工业 、交 通邮政信息产业、国内贸易与国际贸易、科技工作与成果、社会 科学工作与成果、教育、文化体育事业、医药卫生、人物等十六 大行业。
2. 地方年鉴按照行政区划分类可分为北京市、天津市、河北省、 山西省、内蒙古自治区、辽宁省、吉林省、黑龙江省、上海市、 江苏省、浙江省、安徽省、福建省、江西省、山东省、河南省、 湖北省、湖南省、广东省、广西壮族自治区、海南省、重庆市、 四川省、贵州省、云南省、西藏自治区、陕西省、甘肃省、青海 省、宁夏回族自治区、新疆维吾尔自治区、香港特别行政区、澳 门特别行政区、台湾省共34个省级行政区域。 收录年限: 1912年至今。
专利分类: 按照专利种类分为发明专利、外观设计和 实用新型三个类型,其中发明专利和实用新型采用国际 专利分类法(IPC 分类)和CNKI 168学科分类,外观设 计采用国际外观设计分类和CNKI 168 学科分类。

基于学术期刊网的一稿多发信息挖掘系统

基于学术期刊网的一稿多发信息挖掘系统

控 件 的 U L属 性 为 期 刊 网 的查 询 页 面 的 网址 .在 窗体 启 动 的 时 R 候 We Bo srt动 加 载 期 刊 网 的 查 询 页 面 。 接 着 利 用 We. b rwe l b
Bo sr 件 的 d c m n. c m Ee e tueH ML2属 性 获 rw e 控 ou et o u e tl n. t T [ d n m o r ] 11 . 系统 工 作 流 程 tl 接 tl 个 一 稿 多发 信 息 挖 掘 系 统 的 工 作 流 程 如 图 l 系统 启 动 取 当前 页 面 的 hm 源 文 . 着在 hm 源 文件 里 查 找 某 些 特 征 字 。 后 。 行 一 个 后 台线 程 访 问 校 园 网 的 学 术 期 刊 光 盘 镜 像 系 统 。 运 打 符 . d t l s x q ey 如 ea . p ? u ri 现 偶 数 次 的地 方 就 是 论 文 标 题 、 r ia d出 t- a = n cl r 开 期 刊 的 查询 页 面 。 照 给 定 的 主题 词 执 行 查 询 , 取查 询 返 回 gt bak附 近 是 论 文 的作 者 、oo;串 出 现 的 位 置 依 次 是 期 刊 按 读 e l
点进 行 分 析 后 .设 计 了 一 个 基 于 学 术 期 刊 网 的 一 稿 多 发 信 息 挖 掘系 统 。 系统 从 期 刊 网上 下载 论 文 的 基 本 信 息 , 存 到 本 地 数 该 保 据库 . 后依 次 对 同一 作 者 发 表 的 论 文 标 题 进 行 相 关 性 分 析 。 然 能 有 效 的发 现一 稿 多 发 者 在研 究 了 3 0 o 0多 篇 样 本 以 后 发 现 8% 以上 的 论 文 可 以 通 0 过标 题 来 判 断 是否 是 一 稿 多 发 。 一 稿 多发 论 文 标题 大 多 数 一 成 不变 。 分 文 章 标 题 增 加 或 去 除 类 似 基 于 、 究 、 用 等 修 饰 词 部 研 应 或者 利 用 同 义 词代 替 原 先 标 题 里 出 现 的关 键 词 。

信息检索的思路方法与技巧

信息检索的思路方法与技巧

学术机构官网
直接访问相关学术机构、研究机构的官方 网站,获取最新研究成果、研究报告等。
专利信息查询与分析方法
01
专利检索系统
02
专利分析工具
利用国家知识产权局等提供的专利检 索系统,通过关键词、申请人、发明 人等信息进行专利检索。
使用专门的专利分析工具,如智慧芽 、IncoPat等,对检索到的专利信息 进行深度分析,包括技术趋势、竞争 对手分析、法律状态等。
03
专利地图
制作专利地图,将相关领域的专利信 息以可视化的方式呈现,便于快速了 解技术布局和竞争态势。
竞争情报收集与整理策略
行业报告与统计数据
收集行业协会、市场研究机构等发布的 行业报告和统计数据,了解行业发展趋
势和竞争格局。
专家访谈与调研
通过专家访谈、市场调研等方式,获 取关于竞争对手的一手信息和行业内
信息检索发展历程
手工检索阶段
01
早期的信息检索主要依赖手工方式,如图书馆目录、卡片式索
引等。
计算机化检索阶段
02
20世纪60年代开始,计算机技术在信息检索领域得到应用,出
现了计算机化的检索系统和数据库。
网络化检索阶段
03
90年代以后,随着互联网技术的普及,网络搜索引擎逐渐成为
信息检索的主要工具。
信息检索应用领域
跨语言信息检索挑战与机遇
语言障碍 机器翻译技术 多语言资源整合 跨文化交流
不同语言之间的词汇、语法、语义等差异,给跨语言信息检索 带来挑战。
利用机器翻译技术将不同语言的文本转化为同一种语言,降低 语言障碍的影响。
整合多种语言的信息资源,提高跨语言信息检索的覆盖率和准 确性。
通过跨文化交流,了解不同文化背景下的信息需求和表达方式 ,提高跨语言信息检索的针对性和实用性。

万方数据资源检索系统内容范围

万方数据资源检索系统内容范围

万方数据资源检索系统内容范围万方数据资源检索系统是一种用于查找和获取各种学术资源的工具。

它提供了广泛的内容范围,包括学术期刊、学位论文、会议论文、专利、科技报告等。

通过该系统,用户可以方便地检索相关文献和资源,提高学术研究的效率和质量。

学术期刊是万方数据资源检索系统的重要内容之一。

该系统收录了国内外众多学术期刊的文章,涵盖了各个学科领域的研究成果。

用户可以通过关键词、作者、机构等多种检索方式快速找到所需的期刊文章。

万方数据资源检索系统提供的期刊文章内容丰富,涉及到各个学科的前沿研究和学术进展。

除了学术期刊,万方数据资源检索系统还收录了大量的学位论文。

学位论文是研究生在完成学位要求时提交的学术成果,是研究领域的重要参考资料。

万方数据资源检索系统提供了全面的学位论文检索功能,用户可以根据关键词、作者、学校等进行检索。

通过这个系统,用户可以方便地找到与自己研究方向相关的学位论文,借鉴前人的研究成果,提高自己的研究水平。

万方数据资源检索系统还收录了各类会议论文。

学术会议是学者们交流研究成果、分享学术进展的重要平台。

会议论文通常是研究者在学术会议上发表的研究成果,具有较高的实用性和前瞻性。

万方数据资源检索系统提供了丰富的会议论文资源,用户可以通过关键词、会议名称等进行检索。

通过这个系统,用户可以及时了解最新的学术动态,掌握前沿的研究领域。

除了期刊论文、学位论文和会议论文,万方数据资源检索系统还收录了大量的专利和科技报告。

专利是研究者在技术创新方面的成果,具有一定的实用性和创新性。

科技报告是科研机构或企业对科学研究成果的总结和汇报。

这些资源的收录使得万方数据资源检索系统成为了一个全面的学术资源库,为用户提供了丰富的信息来源。

万方数据资源检索系统的内容范围广泛,涵盖了学术期刊、学位论文、会议论文、专利、科技报告等多种资源。

通过该系统,用户可以方便地检索和获取相关的学术资源,提高学术研究的效率和质量。

无论是从事科学研究、学术论文撰写、专利申请还是科技报告编写,万方数据资源检索系统都是一个不可或缺的工具。

知网学术不端检测系统使用说明

知网学术不端检测系统使用说明

学位论文学术不端行为检测系统研制介绍与使用方法第一章系统简介1.1 系统概述学位论文学术不端行为检测系统(简称“TMLC”)以《中国学术文献网络出版总库》为全文比对数据库,实现了对抄袭与剽窃、伪造、篡改等学术不端行为的快速检测,可供用户检测学位论文,并支持用户自建比对库。

其系统示意图如图1所示。

图1 检测系统示意图1.2 系统技术路线介绍TMLC采用CNKI自主研发的自适应多阶指纹(AMLFP)特征检测技术,具有检测速度快,准确率,召回率较高,抗干扰性强等特征。

支持篇章、段落、句子各层级检测;支持文献改写,多篇文献组合等各种文献变形检测;支持研究生学位论文、图书专著等超长文献的学术不端检测。

CNKI自适应多阶指纹技术原理如图2所示:图2 CNKI自适应多阶指纹技术原理图对任意一篇需要检测的文献,系统首先对其进行分层处理,按照篇章、段落、句子等层级分别创建指纹,而比对资源库中的比对文献,也采取同样技术创建指纹索引。

这样的分层多阶指纹结构,不仅可以满足我们对超长文献的快速检测,而且,因为我们的最小指纹粒度为句子,因此,也满足了系统对检准率和检全率的高要求。

原则上,只要检测文献与比对文献存在一个相同的句子,就能被检测系统发现。

1.3 系统功能概述系统主要功能包括:已发表文献检测、论文检测、问题库查询、自建比对库管理等。

◆已发表文献检测:指检测系统能够自动将属于用户的已正式发表的学位论文检索出来,并对每一篇已发表文献进行实时检测,快速给出检测结果。

◆论文检测:主要实现论文实时在线检测功能。

◆问题库查询:指用户可以将检测结果中确认有问题的文献放入到问题库,便于用户集中管理。

◆自建比对库:指管理人员可以选择将检测文献放入个人比对库或者批量上传文献作为个人比对库,该个人比对库即可作为以后学术不端文献检测的比对数据库,该自建个人比对库完全属于用户,其他用户无权使用。

1.4 系统目的TMLC的目的是辅助各研究生培养单位对学位论文质量进行评估,为审查论文提供技术服务。

一种论文作者重名消歧方法

一种论文作者重名消歧方法

一种论文作者重名消歧方法论文作者重名是学术界常见的问题,特别是在研究领域广泛的学科中更为常见。

当两个以上的作者使用相同的名字或者拼音,会导致混淆和误解,严重影响科研成果的可信度和学术交流的效果。

如何对论文作者进行重名消歧成为值得关注的问题。

本文将介绍一种通过姓名、单位、领域等多维度信息进行消歧的方法,以期解决此类问题。

本文将从姓名信息入手,介绍如何通过姓名的拼音、笔画、出生日期等特征对作者进行区分。

本文将介绍如何通过作者的单位信息进行消歧。

现代科研机构众多,作者所在单位的差异往往是作者重名的重要区分特征。

本文将介绍如何通过作者的研究领域进行消歧,不同的研究领域往往对应着不同的学术圈子,这也可以成为区分作者的重要依据。

本文的研究方法主要是通过文献检索、调查研究和数据分析为主要手段。

通过对学术期刊、研究机构网站等各种学术资源进行检索,收集相关信息。

通过问卷调查和专家访谈等方式,了解学术界在面对作者重名问题时的实际困难和需求。

通过对已有数据的梳理和分析,应用合适的算法和模型来验证本文提出的方法的有效性和可行性。

本文的研究内容将主要聚焦于作者重名消歧的方法论和技术实现。

将从姓名信息出发,介绍如何通过姓名的拼音、笔画、出生日期等特征对作者进行区分,可以利用音形义统一码和全国各地行政区划代码来进行对比,确定作者具体的身份。

将介绍如何通过作者的单位信息进行消歧,可以利用现有的学术机构档案库和国家统一认证的学术数据库来进行对比,确定作者所在的具体单位。

将介绍如何通过作者的研究领域进行消歧,可以利用现有的学术期刊分类索引和国家统一认证的研究领域数据库来进行对比,确定作者从事的具体领域。

本文的研究成果将主要包括一套完整的作者重名消歧方法和技术实现,以及相关的算法和模型。

将提出一套综合利用姓名、单位、领域等多维度信息进行消歧的方法,并建立相应的数据库和系统平台。

将设计一套灵活、高效的算法模型,通过大规模的实验验证其有效性和可行性。

proquest的检索方法

proquest的检索方法

proquest的检索方法ProQuest 检索方法:提高学术研究效率的利器引言在当今信息爆炸的时代,如何高效地获取准确、丰富的学术资源成为了学术研究的重要环节。

ProQuest作为全球知名的学术数据库和信息服务商,为用户提供了一种高效、便捷的检索方法,极大地提升了学术研究效率。

本文将介绍ProQuest的检索方法,帮助读者快速掌握如何使用该工具进行学术研究。

一、ProQuest的简介ProQuest是一家专注于数字化内容、学术数据库和图书馆技术的知名公司,成立于1938年,总部位于美国密歇根州。

该公司通过其广泛的数字内容库和技术解决方案,为全球学术界、图书馆、企业等提供信息服务。

ProQuest的数据库涵盖了多个领域的学术资源,包括科学、人文、社会科学、商业等等,几乎涵盖了所有学科领域。

二、ProQuest的检索方法1. 关键词检索ProQuest支持用户使用关键词进行检索,用户可以根据研究的主题、关键词或者学科领域输入相应的关键词进行检索。

在输入关键词时,用户可以使用逻辑运算符(如AND、OR、NOT)进行组合,以提高检索精度。

此外,ProQuest还支持使用通配符和截断符号进行检索,以便更好地匹配相关信息。

2. 高级检索除了关键词检索外,ProQuest还提供了高级检索功能,该功能允许用户在多个字段中进行检索,包括标题、摘要、作者、关键词等。

用户可以通过设置不同的检索条件,精确地定位到所需的文献资源。

高级检索功能还支持用户设置检索时间范围、文献类型等参数,以进一步缩小检索结果的范围。

3. 分类浏览除了关键词检索和高级检索外,ProQuest还提供了分类浏览的功能。

用户可以根据不同的学科领域、主题、出版物类型等进行浏览,以获取相关的学术资源。

分类浏览功能可以帮助用户快速了解某个领域的研究进展和热点问题,为学术研究提供了更多的参考资料。

4. 相关文献推荐ProQuest还通过其强大的算法和数据挖掘技术,为用户提供了相关文献推荐的功能。

知网CNKI总库平台(KNS6.5)使用指南

知网CNKI总库平台(KNS6.5)使用指南
。 高级检索 :用户提供更灵活方便地构造检索式,自由组配逻辑关系,最多可以增加7行。
专业检索:专业检索是指使用逻辑运算符和关键词构造检索式进行文献检索的方式
。 作者发文检索 :通过作者姓名、单位等信息,查找作者发表的全部文献及被引下载等情况
科研基金检索:通过科研基金名称,查找科研基金资助的文献。 句子检索:句子检索是通过用户输入的两个关键词,查找同时包含这两个词的句子
五、 KNS6.5平台使用指南-学习工具
5.2CNKI数字化学习工具(E-Learning 2.2)下载、安装
第一步:与CAJ浏览器下载的方式一样,进入中心网站,在下载处,进入下载页面
安装完成后,在桌面上出现 CNKIE-learning图标
五、KDN使用指南-学习工具
5.2CNKI数字化学习工具(E-Learning 2.2)使用方法
4.下载到本地,双击CAJViewer7.2……开始安装,根据 提示,一步步安装完成
三、 KNS6.5平台使用指南-下载
3.2 文章下载(以“零件加工”为关键词检索为例)
比如要下载这篇文章
在此页面会看到紫色刊名,或者文献名称 后带有“优先出版”字样。紫色刊名是 CNKI独家合作的期刊,优先出版是优先于 纸质出版的文献。
提供更多的检索控制项,精确检索范围
二、 KNS6.5平台使用指南-检索
专业检索(跨库)
检索到篇名包括“生态”并且关键词包括 “生态文明”并且作者为“陈”姓和“王” 姓的所有文章;
二、 KNS6.5平台使用指南-检索
句子检索(跨库

通过“句子检索”在同一句话中包含“知 识挖掘”和“知识发现”的文章
添加LOGO
Click it to Add
谢谢大家

信息检索--CNKI

信息检索--CNKI

出现文章原版显示窗口。 浏览全文:有多种功能,如打印、缩放、查找、摘录、 复制等。
功能按钮:全文阅读器提供了两个功能按钮。
– “T”字母按钮: 是用来选择文本的,意为Text; –两个黑白交叠正方形的按钮: 是用来抓图形的,它的外面有一个虚框,意为:把图片割下来。
****若全文中不能拷贝文字,只能当成图片拷贝,说明遇到了一篇以纯图
2. 导航
知识导航
专辑导航
刊名导航
3.按学科专题检索
逐级打开各学科专题目录,可以检索到全文数 据库中各学科专题包含的所有文章。



题录数据库检索方法 1.初级检索 系统默认进入“初级检索”界面,检索方法与专题全文数 据库“初级检索”方法相同。 2. 高级检索 检索方法与专题全文数据库“高级检索”方法相同。 3.按刊名浏览检索 逐级打开各学科专题目录,可以按学科浏览《中国期刊网》 中包含的期刊,通过期刊目录可以进一步浏览各期刊所收 录的文章。
跨年度检索 单个专题检索 多个或全部专题检索。
〖操作〗
–首先在总目录下选择“电子技术与信息科学专 辑”。 –选择检索年限: 每次可同时检索3年的数据。(1994-1996年, 1997-1999年,2000-2001年)。用鼠标点选。 方格内划上“√”即为选中。 – 选择专题库: 共分25个专题,方格内划上“√”即为选中该 专题。 一般单击【全选】
合作建设项目
● 中国科学文献计量评价数据库(ASPT)项目
● 中国期刊网阵项目 ● 中国研究生网阵项目 ● 中国社会团体网阵项目
CNKI主页
中国学术期刊全文数据库 (China Academic Journal)
简介 检索前准备工作 检索指南

一种新型期刊评价方法——基于论文作者简介的分析

一种新型期刊评价方法——基于论文作者简介的分析

情报学报 2018年9月第37卷第9期Journal of the China Society for Scientific and Technical Information, Sep. 2018, 37(9): 874-881DOI: 10.3772/j.issn.1000-0135.2018.09.002一种新型期刊评价方法——基于论文作者简介的分析宋晓晨1,李梦豪2,周良3(1. 中国人民大学商学院,北京 100872;2. 中国人民大学商学院,北京 100872;3. 四川大学公共管理学院,成都 610065)摘要对于学术期刊质量的评价指标或方法,传统上有两种:文献计量指标和专家评议法。

这两种指标或方法各有优势。

本文提出了一个基于论文作者简介中披露信息的期刊评价方法。

该方法以公认权威期刊论文作者为切入点,通过搜集其在这些期刊论文中所撰写的个人简介,其中披露了自己的研究工作发表的主要期刊,通过对期刊排列顺序的信息进行归纳计算,得到各期刊的作者投票得分,以此得分对某个领域的期刊进行排序。

进一步地,本文以国际信息系统领域重要期刊为实例对该方法的效果进行了检验。

结果表明,该方法在一定程度上结合了两种传统方法的优势,弥补了一定的不足,具有实践意义。

关键词期刊评价;投票得分;作者简介A New Method for Journal Evaluation—Analysis Basedon the Authors’ Bios in Journal ArticlesSong Xiaochen1, Li Menghao2 and Zhou Liang3(1. School of Business, Renmin University of China, Beijing 100872; 2. School of Business, Renmin University ofChina, Beijing 100872; 3. School of Public Administration, Sichuan University, Chengdu 610065)Abstract: Researchers categorize the various methods of assessing journal quality into two approaches—bibliometric methods and expert assessment—each having its own advantages. This paper proposes a new method to measure the academic influence of journals. The method takes the authors of authoritative journal articles as the starting point and collects the personal profiles/biographies written in these articles that disclose the main journals in which such au-thors used to publish. We organize and process the ranking of journals’ importance in a certain field and calculate the authors’ Vote Score (V-score) on every journal. On the basis of this V-score, we can assess the impact of a journal in such a field. In addition, the efficacy of the method is tested with examples based on leading journals in the field of Information Systems. This method combines the advantages of the two traditional methods, and compensates for their deficiencies to a certain extent, which has certain practical significance.Key words: journal evaluation; vote score; authors’ bio收稿日期:2018-04-08;修回日期:2018-06-19基金项目:国家自然科学基金重点项目(71331007);四川大学中央高校基本科研业务费项目(skbsh201808)。

  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

(10)申请公布号 CN 102609546 A(43)申请公布日 2012.07.25C N 102609546 A *CN102609546A*(21)申请号 201210072645.7(22)申请日 2012.03.19201110408020.9 2011.12.08 CNG06F 17/30(2006.01)(71)申请人清华大学地址100084 北京市海淀区100084信箱82分箱清华大学专利办公室申请人国家图书馆(72)发明人朝乐门 张勇 邢春晓 孙一钢朱先忠(74)专利代理机构北京聿宏知识产权代理有限公司 11372代理人王建军钟日红(54)发明名称一种学术期刊论文作者信息挖掘方法及系统(57)摘要本发明公开了一种学术期刊论文作者信息挖掘方法及系统。

该方法中,首先选择目标学科领域,建立OWL 领域本体;其次,从目标学科领域内的学术期刊论文中抽取作者信息;再次,对抽取的作者信息进行格式转换,并存入作者信息库中,并计算出唯一的作者ID ;最后利用上述信息得到作者与学术论文关联矩阵,作者学术成长路线图,作者的合作者网络图,作者之间的学术合作距离,热点研究方向地图以及作者学术声望地图。

本发明改变了作者信息挖掘方法的数据来源,在作者学术合作距离、热点研究方向的计算过程中引入OWL 领域本体技术,提高了语义计算效果。

(66)本国优先权数据(51)Int.Cl.权利要求书2页 说明书8页 附图7页(19)中华人民共和国国家知识产权局(12)发明专利申请权利要求书 2 页 说明书 8 页 附图 7 页1.一种学术期刊论文作者信息挖掘方法,其特征在于,包括:步骤1,选择目标学科领域,建立OWL领域本体;步骤2,从目标学科领域内的学术期刊论文中抽取作者信息;步骤3,对抽取的作者信息进行格式转换,并存入作者信息库中,并计算出唯一的作者ID;步骤4,根据作者ID和论文ID计算作者与学术论文关联矩阵;步骤5,根据作者与学术论文关联矩阵、研究方向和年份计算作者在同一研究方向的累计发表论文绝对数量并生成作者学术成长路线图;步骤6,根据作者与学术论文关联矩阵得到作者的合作者网络图;步骤7,根据作者的合作者网络图计算作者之间的学术合作距离;步骤8,根据OWL领域本体、作者ID及研究方向生成热点研究方向地图;步骤9,根据作者ID以及作者的合作者网络图生成作者学术声望地图。

2.如权利要求1所述的方法,其特征在于,步骤1中,OWL领域本体包含领域术语之间的继承关系、等同关系和集合运算关系。

3.如权利要求2所述的方法,其特征在于,步骤2中,作者信息包括作者姓名、性别、出生年份、籍贯、职称、研究方向、论文标题、期刊名称、发表时间以及作者所在单位;步骤3中,唯一的作者ID包括作者的姓名、出生年份、性别、籍贯、所在单位名称以及随机码。

4.如权利要求3所述的方法,其特征在于,步骤4中,作者与学术论文关联矩阵Sm×n=(sij )m×n,其中i和j分别为论文ID和作者ID,m和n分别代表论文篇数和作者人数,sij代表作者权重,作者权重的计算公式如下:其中,S(i,j)为第i个作者在第j篇论文中的作者权重,n为第i个作者在第j篇论文中的排名次序,n=1,2,3,...,N。

5.如权利要求4所述的方法,其特征在于,步骤5中,第i个作者在研究方向z上的累积发表论文绝对数量y的计算公式如下:其中N为第i个作者在研究方向z上发表的论文总数,S(i,j,z)为第i个作者在第j篇论文中的作者权重;两个研究方向之间存在继承关系、等同关系或集合运算关系则判定为同一研究方向。

6.如权利要求5所述的方法,其特征在于,步骤6中,作者合作网络图包括作者集合和论文集合,作者为结点,论文为纽带,两个结点之间的加权值计算方法如下:D(i,j,k)=|S(i,k)-S(j,k)|;其中,D(i,j,k)为第i个作者和第j个作者在第k篇论文中的权重之差,W(i,k)和W(j,k)分别为第i个作者和第j个作者在第k篇论文中的权重。

7.如权利要求6所述的方法,其特征在于,步骤7中,作者之间的学术合作距离的计算公式如下:其中L(i,j)为结点i和结点j对应的作者之间的学术合作距离,k为作者合作网络图中在结点i和结点j之间最短路径上存在的中间结点,N为中间结点的个数。

8.如权利要求7所述的方法,其特征在于,步骤8中,根据下式生成热点研究方向地图:其中n为从事第i个研究方向的子类研究方向的作者个数,(H(k)为第k个子类的研究方向的热点程度,D(i,k)代表研究方向i 和研究方向k之间的最短路径上的中间结点数,H(0)代表第i个研究方向上的作者人数,D(i,0)=1;OWL本体中的叶结点对应的研究方向为子类研究方向。

9.如权利要求7所述的方法,其特征在于,作者学术声望地图以第一作者为传播者结“作者学术声望的计算方法如下:点,以合作者为接受者结点的有向图;其中,I(i)为第i个作者的声望,n为第i个作者的合作作者人数,k为第i个作者的第k个合作者,D(i,k)为第i个作者与第k个作者之间的距离,I(0)代表与第i个作者直接合作人数,且D(0,k)=1。

10.一种实现如权利要求1-9任意一项所述的方法的系统,其特征在于,包括ETL模块、领域本体、唯一标识模块、作者与学术论文关联矩阵计算模块、作者学术成长路线图生成模块、作者合作网络图生成模块、学术合作距离生成模块、热点研究方向地图生成模块以及作者学术声望地图生成模块;ETL模块,用于从目标学科领域内的学术期刊论文中抽取作者信息,对抽取的作者信息进行格式转换并存入作者信息库中;领域本体为根据所选择的目标学科领域所建立OWL领域本体;唯一标识模块,用于计算出唯一的作者ID;作者与学术论文关联矩阵计算模块,用于根据作者ID和论文ID计算作者与学术论文关联矩阵;作者学术成长路线图生成模块,用于根据作者与学术论文关联矩阵、研究方向和年份计算作者在同一研究方向的累计发表论文绝对数量并生成作者学术成长路线图;作者合作网络图生成模块,用于根据作者与学术论文关联矩阵得到作者的合作者网络图;学术合作距离生成模块,用于根据作者的合作者网络图计算作者之间的学术合作距离;热点研究方向地图生成模块,用于根据OWL领域本体、作者ID、研究方向及其热点程度生成热点研究方向地图;作者学术声望地图生成模块,用于根据作者ID以及作者的合作者网络图生成作者学术声望地图。

一种学术期刊论文作者信息挖掘方法及系统技术领域[0001] 本发明涉及知识工程领域,具体涉及一种学术期刊论文作者信息挖掘方法及系统。

背景技术[0002] 学术期刊论文作者信息是指正式发表在期刊上的学术论文中给出的作者姓名、性别、出生年份、籍贯、职称和研究方向等基本信息,一般出现在论文首页的脚注或论文最后的尾注位置,如图1所示。

相对于图书,学术期刊论文中作者信息具有内容简短、格式固定、用词规范等特点。

[0003] 作者与文献之间的数量关系的分析是指以揭示作者与文献数量之间的关系,描述作者的科学生产力为目的信息分析方法。

在作者与文献之间的数量关系的分析方面,比较有代表性的是洛特卡定律(Lotka’s Law)——作者数量与论文数量的关系遵循一种平方反比规律,即:F(x)=C/x2,其中x、F(x),C分别代表论文数、写x篇论文的作者占作者总数的比例和常数。

在洛特卡定律的基础上,非拉奇等学者提出了影响洛特卡分布的两个因素:一是研究者本人所处的时代或环境直接影响着研究结果;二是统计样本中的作者数量与研究结果有关。

作者与文献之间的数量关系分析的优点是较好地揭示了作者频率与论文数量之间的关系,缺点是没有分析作者的其他信息,包括出生年份、籍贯、职称、研究方向等信息。

[0004] 普赖斯利用每位作者合作数量的分布来研究合作问题,得出了如下方程:[0005][0006] 其中n(x)表示撰写x论文的作者数;I=nmax为该领域内最高产作者的论文总数;N为全部作者的总数。

M=0.749(nmax)0.5。

在普赖斯的研究基础上,学者们提出了合作度、合作率的计算公式,具体如下:[0007][0008][0009] 尽管上述方法各自有其自身的优缺点,并且各自在不同的情况下有成功运用的案例,但是它们无法满足学术论文作者简介信息挖掘的特殊需要:首先,学术期刊论文中的作者简介信息的内容具有特殊性。

其次,学术期刊论文中的作者简介信息的位置具有特殊性。

再次,学术期刊论文中的作者简介信息的格式具有特殊性。

最后,学术期刊论文中的作者简介信息的用词具有特殊性。

发明内容[0010] 针对现有技术中存在的上述问题,本发明提供了一种学术期刊论文作者信息挖掘方法及系统。

[0011] 本发明提供了一种学术期刊论文作者信息挖掘方法,包括:[0012] 步骤1,选择目标学科领域,建立OWL领域本体;[0013] 步骤2,从目标学科领域内的学术期刊论文中抽取作者信息;[0014] 步骤3,对抽取的作者信息进行格式转换,并存入作者信息库中,并计算出唯一的作者ID;[0015] 步骤4,根据作者ID和论文ID计算作者与学术论文关联矩阵;[0016] 步骤5,根据作者与学术论文关联矩阵、研究方向和年份计算作者在同一研究方向的累计发表论文绝对数量并生成作者学术成长路线图;[0017] 步骤6,根据作者与学术论文关联矩阵得到作者的合作者网络图;[0018] 步骤7,根据作者的合作者网络图计算作者之间的学术合作距离;[0019] 步骤8,根据OWL领域本体、作者ID、研究方向及其热点程度生成热点研究方向地图;[0020] 步骤9,作者学术声望地图生成模块,用于根据作者ID以及作者的合作者网络图生成作者学术声望地图。

[0021] 在一个示例中,步骤1中,OWL领域本体包含领域术语之间的继承关系、等同关系和集合运算关系。

[0022] 在一个示例中,步骤2中,作者信息包括作者姓名、性别、出生年份、籍贯、职称、研究方向、论文标题、期刊名称、发表时间以及作者所在单位;步骤3中,唯一的作者ID包括作者的姓名、出生年份、性别、籍贯、所在单位名称以及随机码。

[0023] 在一个示例中,步骤4中,作者与学术论文关联矩阵S m×n=(s ij)m×n,其中i和j分代表作者权重,作者权重别为论文ID和作者ID,m和n分别代表论文篇数和作者人数,sij的计算公式如下:[0024] 其中,S(i,j)为第i个作者在第j篇论文中的作者权重,n为第i个作者在第j篇论文中的排名次序,n=1,2,3,...,N。

[0025] 在一个示例中,步骤5中,第i个作者在研究方向z上的累积发表论文绝对数量y 的计算公式如下:[0026] 其中N为第i个作者在研究方向z上发表的论文总数,S(i,j,z)为第i个作者在第j篇论文中的作者权重;两个研究方向之间存在继承关系、等同关系或集合运算关系则判定为同一研究方向。

相关文档
最新文档