面向科技智库的知识图谱系统构建
合集下载
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
1 研究综述
2015 年国家出台《关于加强中国特色新型智 库建设的意见》[2],迎来了智库大发展的机遇。在 科技智库领域,中国科学院系统、中国科协系统、 高校科学管理学院以及全国各地的科技情报机构 是骨干力量。这些机构长期从事科技情报服务、 科技决策咨询、科技政策研究和技术预见等工作,
∗ 本文系中央引导地方科技发展专项计划 “ 青岛市科技智库公共服务平台 ”(项目编号:18-1-3-1-zyyd-gh)研究成果之一。 作者简介:于升峰(ORCID:0000-0003-2190-6138),青岛市科学技术信息研究院(青岛市科学技术发展战略研究院)研究员, 中国海洋大学硕士研究生导师,学士,E-mail:18661689308@。
开放科学(资源服务)标识码(OSID)
当前全球科技创新步入空前活跃期,以信息 技术、生命科技、新能源、新材料等为引领的新 一轮科技革命正孕育爆发,引导着全球产业变革 加速推进,影响着人们的生产生活方式,重构着 全球科技创新的发展格局和竞争力。科技智库是 科技创新领域的智囊和参谋,对科技和产业的超 前预测、战略研究和政策评估深刻影响着经济社 会的治理,全球高端科技智库的作用日益凸显, 表现出走向世界智库中心舞台的趋势 [1]。而今科 技智库已经由传统的单纯依赖专家经验判断转向 依靠现代信息技术和专家智慧综合分析研判,尤 其是通过构建科学知识图谱系统,运用大数据分 析、知识挖掘、人工智能和可视化等技术,进行 复杂运算和分析,支撑研究战略和结论。
学知识图谱是以知识域为对象,是呈现科学知识 的发展过程和结构关系的一种图像,是用可视化 的知识图形来呈现序列化的知识谱系。在知识图 谱的应用研究方面,由于其具有较高的技术难度 和较大的资源投入的特点,国内目前更多应用于 商业价ph)、搜狗(知立方) 等,而在科技智库这类公益性研究和公共政策服 务为主的领域,尚处于探索起步阶段,目前有实 质进展的仅有中国科学院文献情报中心在探索建设 基于知识图谱的科技大数据知识发现平台 [7],是包 含人员、机构、期刊、论文、项目、基金、专利 等结构化可计量数据的学术知识网络图谱,更加 注重学术的特征,这符合中国科学院探索科学前 沿的需求。
第 6 卷 第 1 期 2021 年 2 月
实践探索
面向科技智库的知识图谱系统构建 *
■ 于升峰 青岛市科学技术信息研究院 青岛 266000
摘要:[ 目的 / 意义 ] 科学知识图谱作为新兴的知识发现工具和可视化知识分析平台,可以辅
助科技智库洞察科技领域的发展脉络,预测未来科技发展趋势。[ 方法 / 过程 ] 本研究遵循科技智
56
Copyright©博看网 . All Rights Reserved.
于升峰 . 面向科技智库的知识图谱系统构建 [J]. 智库理论与实践,2021,6(1):56-64.
20 世纪 90 年代初期,就开始探索建设和应用数 据库系统辅助研究,如中国科技情报所重庆分所 的科技期刊题录数据库、清华大学的科技文献原 文数据库、北京科技情报所联合全国科技情报机 构建设的科技成果数据库等,2000 年之后,随着 WEB2.0 技术兴起,开始将数据仓库、信息挖掘、 知识发现等技术运用到科技决策咨询研究方面的 探索,2005 年中国科学院资源环境科学信息中心 吴新年等 [3] 基于科技情报学研究的需求提出了将 各类不相关联的科学学科数据库统一构建到一个 平台上,建立数据仓库,通过数据加工和挖掘算 法实现统一检索,并设计了不同权限用户的构想, 之后在数据获取和知识处理、数据挖掘和运算等 方面做了诸多探索,中国科学院文献情报中心谭 宗颖等 [4] 运用本体技术对信息进行组织,运用文 本聚类技术挖掘科技主题和相互关系,构建科技 智库科技发展前沿监测跟踪平台,预测科技发展 趋势;逯万辉等 [5] 通过深度学习算法,对期刊文 献进行分群建库,建立科学知识结构库;苏晓娟 等 [6] 综合运用科技大数据、人工智能,构建中英 双语料库,2015 年之后,中国科学院文献情报中 心开始探索基于知识图谱技术的科研主体、科研 活动、科研成果等面向科研全过程链条的知识组 织构建,开发新型知识检索发现服务,胡吉颖等 [7] 基于全球海量科技数据建设的学术知识图谱构建 了研究人员、机构、期刊、论文、项目、基金、 专利等实体相互关联的复杂网络,实现了知识层 面的数据融合与集成,并以知识图谱为核心搜索 引擎,完成了科技大数据知识发现平台的建设; 王颖等 [8] 设计和实现科研实体知识抽取、实体对 齐和关系发现、知识融合与语义丰富化的知识图 谱构建方法。
知识图谱是 2012 年由谷歌提出的基于互联网 语义搜索而构建的大数据本体和概念关联关系知 识库体系,科学知识图谱运用了知识图谱的核心 理念和技术,综合运用图谱学、计量学和科学数
据库技术,构建Байду номын сангаас学技术知识谱系,揭示多重知 识单元和知识组织间的时间、空间等复杂关系, 可推演新知识结构和科技发展趋势。
本研究分析了我国科技智库探索信息化、数 据化、智能化辅助决策的发展脉络,结合科技智 库的研究需求和知识图谱的技术功能特征,构建 了科技智库科学知识图谱系统,设计了系统数据 模型和计算模型,研究了应用范式和运行流程, 并实证应用于前沿技术跟踪监测,验证了其可行 性和应用价值。
知识图谱是 2012 年由谷歌提出的 [9],是为实 现更智能的搜索,它的本质是语义网络(semantic network)知识库,节点代表实体和概念,实体之 间的链接线代表图谱系统,提供更强大的基于语义的 搜索服务。科学知识图谱运用到科技领域,国内 尚没有明确一致的定义,汤建民 [10] 认为科学知识 图谱是以可视化图谱的形式展现学科发展总体图 景、亲族关系和演化历程等,刘则渊 [11] 等认为科
库的工作逻辑和流程,构建科技活动全要素的科学知识图谱,并开发知识图谱分析发现系统。实
施知识获取、知识融合和知识计算。[ 结果 / 结论 ] 实现知识深度挖掘、知识隐含关系发现、趋势
预测和其他智能化决策应用。
关键词:科技智库 知识图谱 可视化 知识库 趋势预测 辅助决策
分类号:G301
DOI: 10.19318/ki.issn.2096-1634.2021.01.07
2015 年国家出台《关于加强中国特色新型智 库建设的意见》[2],迎来了智库大发展的机遇。在 科技智库领域,中国科学院系统、中国科协系统、 高校科学管理学院以及全国各地的科技情报机构 是骨干力量。这些机构长期从事科技情报服务、 科技决策咨询、科技政策研究和技术预见等工作,
∗ 本文系中央引导地方科技发展专项计划 “ 青岛市科技智库公共服务平台 ”(项目编号:18-1-3-1-zyyd-gh)研究成果之一。 作者简介:于升峰(ORCID:0000-0003-2190-6138),青岛市科学技术信息研究院(青岛市科学技术发展战略研究院)研究员, 中国海洋大学硕士研究生导师,学士,E-mail:18661689308@。
开放科学(资源服务)标识码(OSID)
当前全球科技创新步入空前活跃期,以信息 技术、生命科技、新能源、新材料等为引领的新 一轮科技革命正孕育爆发,引导着全球产业变革 加速推进,影响着人们的生产生活方式,重构着 全球科技创新的发展格局和竞争力。科技智库是 科技创新领域的智囊和参谋,对科技和产业的超 前预测、战略研究和政策评估深刻影响着经济社 会的治理,全球高端科技智库的作用日益凸显, 表现出走向世界智库中心舞台的趋势 [1]。而今科 技智库已经由传统的单纯依赖专家经验判断转向 依靠现代信息技术和专家智慧综合分析研判,尤 其是通过构建科学知识图谱系统,运用大数据分 析、知识挖掘、人工智能和可视化等技术,进行 复杂运算和分析,支撑研究战略和结论。
学知识图谱是以知识域为对象,是呈现科学知识 的发展过程和结构关系的一种图像,是用可视化 的知识图形来呈现序列化的知识谱系。在知识图 谱的应用研究方面,由于其具有较高的技术难度 和较大的资源投入的特点,国内目前更多应用于 商业价ph)、搜狗(知立方) 等,而在科技智库这类公益性研究和公共政策服 务为主的领域,尚处于探索起步阶段,目前有实 质进展的仅有中国科学院文献情报中心在探索建设 基于知识图谱的科技大数据知识发现平台 [7],是包 含人员、机构、期刊、论文、项目、基金、专利 等结构化可计量数据的学术知识网络图谱,更加 注重学术的特征,这符合中国科学院探索科学前 沿的需求。
第 6 卷 第 1 期 2021 年 2 月
实践探索
面向科技智库的知识图谱系统构建 *
■ 于升峰 青岛市科学技术信息研究院 青岛 266000
摘要:[ 目的 / 意义 ] 科学知识图谱作为新兴的知识发现工具和可视化知识分析平台,可以辅
助科技智库洞察科技领域的发展脉络,预测未来科技发展趋势。[ 方法 / 过程 ] 本研究遵循科技智
56
Copyright©博看网 . All Rights Reserved.
于升峰 . 面向科技智库的知识图谱系统构建 [J]. 智库理论与实践,2021,6(1):56-64.
20 世纪 90 年代初期,就开始探索建设和应用数 据库系统辅助研究,如中国科技情报所重庆分所 的科技期刊题录数据库、清华大学的科技文献原 文数据库、北京科技情报所联合全国科技情报机 构建设的科技成果数据库等,2000 年之后,随着 WEB2.0 技术兴起,开始将数据仓库、信息挖掘、 知识发现等技术运用到科技决策咨询研究方面的 探索,2005 年中国科学院资源环境科学信息中心 吴新年等 [3] 基于科技情报学研究的需求提出了将 各类不相关联的科学学科数据库统一构建到一个 平台上,建立数据仓库,通过数据加工和挖掘算 法实现统一检索,并设计了不同权限用户的构想, 之后在数据获取和知识处理、数据挖掘和运算等 方面做了诸多探索,中国科学院文献情报中心谭 宗颖等 [4] 运用本体技术对信息进行组织,运用文 本聚类技术挖掘科技主题和相互关系,构建科技 智库科技发展前沿监测跟踪平台,预测科技发展 趋势;逯万辉等 [5] 通过深度学习算法,对期刊文 献进行分群建库,建立科学知识结构库;苏晓娟 等 [6] 综合运用科技大数据、人工智能,构建中英 双语料库,2015 年之后,中国科学院文献情报中 心开始探索基于知识图谱技术的科研主体、科研 活动、科研成果等面向科研全过程链条的知识组 织构建,开发新型知识检索发现服务,胡吉颖等 [7] 基于全球海量科技数据建设的学术知识图谱构建 了研究人员、机构、期刊、论文、项目、基金、 专利等实体相互关联的复杂网络,实现了知识层 面的数据融合与集成,并以知识图谱为核心搜索 引擎,完成了科技大数据知识发现平台的建设; 王颖等 [8] 设计和实现科研实体知识抽取、实体对 齐和关系发现、知识融合与语义丰富化的知识图 谱构建方法。
知识图谱是 2012 年由谷歌提出的基于互联网 语义搜索而构建的大数据本体和概念关联关系知 识库体系,科学知识图谱运用了知识图谱的核心 理念和技术,综合运用图谱学、计量学和科学数
据库技术,构建Байду номын сангаас学技术知识谱系,揭示多重知 识单元和知识组织间的时间、空间等复杂关系, 可推演新知识结构和科技发展趋势。
本研究分析了我国科技智库探索信息化、数 据化、智能化辅助决策的发展脉络,结合科技智 库的研究需求和知识图谱的技术功能特征,构建 了科技智库科学知识图谱系统,设计了系统数据 模型和计算模型,研究了应用范式和运行流程, 并实证应用于前沿技术跟踪监测,验证了其可行 性和应用价值。
知识图谱是 2012 年由谷歌提出的 [9],是为实 现更智能的搜索,它的本质是语义网络(semantic network)知识库,节点代表实体和概念,实体之 间的链接线代表图谱系统,提供更强大的基于语义的 搜索服务。科学知识图谱运用到科技领域,国内 尚没有明确一致的定义,汤建民 [10] 认为科学知识 图谱是以可视化图谱的形式展现学科发展总体图 景、亲族关系和演化历程等,刘则渊 [11] 等认为科
库的工作逻辑和流程,构建科技活动全要素的科学知识图谱,并开发知识图谱分析发现系统。实
施知识获取、知识融合和知识计算。[ 结果 / 结论 ] 实现知识深度挖掘、知识隐含关系发现、趋势
预测和其他智能化决策应用。
关键词:科技智库 知识图谱 可视化 知识库 趋势预测 辅助决策
分类号:G301
DOI: 10.19318/ki.issn.2096-1634.2021.01.07