知识图谱发展报告(2018)

合集下载

知识图谱 概念与技术:第12章 基于知识图谱的搜索与推荐

知识图谱  概念与技术:第12章 基于知识图谱的搜索与推荐

《知识图谱: 概念与技术》第12 讲基于知识图谱的搜索与推荐•基于知识图谱的搜索•搜索意图理解•实体探索•基于知识图谱的推荐•基于传统知识的推荐•基于知识图谱的物品画像•基于知识图谱的用户画像•基于知识图谱的跨领域推荐•基于知识图谱的搜索•搜索意图理解•实体探索•基于知识图谱的推荐•基于传统知识的推荐•基于知识图谱的物品画像•基于知识图谱的用户画像•基于知识图谱的跨领域推荐搜索的进化•Web搜索用户到底想搜什么内容?除了返回姚明的信息还能提供其他内容么?•Web搜索的进化•Web 搜索的进化keyword/stringthing/entity related things相关实体、概念潜在关系有关的属性确定搜索目标发现匹配结果匹配结果排序相关结果推荐搜索意图理解:•分词•规则解析•实体识别•实体链接•……•目标实体的属性展示•相关实体、概念的推荐•展现目标实体与相关实体间的关系•……•排序学习•目标实体、属性的查找•关联计算知识图谱•Web搜索的工作流程内容提纲•基于知识图谱的搜索•搜索意图理解•实体探索•基于知识图谱的推荐•基于传统知识的推荐•基于知识图谱的物品画像•基于知识图谱的用户画像•基于知识图谱的跨领域推荐搜索意图理解•因为搜索/查询语句一般都是短文本,因此搜索意图的理解最主要的挑战是短文本的实体链接•实体链接的基本任务•将指代实体的文本mention链接到知识库中特定实体的过程•实体链接的相关问题与挑战•实体解析/命名实体识别entity resolution/name entity recognition•共指消解co-reference resolution•词义消岐word sense disambiguation•……短文本实体链接•实体链接为什么是一个挑战?•同一个实体在广泛的文本中可能有多个mention(指代词)•Barack Obama•Barack H. Obama都是指美国前任总统奥巴马•President Obama•Senator Obama•President of the United States•同一个指代词可能指代多个不同实体•Michael Jordan 到底是指篮球巨星还是机器学习大牛?•“苹果”是指能吃的水果还是时尚的公司/手机?•算法目标•利用实体指代词m 与候选实体e 的上下文等相关特征计算两者的匹配度分数φe,m ,按分数进行排序,并选择分数最大的实体e best 作为m 的链接结果,即e best =argmax e φe,m •局部模型•为短文本中的每个指代词及其链接的实体单独计算φe,m ,每个链接实体都是独立产生•全局模型•考虑文本中多个指代词所链接的实体间联系,对上下文内所有歧义的实体指代一同消歧•令Γ={m 1,e 1,m 2,e 2…}为一个全局实体链接方案,则目标函数为:Γbest =argmax ΓO Γ=argmax Γ෍i=1N φm i ,e i +෍t j ∈Γψe i ,e jψe i ,e j 是实体e i ,e j 之间的相关度分数不光考虑实体和指代词之间的相关度,还考虑•上下文特征•示例:...when did Steve leave apple...{Steve Jobs,Steve Wozniak,Steve Ballmer,...}句中提的到底是哪个Steve?•上下文特征•文本相似度•计算候选实体上下文文本(如百科页面)与指代词上下文的相似度•候选实体上下文:实体的百科页面(或摘要文字)、实体锚文本•指代词上下文:指代词所在的段落/文档、紧挨指代词前后的n个词•相似度模型:词袋向量、概念(主题)向量•上下文特征•实体间的相似度•计算候选实体e1与上下文中的实体e2的相似度分数,通常利用两个实体的邻居集合U1和U2进行比较•相似度/相关度计算指标:•Jaccard e1,e2=|U1∩U2||U1∪U2|•PMI e1,e2=U1∩U2/|W|U1/|W|∗|U2|/|W|•NGD e1,e2=1−log max|U1|,|U2|−log U1∩U2log|W|−log min|U1|,|U2|•AdamicAdar e1,e2=σn∈U1∩U2log1degree n•短文本实体链接的挑战•训练数据缺乏•难以训练出符合应用环境的监督模型•上下文中的其他实体少•局部模型起主导作用•上下文中的词语少•通常只提供了模糊的主题信息•“红楼梦是谁写的”•“写”->“文学作品”->红楼梦(四大名著之一)•主题的作用•因为短文本上下文的信息量少,利用主题是比较流行的做法•现有主题方法的不足•潜在的主题(LDA)•难以捕捉到实体的细粒度特征•难以解释•手工构造的主题•难以扩展•利用实体的概念作为主题•可以捕捉实体细粒度特征•大量的信息(实体的文章和属性)•大覆盖度(甚至囊括新实体或者长尾实体)•计算主题凝聚度[1]•首先实体与指代词之间的主题/概念相似度sim c m,e=cos v c m,v c ev c e是实体的概念向量,v c m是指代词上下文的概念向量,计算如下:v c m=෍w∈CT(m)v c w D(w,m)CT(m)是上下文词集合•词的概念向量v c w的每一维如下计算r w,c=෍e∈E n w,e·r(e,c)σr(e,c′)•再计算实体与指代词之间的文本相似度cos v w w c,v w w d sim t m,e=max wc∈CT m,w d∈KP(e)KP(e)是关键词组集合,从实体相关文档与属性中抽取•另外再考虑与上下文无关的特征相似度•实体流行度•实体名与指代词的相似度•综合几类相似度分数得到实体与指代词间的最终相似度φe,m•全局目标函数Γ=arg maxΓ′෍i=1Nφe,m i+ψΓ′•其中实体凝聚度(实体间的相关度)为ψΓ=෍e i∈Γ,e j∈Γcoℎe i,e j •短文本上下文中的实体少,因此•NP难的全局算法复杂度可以接受•不需要近似算法•计算实体凝聚度•结合实体相似度和相关度coℎe1,e2=γ·sim e e1,e2+1−γ·rel e1,e2•sim e e1,e2相似度:可考虑NGD距离•rel e1,e2相关度首先计算rel′e1,e2=෍r∈R(e1,e2)2T e1,r+|H(r,e2)|R(e1,e2)是e1,e2之间的关系集合,T e1,r={e′|e1,r,e′∈KG},H(r,e2)={e′|e′,r,e2∈KG}•像“配偶” 和“父母”这样对应少的关系会有大权值•像“国家” 和“出生地”这样对应多的关系会有小权值•由于逆关系通常对应的是同一个关系,因此两个方向取最大值得到rel e1,e2=max(rel′e1,e2,rel′e2,e1)内容提纲•基于知识图谱的搜索•搜索意图理解•实体探索•基于知识图谱的推荐•基于传统知识的推荐•基于知识图谱的物品画像•基于知识图谱的用户画像•基于知识图谱的跨领域推荐实体探索•探索目标实体本身以外更多的内容•展现实体的属性信息•发现(推荐)更多相关实体•KG中的邻居实体(包括直接邻居和高阶邻居)•对目标实体进行概念化的说明/解释•展现目标实体与相关实体间的关系•……•More than oneentity•问题定义[2]•对于给定的一个实体e s,并针对目标实体e所属的类型T及其与给定实体的关系描述R,为目标实体计算如下的概率,最后按照此概率对所有相关的目标实体进行排序并输出•实体共现相关度•实体类型过滤•利用百科实体页面中的分类信息•利用命名实体识别工具•上下文建模t 是关系描述R 中的一个词,是实体e 与e s 的共现语言模型,t 越多地出现在e 与e s 的共现文档集合中,则越大前述的计算两个实体相似度的方法都可适用•问题定义[3]•给定由一组实体代表的查询q ,产生一个(组)概念能完美解释给定实体间的潜在联系•q 中包括搜索实体与推荐的相关实体,因此产生的概念是发现相关实体的基础BRICEmerging economy Growing Market Chinese internet giantChinese companyCountryCompany应该推荐什么相关实体?•算法描述•寻找的概念c i应满足下述目标1. Probabilistic Relevance Modelargmax e∈E−q rel q,e=෍iP e c i P c i qδ(c i)2. Relative Entropy Modelargmin e∈E−q KL P C q,P C q,e=෍i=1nδ(c i)P c i q log(P(c i|q)P(c i|q,e))利用Probase发现概念与实体间的关系找到的概念既要有代表性又要能很好地在最优的粒度层级上解释所推荐的相关实体•计算P(c i |q)1. Naïve Bayes ModelP c i q =P(q|c i )P(c i )P(q)∝ෑe j ∈qP(e j |c i )P(c i )∝P(c i )ෑe j ∈q,n e j ,c i >0λP(e j |c i )ෑe j ∈q,n e j ,c i =0(1−λ)P(e j )2. Noisy-or ModelP c i q =1−ෑe j ∈q(1−P(c i |e j ))•计算δ(c i)•用于度量目标概念的粒度,好的概念既不能太一般化也不能太具体化Concept Number of EntitiesCountry2648Developing country149Growing market18 Entity-based ApproachChina India BrazilDevelopingCountryCountryHierarchy-based Approach 距离q中实体更近的概念更值得考虑•计算δ(c i)1. Entity-based Approach•Penalize popular concepts•δc i=1P(c i)2. Hierarchy-based Approach(Average first passage time)•argmaxC q k σc∈C q kσqi∈qℎ(q i|c)•൝ℎq i c=0,if q i=c ℎq i c=1+σc′∈c(c′)P c′q iℎ(c′|c)if q i≠c•发现实体间的潜在关联具有重要应用价值•KG为实体间的关系提供了数据支撑•挑战:两个实体间的关联路径可能有多条哪种关系才是最该展现的?ISIS头目与一位伊朗少将之间的关联路径[4]•问题转化为对实体间的各条路径进行排序,主要考虑三个要素[4]•Specificity:流行的实体得分要低(类似IDF基本思想)score1p=σe∈p spec e,spe p=log(1+1/docCount(e))•Connectivity:路径中一条边e1,e2的权重与e1和e2的相似度成正比score2p=σ(e1,e2)∈p sim e1,e2,sim e1,e2=cos(e1,e2)•Cohesiveness:要考虑紧挨着的两条边(三个实体)之间的凝聚度score3p=෍(e1,e2,e3)∈psim e1+e2,e3•最终,score p=score1p×score2p×score3pe1是DSM模型[5]产生的实体向量,也可以用前述的方法计算两个实体的相似度•展现实体关系图谱•基于实体间发现的重要关系,可将目标实体与所有挖掘出的相关实体一同展现到一个关系图谱中,为搜索用户提供更加丰富的信息参考文献[1]L.Chen,J.Liang,C.Xie and Yanghua Xiao.“Short Text Entity Linking with Fine-grained Topics”.CIKM(2018).[2]Bron, Marc, K. Balog, and M. D. Rijke. “Ranking related entities: components and analyses.”ACM International Conference on Information and Knowledge Management ACM, 2010:1079-1088.[3]Y.Zhang, Yanghua Xiao et al. “Entity Suggestion with Conceptual Expanation”.IJCAI(2017).[4]Aggarwal, Nitish, S. Bhatia, and V. Misra. “Connecting the Dots: Explaining Relationships Between Unconnected Entities in a Knowledge Graph.” (2016).[5]N. Aggarwal and P. Buitelaar. Wikipedia-based distributional semantics for entity relatedness. In AAAI Fall Symposium Series, 2014.内容提纲•基于知识图谱的搜索•搜索意图理解•实体探索•基于知识图谱的推荐•基于传统知识的推荐•基于知识图谱的物品画像•基于知识图谱的用户画像•基于知识图谱的跨领域推荐电影(豆瓣)图书(亚马逊)推荐系统应用挂广泛•推荐算法的目标p(i|u)或者f:U×I Rargmaxi∈I•推荐算法分类•基于协同过滤:p(i|u,behavior(u))•基于记忆•基于模型•基于内容:p(i|u,content(u,i))•混合方法•基于知识:p(i|u,knowledge)•推荐算法的基本框架精准的用户/物品画像是关键•传统推荐算法的挑战•基于协同过滤•冷启动•数据稀疏•可扩展性•……•基于内容•特征描述•同义/多义词•结果同质性•……❑提高精准度(precision )❑知识图谱为物品引入了更多的语义关系❑知识图谱可以深层次地发现用户兴趣推荐系统中引入知识图谱的优势:喜欢盗梦空间小李子泰坦尼克号主演主演可能喜欢❑增加多样性(diversity)❑知识图谱提供了不同的关系连接种类❑有利于推荐结果的发散,避免推荐结果越来越局限于单一类型推荐系统中引入知识图谱的优势:喜欢盗梦空间小李子泰坦尼克号主演主演科幻黑客帝国克里斯托弗·若兰敦刻尔克题材题材导演导演推荐系统中引入知识图谱的优势:❑可解释性(interpretability)❑知识图谱可以连接用户的兴趣历史和推荐结果❑提高用户对推荐结果的满意度和接受度,增强用户对推荐系统的信任喜欢盗梦空间你可能也喜欢:泰坦尼克号,因为它们有相同的主演;黑客帝国,因为它们有相同的题材;敦刻尔克,因为它们有相同的导演;……内容提纲•基于知识图谱的搜索•搜索意图理解•实体探索•基于知识图谱的推荐•基于传统知识的推荐•基于知识图谱的物品画像•基于知识图谱的用户画像•基于知识图谱的跨领域推荐•基于约束的知识化推荐•什么是约束知识?•通过用户的输入限定物品属性值形成规则集合,形成候选物品的范围约束——关于用户的知识•例如:电影的演员、歌曲的演唱者、餐馆的菜系、手机的价位等类似基于输入条件的查询大众点评餐馆查询/推荐的属性选择页面•基于个案的知识化推荐•什么是个案知识?•先通过某种算法产生一组候选物品给用户选择,将用户的选择作为参照物,再通过物品间的相似性计算找出其他与参照物品高度相似的候选物品,再让用户进一步选择,多次与用户的迭代交互,直至最终产生用户最想要的物品类似问答式的搜索•传统的推荐系统对知识的理解不同于KG的知识•用户的标签、社交网络、商品的目录等信息,只要是有助于发现用户个性偏好和物品特征的数据都曾被看作是知识传统用户/物品知识vs知识图谱知识•传统知识化推荐的挑战•物品知识的获取•系统需要人工构建知识,对长尾实体的覆盖有限•用户知识的获取•系统需要用户输入信息,甚至要反复交互,体验感差知识图谱的出现为解决这些问题带来契机!内容提纲•基于知识图谱的搜索•搜索意图理解•实体探索•基于知识图谱的推荐•基于传统知识的推荐•基于知识图谱的物品画像•基于知识图谱的用户画像•基于知识图谱的跨领域推荐•基本算法目标p(i|u,knowledge(i))argmaxi∈I•基于向量空间模型[2]•为每种属性生成一个表示向量,每一维对应该属性的某个值的权重•例如,电影的演员属性可以表示成一个向量,第一维的值可以是第1号演员对该电影的TF-IDF权重值TF-IDF值如何计算?•两部电影在某种属性上的相似度可以计算为该属性的两个向量的距离•两部电影的相似度则是所有属性相似度的综合,例如加权和或加权平均每种属性的权重如何考虑?•基于向量空间模型[2]用户u对电影m i的喜好评分按照以下公式计算:属性p的权重电影I和j在属性p上的相似度。

以通俗易懂的方式来讲解知识图谱相关的知识

以通俗易懂的方式来讲解知识图谱相关的知识

以通俗易懂的方式来讲解知识图谱相关的知识导读:从一开始的Google搜索,到现在的聊天机器人、大数据风控、证券投资、智能医疗、自适应教育、推荐系统,无一不跟知识图谱相关。

它在技术领域的热度也在逐年上升。

本文以通俗易懂的方式来讲解知识图谱相关的知识、尤其对从零开始搭建知识图谱过程当中需要经历的步骤以及每个阶段需要考虑的问题都给予了比较详细的解释。

对于读者,我们不要求有任何AI相关的背景知识。

1. 概论随着移动互联网的发展,万物互联成为了可能,这种互联所产生的数据也在爆发式地增长,而且这些数据恰好可以作为分析关系的有效原料。

如果说以往的智能分析专注在每一个个体上,在移动互联网时代则除了个体,这种个体之间的关系也必然成为我们需要深入分析的很重要一部分。

在一项任务中,只要有关系分析的需求,知识图谱就“有可能”派的上用场。

2. 什么是知识图谱?知识图谱是由Google公司在2012年提出来的一个新的概念。

从学术的角度,我们可以对知识图谱给一个这样的定义:“知识图谱本质上是语义网络(Semantic Network)的知识库”。

但这有点抽象,所以换个角度,从实际应用的角度出发其实可以简单地把知识图谱理解成多关系图(Multi-relational Graph)。

那什么叫多关系图呢?学过数据结构的都应该知道什么是图(Graph)。

图是由节点(Vertex)和边(Edge)来构成,但这些图通常只包含一种类型的节点和边。

但相反,多关系图一般包含多种类型的节点和多种类型的边。

比如左下图表示一个经典的图结构,右边的图则表示多关系图,因为图里包含了多种类型的节点和边。

这些类型由不同的颜色来标记。

在知识图谱里,我们通常用“实体(Entity)”来表达图里的节点、用“关系(Relation)”来表达图里的“边”。

实体指的是现实世界中的事物比如人、地名、概念、药物、公司等,关系则用来表达不同实体之间的某种联系,比如人-“居住在”-北京、张三和李四是“朋友”、逻辑回归是深度学习的“先导知识”等等。

国内基本公共服务均等化研究知识图谱

国内基本公共服务均等化研究知识图谱

低收入群体的消费影响进行实证研究,由于家庭消费和可支配收入可能同时受到家庭成员的能力、偏好、对未来的预期等一系列不可观察因素的影响,这将导致普通OLS估计出现偏误,我们运用双重差分(DID)方法以消除传统回归中的样本中的内生性问题,并通过了稳健性检验,更有效地获得相应结论。

实证结果表明,对于2,000~3,500元的纯减税群体来说,个税起征点的提高带来了17%的消费提升;对于2,000元的未享受政策福利的群体来说,个税起征点的提高带来了25%的消费提升,反而要高于享受了政策福利的减税群体。

这个结论反映了税改政策确实有刺激消费的作用,但国民的可支配收入普遍提高的情况下,流入市场的货币就会增加,也就间接地抬高了市场上商品的物价。

可以看出,2,000元以下的低收入群体既没有得到更多的可支配收入,还要承担因政策红利带来的额外生活支出。

因此,我们提出以下相关政策建议:第一,在抬高个税起征点,减少中等收入群体税收的同时,最好能辅以相应的低收入补助标准,发布一些利于低收入群体的政策,进一步提升民生福祉,减轻低收入群体的生活压力。

第二,提高企业最低工资标准,促使更多低收入者迈入中等收入群体,减少低收入者的同时,还可以优化我国消费结构,更有利于内需的拉动和民生福祉的提升。

第三,做好相关的市场物价把控,保证基础生活物资的价格保持在相对稳定的水平上,这样就能极大程度避免因市场中货币流通过多而引发的物价上涨,进而抬高低收入群体生活成本的情况。

第四,加大低收入群体在医疗、教育、住房等方面的基本保障,减轻因市场流动货币增加带给低收入群体相关方面的生活成本。

主要参考文献:[1]廖楚晖,魏贵和.个人所得税改革对我国城镇居民收入与消费的影响[J].税务研究,2013(09).[2]刘宁.个税起征点调整对居民消费支出影响的实证分析[J].消费经济,2009(03).[3]王鑫,吴斌珍.个人所得税起征点变化对居民消费的影响[J].世界经济,2011(08).[4]徐润,陈斌开.个人所得税改革可以刺激居民消费吗[J].金融研究,2015(11).基本公共服务均等化是建设服务型政府的重要内容,更是推进国家治理体系和治理能力现代化的必然要求。

我国员工绿色行为研究现状分析——知识化图谱可视化分析及理论视角

我国员工绿色行为研究现状分析——知识化图谱可视化分析及理论视角

引言近年来,环境问题日益严峻,雾霾、全球变暖等已经影响了人们的生活和工作,因此,走可持续发展之路,追求低碳环保绿色,已经成为全球的共识。

环境问题的发生归根到底受到人们行为的影响,企业在经营发展过程中要通过不断加强各种措施,如技术创新、流程改进等,走可持续发展的绿色之路,企业的绿色发展最终还是要落实到企业员工的行为配合与参与上[1]。

近几年,组织行为学家开始关注员工层面在工作场所的亲环境行为,又叫绿色行为。

绿色行为是指企业员工在工作场所采取的有利于环境可持续发展的行为,如节约能源、回收行为、重复利用、环保产品设计等积极践行环境保护的行为[2,3]。

近两年,学者对员工绿色行为的研究呈现明显上升趋势,这些研究对完善和丰富员工绿色行为理论发展和实践作出了重要贡献。

自2019年至今,员工绿色行为的国内研究呈快速发展趋势,因此,有必要对员工绿色行为的国内研究进行梳理。

本文应用知识图谱方法对国内员工绿色行为领域的研究进行梳理,以期为国内员工绿色行为的研究提供参考。

一、研究方法与数据收集(一)研究方法本文借助CiteSpace 软件采用文献计量方法进行可视化分析,即运用关键词共现得到员工绿色行为的研究热点,运用文献共被引分析挖掘国内员工绿色行为研究的知识基础。

(二)数据收集国内文献选择中国知网学术期刊网络出版总库,数据采集时间为2022年9月27日,以“篇关摘=员工绿色行为”OR “员工亲环境行为”OR “环境组织公民行为”OR “环保组织公民行为”OR “员工环保行为”OR “员工环保公民行为”为检索式,匹配为“精确匹配”,检索出2014年至2022年8月间收录与员工绿色行为相关期刊论文,共获得69篇论文,剔除与主题无关的论文,得到论文67篇,其中4篇为综述性论文。

二、数据分析(一)发文趋势阐释发文数量能表示某一主题受关注的程度,每一年是一个数据点,代表该年内发表文献的数量。

最早一篇有关员工绿色行为的文章是王建国(2014)[5]发表的《基于组织支持理论的员工绿色行为意向研究》。

我国军民融合研究热点知识图谱

我国军民融合研究热点知识图谱
热 点知 识 图谱是 共 词 分 析方 法 的集 中 、直 观 展 现形 式 ,体现 了不 同研 究 方 向 的热 度 、相 互 关 系和发 展趋 势 等 。20世 纪 70年 代 中后 期 ,法 国 计 量研 究学 家受 引 文耦 合 与 共被 引 分 析 启 发 ,在 开 发 “LEXIMAPPE” 系 统 提 出 了 一 种 基 于 社 会 网络科 学 绘 图 的 内容 分 析 法— —共 词 分 析 法 ¨J。 Callon等首 次在 将 此类 方 法 应 用 于 研 究 批 量 文 献 并 绘 制 出科 学研 究 图谱 J。20世 纪 9O年代 中期 , 共 词分 析 方法 引入 中 国医 疗 等领 域 并 随 即 引发 了 其 他领 域 的迅速 推 广应 用 。 目前 ,共 词 分析 思 想 和热点 知识 图谱 已被 广 泛 用 于研 究 某 一领 域 的热 点 问题 ,挖掘领 域 内不 同 研究 方 向之 间 的 隐含 关 系 ,考 察该 领域 的研 究 主 题 变 化 和发 展 趋 势 ,并 在 很 多研究 领域 中取 得 了丰硕 的研 究成 果 。
[关键词] 军民融合 ;研 究热点 ;共词分析 【中图分类号]E25 [文献标识码]A 【文章 编号] 1671—4547(2018)02—0010—09 DOI:10.13943/j.issn 1671—4547.2018.02.03
一 、 刖 置
军 民融 合是 指 国防 现代 化 建 设 和经 济 社 会 发 展 相互 渗 透 、相 互 交 融 ,在 更 深 程 度 、更 广 范 围 、更 高层 次上 带 动 科 技 、教 育 、经 济 等各 领 域 全 面有 机结 合在 一起 ,最 终 由量 变 到 质 变形 成 更 高的效 益 。军 民融合 作 为 经 济建 设 和 国 防建 设 结 合 的产 物 ,是 实 现 中 国 梦 和 强 军 梦 的重 要 途 径 。 中 国共 产党 第 十八 次全 国代 表 大会 提 出 “中 国特 色 军 民融合 式发 展 ” 并将 富 国和强 军进 行 统 一 部 署 。十八届 三 中全会 进 一 步将 军 民融合 纳入 深 化 国防 和军 队改革 的 三大 任 务 之 一 ,预示 着军 民融 合 的又 一个 春 天 。习近 平 总 书记 连 续 在 全 国人 大 解放军代表 团和多个重要场合强调军民融合发展 战略 的重要 性 和紧 迫性 ,并 将 军 民融合 发 展 上 升 为 国家 战 略 ,提 出要 加 快 建 立 军 民 融 合 创 新 体 系 ,深 入 实施军 民融 合 发展 战 略。近 年 来 ,国 内 学 者对 军 民融合 问 题进 行 了许 多研 究 ,为军 民融 合 发展 的 实施提 供 了 宝贵 的理论 依 据 。 面对 军 民 融 合快 速 发 展 的 契 机 ,理 论 界 应 当 响应 国 家 号

知识图谱与知识表示学习

知识图谱与知识表示学习

文主要讲解知识图谱最重要的一部分——知识表示。
2 从人工智能认识知识图谱
深度学习和知识图谱其实是 AI 的两个分支 [5],简单地说, 深度学习其实就是聪明的 AI,能够进行感知、识别和判断; 而知识图谱是有学识的 AI,它能够进行思考和推理。所以目 前既要有聪明的算法提供强大的学习能力,又要有丰富的知识 在缺失大量数据的状况下能够通过推理表示出来的能力。AI 的未来离不开联结和符号的相结合、学习和推理的相结合、感 知和认知的相结合 [6]。AI 的核心其实就是学习和推理的过程。
1 引言
随着网络技术的不断推进和发展,知识图谱成为了近几 年学术界研究的热门话题,知识图谱旨在描述概念、实体、 属性、事件及其之间的联系 [1]。1960 年,语义网络(Semantic Networks)作为知识表示的一种方法被提出,主要用于自然 语言理解领域 [2]。20 世纪 80 年代,本体论(Ontology)中 的哲学概念“本体”被引入人工智能领域用来刻画知识。 1989 年 Tim Berners-Lee 发 明 了 万 维 网 Linked Information System。1998 年提出了语义网(Semantic Web),由超文本 链接向语义链接过渡。2006 年 Tim 提出了数据链接(Linked Data), 强 调 语 义 网 的 本 质 是 建 立 开 放 数 据 之 间 的 链 接。 2012 年,谷歌发布了基于知识图谱(Knowledge Graph)的 搜索引擎产品。知识图谱由此而生。知识图谱需要建立在知 识数据库的基础之上 [3],这些知识数据库包括:文本、结构 化数据库、多媒体、传感器、众包等。知识图谱工程包括: 知识表示、知识抽取、知识融合、知识推理、知识问答、语 义搜索、知识链接、知识存储、知识众包与可视化等 [4]。本

基于知识图谱的国内科学数据研究热点和趋势分析

基于知识图谱的国内科学数据研究热点和趋势分析

1概述科学数据是指通过收集、观察、分析和创造各类实验数据、个人观测数据、互联网数据、统计数据、仿真数据,并以表格、数字、图像、新媒体等方式呈现出来的数据。

科学数据是科研创新、技术预见的数据来源和工具,也是国家制定各项决策的重要依据。

近年来随着科学研究进入数据驱动科学的数据密集型研究范式时代,国际组织、政府部门和研究机构等都提高了对科学数据领域研究的关注度和经济资助。

例如联合国教科文组织(UNESCO)推出“促进发展中国家科学数据共享与应用全球联盟计划”国际科学理事会(ICSU)建立了促进全球科学数据共享的国际组织:国际科技数据委员会和世界数据系统等[1]。

图书馆是科学数据的过程监护机构、嵌入式管理机构以及科学数据存档与教育机构[2],对科学数据的管理、共享和服务具有不可替代的地位和作用。

科学数据研究领域在我国虽起步较晚,但在近年来也成为图书情报界的研究热点之一。

从图书馆视角出发,对图书情报界科学数据领域研究热点和趋势进行可视化分析,旨在为图书馆员对科学数据领域进行深入研究提供参考。

2数据来源与研究方法2.1数据来源以中国知网(CNKI)为数据来源,采用高级专业检索,检索式为SU='数据共享'+'数据管理'+'数据监管'+'数据监护'+'科研数据'+'研究数据'+'科学数据'AND SU='图书馆',初次检索得到文献记录1260条,通过手动筛选,去除重复和杂质文献,确定1238条有效文献(检索时间为2018年12月13日)。

2.2研究方法Citespace V 知识可视化软件是由美国德雷赛尔大学陈超美[3]教授开发的一种多元、分时、动态的知识图谱绘制工具。

该软件能将抽象的数据转向图形表达[4],让用户直观地看出对应研究领域的相关信息,通过对图谱的分析与理解可掌握该研究领域的知识结构关系与演进规律等特征。

知识图谱课程大纲

知识图谱课程大纲

知识图谱课程大纲一、课程简介知识图谱是一种表示、存储、管理和应用知识的方法论和技术体系,它基于语义网络和知识表示学,通过对知识的结构化、语义化和链接化,实现知识的可理解、可发现和可推理。

本课程旨在介绍知识图谱的基本概念、原理和应用,培养学生在知识图谱领域的基本能力和实践技巧。

二、课程目标1. 理解知识图谱的基本概念和原理;2. 学习知识图谱的构建和表示方法;3. 掌握知识图谱的查询和推理技术;4. 熟悉知识图谱在各领域的应用案例;5. 培养解决实际问题的能力和创新思维。

三、课程内容第一部分:知识图谱基础1. 知识图谱概述1.1 知识图谱定义1.2 知识图谱的优势和应用领域2. 知识图谱的构建2.1 知识获取方法2.2 知识表示与存储2.3 知识融合与去重3. 知识图谱的表示方法3.1 实体和关系3.2 属性和特征3.3 语义网络和本体第二部分:知识图谱查询和推理1. 知识图谱的查询技术1.1 SPARQL查询语言1.2 图数据库和图查询引擎1.3 知识图谱查询案例分析2. 知识图谱的推理技术2.1 推理规则与推理机制2.2 知识图谱推理应用案例第三部分:知识图谱应用案例1. 面向搜索引擎的知识图谱1.1 知识图谱在搜索引擎中的应用1.2 知识图谱与搜索结果个性化2. 知识图谱在智能问答中的应用2.1 知识图谱与问答系统的关系2.2 知识图谱在智能问答中的应用案例3. 知识图谱在推荐系统中的应用3.1 知识图谱与推荐算法的结合3.2 知识图谱在个性化推荐中的应用案例四、教学方法1. 理论讲授:通过课堂讲解,介绍知识图谱的基本原理和相关技术。

2. 实践操作:通过实验和项目,培养学生在知识图谱领域的实际操作能力。

3. 案例分析:通过实际案例,探讨知识图谱在各行业的应用实践。

五、考核方式1. 平时成绩:参与课堂讨论、实验和项目的表现。

2. 期末考试:考察学生对知识图谱的理解和应用能力。

3. 作业报告:撰写研究性论文或实践报告。

2023年知识图谱行业市场前景分析

2023年知识图谱行业市场前景分析

2023年知识图谱行业市场前景分析一、行业概述知识图谱(Knowledge Graph)是一种基于语义网络的知识组织和表示方式,旨在实现机器可读、半自动化地理解人类语言和语义信息。

随着数据规模的不断扩大和云计算、人工智能等技术的快速发展,知识图谱应用逐渐从学术界走向实际应用,成为当前人工智能领域不可或缺的技术之一。

二、市场规模国内知识图谱市场规模呈现出逐年增长的趋势。

据艾瑞咨询数据显示,2018年中国知识图谱市场规模达到了3.9亿元,预计2022年可达到29亿元。

其中,医疗、金融、物联网等领域是知识图谱应用的重点领域。

三、市场发展趋势1. 数据产业化浪潮将助推知识图谱市场随着大数据时代的到来,数据产业化浪潮已经逐渐兴起。

数据再利用率的提高成为了数据应用与商业化的发展方向。

知识图谱通过对数据进行组织和建模,实现数据的再利用,重构整个行业的数据生态。

随着数据产业化浪潮的不断升级,知识图谱技术的市场需求也会进一步提升。

2. 人工智能驱动下的智能应用持续走热知识图谱和人工智能技术结合能够构建智能应用,并落地到行业垂直领域。

知识图谱具有理解语义、表达属性和关系等优点,可提高人工智能的学习效率和表达能力,从而推动机器智能应用的发展。

预计未来几年随着智能应用的不断出现和用户需求的不断增加,知识图谱市场会持续走热。

3. 政策扶持将为知识图谱行业发展提供政策支持目前,国内的知识图谱产业还处于起步阶段,但是国家已经加大政策扶持力度,鼓励企业进行相关技术研发和应用实践。

同时,政府部门也将在知识图谱领域设置专项资金,技术梯度扶持、示范项目扶持、政策引导等方面入手,为知识图谱行业的发展提供政策支持。

四、市场前景展望随着知识图谱技术的快速发展和应用场景的逐渐丰富,未来市场前景可观。

目前,国内在知识图谱领域已经涌现出大量的企业和技术创新团队。

随着技术的不断成熟和应用场景的不断拓宽,知识图谱市场前景将会进一步扩大。

根据我国科技创新人才总量和科技产业发展潜力等方面考虑,长期来看,中国的知识图谱市场可能进一步扩大,未来发展空间广阔。

高校知识图谱的构建与数字资源分配新融合

高校知识图谱的构建与数字资源分配新融合

高校知识图谱的构建与数字资源分配新融合作者:房栋来源:《中国信息技术教育》2018年第16期摘要:本文提出,知识图谱系统通过大数据和可视化技术,建立以关键词为中心的知识体系,能让资源以结构化、可视化的方式呈现,让知识的获取更加快速、准确。

同时,在移动互联时代为学校的数字资源建设、管理、服务提供了一个获取、存储、组织、管理、更新和展示的有效手段。

关键词:知识图谱;大数据;数字资源;可视化中图分类号:G434 文献标识码:A 论文编号:1674-2117(2018)15/16-0164-04当今的信息化社会,从商业经济运行到科研医疗创新,从政府管理到互联网服务支持,各个领域都爆炸式产生巨量的数据,谷歌公司每天要处理超过24拍字节的数据,谷歌子公司YOUTUBE每月接待多达8亿的访客,平均每一秒钟就有一段长度在一小时以上的视频上传,FACEBOO每天更新的照片量超过1000万张,每天人们在网站上点赞或评论次数大约有三十亿次,TEITTER上的信息量几乎每年翻一倍,每天都会发布超过4亿条微博,这些数据支撑了社会各方面的运行,也成为人类发展进步历程的宝贵财富积累。

2015年,一个名为AlphaGo 的计算机程序横空出世,在短短25个月的时间里斩落了中日韩的围棋顶尖高手,不断地挑战人类对围棋的认知。

从这些事例可以看出,知识图谱、大数据和深度学习成为推动人工智能发展的核心驱动力。

高校作为人类社会知识创造、记录和传承的智力机构,聚集了大量的科研和教学数据资源,因此,高校可利用人工智能技術整合校内外数字数据资源,构建基于校本特色的知识图谱,为学校的智力支持构建一个智能、高效的知识组织方式,形成信息技术与资源的新融合,帮助师生更加快速而准确地查找自己需要的信息。

谷歌公司于2012年首先提出知识图谱的概念,表示将在其搜索结果中加入知识图谱的功能,同年5月推出谷歌知识图谱,强化其搜索引擎的搜索结果,标志着大规模知识在互联网语义搜索中的成功应用。

中国特色地方志文献研究的知识图谱分析

中国特色地方志文献研究的知识图谱分析

中国特色地方志文献研究的知识图谱分析作者:李娜来源:《文教资料》2021年第02期摘要:在文化自信的国家战略下,地方志等中国特色传统文献日益受到重视。

本文运用Cite Space对国内824篇相关文献进行可视化分析,基于文献中的作者、机构、关键词等共现关系梳理国内关于方志研究的热点和趋势。

通过分析国内方志研究进程,为进一步深入挖掘和利用中国地方志资料提供有益参考,推动中华优秀传统文化的传承和创新。

关键词:地方志知识图谱 Cite Space 可视化特色文献一、引言作为独具中国特色的文献类型,中国地方志全面记载着特定时空内的自然、社会、政治、经济、文化等各方面情况,被誉为“一方之全史”[1]。

它起源早、持续久、类型全、数量多,据《中国地方志联合目录》统计,仅保存至今的宋至民国时期的方志就有8264种,11万余卷,占中国古籍的十分之一左右,是传承中华文明、发掘历史智慧的重要载体,具有存史、资治、兴利、教化等功能[2]。

科技史专家李约瑟指出“要了解中国文化,必须先了解中国的地方志”[3]。

党中央多次强调要“修志问道,以启未来”,深入挖掘中华优秀传统文化内涵,弘扬民族文化,服务经济社会发展。

整理和利用地方志资料,为古今学者所重视,也是我国历史上的一个优良传统。

由于历史原因,地方志资料不仅保存在国内,还有大量流散到国外,地方志数据库建设和检索平台开发,推动了地方志资料的传播和共享,国内外学者就地方志的研究积累了一批学术成果。

有学者先后对地方志研究成果进行了综述性梳理,但是绝大多数综述都关注某一类型或者某一地区方志研究的综述,如甘肃方志整理与研究状况[4](52-56)、安徽旧志整理与研究[5](53-62+64)、艺文志的研究[6](106-110)、村志的研究[7](14-16)、一统志的研究[8](10-14)等,基于知识图谱进行大范围方志研究成果的计量研究成果极少。

鉴于此,本文基于知识图谱理论,运用Cite Space软件,通过共现关系对2001年至2018年间国内824篇方志相关研究成果进行计量分析,梳理国内方志研究脉络,厘清研究热点和趋势,以为中国特色方志类资料的整理利用研究提供理论和实践参考。

自然语言处理领域国内发展态势分析

自然语言处理领域国内发展态势分析

自然语言处理领域国内发展态势分析一、自然语言处理技术的概述自然语言处理(Natural Language Processing,简称NLP)是计算机科学、人工智能和语言学领域的一个重要交叉学科。

它研究如何让计算机能够理解、生成和处理人类语言,以实现人机之间的有效沟通。

随着大数据时代的到来,自然语言处理技术在近年来取得了显著的发展,逐渐成为人工智能领域的热点和前沿方向之一。

自然语言处理技术的发展可以追溯到20世纪50年代,当时科学家们开始研究如何使计算机能够理解和生成人类语言。

经过几十年的发展,自然语言处理技术已经从最初的规则系统发展到了基于统计机器学习的方法,再到现在的深度学习技术。

在这个过程中,涌现出了一批优秀的研究人员和企业,如百度、阿里巴巴、腾讯等,为中国自然语言处理领域的发展做出了巨大贡献。

自然语言处理技术在各个领域都有广泛的应用,如智能问答、机器翻译、情感分析、文本分类等。

智能问答是自然语言处理技术的重要应用之一,它可以帮助用户快速获取所需信息,提高人们的生活和工作效率。

随着语音识别技术的发展,越来越多的智能设备开始具备语音交互功能,使得人机之间的沟通更加便捷。

自然语言处理技术将继续保持快速发展的态势,随着深度学习技术的不断成熟,自然语言处理模型的性能将得到进一步提升;另一方面,随着大数据和云计算技术的发展,自然语言处理数据的规模和质量将得到持续优化。

跨学科的研究也将为自然语言处理技术的发展提供新的思路和方法。

结合计算机视觉技术进行图像描述,或者与心理学、社会学等领域的研究相结合,以提高自然语言处理技术的普适性和实用性。

A. 自然语言处理的定义和发展历程自然语言处理(Natural Language Processing,简称NLP)是一门研究人类语言与计算机之间相互作用的学科。

它旨在让计算机能够理解、解释和生成人类的自然语言,从而实现人机之间的有效沟通。

自然语言处理的发展历程可以追溯到20世纪50年代,当时科学家们开始研究如何使计算机能够理解和处理人类语言。

医学知识图谱研究综述

医学知识图谱研究综述

第 22卷第 5期2023年 5月Vol.22 No.5May 2023软件导刊Software Guide医学知识图谱研究综述刘悦悦,李燕(甘肃中医药大学信息工程学院,甘肃兰州 730000)摘要:知识图谱是一个古老又崭新的课题,是知识工程在新时代的新形态,也是当前人工智能的重要研究方向之一。

知识图谱应用于医疗领域在一定程度上对医疗数据以及医患之间的治疗过程起到了很大的助推作用。

针对医学知识图谱的构建,从医学数据源、医学知识抽取、医学知识融合、医学知识表示、医学知识存储、医学知识推理、医学质量评估7个方面结合相关文献展开叙述;然后总结医学知识图谱在临床决策支持诊断、医学知识普及、医学问答系统以及智能语义搜索方面的应用;最后就目前医学知识图谱面临的挑战进行讨论,以期为其进一步发展构建提供参考。

关键词:医学知识图谱;构建技术;人工智能;大数据DOI:10.11907/rjdk.221641开放科学(资源服务)标识码(OSID):中图分类号:TP391 文献标识码:A文章编号:1672-7800(2023)005-0241-07Review of Medical Knowledge Graph ResearchLIU Yue-yue, LI Yan(School of Information Engineering, Gansu University of Traditional Chinese Medicine, Lanzhou 730000,China)Abstract:Knowledge graph is an old and new topic,a new form of knowledge engineering in the new era,and one of the important directions of artificial intelligence.The application of knowledge graph in the medical field has played a great role in pushing the medical data and the treatment process between doctors and patients to a certain extent.The feature of this paper is the construction of medical knowledge graph,from seven aspects:medical knowledge data source,medical knowledge extraction,medical knowledge fusion,medical knowledge representa‐tion,medical knowledge storage,medical knowledge reasoning,and medical quality assessment,and then summarizes the application of medi‐cal knowledge graph in clinical decision support diagnosis,medical knowledge popularization,medical question answering system and intelli‐gent semantic search,and finally discusses the current challenges faced by medical knowledge graph,in order to provide reference for the de‐velopment and construction of medical knowledge graph.Key Words:medical knowledge graph; construction technology; artificial intelligence; big data0 引言大数据(也称巨量资料)时代,医疗数据量以几何级数的形式高速增长,数据增长速度可以用“爆炸式”来形容。

脑机接口研究之演化及教育应用趋势的知识图谱分析——基于1985-2018年SCI及SSCI期刊论文研

脑机接口研究之演化及教育应用趋势的知识图谱分析——基于1985-2018年SCI及SSCI期刊论文研
ቤተ መጻሕፍቲ ባይዱ
研究人脑内部的学习机理& 这使得脑科学在获得更 多的.更直接的学习研究结论方面'显示出巨大的优 势与发展前景&
我国脑科学与教育科学结合的推动者韦钰教授 认为'/教育神经科学的出现' 使我们可以根据人脑 的发展规律来研究人的心智发展' 进而研究教育的 规律& 教育神经科学可以为教育政策的制定.教学和 其他教育实践提供实证的科学基础0,'-' 是教育研究 的新范式& 作为脑科学研究成果之一的脑机接口 $789:; 5<=>?@A8 B;@A8C9DA'75B%技 术 的 逐 渐 成 熟 '为 教育大数据.人工智能教育应用提供数据来源'对智 慧E智 能 学 习 环 境 .智 慧E智 能 课 堂 的 构 建 ' 以 及 学 习 者的学习行为分析和自适应学习均产生了重要影响&
! 基金项目!本文系东北师范大学哲学社会科学校内青年基金项目"基于服务型图书馆的读者行为分析#$编号!"#$%&#'%阶段性成果&
DE
前沿探索
'()*+,EFG2HIJKLM-89:;CD
!" # $" #
势!以期为今后的相关研究提供一些参考"
%&'()*+,-./012+,34 脑机接口#以下简称 !"#$!是近年来在认知神经 科学脑功能成像技术基础上发展起来的一项应用技 术% 它通过对脑信号的采集和预处理!将其转换为计 算机识别的信号!通过信息的特征提取&特征分类等 算法!进而转化为控制外部设备的指令!实现在一定 程度上解读人简单思维的目的$%&" 这种直接通过大脑 的思维活动来表达想法或操纵设备!而不需要任何言 语或动作的技术! 能够为严重神经或肌肉障碍患者! 建立人脑和计算机或其他装置直接交流的途径" 这一领域的最早研究可以追溯到 '()* 年!但直 到 '((( 年 * 月!在美国纽约举行的第一次 !"# 学术 研讨会上!+,-./0 1 对于脑机接口才作出了首次正 式的界定' 脑机接口是一种不依赖于脑的正常输出 通 路 (外 围 神 经 和 肌 肉 $!在 人 脑 和 计 算 机 或 其 他 电 子设备之间建立直接交流和控制通道的适时通讯系 统$2&% 标志着这一全新研究领域的正式形成% 顾名思义! 脑机接口技术首要的研究领域就是 脑信号的获取% 脑信号可分为脑电信号&脑磁信号及 脑血流信号等% 在早期阶段! 由于脑电信号易于获 取!国外研究较多关注脑电信号% 后来!随着脑磁信 号 及 脑 血 流 信 号 等 其 他 信 号 获 取 技 术 的 进 步 !!"# 研究渐趋多样化! 图 ' 所示的是目前脑机接口主流 系统的构成情况%

欧洲传播研究的知识图谱分析——以两本欧洲传播杂志(2010—2014年)为例

欧洲传播研究的知识图谱分析——以两本欧洲传播杂志(2010—2014年)为例

欧洲传播研究的知识图谱分析——以两本欧洲传播杂志(2010—2014年)为例侯东阳【摘要】中国传播学体系主要来源于西方经典的传播学理论和方法,但国内学者对于新媒介环境下西方传播研究关注的热点和研究前沿了解不多.本文对两本研究欧洲传播的杂志进行知识图谱的可视化呈现;然后对其中一本杂志进行内容分析.从参考文献共被引、论文内容和引用频次三方面互相参证,研究发现欧洲传播研究的前沿主要是媒介化、数字媒介、新媒体环境下的政治传播、媒体比较等方面.研究方法以定量为主,"内容分析"经常被突出强调.其中媒介化是近年来欧洲兴起的比较有特色的一种理论和方法.%The system of Chinese communication studies mainly stems from Western classical theories and methods of communication.However,domestic scholars do not learn much about the frontiers of the western com-munication studies under the new media environment.This article visualizes the knowledge maps of two European communication journals,and analyzes the content of one of the journals.From the three aspects of co-citation,text and cited frequency,the author finds that the distinctive feature of European communication research is the trend of mediatization,with digital media, and political communication becoming new forefronts in new media environ-ment.The method applied in European countries is mainly based on quantitative analysis,and"content analysis"is often listed in the keywords.Particularly,the mediatization is a comparatively distinctive theory and method ris-ing from Europe in recent years.【期刊名称】《暨南学报(哲学社会科学版)》【年(卷),期】2018(000)001【总页数】9页(P107-115)【关键词】欧洲传播研究;知识图谱;研究前沿;媒介化【作者】侯东阳【作者单位】暨南大学新闻与传播学院【正文语种】中文【中图分类】G20中国的传播学理论主要来自西方,但大都是20世纪八九十年代传入中国的,在新媒体环境下西方传播理论有何新的变化和趋势,我们对此了解不多。

知识图谱课程教学探索与实践

知识图谱课程教学探索与实践

Science &Technology Vision科技视界1知识图谱课程背景,,、、、[1]。

,,、、、。

,,。

,、,,。

、、、。

2教学现状分析,。

2.1课程开设时间短“”2012,,。

,。

,,。

,2017,,。

2.2课程知识点多,,,,。

,“”,,。

,,。

3知识图谱课程教学目标,,“--”。

,、、、;,、,。

,,、、、。

,、,,、。

4知识图谱课程教学,。

、,、,、,知识图谱课程教学探索与实践谢丽(广州城市理工学院,广东广州510800)【摘要】知识图谱是以图的形式描述客观世界中实体及其实体间关系的知识库,其强大的语义处理和互联组织能力,为智能化信息应用提供了基础,是人工智能技术的重要组成部分。

如何在高校新增的人工智能专业中开设知识图谱课程,让学生对知识图谱有一个较全面的认识,并提供一个实用的知识图谱入门指南,是有着较大挑战性的问题。

文章首先分析了该课程的教学现状,然后从教学目标的定位、教学内容的选择、教学方式及考核方式等方面对知识图谱课程教学进行了深入的探索与实践,以期为知识图谱课程的开展做出一定的贡献。

【关键词】知识图谱;人工智能;课程教学中图分类号:TP391.1;G642.0文献标识码:ADOI:10.19694/ki.issn2095-2457.2021.32.2048. All Rights Reserved.。

4.1教学内容:、、、、[3]。

,,,[2]。

:(1),、、、。

(2),, Protégé。

(3),(、、)。

(4),。

(5),、, Neo4j。

(6),,。

(7),,、、。

4.2教学方式,、、、Python,。

,67,32(2),24 ,8。

,、、[3]。

:(1),。

,、、,,。

(2),,。

、,Freebase、Wikidata、OpenKG,,。

,,,,。

(3),,。

、、,,,,。

4.3考核方式,,。

, 50%,; 15%,、;35%,、、,。

近二十年学校环境教育研究的知识图谱分析

近二十年学校环境教育研究的知识图谱分析

教育文化论坛㊀2018年2期㊀ 理论探索收稿日期:2018-02-28基金项目:辽宁省教育厅人文社会科学研究项目(UPRP20140400)ꎮ作者简介:高源(1976-)ꎬ女ꎬ河北昌黎人ꎬ副教授ꎮ研究方向:区域地理及地理教育方向ꎮ段亚会(1994-)ꎬ女ꎬ内蒙古赤峰人ꎬ研究生ꎮ研究方向:课程与教学论ꎮ张㊀鑫(1991-)ꎬ女ꎬ吉林四平人ꎬ研究生ꎮ研究方向:人文地理ꎮ近二十年学校环境教育研究的知识图谱分析高㊀源㊀段亚会㊀张㊀鑫(辽宁师范大学城市与环境学院ꎬ辽宁大连㊀116029)摘㊀要:㊀ 环境教育 是近些年来两会的热点话题之一ꎬ为探究国内环境教育特别是学校环境教育的发展现状㊁演进趋势ꎬ文章以中国知网(CNKI)收录的期刊论文为研究对象ꎬ借助可视化工具CiteSpace对学校环境教育近二十年的学术成果进行了趋势及现状的知识图谱分析ꎬ发现关于学校环境教育的研究热点主要集中在绿色学校㊁环境意识㊁环境问题㊁环保教育等热点问题上ꎮ同时阐述未来学校环境教育发展的趋向及政策的引导和建议ꎮ关键词:㊀学校环境教育ꎻCiteSpaceꎻ知识图谱分析中图分类号:G420㊀文献标识码:A㊀文章编号:1674-7615(2018)02-0013-06DOI:10.15958/j.cnki.jywhlt.2018.02.003㊀㊀十二届全国人大五次会议上ꎬ环保部部长陈吉宁就 加强生态环境保护 的相关问题答记者问中明确指出ꎬ环境问题是一个公共利益的问题ꎬ并提出加强环境宣传教育ꎮ而对于环境教育他指出ꎬ环境教育是一个长期的过程ꎬ应该从儿童抓起ꎬ要教会他们什么是绿色ꎬ什么是环保ꎮ要想解决环境问题就要解决两个根本问题ꎬ一个是技术问题ꎬ技术的进步是人类的创新ꎮ二是取决于我们的理念ꎬ要建设好每个人的环保理念ꎮ由于近些年在很多一线经济发展好的省市ꎬ教育部多次下发了因雾霾停课的通知ꎬ环境问题严重影响了学校的教育ꎬ因此对各个高校及中小学进行环境教育变得迫在眉睫ꎮ为了探索我国学校环境教育领域的发展现状及研究方向ꎬ本文利用知识图谱可视化工具CiteSpace对近二十年间国内的学校环境教育研究重要文献的发文数量㊁重要作者㊁权威机构㊁研究热点进行了统计分析ꎬ以期对未来各个学校开展环境教育提供有益指导ꎬ促进学校环境教育的不断发展进步ꎮ㊀㊀一㊁研究方法(一)数据来源以中国知网(CNKI)为检索平台ꎬ以 学校环境教育 幼儿园环境教育 小学环境教育 中学环境教育 大学环境教育 为检索主题进行严格检索ꎬ以1997-2016年ꎬ共20年为检索时间界限ꎬ展开文献检索工作ꎬ在剔除诸如会议记录㊁报纸㊁年鉴㊁词典等不符合要求的文献后ꎬ最终得到899篇中文期刊论文作为有效文献进行统计研究ꎮ(二)研究工具与过程此次研究采用的是美国德雷克塞尔大学信息科学与技术学院教授(大连理工大学特聘教授陈超美)开发的CiteSpace进行知识图谱分析ꎮ将确定期刊论文的题录信息以Reworks格式导出ꎬ用于CiteSpace软件进行可视化分析ꎬ以探索我国环境教育的研究热点信息ꎮ㊀㊀㊀㊀㊀㊀㊀㊀教育文化论坛㊀2018年㊀第2期JiaoYuWenHuaLunTan㊀ 理论探索㊀㊀二㊁近二十年学校环境教育研究基本情况(一)近二十年学校环境教育研究的论文发表情况1997年-2016年国内关于学校环境教育研究的所有文献数据来源于中国知网(CNKI)ꎬ其中收录的所有关于环境教育研究的文献均是国内学者的重要研究成果ꎬ具有一定的代表性和典型性ꎬ对于研究和挖掘近二十年我国关于学校环境教育研究的基本情况㊁主题热点等具有重要的意义ꎮ在中国知网(CNKI)高级检索中选定期刊文献搜索ꎬ在 检索条件 中第一个条件以 环境教育 为检索词在 主题 中进行输入ꎬ第二个条件分别以 学校㊁幼儿园㊁小学㊁中学㊁大学 为检索词在 篇名 中输入ꎬ将两个检索条件同时进行检索ꎮ所有文献下载时间限定在1997年到2016年ꎬ共20年ꎬ总共检索到899篇对学校环境教育研究有重要意义的文献[1]ꎮ通过对近二十年的论文篇数统计分析ꎬ利用Excel制成如下数据统计图(见图1)ꎮ图1㊀近二十年学校环境教育研究文献数量统计研究通过图1可以看出ꎬ1997年-2011年国内学校环境教育研究一直处于较平缓的波动状态ꎬ表明这段时间内虽然学者对于学校环境教育研究有了一定的关注度ꎬ但是学校环境教育还没有成为当时的热点话题ꎮ自2012年后到2016年是学校环境教育研究的高峰期ꎬ特别是2012㊁2013及2015年ꎬ这三年每年关于学校环境教育研究的文献高达80篇ꎮ2012年-2016年的几年间经济的快速发展给环境带来了越来越大的负担ꎬ同时环境问题也逐渐的影响到了学校环境和学生的学习生活ꎬ学者的重视和关注度也开始加强ꎮ由此可见ꎬ国内关于学校环境教育研究的重要文献收录数量的总体趋势方面ꎬ2012年是一个分水岭ꎬ2012年以前对于学校环境教育研究的文献总体趋于平缓ꎬ自2012年开始文献研究数量骤然上增ꎬ五年的时间关于学校环境教育的研究文献高达352篇ꎬ一定程度上显示了近几年的研究热度以及未来的发展趋势ꎮ(二)近二十年环境教育研究的权威作者分析CiteSpace图谱可视化软件具有来源作者共现分析功能ꎮ本文对1997年-2016年学校环境教育研究的权威作者进行了来源作者的共现分析ꎬ并绘制出来1997年-2016年关于学校环境教育研究的作者知识图谱(见图二)ꎬ通过对图二中的权威作者进行共现频次统计ꎬ统计出现频次较高的前二十个权威作者并进行了权威作者高频列表(见表一)[2]ꎮ图2㊀学校环境教育研究权威作者图谱表1㊀学校环境教育研究发文作者前二十名统计表序号作者出现频次序号作者出现频次1祝怀新611田亚平32曾红鹰612陈南33申秀英613常昊34陈晓侠614鲁兴树35刘沛林515梁仁君26孙刚316孙润秀27徐美317鞠鑫28房岩318李子建29杨士军319吴殿峰210史威320张琳2通过图2和表1显示可以看出在近二十年来出现最多次数的作者分别是祝怀新㊁曾红鹰㊁申秀英㊁陈晓侠ꎬ均是发文6篇ꎬ其次是刘沛林ꎬ发文5篇ꎬ还有孙刚㊁徐美㊁房言㊁杨士军㊁史威等发文3篇ꎬ以及还有几百名发文作者发文一篇左右没有统计在内ꎮ以上作者近二十年来在学校环境教育研究方面积极高㊀源㊀段亚会㊀张㊀鑫:近二十年学校环境教育研究的知识图谱分析㊀ 理论探索探索研究ꎬ研究成果突出ꎬ为环境教育领域㊁学校教育领域均做出了很大的贡献ꎮ(三)近二十年环境教育研究的重要发文机构分析为发现我国关于学校环境教育研究的核心学术团体和机构ꎬ统计了各个研究单位在学校环境教育方向发表的论文数量ꎬ通过CiteSpace图谱可视化软件对发文机构进行共现分析ꎮ对1997年-2016年学校环境教育研究的发文机构进行可视化分析ꎬ并绘制出了自1997年-2016年关于学校环境教育研究发文机构的知识图谱(见图3)ꎬ通过对图3中的发文机构进行共现频次统计ꎬ统计出现频次较高的前二十个发文机构并进行了发文机构高频列表(见表2)ꎮ根据图三和表二可以看出ꎬ在近二十年来关于学校环境教育研究的发文机构很多ꎬ按照发文数量排序分析ꎬ关于学校环境教育研究的发文机构前二十名在近二十年发文次数均在2次以上ꎬ其中较有影响力的且发文较多的发文机构分别是衡阳师范学院资源环境与旅游管理系(8次)㊁北京师范大学环境教育中心(5次)㊁国家环保局宣教中心(4次)㊁南京师范大学地理科学学院(3次)㊁浙江大学教育系(3次)等ꎮ上述的所有发文机构在近二十年来相互合作对学校环境教育表现出了充分的关注ꎬ并为环境教育的未来发展做出了一定的贡献[3]ꎮ(四)近二十年环境教育研究的热点分析1.研究热点ꎮ关键词是一篇论文的核心观点ꎬ是对文献主题的高度概括和提炼ꎬ因此对某一领域相关文献关键词的分析ꎬ有助于挖掘该领域的研究热点和方向ꎮ使用可视化工具CiteSpace对研究对象的关键词进行分析ꎬ将文献数据以Reworks格式导出ꎬ然后使用CiteSpace软件对学校环境教育的899篇文献进行数据分析ꎬ设置时间跨度为1997-图3㊀学校环境教育研究重要发文机构图谱表2㊀学校环境教育研究发文机构前二十名统计表序号发文机构出现频次序号发文机构出现频次1衡阳师范学院资源环境与旅游管理系811河北大学22北京师范大学环境教育中心512浙江大学教育学院23上海市环境学校413北京师范大学24国家环保总局宣教中心314北京师范大学地理学与遥感科学学院25江苏省环境保护宣传教育中心315衡阳师范学院南岳学院26江苏省运河师范学校316西南大学化学化工学院27南京师范大学地理科学学院317湖南省普通高校哲学社会科学重点研究基地 环境教育研究中心28浙江大学教育系318首都师范大学地理系29长春师范学院生命科学学院319江苏省运河高等师范学校210江苏第二师范学院环境教育研究所220清华大学绿色大学办公室22016年ꎬ经过分析制作了关于学校环境教育关键词的知识图谱(见图四)ꎬ通过对图四中的关键词进行共现频次统计ꎬ统计了出现频次较高的前二十个关键词并进行了关键词高频列表(见表三)[4]ꎮ图4㊀学校环境教育研究主题热点图谱㊀㊀㊀㊀㊀㊀㊀㊀教育文化论坛㊀2018年㊀第2期JiaoYuWenHuaLunTan㊀ 理论探索表3㊀学校环境教育研究关键词前二十个统计表序号关键词出现频次序号关键词出现频次1环境教育53711可持续发展教育312绿色学校17712地球日303环境意识16813幼儿园环境274环境问题12214环境教育工作255小学环境教育6915环境道德216教育内容4716可持续发展197世界环境日4517环保宣传198环保教育4118生态教育179环保意识4019绿色校园1710国际生态学校3320生态校园16通过使用可视化软件进行分析绘制了图四及表三ꎬ首先ꎬ根据图四和表三所有关键词出现的频次可以看出近些年来关于学校环境教育研究的关键词除了 环境教育 出现频次最高(537次)以外ꎬ其他关键词出现频次较高的分别是 绿色学校(177次) 环境意识(168次) 环境问题(122次) 小学环境教育(69次) 教育内容(47次) 世界环境日(45次) 环保教育(41次) 国际生态学校(33次) 及 可持续发展教育(31次) 等ꎬ以上的所有关键词围绕着环境教育ꎬ充分展示了在近二十年来国内在该领域中的充分重视ꎮ根据整理以上关键词可以清楚的发现近些年我国在以下几个方面的关注度明显在加强ꎮ第一是建设绿色校园ꎮ绿色校园的概念在1996年«全国环境宣传教育行动纲要»中首次提出ꎬ之后很多学者都进行了相关研究ꎬ从表三高频关键词统计中也可以看出在近些年来相关研究人员对于学校环境教育研究中建设绿色学校的高度关注ꎮ如吉林大学王福刚提出将低碳环保理念融入校园ꎬ潜移默化的将绿色㊁环保理念渗透进学生的校园生活中ꎬ塑造学生良好的行为习惯[5]ꎬ以及兰州城市学院郑士香提出创建一种节能环保㊁绿色和可持续发展的文化理念ꎬ加强绿色教育ꎬ推广绿色科技等策略ꎬ让学生在生活中重视环保节能材料的运用和注重再生资源的利用或者开展绿色校园活动ꎬ制定环保相关主题ꎬ鼓励学生制定绿色计划ꎬ从节约一度电㊁一滴水开始[6]ꎮ相关研究还有生态教育[7]㊁教育生态化[8]㊁生态校园㊁绿色校园以及曾建平提出的绿色学校是21世纪的必然走向[9]ꎮ第二是环境意识或者环保意识研究ꎮ环境意识是人们对环境和环境保护的一个认识水平和认识程度ꎬ又是人们为保护环境而不断调整自身经济活动和社会行为ꎬ协调人与环境㊁人与自然互相关系的实践活动的自觉性ꎮ根据中国知网(CNKI)提供的文献ꎬ在近10年间关于环境意识的相关期刊文献高达上千条ꎬ可以看出相关学者对此有很高的关注度ꎮ主要的研究方向如学生环保意识的现状研究[10ꎬ11]㊁如何提高学生环保意识的对策研究[12ꎬ13]㊁在各学科中如何培养环境意识的研究[14ꎬ15]等ꎮ随着经济的发展ꎬ环保意识的培养受到很多学者的重视ꎬ一直是社会的热点问题ꎮ第三是环境教育理论的探究ꎮ较早开始进行环境教育问题探讨是1965年在德国基尔大学召开的教育大会上ꎮ而对于环境教育的概念一直存在着分歧ꎬ直到今天ꎬ尽管各国环境教育活动已经开展得相当普遍ꎬ但对此仍没有形成一个统一的定义ꎬ很多学者一直在不断探索的路上ꎮ环境教育的内容很丰富ꎬ大部分学者认为环境教育由意识㊁理解㊁技能㊁价值观与态度四个要素组成ꎮ祝怀新在他的文章里分别阐述了四个要素的基本内容ꎬ如在阐述价值观与态度时说环境教育除了传授有关环境问题的知识㊁发展基本技能之外ꎬ还应注重树立学习者环境方面的价值观和态度ꎬ包括环境审美感㊁主动参与自然保护工作的愿望㊁尊重与热爱生命的品质等ꎮ环境问题日益严峻ꎬ各国都在重视环境教育ꎬ以期提高在校学生的环境意识ꎬ因此环境教育理论的研究迫在眉睫[16]ꎮ第四是国际生态学校研究ꎮ国际生态学校项目(ECO-SCHOOLꎬES)是国际环境教育基金会(FEE)在全球推展的五个环境教育项目之一ꎬ是当今世界上面向青少年的最大的环境教育项目ꎬ旨在帮助学校改善当地环境ꎬ节约资源并减少他们的碳足迹ꎮ该项目始于1994年ꎬ是环保部宣教中心作为中国代表机构加入国际环境教育基金会后ꎬ首次在中国启动的全球性环境与可持续发展教育项目ꎮ该项目提出后受到相关学者的高度重视ꎬ王蕾提出以 七步法 打造国际生态学校[17]ꎬ韦建华以广西第一所国际生态学校柳州市羊角山小学为例阐述了如何开展绿色教育[18]ꎮ国际生态学校在未来的学校环境教育中是一个重要的发展方向ꎬ也得到了越来越多学者专家的关注ꎮ高㊀源㊀段亚会㊀张㊀鑫:近二十年学校环境教育研究的知识图谱分析㊀ 理论探索㊀㊀三㊁结论与展望本文通过CITESPACE进行可视化分析制成知识图谱对学校环境教育进行分析ꎬ识别关于学校环境教育研究的热点㊁核心权威作者㊁主要发文机构ꎬ清楚详细的表现了目前学校环境教育研究的现状ꎮ通过对1997年-2016年发表在中国知网(CNKI)的中文核心期刊论文进行统计分析ꎬ发现关于学校环境教育的研究在2012年以后有越来越热的趋势ꎮ通过对关键词的统计分析发现出现的高频关键词主要是 环境教育 绿色学校 环境意识 环境问题 小学环境问题 等ꎮ近些年关于学校环境教育研究的高发文量作者有浙江大学教育学院教授祝怀新㊁衡阳师范学院教授申秀英及党委书记刘沛林等ꎬ可以看出各个科研机构间科研能力差异显著ꎬ发文次数多且优秀的发文机构主要集中在高校的环境教育系或者环保局等ꎮ1972年斯德哥尔摩人类环境会议是全球环境教育运动的发端ꎬ会议强调要利用跨学科的方式ꎬ在各级正规和非正规教育中㊁在校内和校外教育中进行环境教育ꎮ1992年提出了«21世纪议程»ꎬ使环境教育成为世界公民必备的通识ꎮ1979年ꎬ中国环境科学学会环境教育委员会召开了第一次会议ꎬ此后ꎬ各级各类学校的环境教育蓬勃兴起ꎮ进入21世纪将近二十年间也一直处于平稳发展的状态ꎬ但在发展的过程中也逐渐显现出一些问题ꎮ比如环境教育在地区间发展不平衡㊁国家投入不够㊁公民环保意识不足等[19]ꎬ对近二十年学校环境教育研究热点及所存在的问题的分析后ꎬ建议在未来关于学校环境教育的研究应该更加趋向于以下几个方面ꎮ(一)深化环境教育理论知识ꎮ目前ꎬ在各级各类学校中都在开展有关环境教育的活动ꎬ如让学生制作环境教育手抄报等ꎬ但是由于环境教育与考试分数无关ꎬ亦无益于升学ꎬ被一些学校和家长在有意无意中忽略掉ꎮ在学校开展环境教育ꎬ国家应加大环境教育方面的投资ꎬ加强师资素质建设ꎬ培养环境专业教师ꎬ教给学生环境方面的知识ꎬ通过课程知识的理解培养学生对待环境的态度ꎬ从而激发学生的环境情感ꎮ因此未来的学校环境教育发展中面对家长及学校对于环境教育的忽视国家必须制定专项法律法规ꎬ用国家强制力来保障环境教育在学校的实施ꎮ加大环境教育投资ꎬ培养具有专业素质的教师在学校中深化环境教育理论知识教学ꎬ建设绿色校园㊁生态校园ꎮ(二)通过活动让学生真实的感受自然魅力ꎮ如何激发学生的环境情感ꎮ枯燥的知识学习让学生越来越失去兴趣ꎬ国外很多学校选择带领学生走出教室ꎬ实地感受和理解环境ꎬ比如照料动物㊁记录天气㊁种植植物等ꎬ从自然的接触中开阔学生的胸怀ꎬ学会尊重自然ꎬ爱护环境ꎮ因此ꎬ在未来中小学环境教育中国内应更加重视课外活动的开展ꎬ通过各种课外活动让学生接触自然㊁了解自然ꎬ培养学生创新精神㊁实践能力以及保护环境的意识和能力ꎮ而在高校开展环境教育主要是针对非环境专业的大学生ꎬ可以开设有关环境保护的选修课ꎬ举办专家讲座或者成立各种有助于提高学生环保意识的社团等等ꎮ(三)深化可持续发展教育理念ꎮ生态环境的承载力是有限的ꎬ在未来学校环境教育中应该向学生渗透地球环境是有生命的ꎬ也会枯老㊁会衰竭ꎮ对于环境问题绝不能再走 先污染再教育 的老路ꎬ必须立足于可持续发展理念ꎮ加强环境教育ꎬ培养公众可持续发展能力ꎬ促进人㊁自然与社会的和平共处和可持续发展将成为未来教育发展的重心ꎮ环境教育必须要改变传统的教育观念ꎬ建立新的发展观[19]ꎮ给后代的生存和发展留一条后路ꎮ参考文献:[1]㊀叶金珠ꎬ陈倬.知识图谱视角下国内MOOC研究文献量化分析[J].黑龙江高教研究ꎬ2017(4).[2]㊀房宏君ꎬ郭秀晶ꎬ张玲玲.2000-2014年国内教育管理研究热点及其演进图谱分析[J].现代教育管理ꎬ2016(2).[3]㊀蒋菲.中国课程与教学论研究前沿的知识图谱分析:2000-2012[J].湖南社会科学ꎬ2013(5).[4]㊀张子石ꎬ吴涛ꎬ金义富.基于CiteSpace的网络学习知识图谱分析[J].中国电化教育ꎬ2015(8)4.[5]㊀王福刚ꎬ张丽.高等院校绿色校园德育空间构建的有效途径[J].沈阳建筑大学学报(社会科学版)ꎬ2016(2).[6]㊀郑士香.高等院校绿色校园建设的初探[J].经济研究导刊ꎬ2015(16).[7]㊀赵秀芳ꎬ苏宝梅.生态文明视域下高校生态教育的思考[J].中国高教研究ꎬ2011(4).[8]㊀洪世梅.教育生态学与大学教育生态化的思考[J].高等教育研究ꎬ2007(6).[9]㊀曾建平.绿色学校:21世纪教育的必然走向[J].湖南㊀㊀㊀㊀㊀㊀㊀㊀教育文化论坛㊀2018年㊀第2期JiaoYuWenHuaLunTan㊀ 理论探索师范大学教育科学学报ꎬ2004(2).[10]㊀雷娜ꎬ丁宇ꎬ马彩锋ꎬ等.某地在校大学生环境意识现状抽样调查分析[J].河南预防医学杂志ꎬ2012(2). [11]㊀张勇.大学生环境意识现状及对策 以宁波大学为例[J].宁波教育学院学报ꎬ2013(4).[12]㊀李艳利ꎬ李艳粉ꎬ陈小军.初中生环境意识现状调查及提升对策分析[J].环境科学与管理ꎬ2008(11). [13]㊀申秀英ꎬ徐美ꎬ刘春腊ꎬ等.提升当前大学生环境意识水平的对策研究[J].衡阳师范学院学报ꎬ2006(6). [14]㊀钟佳宁ꎬ纪风娟.要在地理教学中培养学生的环境意识[J].黑龙江环境通报ꎬ1998(4).[15]㊀邓璟生.中学历史教学与环境意识教育[J].桂林师范高等专科学校学报(综合版)ꎬ2004(2). [16]㊀徐辉ꎬ祝怀新.环境教育理论初探[J].教育评论ꎬ1993(3).[17]㊀王蕾ꎬ孙明霞.以 七步法 打造国际生态学校[J].环境教育ꎬ2016(8).[18]㊀韦建华.开展绿色教育ꎬ推进生态文明 广西第一所国际生态学校诞生记[J].世界环境ꎬ2013(3). [19]㊀张进.我国环境教育现状及对策探究[A].水利部政策法规司㊁中国法学会环境资源法学研究会㊁中国海洋大学.水资源㊁水环境与水法制建设问题研究2003年中国环境资源法学研讨会(年会)论文集(下)[C].水利部政策法规司㊁中国法学会环境资源法学研究会㊁中国海洋大学:2003.(责任编辑㊀赵广示)KnowledgeMapAnalysisofSchoolEnvironmentEducationResearchintheRecent20YearsGAOYuanꎬDUANYa ̄huiꎬZhangXin(CollegeofCityandEnvironmentatLiaoningNormalUniversityꎬDalianꎬLiaoningꎬ116029)Abstract:㊀ Environmentaleducation hasbeenoneofthehottopicsinNPC&CPPCCintherecentyears.Inordertoexploredomesticenvironmenteducationꎬespeciallythestatusquoandtrendofdevelop ̄mentofeducationinschoolenvironmentꎬthispaperꎬtakingtherelatedliteratureonCNKIastheresearchsubjectandusingCiteSpacecarriesofknowledgemapanalysisofthetrendandstatusquooftheresear ̄chesꎬandfindsthattheresearchfocusismainlyonsuchhotissuesasgreenschoolꎬenvironmentalawarenessꎬenvironmentproblemꎬandenvironmentalprotectioneducationandotherhotissues.Keywords:㊀schooleducationalenvironmentꎻCiteSpaceꎻknowledgemapanalysis。

  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

前言1.知识图谱的研究目标与意义知识图谱(Knowledge Graph)以结构化的形式描述客观世界中概念、实体及其关系,将互联网的信息表达成更接近人类认知世界的形式,提供了一种更好地组织、管理和理解互联网海量信息的能力。

知识图谱给互联网语义搜索带来了活力,同时也在智能问答中显示出强大威力,已经成为互联网知识驱动的智能应用的基础设施。

知识图谱与大数据和深度学习一起,成为推动互联网和人工智能发展的核心驱动力之一。

知识图谱技术是指知识图谱建立和应用的技术,是融合认知计算、知识表示与推理、信息检索与抽取、自然语言处理与语义Web、数据挖掘与机器学习等方向的交叉研究。

知识图谱于2012年由谷歌提出并成功应用于搜索引擎,知识图谱属于人工智能重要研究领域——知识工程的研究范畴,是利用知识工程建立大规模知识资源的一个杀手锏应用。

94年图灵奖获得者、知识工程的建立者费根鲍姆给出的知识工程定义——将知识集成到计算机系统从而完成只有特定领域专家才能完成的复杂任务。

在大数据时代,知识工程是从大数据中自动或半自动获取知识,建立基于知识的系统,以提供互联网智能知识服务。

大数据对智能服务的需求,已经从单纯的搜集获取信息,转变为自动化的知识服务。

我们需要利用知识工程为大数据添加语义/知识,使数据产生智慧(smart data),完成从数据到信息到知识,最终到智能应用的转变过程,从而实现对大数据的洞察、提供用户关心问题的答案、为决策提供支持、改进用户体验等目标。

知识图谱在下面应用中已经凸显出越来越重要的应用价值:-知识融合:当前互联网大数据具有分布异构的特点,通过知识图谱可以对这些数据资源进行语义标注和链接,建立以知识为中心的资源语义集成服务;-语义搜索和推荐:知识图谱可以将用户搜索输入的关键词,映射为知识图谱中客观世界的概念和实体,搜索结果直接显示出满足用户需求的结构化信息内容,而不是互联网网页;-问答和对话系统:基于知识的问答系统将知识图谱看成一个大规模知识库,通过理解将用户的问题转化为对知识图谱的查询,直接得到用户关心问题的答案;-大数据分析与决策:知识图谱通过语义链接可以帮助理解大数据,获得对大数据的洞察,提供决策支持。

2.知识工程的发展历程知识图谱的发展是人工智能重要分支知识工程在大数据环境中的成功应用。

回顾知识工程四十年来发展历程,总结知识工程的演进过程和技术进展,体会知识工程为人工智能所做出的贡献和未来面临的挑战,可以将知识工程分成五个标志性的阶段,前知识工程时期、专家系统时期、万维网1.0时期,群体智能时期以及知识图谱时期。

图1. 知识工程发展历程1950-1970时期:图灵测试人工智能旨在让机器能够像人一样解决复杂问题,图灵测试是评测智能的是手段。

这一阶段主要有两个方法:符号主义和连结主义。

符号主义认为物理符号系统是智能行为的充要条件,连结主义则认为大脑(神经元及其连接机制)是一切智能活动的基础。

这一阶段具有代表性的工作是通用问题求解程序(GPS):将问题进行形式化表达,通过搜索,从问题初始状态,结合规则或表示得到目标状态。

其中最成功应用是博弈论和机器定理证明等。

这一时期的知识表示方法主要有逻辑知识表示、产生式规则、语义网络等。

这一时代人工智能和知识工程的先驱Minsky,Mccarthy 和Newell以Simon四位学者因为他们在感知机、人工智能语言和通用问题求解和形式化语言方面的杰出工作分别获得了1969年、1971年、1975年的图灵奖。

1970-1990时期:专家系统通用问题求解强调利用人的求解问题的能力建立智能系统,而忽略了知识对智能的支持,使人工智能难以在实际应用中发挥作用。

70年开始,人工智能开始转向建立基于知识的系统,通过知识库+推理机实现智能,这一时期涌现出很多成功的限定领域专家系统,如MYCIN医疗诊断专家系统、识别分子结构的DENRAL专家系统以及计算机故障诊断XCON专家系统等。

94年图灵奖获得者Feigenbaum教授在70年代提出知识工程的定义,确立了知识工程在人工智能中的核心地位。

这一时期知识表示方法有新的演进,包括框架和脚本等。

80年代后期出现很多专家系统的开发平台,可以帮助将专家的领域知识转变成计算机可以处理的知识。

1990-2000时期:万维网Web 1.0在1990年代到2000年,出现了很多人工构建大规模知识库,包括广泛应用的英文WordNet,采用一阶谓词逻辑知识表示的Cyc常识知识库,以及中文的Hownet。

Web1.0万维网的产生为人们提供了一个开放平台,使用HTML定义文本的内容,通过超链接把文本连接起来,使得大众可以共享信息。

W3C提出的可扩展标记语言XML,实现对互联网文档内容的结构通过定义标签进行标记,为互联网环境下大规模知识表示和共享奠定了基础。

这一时期还提出了本体的知识表示方法。

2000-2006时期:群体智能Web 2.0Web1.0万维网的出现使得知识从封闭知识走向开放知识,从集中知识成为分布知识。

原来专家系统是系统内部定义的知识,现在可以实现知识源之间相互链接,可以通过关联来产生更多的知识而非完全由固定人生产。

这个过程中出现了群体智能,最典型的代表就是维基百科,实际上是用户去建立知识,体现了互联网大众用户对知识的贡献,成为今天大规模结构化知识图谱的重要基础。

也是在2001年,万维网发明人、2016年图灵奖获得者Tim Berners-Lee提出语义Web 的概念,旨在对互联网内容进行结构化语义表示,并提出互联网上语义标识语言RDF(资源描述框架)和OWL(万维网本体表述语言),利用本体描述互联网内容的语义结构,通过对网页进行语义标识得到网页语义信息,从而获得网页内容的语义信息,使人和机器能够更好地协同工作。

2006年至今:知识图谱“知识就是力量”,将万维网内容转化为能够为智能应用提供动力的机器可理解和计算的知识是这一时期的目标。

从2006年开始,大规模维基百科类富结构知识资源的出现和网络规模信息提取方法的进步,使得大规模知识获取方法取得了巨大进展。

与Cyc、WordNet和HowNet等手工研制的知识库和本体的开创性项目不同,这一时期知识获取是自动化的,并且在网络规模下运行。

当前自动构建的知识库已成为语义搜索、大数据分析、智能推荐和数据集成的强大资产,在大型行业和领域中正在得到广泛使用。

典型的例子是谷歌收购Freebase后在2012年推出的知识图谱(Knowledge Graph),Facebook的图谱搜索,Microsoft Satori以及商业、金融、生命科学等领域特定的知识库。

最具代表性大规模网络知识获取的工作包括DBpedia,Freebase,KnowItAll,WikiTaxonomy和YAGO,以及BabelNet,ConceptNet,DeepDive,NELL,Probase,Wikidata,XLore,Zhishi.me 等。

这些知识图谱遵循RDF数据模型,包含数以千万级或者亿级规模的实体,以及数十亿或百亿事实(即属性值和与其他实体的关系),并且这些实体被组织在成千上万的由语义类体现的客观世界的概念结构中。

现在我们看知识图谱的发展和应用状况,除了通用的大规模知识图谱,各行业也在建立行业和领域的知识图谱,当前知识图谱的应用包括语义搜索、问答系统与聊天、大数据语义分析以及智能知识服务等,在智能客服、商业智能等真实场景体现出广泛的应用价值,而更多知识图谱的创新应用还有待开发。

3.知识图谱技术人们通过概念掌握对客观世界的理解,概念是对客观世界事物的抽象,是将人们对世界认知联系在一起的纽带。

知识图谱以结构化的形式描述客观世界中概念、实体及其关系。

实体是客观世界中的事物,概念是对具有相同属性的事物的概括和抽象。

本体是知识图谱的知识表示基础,可以形式化表示为,O={C,H,P,A,I},C为概念集合,如事物性概念和事件类概念,H是概念的上下位关系集合,也称为Taxonomy知识,P是属性集合,描述概念所具有的特征,A是规则集合,描述领域规则,I是实例集合,用来描述实例-属性-值。

Google 于2012年提出知识图谱,并在语义搜索中取得成功应用。

知识图谱可以看做是本体知识表示的一个大规模应用,Google知识图谱的知识表示结构主要描述客观存在实体和实体的关系,对于每个概念都有确定的描述这个概念的属性集合。

知识图谱技术是知识图谱建立和应用的技术,是语义Web、自然语言处理和机器学习等的交叉学科。

我们将知识图谱技术分为三个部分:知识图谱构建技术、知识图谱查询和推理技术,以及知识图谱应用。

在大数据环境下,从互联网开放环境的大数据中获得知识,用这些知识提供智能服务互联网/行业,同时通过互联网可以获得更多的知识。

这是一个迭代的相互增强过程,可以实现从互联网信息服务到智能知识服务的跃迁。

3.1 知识图谱构建知识表示与建模知识表示将现实世界中的各类知识表达成计算机可存储和计算的结构。

机器必须要掌握大量的知识,特别是常识知识才能实现真正类人的智能。

从有人工智能的历史开始,就有了知识表示的研究。

知识图谱的知识表示以结构化的形式描述客观世界中概念、实体及其关系,将互联网的信息表达成更接近人类认知世界的形式,为理解互联网内容提供了基础支撑。

知识表示学习随着以深度学习为代表的表示学习的发展,面向知识图谱中实体和关系的表示学习也取得了重要的进展。

知识表示学习将实体和关系表示为稠密的低维向量,实现了对实体和关系的分布式表示,可以高效地对实体和关系进行计算,、缓解知识稀疏、有助于实现知识融合,已经成为知识图谱语义链接预测和知识补全的重要方法。

由于知识表示学习能够显著提升计算效率,有效缓解数据稀疏,实现异质信息融合,因此对于知识库的构建、推理和应用具有重要意义,值得广受关注、深入研究。

实体识别与链接实体是客观世界的事物,是构成知识图谱的基本单位(这里实体指个体或者实例)。

实体分为限定类别的实体(如常用的人名、地名、组织机构等)以及开放类别实体(如药物名称、疾病等名称)。

实体识别是识别文本中指定类别的实体。

实体链接是识别出文本中提及实体的词或者短语(称为实体提及),并与知识库中对应实体进行链接。

实体识别与链接是知识图谱构建、知识补全与知识应用的核心技术。

实体识别技术可以检测文本中的新实体,并将其加入到现有知识库中。

实体链接技术通过发现现有实体在文本中的不同出现,可以针对性的发现关于特定实体的新知识。

实体识别与链接的研究将为计算机类人推理和自然语言理解提供知识基础。

实体关系学习实体关系描述客观存在的事物之间的关联关系,定义为两个或多个实体之间的某种联系,实体关系学习就是自动从文本中检测和识别出实体之间具有的某种语义关系,也称为关系抽取。

相关文档
最新文档