高校课题申报:基于多方法融合的中外教育学知识图谱实证研究

合集下载
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

基于多方法融合的中外教育学知识图谱
实证研究
学科分类:高等教育
课题类别:一般课题
关键词:知识图谱教育学融合
预期研究成果:研究报告
课题设计论证
(一)问题的提出、课题界定、国内外研究现状述评
知识图谱(Mapping Knowledge Domains)是显示科学知识发展进程与结构关系的谱系,具有“图”和“谱”的双重性质和特征:既是可视化的知识图形,又是序列化的知识谱系。

以期用可视化技术与方法描述某一学科知识资源的网络、结构、互动、交叉、演化或衍生等(刘则渊,2008;陈悦,2005)。

1964年,SCI设计者Garfield手工绘制了科学引文编年图谱,以期展示科学活动过程中发生的重要事件以及成就;1973年,Small采用知识图谱识别了科学范式的演进特征(Small,1973)。

上个世纪90代开始,知识图谱得到了迅猛发展。

1998 年,White 通过知识图谱界定了70年代到90年代信息科学的十二个分支学科(White,1998);同年,Noyons等采用知识图谱识别了90年代文献计量学、科学计量学和信息计量学的五个主要分支领域(Noyons et al,1998)。

进入21世纪,随着信息技术的快速发展,知识图谱得到了进一步深化发展。

2001 年,Garfield 等开发
了Histcite知识图谱软件,并绘制了图书情报学和生物学领域的编年图谱(Garfield et al,2004)。

2003 年,Steven Morris 等通过聚类知识图谱分析了研究前沿和新兴领域(Morris et al,2003)。

信息可视化新领域的最早开拓者之一,Drexel 大学的美籍华人陈超美教授2004年开发了当代最为流行的知识图谱可视化软件CiteSpace(Chen C et al,2003;Chen C,2005),并得到广泛应用。

2010年,Ryosuke L运用共词分析方法,绘制了生命科学领域近30年的演进和前沿(Ryosuke L,2010)。

2006 年,大连理工大学侯海燕教授绘制了科学计量学知识图谱,以期发现科学计量学领域的演化规律(侯海燕,2006),较早地开展知识图谱实际应用研究。

2008 年,刘则渊教授等编著出版了《科学知识图谱:方法与应用》,是国内第一部关于知识图谱的学术专著(刘则渊,2008)。

大连理工大学为推广知识图谱(尤其是CiteSpace)在国内的应用,举办了多期高级研修班,以至于2008年开始,国内知识图谱应用研究的论文剧增。

2010 年,秦长江基于共词分析绘制了人文科学知识图谱,分析该学科的热点主题(秦长江,2010)。

2011 年,郝韦霞绘制了我国能源材料知识图谱,以期发现该领域1999-2008年研究热点(郝韦霞,2011)。

目前,知识图谱在图书情报学、科学学、管理学、医学、经济学和教育学已得到广泛应用,学者试图将知识图谱方法应用于预测学科前沿、揭示学科关系、探究学科历史、促进科研管理、明晰学科结构、描述科研合作、分析主题领域和进行科学评价等。

在互联网和数字化时代未来临之前,学者了解教育学领域发展状况的方法,主要通过人工查阅教育学领域文献,获取全部文献后,从中筛选出自认为
具有代表性和重要文献作为研究样本,进行综合分析(郭文斌,2015)。

这样的方法费时费力,又因不可避免的主观偏颇使研究结论可能有失科学性、并难以重复验证。

知识大爆炸和数字时代的到来,教育学研究成果增长迅速,研究内容极其丰富并不断发展变化,传统的抽样调查和主观判断已无法胜任。

数据密集型科研范式下,采用数据挖掘与分析技术,结合科学计量学和信息可视化方法,对海量文献进行分析与管理,无疑为教育学领域的整体分析提供了前所未有的机遇(郭文斌等,2012)。

以“知识图谱”、“信息可视化”为关键词,学科限制在教育学领域,共检索到150余篇相关应用研究的期刊论文。

大连理工大学彭绪梅等在2007年首次将知识图谱引入教育学领域,其对创业型大学1990-2007年间的研究状况进行了科学计量分析并绘制知识图谱(彭绪梅等,2007)。

此后,文献量逐年增长,2016年文献量达到了顶峰(64篇),知识图谱已经成为学者梳理教育学领域研究状况的重要方法,得到了广泛关注。

如祁占勇等(2016)以中国知网1985-2015年的1443篇期刊论文作为文献来源,利用Bicomb软件及Spss软件绘制了教育政策学研究热点的知识图谱;李金臻(2016)以2000-2015年中国知网数据库为数据源,利用CiteSpace进行共词分析,总结了我国智慧教育研究的特征和发展趋势;赵磊等(2016)运用科学计量学和CiteSpace,以中国知网2012-2015年的教育类核心期刊为样本,对我国MOOC研究热点和趋势进行了分析;邓烈君等(2016)基于教育学36种CSSCI 期刊及15种CSSCI扩展版期刊的所有相关文献数据,采用CiteSpace绘制了可视化教学的知识图谱;Fida(2015)对摩洛哥和北非一些国家1996-2012年高等教育研究产出成果进行了科学计量学与知识图谱比较分析;
Jose(2015)对欧洲高等教育机构的科研产出进行了知识图谱分析;Olaf (2016)对1980-2014年远程教育的研究热点进行知识图谱分析,并以五年为一时间窗口,识别各阶段的研究热点。

最近2-3年间,知识图谱分析已成为教育学博硕士学位论文选题,并且相比期刊论文而言,采用的方法更加综合化。

中国知网调研显示,教育学领域的知识图谱应用研究硕士论文有4篇,博士论文1篇。

在硕士论文中,梁莉(2013)以CNKI和Web of Science为数据源,以共词分析法、共引分析法、因子分析法、多维尺度分析、聚类分析、社会网络分析为基本方法,采用ROSTCM 、Spss、Ucinet、CiteSpace工具,绘制了中外教育经济学研究热点、前沿和机构合作知识图谱;朱宏(2014)以《高等教育研究》1999—2012 年刊发论文为研究样本,基于科学计量学的相关研究方法,运用 CiteSpace 可视化软件,分别从研究主体、研究热点、知识基础、研究前沿等方面描绘和梳理了我国高等教育的主要研究进展;亢铭(2014)借助CiteSpace 软件,以 SSCI、CSSCI 为数据源绘制了文献共被引图谱、突变词演进图谱、关键词共现图谱、作者共被引图谱及其聚类图谱。

在博士论文中,蒋菲(2014)以2000年至2012年的教育类核心期刊为数据源,运用词频分析、共词分析、共被引分析等方法,结合知识图谱绘制,分析了我国课程与教学论的研究热点、研究前沿、学科范式、合作网络的发展等。

然而,上述研究并未克服期刊论文所暴露出来的数据源单一的问题,同时虽然在论文中综合采用了多种分析方法,但各方法针对的是某一特定分析内容,如分别采用共词分析识别研究热点,采用共被引方法分析研究前沿等,而没有在某一特定分析内容中采用两种或两种以上方法,类似于
分析前沿时同时采用共词分析和共被引分析方法互为补充,因此本质上还不是方法的融合。

最为遗憾的是,期刊论文由于其固有特征,仅是应用探索无可厚非;而博硕士论文的研究中,也同样局限于应用研究上,甚少对原理和理论加以综合和提炼。

综上,知识图谱用于探测某一学科领域的整体状况已得到广泛关注和认可,在教育学领域也成为前沿方法被众多学者推崇。

但以往的研究中存在的局限也是十分显著的:1)所依赖的数据源过于单一,从而限制了观察的广度与深度; 2)所采用的方法还未达到融合的层面,从而无法发挥各方法的优势互补功能,冒有研究结论偏颇的风险; 3)绝大多数研究仅停留在应用层面,所不同的是选择主题的差异,千篇一律的应用并不能推进知识图谱在教育学领域研究中的进步; 4)所研究的对象是教育学中某一特定的主题领域,缺乏对教育学整体情况的分析,从而无法将教育学发展规律与教育环境的变革相结合,分析数据背后产生的深层次原因,指导价值有限。

鉴于此,本研究以数据集构建理论为基础,基于多方法的融合,绘制教育学全领域的多种知识图谱,不仅分别对国内、外进行描述性分析,同时还进行比较性分析,并深度挖掘教育学发展中的影响因素,以期为我国教育学规划与发展管理提供决策支持。

(二)选题意义与研究价值
对学科领域发展状况梳理与分析,有助于对学科发展历史、发展演进与前沿的把握,从而可以以此获得学科发展的整体图景,为学科后续的研究管理提供重要参考。

以往通常情况下,教育学界更多的是通过对某些重点期刊、学者、会议等不间断的监测来跟踪国内外研究成果。

以定量化、大范
围数据分析为核心的科学计量学和可视化分析方法无疑满足了学者对更广泛科研成果的考察需求。

教育学界近年来也有不少成果借鉴该方法进行教育学某一特定主题领域的分析,但是千篇一律的重复性应用研究无法推进知识图谱方法在教育学领域研究中的进步,而尤为重要的是,多数学者并未认识到知识图谱分析的各方法中的局限,一种特定内容分析仅单纯的采用一种方法,存在研究结论有失偏颇的风险。

鉴于此,本课题的研究价值在于:
在理论上:1)建立了教育学数据集构建方法模型,为数据采集提供理论与方法指导;2)提出多方法融合的知识图谱分析方法,即一种主题领域采用多种方法进行相互补充和相互印证分析,以期为规范教育学领域的知识图谱应用提供理论参考;(3)构建了教育学多维知识图谱体系,以期为教育学中的知识图谱构建提供不同层面和方向的方法与过程参考。

在实际应用上:1)提出了我国教育学发展近20年研究发展过程中的影响因素,有助于发现我国教育学发展的机理;2)提出了我国教育学研究发展规划制定策略,学者、机构甚至国家层面的竞合策略,以及教育学文献资源保障策略,为教育主管部门和文献服务部门管理策略制定提供了参考;3)进行了教育学国内外比较分析,有助于发现我国与国外教育学发展中的差异、差距,从而为我国教育学研究提供数据支持。

(三)课题理论依据
目前获取学科领域的数据集主要通过学科分类、该学科的重要期刊、关键词和重要机构、作者等作为载体,分别依据学科分类检索、期刊名检索、关键词或主题词检索和机构名称、作者名称检索等。

通过学科分类检索,
可以满足族性检索要求,但依赖于数据库的分类合理性,尤其是在进行中外对比研究时,中外数据库在学科分类上会有一定差异,从而限制了可比性。

同时跨学科研究逐渐兴起的背景下,仅通过某一特定学科检索,显然会有失全面性;通过期刊、机构和作者检索,可以获得学科内重要代表性文献,但与此同时也限制了文献的全面性;通过关键词检索,可以满足特性检索要求,但无法满足族性检索要求,无法胜任面向某一学科的整体性研究。

如何发挥它们的优势、弱化劣势是构建数据集的终极目标。

1)数据集构建的基本原则分析。

既要建立在来源数据的组织形态基础上,也要科学界定数据集的边界。

同时通过过程控制、效果评估等质量控制机制的建立,保证数据集具有核心性和典型性。

2)构建学科分类为主体,其他方法为补充和修正的数据集构建方法。

结合数据库已有的分类体系和国内外同行的分类号进行数据检索,并借助重要期刊、作者和机构之间的引证关系挖掘,弥补单纯学科分类检索带来的跨学科问题,同时通过内容分析法和专家调查法,穷举教育学领域的重点、热点主题领域,辅以关键词检索相补充。

3)数据集检全、检准评价研究。

分别以重要机构和作者为实验方法,对获取的数据进行检全、检准评价研究。

4)教育学领域数据集构建模型研究。

通过上述实践研究,通过论证学科分类、重要期刊、关键词和重要机构、作者等之间的关系与优势互补机制,构建教育学领域数据集模型。

(四)研究目标1)以教育学为例,提供一种具有普适性的学科领域数据集获取方法和模型,以期拓展其应用范围。

2)绘制一套可以发现教育学发展整体图景的知识图谱体系,通过各不同图谱和不同方法的相
互印证,客观揭示教育学发展整体状况,一方面为规范知识图谱的应用提供方法论参考,另一方面丰富教育学分析研究的方法与手段。

3)通过关键文献解读、研究演进中的关键拐点分析,并结合国内外比较分析和我国教育环境的变迁,挖掘教育学发展演进中的影响因素。

以期为考察教育学发生的机理分析和我国教育学研究管理提供借鉴。

4)通过关键词共现分析、文献共被引分析和社会网络分析,提出我国教育学研究与发展规划制定策略,机构、学者甚至国家层面的竞合策略和保障教育学发展的文献保障策略。

(五)研究思路和研究方法
为客观反映教育学全领域的整体发展状况和国内外发展差异、差距,以科学计量学、信息可视化为基本方法,以教育学多源科研数据为基本数据源,进行定量化、可视化分析。

为此,首先需解决的是数据获取与组织问题,选择国内外具有代表性的数据库为基本数据源,在数据集构建模型支撑下,对核心和典型数据进行全面、准确地获取。

然后对获取的数据进行必要的清洗、元数据标准建立、数据的整合以及标准化处理,以供后续知识图谱分析所用;其次,通过各方法的论证、分析,为实现各方法在针对某一特定分析内容的功能上优势互补和能够相互印证,展开多方法的实质上融合研究。

再次,在上述基础上,绘制可反映教育学全领域研究发展状况的知识图谱体系,并通过知识图谱的解读与分析,发现教育学近20年发展的基本特征与规律,进而通过图谱展现的关键文献、关键拐点内容分析,结合国内外比较分析和我国教育环境变迁考察,挖掘我国教育学发展中的影响因素,并最终构建我国教育学研究发展规划制定策略、竞合策略以及文献资源保障策略等。

在整个研究中,主要涉及科学计量学法,信息可视化方
法以及专家调查法。

(六)技术路线和实施步骤
1)以定量化方法,可视化呈现教育学全领域近20年研究热点及其演进、研究前沿及其演进、研究趋势,以及国内外的差距、差异等,以期解决教育科研大数据面前传统梳理方法无法胜任的问题。

2)构建实质上的多方法融合的方法论,以期克服各方法功能的缺陷,实现各方法就某一特定问题分析中的相互印证,提高研究结论的客观性、科学性。

3)通过关键文献内容分析法、关键拐点分析和突现节点分析,结合知识图谱体系的解读、国内外比较分析和我国教育环境发展变迁,识别我国教育学研究发展中的影响因素。

课题编号:2905。

相关文档
最新文档