20世纪教育测量学发展的回顾与现状评析(张敏强)
教育测量与评价的发展历史
教育测量与评价的发展历史教育测量与评价作为一门学科,其发展历史可以追溯到古代。
在古代,教育测量与评价的目的是为了评估学生的学习成果,帮助教师了解学生的学习情况,以便更好地教学。
然而,在古代教育测量与评价的方法相对简单,主要是通过口试和答题来评估学生的学习成绩。
随着教育的进步和发展,教育测量与评价的研究逐渐深入,并形成了一套完整的理论体系和研究方法。
20世纪初,教育心理学家开始研究教育测量与评价的基本原理和方法。
他们提出了许多经典的测量理论,如克鲁格-卡尔巴赫理论和检验理论。
这些理论不仅为教育测量与评价的研究提供了理论支持,而且在实践中也产生了重要的影响。
在20世纪中叶,随着计算机技术的进步,教育测量与评价研究进入了一个崭新的时代。
计算机辅助测量技术的应用使得测量工作更加高效和精确。
研究者可以使用计算机自动生成试题、收集数据和分析结果,大大提高了工作效率。
此外,计算机辅助测量技术还可以实现个性化评价,根据学生的特点和需求,为其量身定制学习计划和教育资源。
近年来,教育测量与评价的研究逐渐与教育改革相结合,成为教育改革的重要组成部分。
教育测量与评价被广泛运用于学校教育、职业培训、人才选拔和教育政策制定等领域。
通过科学准确的测量和评价,可以全面了解学生的学习情况、能力水平和发展潜力,为教育决策提供依据。
同时,教育测量与评价也促进了教学的改进和创新,帮助教师更好地了解学生的学习需求,因材施教,提高教学质量。
然而,教育测量与评价也面临着一些挑战。
例如,如何选择合适的测量工具和评价方法,如何在不同文化背景下进行有效评价,如何解决测试的难度和容易度的不同等等。
这些问题需要教育测量与评价研究者深入探讨,并寻找合适的解决方案。
综上所述,教育测量与评价作为一门学科,其发展历史丰富多样。
从古代简单的口试和答题,到现代复杂的测量理论和计算机辅助测量技术,教育测量与评价不断推动教育的发展和改革。
希望未来的教育测量与评价研究者能够继续探索创新,为教育事业做出更大的贡献。
教育测量与评价(第二版)课件:现代教育测量与评价的发展趋势
四、经典测验理论与现代测验理论 的比较
• 参数稳定性 • 能力的比较 • 平行复本 • 预测力 • 测量标准误
五、现代教育测量与评价的发展趋势
• 教育测量与评价的政治性得到加强 • 教育测量与评价的教育功能得到强化 • 教育测量与评价的理论研究得到突破性进
展
—完—
潜在特质理论
• 研究潜在特质的目的:探清结构和性质,将其量 化;测量个体特质变量值,预测个体行为
• 测量单维定义:如果制约某种任务行为的空间既 是一维的,又是完备的,则称这一任务行为的测 量具有单维性。单维IRT模型是最为人们熟悉的。
项目特征曲线
• 原理:编制质量良好的试题,随着被试水平的提 高,其正确作答的概率会越来越大。
• 与经典测量理论项目特征曲线的区别
– 经典测量理论Байду номын сангаас目特征曲线实质:被试正确作答概率 对测验总分的回归曲线。
• 项目反应理论的优点
– 题目难易度的估计不因样本的不同而不同; – 考生能力的估计不因测验的改变而改变; – 测量误差的估计因考生程度不同而不同;
– 为多种形式测验的实施提供了更为完美的理论 和方法
• 项目反应理论的主要局限性
– 对数学模型与实测数据的拟合要求较高; – 题目反应理论的一维性假设是一个强假设。
• 我国教育工作者在使用过程和实践中不断形成和 完善了一套适合国情的具体应用方法和应用原则
二、经典测量理论的主要局限性
• 通过统计方法得到的各项指标依赖于特定 的被试样本,求得的参数会受到不同样本 组能力水平的影响;
• 无法建立考生得分与测验题目参数之间的 函数关系;
• 两个重要的假设条件(严格平行测验和误 差,与真分数不相关)在实际操作中难以 做到。
我国工程测量技术发展现状与成就
我国工程测量技术发展现状与成就工程测量技术是现代化社会基础设施建设的重要保障,其水平和质量直接关系到国家经济发展和社会稳定。
随着我国经济的高速发展和城市化进程的加速,工程测量技术在基础设施建设、房地产开发、交通运输、资源管理等方面发挥越来越重要的作用。
本文将从我国工程测量技术发展的现状和成就两个方面进行阐述。
在全球范围内,工程测量技术一直是技术革新和进步的重要方向。
在我国,自20世纪初引进西方测绘技术以来,我国工程测量技术得到了快速发展。
随着综合国力和科技实力的不断提升,我国工程测量技术的发展水平日益提高,国内测绘科技取得了诸多成果。
1. 数字化测绘技术的发展与应用数字化测绘技术是当前国际上测绘技术的主流。
我国在这方面也开展了一系列的技术研究,逐步掌握了数字地形数据获取、处理、分析和应用的核心技术,促进了测绘技术的数字化转型和产业升级。
数字化应用广泛,如在城市建设、环境监控、资源调查、军事防卫、地震预警等方面已经得到广泛的应用。
2. 遥感技术的高度发展和应用我国在遥感技术的研究和应用方面也取得了突破性进展。
自20世纪60年代以来,我国一直在探索遥感技术的应用,先后在土地利用、水资源管理、林业、城市规划、海岸带开发等方面进行了广泛应用。
尤其是进入21世纪以来,卫星遥感测绘技术已经得到广泛应用,已经成为了国家地理信息资源公共服务体系建设的重要工具。
3. 工程测量在基础设施建设领域的应用近年来,我国基础设施建设蓬勃发展,工程测量技术也有了巨大进展。
特别是高速公路、高铁、机场、港口等基础设施建设,需要大量精细的工程测量工作。
我国工程测量技术在这些领域的应用已经达到国际领先水平。
4. 测量数据融合技术的应用在大数据时代,测量数据融合技术越来越受到重视,我国也在这方面展开了研究和应用。
例如,将不同测量方法的数据进行融合处理可以有效提高数据的准确度和可靠性。
在许多工程测绘应用中,这种方法已经得到很好的应用。
我国在工程测量技术方面取得了很多值得骄傲的成果,这些成就不仅为国家建设起到了重要作用,同时也在国际上获得了广泛的认可。
教育测量与评价(第二版)课件:教育测量与评价的学科发展
• 教育评价
概念:按照一定的价值标准和教育目标,利用测量和非测量的种种方法系统地收集 资料信息,对学生的发展变化及其影响学生发展变化的各种要素进行价值分析和价值 判断,并为教育决策提供依据的过程。
内涵:
(1)强调以教育目标为标准的价值判断过程;
(2)强调用多种方法(测量和非测量)系统收集 资料与信息;
教育测量与评价的学科发展
本章内容
• 教育测量与评价的概念与内涵 • 教育测量与评价的发展历史 • 教育测量与评价的学科地位和作用
一、概念与内涵
• 测量与教育测量
• 测量的含义:根据某些法则与程序,用数字对事物在量上的规定性予以确定和描述的 过程。
• 测量的要素
• 量具 • 测量单位 • 参照点
(4)特点:
力、实践能力、创造能力……
教育测量是精神特性的测量,涉及学生德育、智育、体育、 美育、劳动技能及个性、 心理素质等许多方面
• 评价(evaluation)与教育评价
• 评价
(1)衡量、判断人物或事物的价值;
(2)一种划定、获取和提供叙述性和判断性信息的过程;
(3)对某些现象的价值如优缺点的系统调查,是为教育政 策提供依据的过程;
• 教育测量与评价在教育改革中的作用
• 教育改革常以教育测量与评价的改革作为突破口 • 考试与评价改革成为基础教育改革的重要内容
• 教育测量与评价是教师的专业素养和能力
• 正确评价学生的发展是教师职业能力的重要组成部分 • 国外教师教育普遍开设“教育测量与评价”类课程
—完—
• 量表(scale):确定了测量单位与参照点并具有取值系统的测量工具
二、发展历史
(一)我国考试制度的演变
– 西周:考试制度初见端倪
教育测量与评价的学科发展
• 教育测量与评价的概述 • 教育测量与评价的理论基础 • 教育测量与评价的方法和技术 • 教育测量与评价的实践应用 • 教育测量与评价的未来发展 • 教育测量与评价的挑战与对策
01
教育测量与评价的概述
定义与目的
定义
教育测量与评价是一门研究如何量化评估教育领域表现和成就的学科。它运用 数学和统计方法,对教育活动、教育过程和教育结果进行定量描述和评估。
评价指标应涵盖学生的知识、技能、态度等多个方面 ,以确保全面、客观地评价学生的表现。
数据安全与隐私保护
加强数据安全防护
通过采用加密技术、权限控制等手段,确保教育测量 与评价数据的安全性和保密性。
保护学生隐私
在收集和处理学生个人信息时,应严格遵守相关法律法 规,确保学生的隐私权益得到充分保护。
THANKS
01
创新评价方法
借鉴其他领域的方法和技术,创新教育 评价方法,提高教育评价的科学性和有 效性。
02
03
培养跨学科人才
加强跨学科人才培养,培养具备多学 科背景和创新能力的高素质人才,推 动教育测量与评价的持续发展。
06
教育测量与评价的挑战与对策
信度与效度问题
信度问题
信度是指测量的一致性,由于教育环境的复杂性和动态 性,教育测量工具的信度往往难以保证。为解决这一问 题,需要定期对测量工具进行校准和修订,确保其一致 性和稳定性。
格的标准和程序。
教育评价理论
评价目的的明确性
教育评价旨在促进学生的学习和 发展,提高教育质量,评价目标 应明确、具体。
评价标准的制定
制定科学、合理的评价标准是教 育评价的关键,标准应反映教育 目标和教育价值观。
20世纪90年代至今我国教育实验研究方法的回顾与反思
20世纪90年代至今我国教育实验研究方法的回顾与反思【摘要】20世纪90年代至今,我国教育实验研究方法经历了持续发展和创新。
在此过程中,受到多方面因素的影响,面临着一系列问题和挑战。
但也不断有方法的创新与应用,以及成功的案例分析。
通过对这些内容的回顾与反思,我们可以更好地总结经验教训,展望未来发展方向。
本文旨在探讨20世纪90年代至今我国教育实验研究方法的历程和现状,分析影响因素,挑战和问题,并重点关注方法创新以及案例分析。
通过这些内容的论述,旨在为未来教育实验研究提供借鉴和启示。
【关键词】教育实验研究方法、20世纪90年代、回顾、反思、影响因素、问题、挑战、方法创新、案例分析、总结、展望未来1. 引言1.1 背景介绍20世纪90年代至今,我国教育实验研究方法经历了持续不断的发展和改进。
随着教育领域的不断进步和需求的不断增长,教育实验研究方法也逐渐受到重视。
教育实验研究方法的不断完善与创新,为教育领域提供了更多的可能性和选择。
在这个时期,我国的教育实验研究方法逐渐从传统的文献研究和调查研究转向实证研究和定量研究,注重数据的收集和分析,倡导科学化与客观化的研究方法。
教育实验研究方法也逐渐融入新技术、新工具的应用,提高了研究效率和质量。
随着社会的快速变化和教育的不断改革,教育实验研究方法也面临着新的挑战和问题。
对于教育实验研究方法的回顾与反思具有重要的意义,有助于总结经验、发现问题、探索解决之道,为未来的发展提供借鉴和指导。
1.2 研究目的研究目的是对我国教育实验研究方法在20世纪90年代至今的发展历程进行全面回顾和深入分析,以揭示其在不同阶段的变化和演进,探讨其存在的问题和挑战,总结方法创新与应用的经验和启示,以及通过案例分析展示具体实践情况。
通过对这些内容的系统研究与总结,我们旨在全面了解我国教育实验研究方法的发展路径和实践特点,为今后的教育实验研究工作提供借鉴和参考,促进我国教育实验研究的进一步发展和提升。
现代教育测量与评价的发展趋势
现代教育测量与评价的发展趋势随着社会的快速发展和教育的不断改革,教育测量与评价作为教育领域的重要组成部分也在不断发展。
本文将探讨现代教育测量与评价的发展趋势,并分析其对教育的影响。
现代教育测量与评价趋向多样化。
传统的教育测量主要依赖于考试和测验,但这种方式在评估学生知识和能力方面存在局限性。
现代教育测量与评价不仅关注学生的学科知识,还注重培养学生的综合能力和素质。
因此,现代教育测量与评价的形式也更加多样化,包括项目作业、实践考核、口头表达等,以全面了解学生的学习状况和能力水平。
现代教育测量与评价趋向个性化。
每个学生都有自己的学习特点和发展需求,因此,个性化评价成为现代教育的重要趋势。
个性化评价可以更好地满足学生的学习需求,发现并发挥每个学生的潜能。
通过采用不同的评价方式和工具,教师可以更准确地了解学生的学习进展,并根据学生的实际情况进行针对性的教学。
第三,现代教育测量与评价趋向综合性。
传统的教育测量主要关注学生的学科知识,而现代教育测量与评价更加注重学生的综合素养和能力发展。
综合性评价不仅考察学生的学科知识,还包括学生的创新能力、实践能力、沟通能力等。
这种综合性评价可以更全面地了解学生的发展状况,促进学生的全面发展。
第四,现代教育测量与评价趋向科技化。
随着科技的迅猛发展,教育测量与评价也逐渐运用科技手段进行创新。
例如,通过在线测评、电子作业等方式,可以更快速、准确地获取学生的学习数据。
同时,人工智能技术的应用也为教育测量与评价提供了更多可能性。
通过人工智能技术,可以对学生的学习数据进行深度分析,为教师提供更具针对性的教学建议。
现代教育测量与评价趋向公正性。
传统的教育测量与评价存在一些公平性问题,例如评价标准的主观性和评分者的个人偏见等。
现代教育测量与评价更加注重公正性,通过建立科学的评价标准和规范化的评分程序,减少主观因素的影响,确保评价结果的客观性和公正性。
现代教育测量与评价的发展趋势呈现出多样化、个性化、综合性、科技化和公正性等特点。
测量技术的发展历史和现状
浅谈测量技术的发展历史和现状摘要:测量技术的发展也同其他技术一样,由原始的、落后的方式,经漫长的人类社会发展历程,一步步的发展起来。
生产力的发展促进了测量科学的发展,同时测量技术的应用又为生产力的发展创造了条件,最终服务于科学研究、国防建设和国民经济建设。
关键词:测量技术;发展历史;现状;高新技术1 引言科学的产生和发展是由生产力决定的。
测量科学也不例外,它是人类长期以来在生产、生活方面与自然斗争的结晶。
测量技术的发展也经历了一个长期的、艰难的历程,且至今仍处在不断发展之中。
本文主要对这一历程进行了总结概述。
2 测量技术的发展历史2.1 地图测绘方面目前见于记载最早的古地图是西周初年的洛邑城址附近的地形图。
战国时管仲著有《管子》一书,书中第十卷专门论述了地图的重要用途和内容。
但遗憾的是,秦代以前的古地图都已失传。
长沙马王堆三号墓出土的公元前168年陪葬的古长沙国驻军图和地形图是现在能见到的最早的古地图。
图上有军事要素、道路、河流、山脉和居民地等。
西晋时裴秀编制了《方丈图》和《禹贡地域图》,并创立了《制图六体》的地图编制理论。
此后,历代都编制过各种地图,如明代郑和下西洋绘制的《郑和航海图》;清代康熙年间绘制的《皇舆全览图》;1934年,上海申报馆出版的《中华民国新地图》等。
在我国历史上,能绘制出如此水平的地图,与测量技术的发展是密切相关的。
我国古代测量长度的工具有记里鼓车、步车、测绳和丈杆等。
测量高程的工具仪器有水平(相当于现在的水准仪)和矩。
测量方向的仪器有指南针和望筒。
测量技术的发展离不开数理知识的支撑。
公元前问世的《九章算术》和《周髀算经》都记载有利用相似三角原理进行测量的知识。
之后,三国时期刘徽所著的《海岛算经》,介绍了利用丈杆进行两次、三次甚至多次测量的方法求解河宽、山高的实例,极大地推动了我国测量技术的发展。
2.2 研究地球大小和形状方面早在公元前就已经有人提出通过丈量子午线上的弧长来推断地球大小和形状的方法。
教育测量与评价课件(13)(第十三章 现代教育测量与评价的发展趋势)
经典测验理论的经典测验理论的主要优点
(1)经典测验理论是以弱假设为基础的,这弱假设条件容易被绝大多数 测验数据资料所满足;
(2)经过几十年的发展,经典测验理论形成一套以真分数理论为基础的 较完善的测验理论和对题目与测验进行统计及分析的方法,且这些方法在计 算上较为简单,意义上也直观明了,易被教育工作者理解和掌握,所以应用 上具有普遍性;
(3)我国教育工作者在使用过程中和实践中不断形成和完善了一套适合 国情的具体应用方法和应用原则。
经典测验理论的主要局限性
(1)经典测验理论的统计分析方法得到的各项指标,依赖于特定的被 试样本;
(2)在经典测验理论的条件下,题目参数和考生得分是在不同的基础 上分别求得的,所以经典测验理论无法建立考生得分与测验题目参数之间 的函数关系。即考生能力的估计会由于测验的改变而改变;
(4)计算机技术的发展提高了测验的效率
测验的发展及其应用与计算机技术的发展紧密相联。计算机阅卷评分出现,使得很 多客观测验题能迅速计分,为测验效率的提高作出很大贡献。在此同时,计算机化自适 应测验出现并迅速发展,这种测验以现代题目反应理论为根据,它与常规测验的最大区 别是:后者对所有被试使用相同的固定题目,而前者则根据被试的反应选项题。这类测 验既减少了被试的测验时间,又提高了测验的精度,更有效地测量被试的能力水平,并 且能从每一道测题中获取有关被试的最大量信息,从而促进测验的教学指导价值。
题目反应理论的主要局限性
(1)对数学模型与实测数据的似合要求较高。在实际应用中我们发现, 实测数据与模型拟合,也会收到考生样本容量大小及题目数量多少这两个 因素的制约。所以使用题目反应理论时,还必须对拟合度作统计检验。此 外,拟合度还与所选择的模型有关。
中外教育评价与测量发展历程
中外教育评价与测量发展历程教育评价与测量是指通过各种方法和工具,对教育过程和结果进行全面、科学、客观的评价和测量。
以下是中外教育评价与测量发展历程的相关介绍。
一、中国教育评价与测量发展历程1. 新中国成立前:在新中国成立前,中华民族的教育评价传统主要是通过科举考试来选拔人才,这种选拔制度存在很多局限和弊端。
同时,也存在着一些基于实践的教育评价,如明朝的“四书五经”教育体系,以及清朝的科举制度等。
2. 新中国成立后:在新中国成立后,教育评价与测量得到了快速发展。
1952年,成立了全国教育测试研究所,开始进行大规模的教育评价和测量工作。
1955年,中华人民共和国教育部颁布了《中小学教育评价办法》,明确了教育评价的目的、原则、方法和步骤,并在全国范围内实行了普及教育。
3. 改革开放以后:改革开放以后,中国的教育评价和测量工作得到了进一步的发展。
1985年,教育部首次在全国范围内实行了高考制度,成为了中国教育评价和测量的重要组成部分。
同时,也出现了一些新的教育评价和测量方法,如教育质量检查、学生评教、教师评职称等。
二、国外教育评价与测量发展历程1. 欧洲:在欧洲,教育评价和测量的发展历程比较早。
19世纪初,英国和法国开始进行普及教育,教育评价和测量工作也随之产生。
20世纪初,瑞典和丹麦等国家也开始发展教育评价和测量工作。
1948年,欧洲理事会成立,开始进行跨国教育评价和测量研究。
2. 美国:在美国,教育评价和测量的发展历程也比较早。
19世纪末,美国开始进行普及教育,教育评价和测量工作也随之产生。
20世纪初,美国成立了全国教育测试局,开始进行大规模的教育评价和测量工作。
1944年,美国通过了《教育改革法》,这是美国历史上第一部明确规定教育评价和测量的法律。
综上所述,中外教育评价与测量发展历程是有着较为悠久的历史的。
随着教育体制的不断改革和发展,教育评价和测量工作也在不断创新和完善,成为教育改革和发展的重要组成部分。
教育测量的发展历史论文
教育测量的发展历史论文教育测量作为教育评估的重要组成部分,其发展历史可以追溯到古希腊时期。
在亚里士多德的著作中,就可以看到他对学生的智力和能力进行了测量和评估。
然而,教育测量在近代的发展更加系统和深入。
19世纪末至20世纪初,心理学家和教育家开始对学生的智力和能力进行量化和评估。
在这一时期,智力测验成为了教育测量的重要工具,例如斯坦福-比奈特智力量表和韦克斯勒成就测验等。
这些测验的使用不仅促进了教育评估的发展,也对教学实践和学生学习产生了重要影响。
20世纪中叶以后,随着信息技术的发展,计算机化测验成为了教育测量的新趋势。
计算机化测验不仅提高了测验的效率和准确性,同时也为个性化教育和评估提供了更多可能性。
此外,教育测量的发展也促进了教育统计学的兴起,教育统计学的方法和技术为教育测量提供了更科学和系统的分析手段。
当今,教育测量已经成为了教育评估的重要领域之一,它应用广泛,不仅在学校教育中,也在职业培训、人才选拔和社会调查等领域都有重要的作用。
随着人工智能和大数据技术的发展,教育测量也面临着新的挑战和机遇,它将继续为教育改革和发展做出重要贡献。
教育测量的最新趋势之一是大数据分析。
通过收集和分析大量学生的学习数据,教育者可以更好地了解学生的学习特点和需求,从而更好地设计个性化的教学方案。
同时,大数据分析也可以帮助教育管理者进行教育政策的制定和改革,促进教育系统的整体优化和提高。
除了大数据分析,另一个重要的趋势是综合测量方法的发展。
传统的教育测量主要依靠笔试、口试和实验等单一测量手段,然而综合测量方法可以结合多种测量手段,包括观察、访谈、项目作业等,从不同角度全面评估学生的能力和素质。
这种综合测量方法更能够客观地反映学生的实际水平和潜能,有助于促进全面发展和个性化教育。
尽管教育测量在发展过程中取得了巨大的进步,但仍面临一些挑战。
例如,如何保障测量的公平性和准确性,如何更好地应用测量结果指导教学实践,以及如何推动教育测量的国际化合作等。
我国近现代教育测量与评价的进程与未来发展趋势
(4)继续改革和完善考试制度。
(1)建立促进课程不断发展的评价体系; 对课程的执行情况、实施问题进行分析评估,从 而调整课程内容、改进教学管理、形成革新机制。
(2)建立促进学生全面发展的评价体系;
不仅关注学业成绩,而且发展多种潜能,了解 学生发展需求,帮助他们认识自我、建立自信、 促进发展。
H、1966年我国开始了史无前例的“文化大革命”,在这一时期,我国高等 学校的正常招生被中断了6年之久。1972年起,大多数学校开始恢复招生, 主要是招收具有两年以上实践经验和初中毕业以上文化程度的工农兵学员, 取消了文化考试,实行“自愿报名、群众推荐、领导批准、学校复审”的办 法。在教育评价的实践和研究进程中,就其内容而言,有一个由单一到多样 的发展过程,即由主要评定学生的有关方面到全面评价教育系统各种因素的 发展过程。建国以后直到80年代初期,我国的教育评价实践和研究都还基本 处于单一化的学生评定阶段。
c、创新阶段(2002年~至今)
2002 年,国务院颁布了《基础教育课程改革纲要 (试行)》 ,全国开始开展教 育评价的试点和改革。 2002 年 12 月,教育部颁布《关于积极推进中小学评价与考试制度改革的通知》 , 规定了中小学评价与考试制度的原则。
我国现代教育测量发展述析
我国现代教育测量发展述析作者:李夏妍来源:《哈尔滨师范大学·社会科学学报》2014年第02期[摘要]我国现代教育测量的产生主要源于我国古代教育测量和西方心理与教育测验。
20世纪,我国现代教育测量历经形成并快速发展、缓慢和停止发展、蓬勃发展等时期。
21世纪初,我国教育测量在理论和方法研究上已经走向世界前沿。
在经典测验理论、概化理论、项目反应理论的深化研究的同时,还探讨了多维项目反应理论、认知诊断理论和测验等值理论的研究;主要关注计算机自适应测验、高级统计方法、国际学科能力测验的新方法在教育测量中的应用。
[关键词]现代教育测量特征;理论前沿;新方法;发展[中图分类号][文献标识码]A[文章编号]2095-0292(2014)02-0156-03[收稿日期]2014-01-10[作者简介]李夏妍,广东金融学院讲师,硕士,研究方向:教育测量与评价。
我国从夏商周三代至清末废科举时止,为古代教育测量时期;清末废科举至现在,为现代教育测量时期。
一、我国现代教育测量的出现并快速发展时期“教育测量”一词,是美国桑代克在1904年提出来的。
20世纪初期,我国进入现代教育测量阶段。
笔者认为,我国现代教育测量的产生,主要源于我国以科举考试为特征的古代教育测量和西方以智力测验量表以及调查问卷为特征的心理测验和学绩测验,受西方心理与教育测量学影响较大。
现代教育测量的主要特征是:第一,测量类型的多元化。
我国古代教育测量只是学业考试。
现代教育测量除了学业考试,还有智力测验、品德测验、能力倾向测验等。
既有个别测验,又有团体测验。
第二,客观性、科学性和标准化。
古代教育测量大多偏于主观经验性测量,如口试、凭经验观测、主观评判等,现代教育测量开始注重客观依据和科学标准,测量手段、工具更先进、更科学、更有效。
从测量标准、命题、测量过程到评定都讲究客观性和科学性。
19世纪,冯特时代的心理实验十分强调控制实验情景。
到了20世纪,实验控制的思想在测验中就演变为测量的标准化问题。
教育测量与评价的学科发展详解
第五,不同时期,不同学者所提出的教育评价概念的侧重 点有所不同。
第三十七页,共72页。
教育评价
注重效果:美国的泰勒(侧重课程评价)
格兰朗德和布卢姆基于教学评价和学生评价
注重资料的获得:(美)克龙巴赫、
斯塔弗尔比姆
注重评价方法、手段:(中国)张秀理、
根据事物的特性和设定的法则在分类的基础上确定同类客 体中各元素之间的相对顺序,只关心研究对象的顺序,不 问津间距是否一致。
3. 等距量表(interval scale)[间距量表] 在赋值时有相等的度量单位,采用相对零点,被测所对应 的测量值由明确的距离关系
4. 比率量表(ratio scale) 采用绝对零点,针对总体而不是样本,不但能确定一个被 测比另一个被测大(小)多少,而且还能得出其间的倍数 关系
测验的编制与实施
教育评价的方法
测量结果的整理和解释
教育评价的应用
第十二页,共72页。
四、教材和参考书
1.《教育测量与评价》华东师范大学出版社,黄光扬主编,2012年。 2.《教育评价学》高等教育出版社,涂艳国主编,2007年。
3.《教育测量与评价》广东高等教育出版社,胡中锋主编,1999年。
第二十七页,共72页。
三、教育评价的概念与特点
评价泛指
衡量、判断
人物或事物的
价值
教育评价:……
由美国泰勒于1930年首次提出,在美国国会1965年 通过的《初等及中等教育法案》中得以合法化。
第二十八页,共72页。
拉尔夫·泰勒(Ralph Tyler)——“当代课 程评价之父”、“现代课程理论之父”
第二十二页,共72页。
教育统计与测量技能亟须纳入教师资格认定体系
教育统计与测量技能亟须纳入教师资格认定体系
焦璨;张敏强
【期刊名称】《中国考试》
【年(卷),期】2012(000)007
【摘要】国家中长期教育改革和发展规划纲要明确指出,把改革创新作为教育发展的强大动力,改革教育质量评价制度。
改革教育质量评价制度,关键在教师。
但目前双轨制的教师资格认定办法,不利于教育质量评价,没有体现教育统计与测量的功能及其重要性。
建议:编制统一的教学大纲;实施分学科教学;教师教育毕业人员需补修教育统计与测量学;非教师教育毕业人员需参加教育统计与测量学的统一考试;考试形式不拘泥于书本知识。
【总页数】4页(P32-35)
【作者】焦璨;张敏强
【作者单位】深圳大学师范学院;华南师范大学
【正文语种】中文
【中图分类】G405
【相关文献】
1.中小学教师资格认定中的教育教学实践评价指标体系研究 [J], 张纪洪;朱宁波
2.学前教育是否应该纳入义务教育体系之辩——基于国际教育视野的我国学前教育走向分析 [J], 陈立武
3.测量管理体系纳入一体化管理体系的探讨 [J], 张革
4.广西职业教育\"双师型\"教师资格认定体系构建与实践 [J], 罗秋兰;秦福利;韦娇
艳;韦兰用
5.美国普瑞克西斯考试体系对我国教师资格认定的借鉴——基于教育教学能力测试的视角 [J], 程家福; 金林祥
因版权原因,仅展示原文概要,查看原文内容请购买。
新一代教育测量理论的研究现状
新一代教育测量理论的研究现状张晓军;张彦军【摘要】在提倡教育质量的背景下,学业评价的要求也越来越高,但是,传统的考试测验主要只能在学习成绩方面提供排序信息,缺乏深入了解被试的认知结构和认知水平的诊断信息,认知诊断的出现弥补了这一缺憾,新一代测量理论的出现顺应了教育研究者的需要.新的测量理论——认知诊断理论不仅弥补了传统测量方式的缺陷,也为之后研究者的研究提供了借鉴.对于认知诊断的研究,一定要以认知诊断含义、认知属性标定、认知模型、模型在实践中应用等几个方面为中心展开研究.此外,还要注重理论在实践中的应用,不断提高其实践的效果.【期刊名称】《山西广播电视大学学报》【年(卷),期】2018(000)001【总页数】4页(P10-13)【关键词】诊断;认知诊断;认知属性;认知模型【作者】张晓军;张彦军【作者单位】山西师范大学教育科学研究院, 山西临汾 041000;南京航空航天大学继续教育学院, 江苏南京 210016【正文语种】中文【中图分类】G642.4随着教育改革的不断发展,对教育质量评价要求越来越高,传统测验主要从宏观层面以被试的考试结果作为评价学生的方式,这种传统的考试结果只能判断学生成绩的高低和学习的优劣,但是这种传统的测量手段已经不能满足发展中的教育需求,它忽视了从微观方面对学生的认知加工过程以及对知识内部认知结构进行评价。
当今,在要求因材施教的教学方式的背景下,对学生具体学业认知的掌握情况需求的增加,促使了认知诊断理论的产生,它弥补了传统测量的不足。
认知诊断对教育教学评价起到了一定的积极作用。
一、认知诊断含义认知诊断理论是教育发展至一定阶段的产物,关于认知诊断的含义国内外研究者没有给出具体的定义,Leighton和Gierl认为认知诊断就是用于测量个体知识结构和加工技能。
他们提出的认知诊断主要测量的是知识结构和加工技能两个方面。
然而,测量学以及Yang和Embretson将认知过程加入到认知诊断测量的内容中,因此,测量学将认知诊断定义为人们通常把对个体认知过程、技工技能或知识结构的诊断评估称为认知诊断。
我国近现代教育测量与评价的进程与未来发展趋势(1)
1900-1949年教育评价与教育测量相结合,并呈现多种体制的多元 化格局;教育测量活动蓬勃发展,翻译引进国外的测验量表,修 改编制量表,建立学术组织,开设测量课程,出版测量方面的专 著;建立教育督导制度
G、50年代末期,中苏两党乃至两国的矛盾已初露端倪。到了60年代初,以布加勒斯特会议为 标志,中苏论战全面爆发,两国关系彻底破裂。此时,政治上的斗争再次延伸到教育领域中来, 我国教育系统对于以凯洛夫教育学为代表的苏联教育模式,由学习模仿转变为声讨批判。至此, 在教育评价领域,欧美式的教育测验既以“资”字号被否定于前,学习以五级分制为核心的苏 式的考评方法又以“修”字号被批判于后,而教育行政领导部门又并不能指出评价发展的正确 方向在哪里,于是我国的教育评价研究遂陷于无所适从的困境而再次被迫中断。
H、1966年我国开始了史无前例的“文化大革命”,在这一时期,我国高等学校的正常招生 被中断了6年之久。1972年起,大多数学校开始恢复招生,主要是招收具有两年以上实践经 验和初中毕业以上文化程度的工农兵学员,取消了文化考试,实行“自愿报名、群众推荐、 领导批准、学校复审”的办法。在教育评价的实践和研究进程中,就其内容而言,有一个由 单一到多样的发展过程,即由主要评定学生的有关方面到全面评价教育系统各种因素的发展 过程。建国以后直到80年代初期,我国的教育评价实践和研究都还基本处于单一化的学生评 定阶段。
素质教育的三分合评价模式
“三分合评价模式”的“三合”
评价目的的三结合(少数尖子到全体受教育者、 单一智育到全部领域、共性标准加因材施教的 个性发展标准) 评价标准的三结合(团体参照标准、社会参照 标准、个体参照标准) 评价主体的三结合(学生、学校、家庭) “三分合评价模式”的“三分” 评价内容的三分(知识、能力、素质) 评价过程的三分段(安置、形成、总结) 评价结论三分等(合格、良好、优秀)
从《教育测量与评价》杂志看国内教育测评研究的进展
从《教育测量与评价》杂志看国内教育测评研究的进展
田静;史赛云
【期刊名称】《教育测量与评价(理论版)》
【年(卷),期】2011(000)007
【摘要】本文采用文献计量法,对2008年~2010年《教育测量与评价》所载论文从论文主题、研究类型与方法、研究力量以及引文与基金资助等方面进行了统计分析,以期对国内教育测量与评价研究的现状予以梳理,从而为促进教育测评的改革与研究提供借鉴扣参考.
【总页数】5页(P9-13)
【作者】田静;史赛云
【作者单位】山西师范大学教师教育学院临汾041004;山西师范大学课程与教学研究所
【正文语种】中文
【中图分类】G40-058.1
【相关文献】
1.便秘症状测评工具及评价指标的研究进展
2.基于表现性评价的计算机模拟病例在教育测评中的研究进展
3.小而密低密度脂蛋白胆固醇、D-二聚体联合检测评价中医药治疗冠心病的研究进展
4.粮食收储质量检测评价指标体系研究进展
5.近红外光谱分析技术在青贮饲料营养品质检测评价上的研究进展
因版权原因,仅展示原文概要,查看原文内容请购买。
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
20世纪教育测量学发展的回顾与现状评析(张敏强)作者:张敏强主题类号:G1教育学【文献号】1-629 【原文出处】教育研究【原刊地名】京【原刊期号】199911【原刊页号】32~37【分类号】G1【分类名】教育学【复印期号】200001【标题】20世纪教育测量学发展的回顾与现状评析【作者】张敏强【作者简介】张敏强,中山大学高教所所长、教授。
广州510275【正文】20世纪是教育测量学兴起并得到迅速发展的世纪。
在理论上,经典测量理论不断得到完善,现代测量理论亦得以发展。
在应用上,由于计算工具的飞速发展,使教育测量学的应用上了更高的层次并拓展至各个领域,反过来又促进了理论的研究和发展。
本文对本世纪教育测量学的发展作了回顾,并对现状作出评析。
一、教育测量学简史教育测量学是在本世纪二三十年代兴起、四五十年代定型、六七十年代迅速发展起来的一门教育学科。
回顾与展望教育测量学的历史,可以使我们进一步了解和确认教育测量产生与发展的历史必然性和合理性。
作为教育测量的基本形式的考试和测验最早可以追朔到隋炀帝大业二年(公元606年)的科举制。
科举制的特征是:逐级考试选拔人才;制度相当完备,考场规定相当严格;有一套命题、保密、封存、评卷的措施及违者的处罚规定。
科举制在唐朝极盛,所用的方法有口试、贴经、墨义、策问、诗赋等五种。
宋、元、明、清各朝基本沿袭了科举制,至清末,程式严格的八股文成了经义考试的主要形式,使考试成了僵死的东西,科举制由此走向衰败。
19世纪末20世纪初,实验心理学和心理测验的发展推动了教育测量的发展。
1904年,被誉为教育测量之鼻祖的美国心理学家桑代克,出版了《心理与社会测量(Mental and Social Measurements)》一书,该书首次系统介绍了统计方法和编制测验的基本原理。
教育测量的客观化、标准化问题受到了极大的重视,教育测量由此走上科学化的道路。
1909年桑代克又用统计学上的“等距原理”编制了首批标准化的教育测检量表,如《书法量表》、《拼字量表》、《作文量表》等。
从1909年到1915年,教育测验逐渐增多,并且从单独的学科测验扩展至综合测验的编制,即由几种主要学科的测验组合而成。
同时,教育测验不再限于小学的学科测验,中等学校以上的各科测验大都一一编制出来。
不仅学科测验有了发展,诊断测验和练习测验也陆续有所编制。
当时在西方已兴起利用教育测量进行教育调查研究的风气。
辛亥革命后,教育测量学随着西方的科学技术被引进我国。
1918年,俞子夷根据桑代克《书法量表》的编制程序,编制了《小学国文毛笔书法量表》,开我国教育测量编制的先河。
1919年,廖世承和陈鹤琴在南京高等师范学校讲授测验,为我国高校设置测验课程之始。
1922年,美国测验学专家麦柯尔(McCall,W.A. )应中华教育改进社之邀来华讲学,并主持编制各种应用测验。
至1925年前后,编成的中小学教育测验不下几十种,例如廖世承的《中学国文常识测验》、《中学文法测验》,陈鹤琴的《小学默读测验》、《小学文法测验》等。
1931年中国教育测验学会在南京成立,1932年《测验》杂志创刊。
1935年,中央大学教育学院编制了《小学国语默读测验》、《小学算术测验》、《小学中年级常识测验》等。
抗日战争爆发后,中央大学西迁重庆,艾伟组织与指导中央大学一些师生继续编制教育测验,如《中学语文理解力量表与汉字测验》等。
同时,我国一些从事教育测量研究和教学的学者,出版了有关专著和教材,如孟宪承的《测验之学理研究》、王征葵的《态度测验法》、沈有乾的《心理与测验》等。
全国各高校教育学系和中等师范学校开设了教育测量或心理与教育测量的课程。
1949年到1978年之间的30年,由于受原苏联教育理论的影响,教育测量学遭到否定。
自从1978年党的十一届三中全会召开以后,教育和心理测量重新开始受到重视。
张术祖在《教育研究》1979年第5 期发表了《论教育测量的重要性和教育测量的一些基本概念》,被认为是建议恢复教育测量学研究和教学的第一篇论文。
1982年,在叶佩华等的主持下,翻译了桑代克、哈根合著的《心理与教育的测验和评价(Measurement and Evaluation in Psychology and Education)》(1977年版),这是自1979年以来的第一本有影响的教育测量译著。
随后,教育测量学被列为高校教育系的必修课。
1988年,经中国教育学会批准,中国教育学会教育统计与测量研究会正式成立,由张厚粲任第一届理事长,叶佩华任名誉理事长。
在研究会成立以后,多次举办高层次的讲习班。
研究会的部分会员自1985年以来积极参加全国高考标准化改革实验,在全国高考命题标准化、施测标准化、评卷记分标准化、分数报告标准化等方面的策划和实践中作出了积极的贡献。
在上述这段时间,除教材以外,还出版了不少教育测量学方面的论著,如张厚粲等的《标准化考试简介》、桂诗春的《标准化考试的理论与实践》、张敏强等的《标准化考试》、郑日昌等的《教育测量学的基础》等等。
这些论著的出版及高考标准化改革实验的成功,加上舆论的支持,在全国真正打开了宣传教育测量学、重视教育测量学的新局面。
1988 年,我国正式加入国际教育成就评价协会(InternationalAssociation for Educational Assessment, IAEA)。
可以说,1979年以来的20年中,我国的教育测量学的教学与研究工作者以优良的成绩,使教育测量学在教育科学领域中占据了重要的一席。
二、教育测量学基本理论与方法的评析下面对20世纪主要的教育测量理论:经典测量理论与题目反应理论作出比较与评析。
(一)经典测量理论的优点与不足经典测量理论经过几十年的发展,形成了以真分数理论作为其理论基础,并具有完善、可操作的对题目和测验进行统计分析的方法。
经典测量理论的优点在于:(1)以弱假设作为理论基础。
这些弱假设条件容易被绝大多数测验数据资料所满足。
所以,从实用的意义上说,其应用具有广泛性。
(2)具有明了简单的统计分析方法,且这些统计分析方法都有数学上的实际意义,易于掌握和理解。
(3 )我国教育测量工作者对经典测量理论及方法有深刻的认识,其应用具有基础性。
其不足之处有:(1 )经典测量理论的方法所求得的题目参数(如题目难度、题目区分度)会受到不同考生样本组能力水平的影响。
所以,选取的考生样本不同,就有可能得出不同的题目难度和题目区分度,故在考生样本选取方面要做到非常精确有一定的困难。
(2 )在经典测量理论的条件下,题目参数与考生得分量是在不同的基础上分别求得的,所以无法建立考生得分与测验题目参数之间的函数关系,即考生能力的估计会由于测验的改变而改变。
(3 )经典测量理论中有两个重要的假设条件,即严格的平行测验和测验误差与真分数相关为零,这在实际操作中是难以做到的。
(二)经典测量理论的质量评估测量工具决定着测量结果的准确性。
所以,良好的测验也决定着测量结果的准确度,评价一份测验的优良性,主要有以下内容。
1.效度。
它是指测验是否测出了所要测的东西。
效度分为:(1 )内容效度,即测验的题目与内容是否与教学内容与目的相适应。
(2 )构想效度,即测验的分数是否达到了某一预想的特质。
(3 )效标关联效度,用测验所得分数与标准测验所得的分数的相关来制定这次测验的效度,称之为效标关联效度,而标准测验则被称之为“效标”,在此起到预测作用。
2.信度。
信度是反映测量的一致性程度的指标。
计算信度的方法主要有:(1)再测信度,即对同一被试总体进行重复测量而得到的两组数据,以相关系数的大小表示一致性程度,相关系数高,则说明信度高。
(2)复本信度,即建立两个在内容、质量各方面都相等的测验,并对实施后的两个测验分数求相关。
(3)分半信度,把一个测验分为质量相等的两部分,求这两部分所得的分数的相关。
要提高信度,可以加长测验。
但信度是效度的必要条件,而不是充分条件,即信度低,效度不可能高,但信度高,效度不一定高。
3.区分度。
区分度是测验题目对被试者能力高低的鉴别能力。
不同的测验要求有不同的区分度指标,如高考对区分度的要求就比中学会考高。
4.难度。
难度是指测验题目的难易程度。
显然,难度大,通过率低;难度小,通过率高。
难度指标的高低直接影响到区分度指标,因为难度太大或太小,都将使题目的鉴别能力受到影响。
(三)经典测量理论的评价工具评价是把测验结果放在一定的参照标准上来评定其高低、优劣。
评价工具是按参照标准编制出来的,评价工具也与物理测量的量具同理,须具备以下的要素。
(1)参照点。
这是计算的起点,参照点不同,测量结果就会因其所代表的意义不同而无法进行比较。
(2)单位。
这是测量的基本要求。
教育测量也须有相应的单位,但教育测量的单位却往往不等距或等距不等值。
比如,在同一数学测验上,两考生分别得100分与80分,另两考生分别得70分与50分,分数差相等但却不能认为差距相同。
教育测量的评价工具所参照的标准,主要有以下两种。
(1 )标准参照测验。
标准参照测验是以被试对测验目标或内容的掌握程度作为标准。
按照参照标准的不同,可将标准参照测验的分数分为两种:1 )内容参照分数。
这种分数是依据被试对某个确定的内容或技能的掌握和熟悉程度来表示的,因而,建立内容参照分数的前提是测验内容范围的确定;2)结果参照分数。
用效标行为的标准来解释测验分数,称为结果参照分数。
由此可知,标准参照测验是一种使用广泛的测验形式,如会考、课程考试等等。
(2)常模参照测验。
这是以全体考生在某一大规模测验中所得到的成绩分布为标准,衡量被试在这一测验上所得到的成绩在全体成绩分布中所处的地位。
因而,将被试在这类测验上所得到的分数作单独解释是毫无意义的,只能将它放在被试团体中作比较。
这个团体的分布则称为模团体,而对常模参照测验的测验分数作解释的参照则称为常模。
(四)题目反应理论的评析题目反应理论是现代测量理论中最具代表性的一种。
题目反应理论是建立在潜在特质理论基础之上的。
题目反应理论认为,潜在特质指的是所要测的内在能力,定量地估计个体在每一种特质上的位置是心理测验的任务。
但是,由于心理特质的潜在性,心理学家只能依据可观测变量来鉴别和定义这些特质,并希望能探明:哪些特质所起的作用是重要的,哪些特质对人的行为发展产生重大影响,等等。
题目反应理论的最大特点就是它找到了一条题目特征曲线(ItemCharactteristic Curve简称ICC),并且以多种数学表达式(或数学模型)来描述它和逼近它。
题目特征曲线的数学模型一般都包含两个方面的参数:(1)对测验题目的特征进行刻画的题目参数;(2)对考生的特征进行刻画的潜在特质或称为能力参数。