教育测量课件
教育统计与测量PPT课件
.
11
描述统计
目的
描述数据特征
找出数据的基本规律
50
内容
确定要研究的数量特征
设计统计指标(说明这些数量特征的) 25
搜集数据
整理数据 计算并显示指标数据
0 Q1 Q2 Q3 Q4
x = 30 s2 = 105
.
12
描述统计的主要方法
特征值
集中量数: 描述集中趋势 差异量数: 描述离散程度
整群抽样
是抽取的对象以整群为单位而不是以个体不单位的抽 样方法
机械抽样P4
.
8
随机数的产生
大小为N的总体中产生样本量为n的随机样本的一个常用的方法是利用 随机数(random number)。
利用随机数步骤为:(1) 把总体的所有个体编号;(2) 产生n个在0到N 之间的随机数;(3)与如此产生的随机数中的数目相同的个体则形成了 样本量为n的简单随机样本。
3
教育统计篇
第一讲 教育统计绪论 第一节 教育统计学概述 ➢研究对象 ➢研究方法 ➢研究内容
.
4
研究对象
教育统计学: 应用数理统计学的原理和方法研究教育问题。 主要研究如何收集、整理、分析由教育调 查和教育实验所获得的数据资料,并以此为依 据进行科学推断,揭示教育现象所蕴涵的客观 规律。
.
5
研究方法
图1-1 统计学探索现象数量规律性的过程
.
15
第二节 教育统计学的初步概念
被试 数据与变量 随机 误差 抽样与样本 定性研究和定量研究
统计量与参数
.
16
(一) 随机变量 (二)总体、样本和个体 (三)次数、频率和概率 (四)误差 (五) 统计量与参数 (六)定性研究与定量研究
教育测量与评价课件(第一章-教育测量与评价学科发展)
思考题 教育测量属于哪一种水平的测量,为什么?
2020/12/18
11
答:
(1)教育测量属于顺序测量的水平。 (2)① 从所使用的参照点来说,教育测量领域的参照点均为相对参照点; ② 从所使用的单位来说,教育测量的单位远没有其他测量的单位成熟和完善,既无统一的单位, 也不符合等距的要求。
2020/12/18
教育测量的定义与特点
教育测量的定义 教育测量,就是针对学校教育影响下学生各方面的发展,侧重从量的规定性上予以确定和描述的
过程。 教育测量的特点
(1)本书的观点: ① 间接性和推断性;
② 测量对象的模糊性和测量误差的不可避免性; ③ 量表具有多样性,结果具有相对抽象性。 (2)其他的观点:
有人概括为:① 间接性; ② 相对性。(金瑜) 有人概括为:① 间接性; ② 相对性; ③ 客观性。(郑日昌) 有人概括为:① 间接性; ② 不确定性; ③ 明确的目的性。(朱德全、宋乃庆)
测量、等距测量、比率测量。这四种不同水平的测量产生了相应的四种类型的量表。
称名量表和顺序量表
称名量表(命名量表或名称量表或类别量表) 称名量表是最低水平的测量量表,它只是用数字代表事物或用数字对事物进行分类。在这种
情况下,数字只是事物的符号,而没有任何数量的意义。 适合于对称名量表进行统计分析的统计方法有百分比、次数、众数和χ2 检验。
量表及其种类
量表的概念 量表(量尺)是指确定了测量单位和参照点并具有取值系统的测量工具。
量表的类型 由于事物的属性(特征)不同,以及所制定的规则不同,致使用数的属性来描述事物属性(特
征)所达到的程度不同,这就产生了不同测量水平的问题。 史蒂文斯根据对测量结果数量化描述的不同水平,将测量分成四种不同水平:称名测量、顺序
第五章-教育测量研究PPT课件
可编辑课件PPT
12
(二)根据测量的内容分类:学业成就测验、智力测验、能力倾向测验、 人格测验等。
1.学业成就测验 ❖ 测被试经某种形式的学习或训练后对知识、技能的掌握程度或熟练水
平。如识字量、阅读、算术测验等,成就测验可以是学科成就测验或 综合成就测验。 2.智力测验 ❖ 测被试的智力高低,其结果常以智商(IQ)来表示,此类测验比较多, 其中比较著名的有:斯坦福——比纳智力测验、韦克斯勒儿童智力测 验量表(WISC-CR)、瑞文推理测验等。
可编辑课件PPT
13
3.能力倾向测验 ❖ 测被试潜在的某种能力,以了解其发展的可能性,预测个人能力发展
倾向。如音乐、美术、体育、创造力、想象力、记忆力等方面的能力 倾向测验。 4.人格测验 ❖ 测被试的需要、动机、兴趣、态度、气质、性格、人际关系等人格心 理特征,较为著名的有明尼苏达多相个性测验(MMPI)、艾森克人格 问卷(EPQ-R)、卡特尔16项人格因素测验(16PF)等。
可编辑课件PPT
14
(三)根据测量结果的评价标准分为:常模参照测
验、目标参照测验。
1.常模参照测验
❖ 常模参照测验是一种衡量被试相对水平的测验,是将被试的测验成绩 与同类对象在同一测验上的平均分(常模)相比较,从而解释分数, 确定被试在总体中的相对位置的测验方法。
❖ 另一种是相对参照点,即以人为确定的零点为测量的起点。 如地势高度的测量,就是以海平面为测量的起点。最理想的 参照点是绝对参照点。
教育测量与评价课件(7)(第七章 教育测验“标准”及其建立方法)
标准参照测验分数解释方法之二:掌握分数
无论是针对每一教学单元的形成性测验,还是针对一门课程的终结性测 验,如果要了解与判断学生是否掌握所学的内容,我们就要编制一份有内容效 度的教育测验,并且事先定出一个可接受的最低标准。这个标准是人为确定的, 它可以是百分制评分量尺上的某一人点,也可以是80%-90%的正确反应 所对应的分数,作为最低通过标准。这个分数就是所谓的掌握分数。以它作为 判断标准,把所有的学生区分为掌握和未掌握两类。 对于掌握分数,应注意以下几点: ① “掌握”与“未掌握”是人为确定的。 ② 从知识的掌握状态来讲,事实上更应该是一种连续模型。因此,把学 生区分为“掌握”与“未掌握”两类,在许多情况下的确是迫不得已的办法。 ③ “掌握”、“及格”或“合格”的概念类似,但有区别。 ④ 当利用测验的掌握分数给学生进行二分类时,对于不同的年级、不同 的课题内容、不同的测验乃至同一测验中不同的分测验,人为规定的掌握分数 也未必相同。
(2)美国IOX模式
① 一般描述:是对测量的领域进行一般性的、简明扼要的描述。 ② 样本题目:是给出一个带有指导性与限制性的测验题目的具体例子。 ③ 刺激的界定:是对题目的内容、素材、难度、广度等因素作出更为明确的规
定。
④ 反应的界定:是对被试者如何作答题目的方式,包括正确答案与错误答案的 区分准则等方面作出规定。 ⑤ 其他补充说明:若有必要时,对界定测验内容领域所涉及的有关问题作出交 待或补充说明。
(② 目的; ③ 评价目标 ④ 内容或核心内容; ⑤ 评价目标和内容的关系; ⑥ 评价技术; ⑦ 等级描述。
编写测验内容领域规范的方法(二)
(4)我国高中毕业会考标准的建立模式
① 制定各学科考试大纲; ② 使用参照试卷进行取样测试,建立高中毕业会考的标准分量表: T 85 15Z ; ③ 根据分数,把高中毕业会考成绩确定为五个等级; ④ 编制与参照试卷大体平行的会考试卷; ⑤ 在保密的状态下,抽取有代表性的样本,随机分成两组,分别用会考试卷和参 照试卷进行测试,取得数据; ⑥ 在会考试卷原始分数和参照考试卷原始分数建立等值对应关系; ⑦ 根据每位高中生的会考成绩,经分数转换表,便可得知会考的等级分数。
教育测量与评价课件(6)(第六章-教育测验的常模及其建立方法)
准分数量表上,其一般转换公式为: T a bZ 标准分数常模的建立方法
标准分数常模是指以常模团体在某一测验上实测数据为基础,把原始分 数转换成基本标准分数Z或转换到更大的标准分数T量表上,能够揭示每个测 验分数在常模团体测验分数中的相对地位的一种组内常模。
(2)标准分数Z 量表的单位是相等的,其零点是相对的。因此,不同科 目的Z 分数具有较好的可比性和可加性。
(3)Z 分数本身是关于原始分数X 的一种线性变换,因此,Z 分数不改 变原始分数的分布形态。
百分等级常模的意义与应用
百分等级是一个地位量数,能够反映某个测验分数在一组数据中的相对 地位。它是把学生的原始分数放在该学生所在群体的成绩中进行比较,以确 定学生在群体中的相对地位之高低。
百分等级常模是指基于某个常模团体,为某种测验的原始分数与百分等 级之间建立起对应关系的组内常模类型。
百分等级常模意义直观、容易理解、便于解释,在能力测验和学业测验 中得到广泛的应用、它不仅可用于解释学生在单一能力测验的成绩,以便了 解该生的能力发展在其所属团体中的相对位置,而且对于同时施测的若干个 不同的测验来讲,利用各自的百分等级常模,可以比较学生在不同科目上的 发展状况,克服了原始分数不能直接比较的缺陷。
建立标准分数常模实际上就是根据常模团体的实测数据,利用公式 Z X X
S
和 T a bZ ,在原始分数序列{ Xi }和标准分数之间{ Z i }或标准分数{ T i }之间,
建立起对应关系,从而形成某种测验的标准分数常模转换表。
标准分数 Z 的性质与特点
(1)任何一批原始分数,转化成Z 分数后,这批Z 分数的平均值为0, 标准差为1。Z 大于0,表示测验成绩在平均数之上;Z 小于0,表示测验分 数在平均数之下;Z 为0,则表示测验成绩与平均数相等。
《教育统计与测量》课件
人工智能技术可以通过自然语言处理 、图像识别等技术,实现多样化的教 育测量方式,满足不同场景和需求。
教育统计与测量的未来展望
随着技术的发展和社会的进步, 教育统计与测量将不断拓展其应 用领域和范围,为教育事业的发 展提供更加全面和深入的支持。
教育统计与测量将进一步融合多 学科的理论和方法,形成更加科 学和系统的理论体系和实践框架
对数据进行整理、分类和概括,以描述 数据的集中趋势、离散程度和分布形态 。
VS
详细描述
描述性统计是教育统计的基础,主要包括 数据的收集、整理、分类、概括等步骤。 通过对数据的描述,可以了解数据的集中 趋势(如平均数、中位数等)、离散程度 (如标准差、变异系数等)和分布形态( 如偏度、峰度等),从而对数据有一个初 步的认识和评估。
量化结果解释
对量化结果进行解释,说明各评 价指标的具体表现情况。
05
教育统计与测量的发展 趋势
大数据在教育统计中的应用
大数据技术为教育统计提供了海量的数据来源,使得教育数据的收集和分析更加全 面和深入。
大数据技术能够实时监测和分析教育过程,为教育决策提供科学依据,提高教育管 理的科学性和有效性。
实验设计
总结词
根据研究目的和假设,合理安排实验条件和操作,控 制干扰因素,以提高实验的内部效度和外部效度。
详细描述
实验设计是教育统计中不可或缺的一部分,它是教育研 究中的重要环节。一个好的实验设计需要考虑多种因素 ,如实验目的、实验假设、实验变量、实验操作、实验 对象等。通过合理的实验设计,可以有效地控制干扰因 素,提高实验的内部效度和外部效度,从而使得研究结 果更加可靠和科学。在教育研究中,实验设计的应用非 常广泛,可以帮助研究者深入了解教育现象和教育过程 ,为教育实践和教育改革提供科学依据。
教育测量ppt课件
3.2.5项目与测验的信息函数
• 某个试题j的信息函数值的大小直接反映这种估计就越精确。因而 信息函数可作为衡量测验试题是否有效的 工具。在项目反应理论中,某个测验项目j 的信息函数定义为:
I
j (Q)
Pj 2 PjQ j
4 教育测验的编制与实施
• 迷惑性答案的效力,是指多项选择题中用的非 正确答案被考生选中的可能性,所以这项指标 只对多项选择题有意义。对这项指标的计算比 较困难,通常是用一次测验中选中某答案的次 数来估计该答案的迷惑效力。如果在考试中某 一选项无一人挑选,则说明改选项没有迷惑力; 如果选用的人数多且低分组的选用多于高分组, 则说明改选项的迷惑力强;如果高、低分组选 择某选项的人数都较少且人数接近,则说明该 选项的迷惑力较弱。显然,在测验组卷时应尽 量少用或不用迷惑力弱的试题,以免影响测验 效果。
• 准则关联效度 :准则关联效度是根据测验所作的 预测是否能被证实来衡量测验的有效性。如果测 验所作的预测与未来实际发生的事情很接近,这 个测验就是一个有效的好测验。在这种场合,被 预测行为是用来衡量测验是否有效的标准,因此 被称之为“准则”。准则关联效度就是要考察测 验得分与准则之间有什麽样的关系。例如用“模 拟考试”来预测高考的成绩,模拟考试在这里就 是一个准则。如果预测的准确性高,该模拟考试 就是一个有效的好测验。
3.2.1 项目反映理论
• 项目反映理论(IRT)正是针对经典测量理 论的上述局限提出来的。它的最大优点就 是,项目参数(CTT中的质量指标对应)的 估计值与被试样本的选择无关;对被试能 力水平的估计值与施测所用试题无关;同 时还能给出测验项目对被试实际能力估计 值的精度。
3.2.2 项目反映理论的假设
是指,该题被能力强者答对的可能性大,被能
《教育评价与测量》课件
标准化处理可以采用多种方法,如Z 分数法、百分位数法等,将原始数据 转换为标准分数或相对位置,以消除 不同评价指标之间的量纲和量级差异 。
04 教育评价的实施过程
评价计划的制定
确定评价目的和评价对象
确定评价方法和工具
明确评价的目标和评价的对象,为后 续的评价工作提供指导。
根据评价标准和指标,选择合适的评 价方法和工具,确保评价的有效性和 可靠性。
评价指标的权重分配
总结词
权重分配是根据各评价指标的重要程 度对其进行加权处理,以突出重要指 标在评价中的作用。
详细描述
权重分配应根据教育目标和评价目的 进行合理设置,可以采用专家打分、 层次分析法等定性与定量相结合的方 法进行权重赋值。
评价指标的标准化处理
总结词
标准化处理是将不同性质和单位的评 价指标转换为可比较的统一标准,以 便进行综合评价。
测量的效度与项目分析
效度评估
内容效度、结构效度和验证效度。
项目分析
对测验项目的质量进行评估,包括难度、区分度和项目功能差异等指标。
03 教育评价的指标体系
评价指标的确定
总结词
确定评价指标是教育评价的关键步骤,需要综合考虑教育目 标、学生发展需求和课程要求等因素。
详细描述
在确定评价指标时,应首先明确教育目标和期望学生达到的 发展水平,然后根据课程内容和教学要求,选择能够反映学 生知识、技能、态度等方面的可测量指标。
教育评价的类型和特点
总结词
教育评价可以分为多种类型,每种类型具有不同的特 点和应用范围。
详细描述
根据不同的分类标准,教育评价可以分为多种类型。按 照评价目的可以分为诊断性评价、形成性评价和终结性 评价;按照评价对象可以分为学生评价、教师评价、课 程评价、学校评价等。每一种评价类型都有其特定的应 用范围和特点,需要根据具体情境选择合适的评价类型 和方法,以达到最佳的评价效果。同时,不同评价类型 之间也存在相互补充的关系,应该根据实际需要综合运 用。
教育测量与评价课件(3)(第三章-教育测量与评价的质量特性)..复习课程
(3)重测信度适用于异质性测验(一个测验包括几个不同的部分,这几个部 分分别测量几个不同的心理特质,它们之间可能并不存在相关或相关较低),也 适用于速度测验和运动技能测验。
复本信度(等值性系数或等值稳定性系数)
(1)复本信度是指两个平行测验(在试题格式、题数、难度、指导语说明、施测要求等方面 都相当,并且都用来测量相同潜在特质或属性,但试题又是不相同的测验)测量同一批被试所得结 果的一致性程度,其大小等于同一批被试在两个复本测验上所得分数的相关系数。
(1)效度始终是针对一定测量目的而言的; (2)效度只有程度上的差异; (3)效度是针对测量结果而言的; (4)评价一个测量是否有效要多角度、多方面地收集证据。
内容效度
内容效度的含义及应用范围
内容效度是指测验题目样本对于应测内容与行为领域的代表性程度。如果是教学情境下的成就测验,那么 其内容效度就是看测验题目样本能体现教学目标与教材要求的程度。
(4) 荷伊特信度
1941年荷伊特提出用方差分量K 比K 来估1计测1验内s部sx2i2一致性的方法,其估计值为:
rxx
1
MS人题 MS人
评分者信度
评分者信度的含义 评分者信度是指多个评分者给同一批人的答卷进行评分的一致性程度。
评分者信度的计算 (1)当评分者人数为两人时,评分者信度等于两个评分者给同一批被试的答卷所评分数的相
《教育测量评价》课件
展望
技术进步
随着技术的发展,将会有更精确、更 有效的测量和评价工具出现,这将极
大地推动教育测量评价的发展。
数据安全与隐私保护
随着人们对数据安全和隐私保护意识 的提高,教育测量评价将更加重视这
方面的规范和标准。
公平性追求
随着社会对公平性的追求,教育测量 评价将更加注重公平性,使每个受教 育者都能得到公正的评价。
测量工具与技术
标准化测试
经过标准化处理的测试,具有较 高的可靠性和有效性,常用于大
规模评估。
问卷调查
通过问卷形式收集数据,适用于了 解受访者的态度、行为等方面。
观察法
通过观察受试者的表现来收集数据 ,需要经过专业培训的观察员进行 操作。
03
教育测量评价的实施过程
确定评价目标
总结词:明确性
详细描述:在实施教育测量评价之前,需要明确评价的目标,包括要评价的内容、评价的标准 以及评价的目的。目标明确有助于确保评价的针对性和有效性。
战。
数据安全与隐私保护
在收集和使用教育数据的过程中,如 何确保数据的安全和隐私不被侵犯,
是一个亟待解决的问题。
公平性问题
在评价教育效果时,如何确保评价标 准的公平性,避免因为某些群体的特 性而产生偏差,是一个需要重视的问 题。
评价标准的更新
随着社会的变化和教育理论的发展, 如何及时更新评价标准以适应新的教 育环境,是一个持续的挑战。
分析数据
总结词:深入性
详细描述:数据分析是教育测量评价的核心环节,需要对收集到的数据进行深入的分析和挖掘。运用 统计分析、内容分析等方法,对数据进行处理、描述和解释,以揭示数据背后的规律和意义。分析数 据时应注重深入性和综合性,挖掘数据之间的内在联系和规律。
《教育统计与测量》课件
个体差异是由于特质差异所致,而不是偶然误差。
IRT的应用
用于解释和预测测验项目的难度和区分度,以及个体在测验中的表 现。
04 教育统计与测量实践
学生成绩分析
总结词:通过对学生成绩的统计分析, 了解学生的学习状况和进步情况,为教 学改进提供依据。
跟踪学生成绩变化,评估教学改进的效 果。
分析不同科目之间的成绩差异,找出学 生的学习短板。
详细描述
计算平均分、标准差等统计指标,评估 学生整体表现。
教师绩效评估
总结词:通过对教师教学 绩效的测量和评估,激励 教师提高教学质量,促进 教师专业发展。
详细描述
制定评估指标和标准,明 确教师职责和要求。
综合分析评估结果,为教 师提供有针对性的改进建 议。
教育统计与测量的应用
教育政策制定
通过对教育数据进行统 计分析,为政策制定提
供科学依据。
教育研究
用于收集和分析教育实 验、调查等研究数据, 探究教育现象的本质和
规律。
教育评价
对教育实践的效果进行 测量和评估,为改进教
育质量提供反馈。
教育决策
基于统计分析结果,为 教育资源配置、课程设
置等决策提供支持。
个性化教育
通过大数据分析,了解学生的学习习 惯、兴趣和需求,为每个学生提供个 性化的教育方案。
人工智能在教育测量中的应用
自动化评估
利用人工智能技术对学生的学习成果进 行自动化评估,提高评估效率和准确性 。
VS
智能辅助教学
通过人工智能技术为教师提供智能辅助教 学工具,帮助学生更好地理解和掌握知识 。
目的
通过对教育数据的科学分析和解 读,为教育决策、研究和实践提 供有力支持,促进教育质量的提 升。
教育测量与评价的基本原理PPT课件
适用的统计方法:均数、标准差、相关系 数,t、F检验等
2021
24
比率量表
含义:有相等单位和绝对零点的量表。 功能:区分性、顺序性、等距性、相等单
位、绝对零点。 数量化结果的含义:可以进行加减乘除四
则运算。 适用的统计方法:几何平均数、变异系数
功能:区分性、顺序性
数量化结果的含义:比较大小,不能进行 运算。
适用的统计方法:中位数、百分位数、等 级相关系数、肯德尔和谐系数以及秩次的 方差分析。
2021
23
等距量表(区间量表 )
含义:在给事物及属性指派数字和符号时, 要求各数字或等级之间的差距是相同的, 即具有相等的单位 。
功能:区分性、顺序性、等距性、相等单 位。
常模参照性测验题目要求难易适中,强调 题目的鉴别力,测验信度的估计适合用 统计方法;
标准参照性测验不强调题目的鉴别力,测 验信度的估计不适合用统计方法。
2021
16
常模参照测验与标准参照测验的比较
5、从解释考试结果的依据及分数的意义 来看,两种考试各有其依据;
常模参照性测验的常模是解释分数的标准, 用地位量数表示考生在团体中的相对位 置;
2021
21
名称量表
意义:依照某种法则给事物及属性指派 名称或类别的量表。
功能:区分性。 数量化结果的含义:不具有数的意义,
不能比较大小。 适用的统计方法:次数的统计,如次数、
众数、百分比、离散相关、卡方检验等。
2021
22
顺序量表
含义:依照某种法则给事物或人的心理现 象指派名称或类别,还可以将分类结果按 数量大小进行排序。
2021
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
第一章:教育测量导论*什么是测量(测量的定义、要素、水平)*什么是教育测量?*教育测量的特点*什么是心理测验?*测验的分类*测验观*行业标准和伦理规范1、测量的定义测量就是按法则给事物指派数字——史蒂文斯(S.S.Stevens)2、测量的两个要素:*参照点:计量的起点(零点):a.绝对零点b.相对零点*单位:理想的单位要满足两个条件:a. 确定的意义b. 相等的价值3、四种测量水平美国史蒂文斯根据测量结果数量化程度的不同,将测量分成四种水平,对应四种测量量表:*类别量表*等级量表*等距量表*等比量表*a、类别量表(nominal scale):*无参照点,无单位,“二无量表”,从严格意义说,类别量表不能称之为量表。
*这种量表只是用数字来代表事物或事物的类别,没有任何数量的意义。
b、等级量表(ordinal scale)*无参照点,单位没有相等价值*等级量表不仅指明类别,而且指明不同类别的大小等级c、等距量表(interval scale)*相等的单位*相对参照点d、等比量表(ratio scale)*相等单位*绝对参照点*最完善的量表一般说来,教育和心理测验大多数是等级量表和等距量表。
4、教育测量的定义*广义:依据一定的心理学和教育学理论,使用测验,对教育领域内的事物和现象予以数量化描述的过程。
*狭义:教育测量是指学生经过学习和训练之后,对学生知识、技能掌握程度的测量。
又称成就测量、学业成绩测量或学科测量。
5、教育测量的特点:a、可测性孟子:¡°权,然后知轻重;度,然后知长短。
物皆然,心为甚¡±美国心理学家桑代克(E. L . Thorndike)在1918年提出:¡°凡物之存在必有其数量美国测量学家麦克尔(A. W. McCaLL)于1923年提出:¡°凡有数量的东西都可以来测量。
b、间接性心理特质(trait)理论认为:某种内在的、不可直接测量到的心理特质,可表现为一系列具有内在联系的外显行为,测量者可以通过一定方法测量这些外显行为,并由这些判别内在的心理特质,c、相对性*心理测验实质上是对行为样组的客观和标准化测量。
——安娜斯塔谢(A.Anastasi)心理测验的三个要素:行为样组:必须是具有代表性的行为。
标准化:测验内容、施测、计分、常模客观性:测验不受主观支配,其测量方法是可以重复的,测验的实施、记分和解释是客观的。
客观性指标:信度、效度、难度、区分度*假如你向树林深处走去,你觉得将会遇到什么呢?A、人B、动物C、土人D、仙女。
*如果是你,你会选择哪一个答案?你会觉得这个题是用来测什么的?* A 型.....你是个坚守常规的人,你不会作有损伦理之事,更不会发生不伦之恋。
你也会要求你的恋人对你从一而终,所以恋爱中的你是个心胸异常狭窄的人。
试问一个毫无量度的人,有人会受得了吗?* B 型.....你是个不爱发脾气的人,所以很易相处。
你喜欢的恋爱方式是经过时间累积而逐渐酝酿出来的感情。
你能包容恋人的一切,即使对方做错了事,你也不愿和他争吵。
但一味的忍气吞声,可能会助长对方得寸进尺。
* C 型.....你擅於与人交往,有令人对你一见锺情的魅力,恋爱的经验也不少。
你对恋人的宽容,其实是你视体验不同性格的人的一种挑战。
这种恋爱心理,似乎有些过於自信与骄傲,小心误人误己。
* D 型.....虽然你沉溺在完全自我的境界里,但这也是你的魅力所在,你也意识到自己这一特长,所以也引以为傲。
因此你绝不会与自己性格相异的人交往,对恋人的要求也非常严格,委曲求全的事你绝对不屑一顾。
测验的类型一、测量的对象1、能力测验成就智力能力倾向2、人格测验结构化人格测验投射人格测验二、测量的方式或人数1、个别测验2、团体测验三、测验材料1、文字测验/纸笔测验2、非文字测验/操作测验四、测验的功能1、难度测验2、速度测验五、评价所参照的标准1、常模参照测验2、标准参照测验六、测验的要求1、最高作为测验2、典型行为测验测验观错误的测验观:*测验万能论*测验无用论正确的测验观:*测验这种工具并不完善*测验是决策和研究的辅助工具测验标准和伦理规范行业标准:《教育和心理测验标准》,1999*美国教育研究协会(American Educational Research Association AERA)*美国心理学会(American psychological Association APA) *美国国家教育测量学会(National Council on Measurement in Education NCME)*第二章测验在中国的悠久历史1.我国古代的测量思想*孔子差异性思想智力:中上之人、中人、中下之人,中上之人可以语上,中下之人不可以语上也。
——论语²雍也*孟子可测性思想权,然后知轻重,度,然后知长短。
物皆然,心为甚。
心理测量在中国的悠久历史*故君子远使之而观其忠*近使之而观其敬*烦使之而观其能*卒然问焉而观其知*急与之期而观其信*委之以财而观其仁*告之以危而观其节*醉之以酒而观其侧*杂之以处而观其色2. 中国古代测量的实践(1)尧考察舜尧纳舜于大麓,迅风雷雨,弗迷——《尚书²尧典》(2)西周时期:最早的教育测量*“古之教者,家有塾,党有庠,术有序,国有学。
比年入学,中年考校。
一年视离经辨志,三年视敬业乐群,五年视博习亲师,七年视论学交友,谓之小成。
九年知类达通,强立而不反,谓之大成。
夫然后足以化民易俗,近者说服,而远者怀之,此大学之道也。
”——《礼记²学记》(3)汉代*董仲舒一手画方,一手画圆,莫能成(注意分配测验)*考试*考试时间:汉武帝初年,岁考制。
*考试类型:口试、策试、射策;开笔试先河*考试功能:督促和检查学生的学习(4) 抓周(南北朝-梁朝)“儿生一期,为制新衣,盥浴装饰。
男则用弓矢纸笔,女则用刀尺针缕,并假饮食之物及珍宝服玩,置之儿前,观其发意所取,以验贪廉、智愚,名为试儿。
”——颜之推《颜氏家训》(5)七巧板、九连环(清代)20年代,我国早期心理学家刘湛恩用英文撰写了《中国人用的非文字智力测验》将七巧板、九连环介绍到外国美国心理学家武德沃斯(Woodworth)对九连环极为赞赏,把它视为“中国式的迷津测验”,七巧板则被称为“唐图”(6)其他测验实践*华容道*填词*对联(反应速度和文字能力)3、科举(古代测验实践的代表和集中体现)(1)科举的历史*隋炀帝时正式设置进士科*唐太宗、武则天、唐玄宗完善科举制*1905年9月2日,袁世凯、张之洞奏请立停科举,以便推广学堂,咸趋实学。
清廷诏准自1906年开始所有乡会试一律停止,各省岁科考试亦即停止,历时1300年(2)科举的影响*现代欧美的公务员制度1832年,东印度公司模仿了中国的测验方法,选择雇员到海外就职。
1855年,英国政府也采用了类似的测验方法来选择行政人员。
法国建立了一套以考试为基础的文官选拔制度*现代考试制度科举创造了分科考试、弥封、誊录、复评等方法,而且在命题、考试组织、反舞弊等方面形成了一整套制度西方现代测验发展历程1、现代测验的起源*个体差异深入认识:人差方程式、达尔文进化论*社会需要:工业技术革命带来分工的日益精细早期对智力落后儿童的分类和训练的兴趣2、现代测验的早期探索者美国心理学家波林(E²G²Boring)《实验心理史》:“在测验领域中,19世纪80年代是高尔顿的10年,90年代是卡特尔的10年,20世纪头10年则是比奈的十年”(1)弗兰西斯²高尔顿爵士(Francis Galton)达尔文的表兄弟、天才儿童*五岁可以阅读任何英文文本,七岁阅读莎士比亚来打发时间。
*非洲西南腹地探险,带回大量地理学制图信息,英国皇家地理学会授予金奖。
*创新发明:建议用指纹鉴别身份旋转蒸汽机潜望镜等压曲线(40岁)*47岁,出版《遗传的天才》:天才是遗传的,而且天才或是出众的人会出现在同一个家族,教育和后天环境对于智力只有很有限的影响。
他根据他这个思想发起了优生运动,鼓励生物上的优等人群进行婚配,从而提高人类物种质量。
*1884年,62岁的高尔顿在伦敦国际博览会上成立了一个“人类实验室”:身高、体重、视听敏度、肌肉力量、反应时间等*高尔顿把实验室搬到伦敦的南克圣顿博物馆,继续了六年,积累了大量有关简单心理现象和个别差异的系统资料。
*70岁统计学:扩展百分位法、创造了计算相关的简单方法——发展成皮尔逊积差相关、提出回归概念。
(2)卡特尔(J¡¤M¡¤Cattell)(James Mckeen Cattell)*师从冯特,获莱比锡大学的博士学位* 1883—1886年,他来到伦敦,期间与高尔顿有过密切交往。
*1888,美国宾夕法尼亚大学心理学教授* 1890年,卡特尔在《心理》杂志上发表论文《心理测验与测量》,首次提出心理测验(mental test)这个术语,并且他报告了他编制的一套测验在大学生中施测的结果。
(3)比奈/比内(A²Binet)*1889年与亨利²博尼(Henri Beaunis)在索那建立法国第一个心理实验室*1895年创办法国心理杂志《心理学年报》*1903,出版《智力测验的实验研究》:智力是高级心理过程,包括推理、判断、以及用已有知识解决新问题的能力。
*1904,他与助手(T²Simon)合作完成了世界上第一个真正意义的智力测验量表¡ª¡ª比奈-西蒙量表(Binet-Simon Scale),由此,比奈被称为¡°心理测验之父¡±*1905年,他们在《心理学年报》上发表的《诊断异常儿童的新方法》一文中介绍了该量表,因此也叫¡°1905年量表¡±3.测验运动的发展智力测验:*1916.推孟修订斯坦福¡ª比奈量表:比率智商。
*1917年,美国心理学会(APA):陆军α量表和陆军β量表贡献:团体测验、客观题。
*斯皮尔曼¡°二因素理论¡±,推动了智力结构的研究,为智力测验奠定理论基础。
*英国心理学家瑞文:瑞文推理测验*韦克斯勒相继编制韦氏成人智力测验(1939)、韦氏儿童智力测验(1949)、韦氏幼儿智力测验(1967)。
成就测验:* 20世纪初,桑代克(E²L²Thorndike)编制了第一个标准化的教育成就测验,桑代克被公推为“教育测验之父”。
*1923,凯利(kelley)、鲁奇(Ruch)、推孟(Terman)合作编制了第一个成套成就测验:斯坦福成就测验。