心理测量学复习_项目分析
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
测验的项目分析
一.项目分析的目的和任务
项目分析是根据具有代表性的被试样本的测验数据,对每个题目进行质量分析。主要包括:
项目的难度分析
项目的区分度分析
项目间的相关分析
项目的答案选项分析
目的和任务?
对测验题目进行筛选、修订,保留质量较好的题目,删除品质较差的题目,以保证测验的效度、鉴别力和信度。
二.测验项目的难度分析
(一)什么是测验项目的难度
项目的难度(difficulty)是指测验的项目(或试题)难易程度,通常用 P 表示。 在能力测验中,它就是指试题的难度水平。
在非能力测验(如个性、态度等测验)中,难度被称为“通俗性”、“流行性”水平, 指被试样本中所选答案的倾向性。
(二)项目难度的计算
1.二级评分法题目的难度计算公式
这类项目属客观题,一般是答对给1分,答错给0分.
难度计算公式:
P = R/N [即:试题通过率]
R 为其中的答对人数
N 代表总体(或被试样本)人数
● 练习:在一次200人参加的测验中,第一道单项选择题的答对人数为60人,第二道
题目的答对人数为150人,两道题目的难度系数分别是多少?
2.多级评分项目的难度计算
这类题目题目的评分有三个以上分值。
▪ 在能力测验中,这类题目可以根据被试的答案与标准答案的接近程度,评定
出多个分值。如:测验中的名词解释、简答、论述、案例分析、作文、列举
等题目 ▪
在非能力测验中,这类项目一般有多个程度(或层次)不同的答案选项,根据选项的程度(或层次),评定相应的分值。例如: ▪
我喜欢可以拆开的玩具: ▪
A.完全符合、
B.部分符合、
C.完全不符合 ▪ 我的思想似乎:A.走在了时代前面;B.一般;C.比较保守
多级评分项目的难度计算公式:
P = X /Xmax
● 练习:在一次测验中,某道论述题的满分值为15分,90名学生的平均得分为10分。
则对于这90名学生来说,该题的难度系数是多少?
被试总体(或代表性样本)某题的平均得分
该题目满分值 即:P =
3.大规模测验中题目的难度计算:极端分组法
当测试人数非常多,而对难度的精确度要求不高时,可以采用面步骤和方法计算题目的难度系数:
(1)可将被试按总分高低排列,然后取得分最高的27%作为高分组,取得分最低的
27%的被试作为低分组。
(2)分别计算题目对于两组被试的难度系数: PH 和 PL
(3)根据下面公式,计算题目对于被试总体的难度系数:
P=(PH + PL)/2
凯利(Kelley)1939年的研究表明,取 27% 最精确。
4.二级评分题目的难度校正
能力测验中, 是非和单项选择题作答有猜测的可能。答案备选项越少,猜测得分的可能性越大。
为平衡猜测对难度系数的影响, 可用下式校正:
CP=(KP-1)/(K-1)
CP为校正后的难度;K为备选答案数目;
P为由题目得分直接计算出的难度(即通过率)。
校正目的:比较答案选项数不同的题目的难度
●练习:一个四选一题目的难度系数为0.60;一个是非判断题的难度为0.70。哪个题
目的难度大?
CP=(4*0.60-1)/(4-1)=0.467
CP=(2*0.70-1)/(2-1)=0.40
(三)测验难度对测验结果的影响
1.测验难度对测验分数分布形态的影响
如果测验项目是同质的,项目间相关在0.25~0.70间,那么
●题目难度在0.25~0.75间均匀分布,测验难度适中时,测验分数会出现什么情况?
扁平的、近似正态的对称分布,分数的离散程度较大。
●题目难度大多在0.80以上,测验难度较小时,测验分数的分布会出现什么情况?
负偏态分布:高分偏多且较接近,低分少且较分散
●题目难度大多在0.20以下,测验难度较大时,测验分数的分布会出现什么情况?
正偏态分布:低分偏多且较接近,高分少且较分散
题目的难度分布对测验分数分布的影响?
A:题目难度在0.25~0.75间均匀分布
扁平的对称分布(多数测验的追求)
B:题目的难度大都>0.80
负偏态分布。哪类测验希望这样?
C:题目的难度大都<0.20
正偏态分布。哪类测验希望这样?
D:题目间相关都很低,难度在0.50左右
分数:尖峰的对称分布(不希望的)
E:题目间高度相关,题目难度相近,
分数:双峰或多峰分布(不希望的)
2.测验题目的难度分布对测验信度的影响
艾伯尔的研究表明,题目的难度分布影响测验信度:
●正确回答率(或得分率)在25%~75%之间的题目,对测验信度有可能做出较大贡献。
●正确回答率(或得分率)在50%左右的题目,能对测验的信度做出更大的贡献。
●正确回答率(或得分率)大于90%或小于10%的题目,对测验的信度不可能做出多少贡
献。
3.测验的难度对测验鉴别力的影响
鉴别学生能力水平的高低,区分出他们之间的差异,是心理与教育测验的主要功能。
判断测验的鉴别和区分能力主要看的统计指标?测验分数的分布形态、离散程度等。
测验题目的难度对测验的鉴别能力有什么影响?
●练习:
下面五套测验测量的都是同一种心理属性,题目数量一样,记分方法一样。从理论上讲,下面哪套测验的鉴别力最好?()
▪测验A:题目的难度均在 0.4~0.6之间
▪测验B:题目的难度均匀地分布在 0.2~0.8之间
▪测验C:绝大数题目的难度都在 0.2以下
▪测验D:绝大数题目的难度都在 0.8以上
▪测验E:题目的难度集中在 0.2 与 0.8两端。
(四)测验题目难度分布的要求
测验题目的难度分布:是指各种难度的题目数量在题目总数中所占比率的情况。
确定项目的难度分布,要考虑两个重要因素:测验目的和项目间的相关程度
▪测验目的和任务不同,对题目的难度要求也不同;
▪项目间的相关越高,项目的难度分布范围应越广。
不同类别测验对题目难度的要求:
▪目标参照测验
▪针对普通群体的常模参照测验
▪选拔性测验
▪针对少数特殊群体的标准化测验
1.目标参照测验:
测验目的:判断教学目标是否实现
题目难度要求:以教学目标的要求为标准,即:教学计划和目标要求学生形成什么样的心理品质和行为表现、能解决什么样的问题,就编制相应的问题
情境、评定项目。
2.针对普通群体的常模参照测验:
测验目的:对大规模群体的个体水平进行区分和鉴别
对于能力和特性水平测验:
▪题目的难度分布应接近正态分布,
▪绝大多数题目的难度应在0.25~0.75之间;
▪平均难度在0.50左右
对于个性、态度测验:各个项目被选答案的评定等级的次数分布应接近正态分布。3.选拔性(或筛选)测验:难度要求
测验目的:选拔或筛选出某方面能力水平较高(或较低)的少数人。
测验题目的难度:应向选拔率(筛选率)方向靠近。
●思考与练习:如果要从2000人的总体中选拔出能力水平较高的100人,并进一步区
分其能力水平高低,那么测验题目的难度多大比较合适?
▪选拔率:100/2000 = 0.05