心理测量学复习_项目分析

合集下载
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

测验的项目分析

一.项目分析的目的和任务

项目分析是根据具有代表性的被试样本的测验数据,对每个题目进行质量分析。主要包括:

项目的难度分析

项目的区分度分析

项目间的相关分析

项目的答案选项分析

目的和任务?

对测验题目进行筛选、修订,保留质量较好的题目,删除品质较差的题目,以保证测验的效度、鉴别力和信度。

二.测验项目的难度分析

(一)什么是测验项目的难度

项目的难度(difficulty)是指测验的项目(或试题)难易程度,通常用 P 表示。 在能力测验中,它就是指试题的难度水平。

在非能力测验(如个性、态度等测验)中,难度被称为“通俗性”、“流行性”水平, 指被试样本中所选答案的倾向性。

(二)项目难度的计算

1.二级评分法题目的难度计算公式

这类项目属客观题,一般是答对给1分,答错给0分.

难度计算公式:

P = R/N [即:试题通过率]

R 为其中的答对人数

N 代表总体(或被试样本)人数

● 练习:在一次200人参加的测验中,第一道单项选择题的答对人数为60人,第二道

题目的答对人数为150人,两道题目的难度系数分别是多少?

2.多级评分项目的难度计算

这类题目题目的评分有三个以上分值。

▪ 在能力测验中,这类题目可以根据被试的答案与标准答案的接近程度,评定

出多个分值。如:测验中的名词解释、简答、论述、案例分析、作文、列举

等题目 ▪

在非能力测验中,这类项目一般有多个程度(或层次)不同的答案选项,根据选项的程度(或层次),评定相应的分值。例如: ▪

我喜欢可以拆开的玩具: ▪

A.完全符合、

B.部分符合、

C.完全不符合 ▪ 我的思想似乎:A.走在了时代前面;B.一般;C.比较保守

多级评分项目的难度计算公式:

P = X /Xmax

● 练习:在一次测验中,某道论述题的满分值为15分,90名学生的平均得分为10分。

则对于这90名学生来说,该题的难度系数是多少?

被试总体(或代表性样本)某题的平均得分

该题目满分值 即:P =

3.大规模测验中题目的难度计算:极端分组法

当测试人数非常多,而对难度的精确度要求不高时,可以采用面步骤和方法计算题目的难度系数:

(1)可将被试按总分高低排列,然后取得分最高的27%作为高分组,取得分最低的

27%的被试作为低分组。

(2)分别计算题目对于两组被试的难度系数: PH 和 PL

(3)根据下面公式,计算题目对于被试总体的难度系数:

P=(PH + PL)/2

凯利(Kelley)1939年的研究表明,取 27% 最精确。

4.二级评分题目的难度校正

能力测验中, 是非和单项选择题作答有猜测的可能。答案备选项越少,猜测得分的可能性越大。

为平衡猜测对难度系数的影响, 可用下式校正:

CP=(KP-1)/(K-1)

CP为校正后的难度;K为备选答案数目;

P为由题目得分直接计算出的难度(即通过率)。

校正目的:比较答案选项数不同的题目的难度

●练习:一个四选一题目的难度系数为0.60;一个是非判断题的难度为0.70。哪个题

目的难度大?

CP=(4*0.60-1)/(4-1)=0.467

CP=(2*0.70-1)/(2-1)=0.40

(三)测验难度对测验结果的影响

1.测验难度对测验分数分布形态的影响

如果测验项目是同质的,项目间相关在0.25~0.70间,那么

●题目难度在0.25~0.75间均匀分布,测验难度适中时,测验分数会出现什么情况?

扁平的、近似正态的对称分布,分数的离散程度较大。

●题目难度大多在0.80以上,测验难度较小时,测验分数的分布会出现什么情况?

负偏态分布:高分偏多且较接近,低分少且较分散

●题目难度大多在0.20以下,测验难度较大时,测验分数的分布会出现什么情况?

正偏态分布:低分偏多且较接近,高分少且较分散

题目的难度分布对测验分数分布的影响?

A:题目难度在0.25~0.75间均匀分布

扁平的对称分布(多数测验的追求)

B:题目的难度大都>0.80

负偏态分布。哪类测验希望这样?

C:题目的难度大都<0.20

正偏态分布。哪类测验希望这样?

D:题目间相关都很低,难度在0.50左右

分数:尖峰的对称分布(不希望的)

E:题目间高度相关,题目难度相近,

分数:双峰或多峰分布(不希望的)

2.测验题目的难度分布对测验信度的影响

艾伯尔的研究表明,题目的难度分布影响测验信度:

●正确回答率(或得分率)在25%~75%之间的题目,对测验信度有可能做出较大贡献。

●正确回答率(或得分率)在50%左右的题目,能对测验的信度做出更大的贡献。

●正确回答率(或得分率)大于90%或小于10%的题目,对测验的信度不可能做出多少贡

献。

3.测验的难度对测验鉴别力的影响

鉴别学生能力水平的高低,区分出他们之间的差异,是心理与教育测验的主要功能。

判断测验的鉴别和区分能力主要看的统计指标?测验分数的分布形态、离散程度等。

测验题目的难度对测验的鉴别能力有什么影响?

●练习:

下面五套测验测量的都是同一种心理属性,题目数量一样,记分方法一样。从理论上讲,下面哪套测验的鉴别力最好?()

▪测验A:题目的难度均在 0.4~0.6之间

▪测验B:题目的难度均匀地分布在 0.2~0.8之间

▪测验C:绝大数题目的难度都在 0.2以下

▪测验D:绝大数题目的难度都在 0.8以上

▪测验E:题目的难度集中在 0.2 与 0.8两端。

(四)测验题目难度分布的要求

测验题目的难度分布:是指各种难度的题目数量在题目总数中所占比率的情况。

确定项目的难度分布,要考虑两个重要因素:测验目的和项目间的相关程度

▪测验目的和任务不同,对题目的难度要求也不同;

▪项目间的相关越高,项目的难度分布范围应越广。

不同类别测验对题目难度的要求:

▪目标参照测验

▪针对普通群体的常模参照测验

▪选拔性测验

▪针对少数特殊群体的标准化测验

1.目标参照测验:

测验目的:判断教学目标是否实现

题目难度要求:以教学目标的要求为标准,即:教学计划和目标要求学生形成什么样的心理品质和行为表现、能解决什么样的问题,就编制相应的问题

情境、评定项目。

2.针对普通群体的常模参照测验:

测验目的:对大规模群体的个体水平进行区分和鉴别

对于能力和特性水平测验:

▪题目的难度分布应接近正态分布,

▪绝大多数题目的难度应在0.25~0.75之间;

▪平均难度在0.50左右

对于个性、态度测验:各个项目被选答案的评定等级的次数分布应接近正态分布。3.选拔性(或筛选)测验:难度要求

测验目的:选拔或筛选出某方面能力水平较高(或较低)的少数人。

测验题目的难度:应向选拔率(筛选率)方向靠近。

●思考与练习:如果要从2000人的总体中选拔出能力水平较高的100人,并进一步区

分其能力水平高低,那么测验题目的难度多大比较合适?

▪选拔率:100/2000 = 0.05

相关文档
最新文档