【大学课件】测验的项目分析
合集下载
第六章 测验的项目分析
难度 区分度 猜测问题 多选题的项目分析
• 信度和效度分析是对测验质量的整体评价。 • 项目分析是对测验中每一个测题的质量进 行的分析。 • 项目分析的目的是通过分析改进项目统计 量进而提高测验的信度和效度。 • 项目分析包括分析质的分析和量的分析。
第一节 项目的难度
一、难度的意义
• 难度一般是指测验项目的难度,当然 也可指一个测验的难度。后者是其所 包含的所有测题难度的综合指标。我 们这里所讲的是项目的难度。 • 从心理学角度看,难度是被试在作答 项目时心智操作感到的难易程度。
• 提出者 – 美国测验学家:伊贝尔(L. Ebel)
测题鉴别指数与评价标准
区分度(D) 0.40以上 0.30-0.39 评 价
非常良好 良好,如能改进则更佳
0.20-0.29
0.19以下
尚可,仍需再改进
劣,必须淘汰或加以修改
极端组的划分
• 高低组的比率介于25%---33% • 标准化测验采用27% • 样本人数过少时,可以用50%作为分界点。 • 此方法只利用了一部分信息,精确性差一 些。
(二)非0、1记分项目
X P X max
某题的 平均得分
该题的 满分值
例4-4:某试卷中一 论述题为20分,10 名参加测验者得分为 10、18、14、8、 18、3、14、10、 9、8。试问该题的 难度是多少?
112 X 11 .2 10 11 .2 P 0.56 20
• 2、极端分组法
三、区分度与难度的关系
• 难度是区分度的必要条件
– 难度愈接近.50,试题区别作用愈大。 – 较难项目,对高水平被试区分能力高 – 较易项目,对低水平被试区分能力高
– 中等项目,对中等水平被试区分能力高
• 信度和效度分析是对测验质量的整体评价。 • 项目分析是对测验中每一个测题的质量进 行的分析。 • 项目分析的目的是通过分析改进项目统计 量进而提高测验的信度和效度。 • 项目分析包括分析质的分析和量的分析。
第一节 项目的难度
一、难度的意义
• 难度一般是指测验项目的难度,当然 也可指一个测验的难度。后者是其所 包含的所有测题难度的综合指标。我 们这里所讲的是项目的难度。 • 从心理学角度看,难度是被试在作答 项目时心智操作感到的难易程度。
• 提出者 – 美国测验学家:伊贝尔(L. Ebel)
测题鉴别指数与评价标准
区分度(D) 0.40以上 0.30-0.39 评 价
非常良好 良好,如能改进则更佳
0.20-0.29
0.19以下
尚可,仍需再改进
劣,必须淘汰或加以修改
极端组的划分
• 高低组的比率介于25%---33% • 标准化测验采用27% • 样本人数过少时,可以用50%作为分界点。 • 此方法只利用了一部分信息,精确性差一 些。
(二)非0、1记分项目
X P X max
某题的 平均得分
该题的 满分值
例4-4:某试卷中一 论述题为20分,10 名参加测验者得分为 10、18、14、8、 18、3、14、10、 9、8。试问该题的 难度是多少?
112 X 11 .2 10 11 .2 P 0.56 20
• 2、极端分组法
三、区分度与难度的关系
• 难度是区分度的必要条件
– 难度愈接近.50,试题区别作用愈大。 – 较难项目,对高水平被试区分能力高 – 较易项目,对低水平被试区分能力高
– 中等项目,对中等水平被试区分能力高
第4章 测验的项目分析
二级评分IRT模型 例:逻辑斯蒂模型 单参数模型(拉希模型);双参数模型 和三参数模型。 多级评分IRT模型 连续型IRT模型
优点及运用
能力参数估计的不变性。 即个体独立于测验 项目参数估计的不变性。 即测验独立于个体 提供被试能力估计值的精确度指标 被试能力和项目难度在同一量表上,为 测验编制、测题分数的报告和解释提供 了便利。
三、区分度与难度的关系
四、区分度的相对性
(一)不同的计算方法,所得区分值不同 (二)样本容量大小影响相关法区分度值的 大小 (三)分组标准影响鉴别指数值(D ) (四)被试样本的同质性程度影响区分度值 的大小
第三节
猜测问题与猜测率
一、客观测验题中的猜测问题与猜测率 (一) 客观测验题中的猜测问题 (二)猜测率 (三)猜测误差的来源 二、项目难度受猜测影响的校正 CP=(KP-1)/(K-1)或 CP=P-q/(K-1) 式中CP为校正后通过率,P为实际通过率,K为备选 答案数目;q=1-p。 S=R-W/(K-1)式中S为校正后的得分,R为被试 答对的项目数,W为被试答错的项目数,K为项目的 选项数目。
(二)非二分法记分项目的难度
X
全体考生在该题上均分;
X max
该题的满分。
整个试卷的难度计算: 试卷的难度是指一份试卷的总体难易程度,其由试卷 中每道题的难度决定。其计算办法为:将每道题目的难度 与满分值相乘的积相加,然后将其总和除以试卷的满分值, 所得的商即为整个试卷的难度。
例题
例1. 在200个学生中,答对某项目的人数为120 人,则该项目的难度为多少? 例2. 在370名被试中,选为高分组和低分组的被 试各有100人,其中高分组有70人答对第1题,低 分组有40人答对第1题,求第1题的难度。 例3. 数学测验的第七题满分为15分,该题考生的 平均得分为9.6分,则该题的难度是多大?
心理测量—测验的项目分析
(二)区分度与难度的关系
难度和区分度都是针对一定团体而言的。 一般来说,较难的项目对高水平被试区 分度较好,较易的项目对低水平被试的 区分度高。
难度为1或0时,区分度为0,难度为0.50 时,题目的区分度达到最大值。
第三节 项目分析的一些特殊问题
一、选择题中的备选答案的质量分析 对于选择题,除分析题目的难度和
区分度外,还要分析各备选答案的 质量。
例如:
题 号
组别
A
选择项 B CD
PD E
高分组 2 40* 4 4 0
1
.60 .40
低分组 6 20 10 14 0
高分组 4 10 6 20* 10
2 低分组 4
6
4 30 6 .50 -.20
高分组 18* 10 4 6 12
3
.36 0
低分组 18 8 8 4 12
D值为0称为无区分,表示项目与被试 心理特质水平无关。
D值为负值称为消极区分。-1表示项 目与被试心理水平相反。
对区分度值的评价(R.L.Ebel,1965)
0.40以上:非常优良 0.30—0.39:良好 0.20—0.29:尚可,需修改 0.19以下:劣,必须淘汰
2.方差法 计算被试在项目得分的方差。方差越大,表
123 4
11.我认为这是一份相当有意义的工 1 2 3 4 作。 12.我可以由工作获得心理上的满足。 1 2 3 4
13.我有自己的工作目标和理想。
从未 很少 有时 经常 如此 如此 如此 如此
123 4
14.我在工作时精力充沛。
123 4
15.我乐于学习工作上的新知。
123 4
16.我能够冷静的处理情绪上的问题。 1 2 3 4
测验的项目分析解析课件
作为鉴别指数的D值的含义,是高分组比低分 组通过率高出的百分比程度。
第40页,共65页。
鉴别指数的一般标准(美.艾伯尔)
鉴别指数D 0.4以上 0.30-0.39
0.20-0.29 在0.19以下
题目评价
优
良好,如能修改, 则更佳。 尚可,须修改
劣,必须淘汰。
第41页,共65页。
❖ 极端组的划分,见P79
答
回 确
C
正
D
0.00
低
中
高
能力
多项选择中每个选项的ICC
第36页,共65页。
二、区分度计算
项目区分度可以有不同的计算方法,我们要根据测验的目的以 及测验分数的特征来选择合适的方法。
1、鉴别指数法(适合0、1计分)
一个项目的鉴别指数指总分高分组与低分组在该项目上的通 过率之差。
D = PH – PL
CP=矫正后的难度 P=未矫正的难度 K=测题的选项数目
第16页,共65页。
例题
❖ 1.一个五择一的项目,其通过率为0.50,则排除猜 测的影响,矫正后的难度为多少?
❖ 2.有A、B两个测题,项目A为四重选择题,通过率 为0.58;项目B为五重选择题,通过率为0.56,试比 较两题的难度。
第17页,共65页。
序量表的水平上衡量题目的难度。
⑵难度的等级量表是反序而行的,P值越大,项目越容易,这与 我们的日常概念是相反的。
第21页,共65页。
❖ 当样本的容量很大时,测验分数接近正态分 布。将某题的通过率P视为正态分布曲线下的 面积;查正态分布表找出正态曲线右侧面积 所对应的Z分数。就可以将以等级量表表示的 P值转换为具有相等单位的等距量表Z值。
第31页,共65页。
第40页,共65页。
鉴别指数的一般标准(美.艾伯尔)
鉴别指数D 0.4以上 0.30-0.39
0.20-0.29 在0.19以下
题目评价
优
良好,如能修改, 则更佳。 尚可,须修改
劣,必须淘汰。
第41页,共65页。
❖ 极端组的划分,见P79
答
回 确
C
正
D
0.00
低
中
高
能力
多项选择中每个选项的ICC
第36页,共65页。
二、区分度计算
项目区分度可以有不同的计算方法,我们要根据测验的目的以 及测验分数的特征来选择合适的方法。
1、鉴别指数法(适合0、1计分)
一个项目的鉴别指数指总分高分组与低分组在该项目上的通 过率之差。
D = PH – PL
CP=矫正后的难度 P=未矫正的难度 K=测题的选项数目
第16页,共65页。
例题
❖ 1.一个五择一的项目,其通过率为0.50,则排除猜 测的影响,矫正后的难度为多少?
❖ 2.有A、B两个测题,项目A为四重选择题,通过率 为0.58;项目B为五重选择题,通过率为0.56,试比 较两题的难度。
第17页,共65页。
序量表的水平上衡量题目的难度。
⑵难度的等级量表是反序而行的,P值越大,项目越容易,这与 我们的日常概念是相反的。
第21页,共65页。
❖ 当样本的容量很大时,测验分数接近正态分 布。将某题的通过率P视为正态分布曲线下的 面积;查正态分布表找出正态曲线右侧面积 所对应的Z分数。就可以将以等级量表表示的 P值转换为具有相等单位的等距量表Z值。
第31页,共65页。
测验的项目分析(新教材)
测验项目的复杂度增加
随着教育内容的不断更新和深化,测验项目的复杂性和难度也在 逐渐增加,对项目分析提出了更高的要求。
测验结果的不确定性
由于学生个体差异、考试环境等因素的影响,测验结果往往存在不 确定性,对项目分析的准确性造成一定影响。
缺乏统一的评价标准
目前测验项目分析缺乏统一的评价标准,导致分析结果可能存在主 观性和片面性。
生的综合素质和能力。
提高测验项目分析效果的建议
建立统一的评价标准
01
制定和完善测验项目分析的评价标准,提高分析结果的可信度
和可比性。
加强数据挖掘和分析
02
利用大数据和数据挖掘技术,深入挖掘和分析测验数据,提高
项目分析的准确性和有效性。
提高教师素质
03
加强教师对测验项目分析的认识和技能培训,提高教师的项目
企业培训的应用
培训需求分析
通过测验项目分析,企业 可以了解员工的技能水平, 从而制定针对性的培训计 划。
培训效果评估
企业可以通过测验项目分 析评估培训效果,了解员 工在培训后的技能提升情 况。
员工晋升选拔
企业可以通过测验项目分 析选拔具备潜力的员工, 为晋升和职业发展提供参 考依据。
测验项目分析的案例分析
特点
测验项目分析具有客观性、定量性和 应用性,通过数据分析和统计方法对 题目进行量化评估,为改进和优化测 验提供科学依据。
测验项目分析的重要性
提高测验质量
通过对题目进行质量分析,可以 识别出低质量的题目,进而改进 和优化测验,提高测验的整体质
量。
确保公平性
通过对题目难度和区分度的分析, 可以确保测验对所有考生都具有公 平性,避免因题目过难或过易而对 部分考生造成不公平。
6第六章 测验的项目分析
低
中 能力
高
难度不同的3个项目的ICC
1.00 率 概 的 目 项 答 回 确 正
A B
0.50
0.00
C D
低 中 能力 高
多项选择中每个选项的ICC
二、区分度计算
项目区分度可以有不同的计算方法,我们要根据测验 的目的以及测验分数的特征来选择合适的方法。
1、鉴别指数法(适合0、1计分)
一个项目的鉴别指数指总分高分组与低分组在该 项目上的通过率之差。
注意:标准化测验一般采用27%为分组点。也可
以取总人数的1/4或1/3(即25%或33%)为分组点。 当样本小于100时,一般选50%作为分界点。
(二)非二分法计分的难度 当项目是多重计分时,难度等于平均分与满分之比。
=试题的难度 X =全体被试在该题上的平均分数 X max=该题的满分分数
P
例题
问答题满分为15分,10名被试在该题的得分如下。 试计算该题的难度。
1 2 3 4 5 6 7 8 9 10
被 试 得 分Leabharlann 131510
10
9
11
10
9
11
10
问题 有A、B两个测题,项目A为四重选择题,通 过率为0.58;项目B为五重选择题,通过率为 0.56,能否说项目A更容易,项目B更难?
鉴 别 力 较 好
低 中 高
能力
1.00 率 概 的 0.50 目 项 答 回 0.00 确 低 正 1.00 率 概 的 0.50 目 项 答 回 0.00 低 确 正
中 能力
高
鉴 别 力 较 低 鉴 别 力 为 负
中
高
能力
1.00 率 概 的 目 项 答 回 确 正
第六章 测验的项目分析
二、项目难度的计算-2
极端分组法(当被试人数较多时)
将被试依测验总分从高到低排列分成三组,总分最高和最低的27%
分别为高分组和低分组。分别计算高分组和低分组的通过率,然后 求项目的难度。
PH PL P 2
1 RH RL P 2 NH NL
PH、PL分别为高分组和低分组的通过率;RH、RL分别为高分组和 低分组通过该项目的人数;NH、NL分别为高分组和低分组的人数。
三、难度水平的确定
难度水平的适合性,取决于测验的目的和性质
a) 标准化常模参照测验:接近0.50,范围在0.30-0.70间
b) 标准参照测验:不必过多考虑难度
c) 选拔和录用类测验:接近录取率
d) 速度测验:不宜太高,且每个项目基本相等 e) 难度测验:0.50左右
四、难度的等距变换-1
通过率或得分率难度属于顺序变量。
rb为二列相关系数,xp、xq、p、q、St的意义同点二列相 关系数公式;y为正态分布p与q分割点正态曲线的高度。
三、区分度的计算-5
相关
rФ为Ф的相关系数,a、b、c、d分别为四格表中四项所包 含的人次数。
四、区分度与难度的关系
应使整个测验难度呈正态分布,且平均水平在0.50左右。
五、区分度的相对性
不同计算方法所得的区分度不同。分析同一个测验时, 各个项目的区分度值要采用同一种指标。 样本容量大小影响相关法区分度值的大小。样本越小, 统计值越不可靠,算出r后,应进行统计检验。 分组标准影响鉴别指数值。分组越极端,D值越大。
被试团体的同质性程度影响区分度值的大小。被试团体
越具有同质性,项目的区分度值就越小。
四、猜测校正的缺点
第五章 测验的项目分析
• 对于四择一题目,其难度值约为0.63时最为
合适
P 4 1 0.63 2 4
五、难度对测验的影响
整个测验的难度取决于组成这个测验的各个试题的难度。整个测验难度水 平的确定,需要根据测验分数的分布作出。 (一)测验难度影响测验分数的分布形态 难度大,正偏态
难度低,负偏态
(二)测验难度影响测验分数的离散程度 测验过难或过易,分数全距缩小,信度降低。 P=0.50时最佳
第二节
测验的区分度
一、区分度的定义 二、区分度的估计方法 三、区分度和难度的关系 四、区分度的相对性
• 一、区分度的意义
• 项目区分度(item
discrimination)是
指测验项目对于所测量的心理属性的 鉴别能力和区分程度,也称鉴别力。
• 项目的区分度是测验是否有效的“指示
器”。
二、区分度的估计方法
测验的作用
• 一般能力测验和成就测验的平均难度在0.50
左右比较合适。 • 筛选性测验(选拔性,竞争性测验)则要采 用难度接近录取率的项目。
项目的形式 • 对于选择题而言,P值一般应大于概率水平
K 1 P 2K
• 对于是非题而言,其难度值应该为0.75最为
合适
P 2 1 0.75 2 2
• 计算二列相关的公式是:
• rb
X
p
X q pq St y
(公式3-7)
•
– rb:二列相关系数; – X p :答对该题的被试在总分上(或效标分数上) 的平均得分; – X q :答错该题的被试在总分上(或效标分数上) 的平均得分; – St全体被试的总分(或效标分数的标准差); – p为答对该题的人数百分比;q答错该题的人数百分 比,q=1-p; – y为正态分布下答对百分比所在位置的曲线高度。
心理测量—测验的项目分析
第二节 区分度
一、什么是区分度 区分度又叫鉴别力,指测验项目对被试
间心理品质差异水平的区分程度。 评价测验项目的区分度高低依赖于对被
试水平的准确测量,一般称为效标分数。 测验项目区分度的效标分数一般使用的 是测验总分,又称内部效标。
二、项目区分度的计算方法
1.极端分组法(项目鉴别指数)
D=PH-PL D:项目鉴别指数 PH:高分组通过率 PL:低分组通过率
123 4
5.面对工作时,有力不从心的感觉。 1 2 3 4
6.工作时感到心灰意冷。
123 4
从未 很少 有时 经常 如此 如此 如此 如此
7.觉得自己推行工作的方式不适当。 1 2 3 4
8.想暂时休息一阵子或另调其他职务。 1 2 3 4
9.只要努力就能得到好的结果。
123 4
10.我能肯定这份工作的价值。
2.
P PH PL
P:难度
2
PH:在一题目上高分组的通过率 PL:在一题目上低分组的通过率
例:在100名学生中,高分组与低分组各有27 人。其中高分组答对第一题的有20人,低分 组答对第一题的有10人。试问该题的难度是 多少?
PH
20 27
0.74
10 PH 27 0.37
P 0.74 0.37 0.56 2
D值为0称为无区分,表示项目与被试 心理特质水平无关。
D值为负值称为消极区分。-1表示项 目与被试心理水平相反。
对区分度值的评价(R.L.Ebel,1965)
0.40以上:非常优良 0.30—0.39:良好 0.20—0.29:尚可,需修改 0.19以下:劣,必须淘汰
2.方差法 计算被试在项目得分的方差。方差越大,表
项目分析 ppt课件
项目分析
ppt课件
1
• 项目分析就是根据试测结果对组成测验的各个题目(项目)
进行分析,从而评价题目好坏、对题目进行筛选。
• 包括质的分析和量的分析。 • 如有关项目的内容效度的分析就属于质的分析; • 而有关难度和区分度的分析就属于量的分析;
ppt课件
2
学习目标
• 掌握难度的估计方法 • 了解测验难度水平的确定依据 • 掌握项目区分度的求法及区分度对测验质量的影响 • 了解难度与区分度的关系
ppt课件
14
b. 转换为等距量表的方法
• 查标准正态分布表,将以等级量表表示的P值转换成具 有相等单位σ的等距量表Z值。
• P值作为正态曲线下面积时,要从右向左而行。 • 转换好的Z值在平均数以下是负数。为了避免负号出现
的情况,使用Δ 。
ppt课件
15
例
• 在正态分布中,平均数之上或之下一个标准差的距离 约占全体人数的34%
ppt课件
back
13
4. 项目难度的等距量表
通过率是以何种量表水平表示难度? a.使用项目难度等距量表的理由 第一,测题的难度一般用答对某题的人数比率或百分比
表示。百分量表是等级量表,不是等距量表。因此不 能比较题目之间的具体差异。 第二,难度量表是反序而行的,P值越大,项目越容易, 转换成等距量表后更清晰明了。
ppt课件
8
例:
• 假设有370个被试,取其中成绩最高的27%(100)人定 为高分组,成绩最低的27%(100)人定为低分组,对 于某一道试题,若高分组有60人答对,低分组有30人答 对,则:
• Ph=60/100=0.60 Pl=30/100=0.30 • 所以该题的难度为
• P=(0.6+0.3)/2=0.45
ppt课件
1
• 项目分析就是根据试测结果对组成测验的各个题目(项目)
进行分析,从而评价题目好坏、对题目进行筛选。
• 包括质的分析和量的分析。 • 如有关项目的内容效度的分析就属于质的分析; • 而有关难度和区分度的分析就属于量的分析;
ppt课件
2
学习目标
• 掌握难度的估计方法 • 了解测验难度水平的确定依据 • 掌握项目区分度的求法及区分度对测验质量的影响 • 了解难度与区分度的关系
ppt课件
14
b. 转换为等距量表的方法
• 查标准正态分布表,将以等级量表表示的P值转换成具 有相等单位σ的等距量表Z值。
• P值作为正态曲线下面积时,要从右向左而行。 • 转换好的Z值在平均数以下是负数。为了避免负号出现
的情况,使用Δ 。
ppt课件
15
例
• 在正态分布中,平均数之上或之下一个标准差的距离 约占全体人数的34%
ppt课件
back
13
4. 项目难度的等距量表
通过率是以何种量表水平表示难度? a.使用项目难度等距量表的理由 第一,测题的难度一般用答对某题的人数比率或百分比
表示。百分量表是等级量表,不是等距量表。因此不 能比较题目之间的具体差异。 第二,难度量表是反序而行的,P值越大,项目越容易, 转换成等距量表后更清晰明了。
ppt课件
8
例:
• 假设有370个被试,取其中成绩最高的27%(100)人定 为高分组,成绩最低的27%(100)人定为低分组,对 于某一道试题,若高分组有60人答对,低分组有30人答 对,则:
• Ph=60/100=0.60 Pl=30/100=0.30 • 所以该题的难度为
• P=(0.6+0.3)/2=0.45
测验的项目分析(新教材)
测验的项目分析
1
2020/3/21
项目分析的分类
定性分析
包括考虑内容效度析 是指对题目难度和区分度等进行分析。
通过项目分析,我们可以选择和修改测验题目, 以提高测验的信度和效度。
2
2020/3/21
第一单元 项目的难度
一、定义 难度是指项目的难易程度。 能力测验中反映难度水平的指标。 非能力测验(如人格测验),类似的指标是
Xp 为与二分变量通过组相对应的连续变量的平均数 Xq 为与二分变量未通过组相对应的连续变量的平均数
St为连续变量的标准差
p为通过组人数与总人数之比,q为未通过组人数与总
人数之比
21
2020/3/21
2、二列相关
适用于两个变量,但其中一个变量被人为分成 两类。必须是正态分布。
rb = Xp-Xq gpq
Xmax 为该题的满分
8
2020/3/21
三、难度水平的确定
(一)项目的难度
主要目的是为了筛选项目;
项目的难度多高合适,取决于测验的目的、性 质以及项目的形式。
P值越接近于0或接近于1,越无法区分被试者之 间能力的差异。
相反, P值越接近于0.50,区别力越高。
9
2020/3/21
注意事项
St y
的r b高为度二列相关系数, y为p与q交界处正态曲线
22
2020/3/21
r b显著性检验公式
Z rb
1 pq g
yN
N 为总人数,Z值大于1.96,即为显著相关。
23
2020/3/21
3、Φ相关法:
适用于两个变量均为二分变量。如将测验总分按及 格、不及格或录取、淘汰划分。
D的最大值 0
1
2020/3/21
项目分析的分类
定性分析
包括考虑内容效度析 是指对题目难度和区分度等进行分析。
通过项目分析,我们可以选择和修改测验题目, 以提高测验的信度和效度。
2
2020/3/21
第一单元 项目的难度
一、定义 难度是指项目的难易程度。 能力测验中反映难度水平的指标。 非能力测验(如人格测验),类似的指标是
Xp 为与二分变量通过组相对应的连续变量的平均数 Xq 为与二分变量未通过组相对应的连续变量的平均数
St为连续变量的标准差
p为通过组人数与总人数之比,q为未通过组人数与总
人数之比
21
2020/3/21
2、二列相关
适用于两个变量,但其中一个变量被人为分成 两类。必须是正态分布。
rb = Xp-Xq gpq
Xmax 为该题的满分
8
2020/3/21
三、难度水平的确定
(一)项目的难度
主要目的是为了筛选项目;
项目的难度多高合适,取决于测验的目的、性 质以及项目的形式。
P值越接近于0或接近于1,越无法区分被试者之 间能力的差异。
相反, P值越接近于0.50,区别力越高。
9
2020/3/21
注意事项
St y
的r b高为度二列相关系数, y为p与q交界处正态曲线
22
2020/3/21
r b显著性检验公式
Z rb
1 pq g
yN
N 为总人数,Z值大于1.96,即为显著相关。
23
2020/3/21
3、Φ相关法:
适用于两个变量均为二分变量。如将测验总分按及 格、不及格或录取、淘汰划分。
D的最大值 0
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
.
2
三、测验难度水平的确定 ▪ 效标参照测验、掌握测验:不考虑难度; ▪ 选拔测验:难度=录取率; ▪ 对于选择题来说,难度一般应大于猜测概率; ▪ 无论是速度测验,还是难度测验,一般都应防止被试得满分, 因为满分的意义是不明确的。
大体而言,难度为0.50时最理想,此时项目具有最大的鉴 别力。但在实际操作中,让所有项目难度都到达0.50困难很大, 而且也不必要,一般只需使项目的平均难度接近0.50,而各个 项目的难度在0.50± 0.20之间变化。
取值范围:-1~ +1
.
9
鉴别指数 0.40以上 0.30~0.39 0.20~0.29 0.19以下
题目评价 很好 良好,修改会更好 尚可,仍需修改 差,必须淘汰
.
10
2.极端组的划分
27%规则
一般情况下,取上下25%~33%均可。
样本少时,可以取50%
注意:
由于计算机的方便使用,可以上下50%作为划分高低组的 标准,或者多分几组,对区分度和难度作详细分析。因为 只取上下两端,只利用了一部分资料,浪费了很多信息, 有可能得出错误结论。
第五章 测验的项目分析
项目分析包括定性分析和定量分析。定性分析包括考虑 内容效度、题目编写的恰当性和有效性等;定量分析主要是 指题目难度和区分度的测量。
对项目进行筛选和修订,可以提高测验的信度和效度。
第一节 测验的难度
一、难度(difficulty)的意义
难度,指项目的难易程度。
在最高作为测验中,称为“难度”,而在典型作为测验
.
3
四、难度的等距变换 根据正态分布表,将难度P作为正态曲线下的面积,转换 成相应的Z分数,这就是等距量表。
P
Y
0Z
.
4
Z
Y
P
.00 .39894 .00000
.50 .35207 .19146
1.00 .24197 .34134
1.50 .12952 .43319
1.96 .05844 .47500
.
11
(二)相关法(项目-总分相关)
1.点二列相关
Xp-Xq
rpb=
√pq
St
2.二列相关
Xp - Xq pq
rb=
•
St
y
Xp - Xt p
或 rb=
•
St
y
.
12
3.φ 相关 ad-bc
rφ= √(a+b)(c+d)(a+c)(b+d)
4.积差相关
.
13
(三)项目特征曲线(item characteristic curve, ICC) 项目特征曲线描述了效标分数不同的被试在该项目上的通过率。 曲线坡度越陡,鉴别力越好,预测的误差越小。
0.50
1
0.40
0.80
0.30
0.60
0.20
0.40
0.10
0.20
.
18
0.00
0
难度和区分度都是针对一定团体而言的。
一般来说,较难的项目对高水平被试区分度高,较易的项目 对低水平被试的区分度高。
.
19
四、区分度的相对性 (一)不同的计算方法,所得区分值不同
区分度有几种计算方法? (二)样本容量大小影响相关法区分度值的大小
样本越大,区分度越…… (三)分组标准影响鉴别指数
分组越极端,区分度越…… (四)被试样本的同质性程度影响区分度值的大小
样本越同质,区分度越……
.
20
第三节 项目分析的特殊问题 一、多重选择题的项目分析(诱答分析)
对于多重选择题,除了分析难度和区分度外,还要对 每个选项进行分析。
下列哪一个最有可能是偏执型精神分裂症患者的次级症状: A 幻听 B 瘫痪 C 记忆丧失 D 厌食
中,则指“通俗性”。两者都是指在总体中,能够正确或确
切回答某项目的人数。
.
1
二、难度的计算 (一)二分法记分项目的难度 1.通过率
P=R/N 2.极端分组法(上下27%)
P=(PH+PL)/2
(二)非二分法记分项目的难度
P=X / Xmax
X为所有被试在该项目上的平均得分, Xmax为该项目的满分。
0.00
低
中 能力
A B C
高
难度不同的3个项目的ICC
.
16
1.00
率 概 的 目 项 0.50 答 回 确 正
0.00
低
中 能力
A B
C D
高
多项选择中每个选项的ICC
.
17
三、区分度与难度的关系
难度(P) 区分度(D)
1.000.80
0.40
0.70
0.60
0.60
0.80
.
21
▪ 如果所有被试都选择某一正确的选项,说明该选项……
▪ 如果没有一个被试选择某个错误选项,说明该选项……
▪ 如果所有被试都选择某个错误选项,说明该选项……
▪ 如果高分组被试的选择集中在两个选项上,说明该选 项……
▪ 如果高分组和低分组对正确选项的选择没有区别,说明该 选项……
▪ 如果所有被试都未回答某个题目,说明该题……
.
8
第二节 测验的区分度
一、区分度的意义
区分度(discrimination)是指测验项目对被试心理品质水 平差异的区分能力或鉴别能力。
项目的区分度是测验是否有效的“指示器”。
二、区分度的计算
(一)项目鉴别指数法
1.鉴别指数(index of discrimination,D)的计算
D = PH - PL
2.00 .05399 .47725
2.50 .01753 .49379
2.58 .01431 .49506
3.00 .00443 .49865
3.50 .00087 .49977
3.99 .00014 . .49997
5
美国教育服务中心以Δ 作为难度指标: Δ=13+4Z
P = .0013 P = .16 P = .50 P = .84 P = .9987
▪ 如果选择各个选项的人数几乎相等,说明该题……
Z = +3 Z = +1 Z=0 Z = -1 Z = -3
Δ= 25 Δ= 17 Δ= 13 Δ= 9 Δ= 1
.
6
五、难度对测验的影响 (一)测验难度影响测验分数的分布形态 ▪ 难度大,正偏态
▪ 难度低,负偏态
.
7
(二)测验难度影响测验分数的离散程度 测验过难或过易,分数全距缩小,信度降低。 P=0.50时最佳
1.00
率 概 的 目 项 0.50 答 回 确 正
0.00
低
鉴 别 力 较 好
中
高
能力 .
14
1.00
率 概 的 目 项 0.50 答 回 确 正
0.00
低
1.00
率 概 的 目 项 0.50 答 回 确 正
0.00
低
中 能力
中. 能力
鉴 别 力 较 低
高
鉴 别 力 为 负
高
15
1.00
率 概 的 目 项 0.50 答 回 确 正