04测验的项目分析

合集下载

02经典测验理论--信效度+项目分析

02经典测验理论--信效度+项目分析


适用范围:二分法计分的测验。
第二节 信度评估的方法
3.克伦巴赫系数


α=
KK-1[1-
∑ Si2
Sx2


Si2:某项目分数的方差 SX2:测验总分的方差

说明: 适用多重记分(1~n)的测验。

当k=2时,α 系数与分半效度估计等价。
第二节 信度评估的方法
五、评分者信度

多位评分者对随机抽取的若干份测验卷按评

(3.3)
于是公式(3.2)可以改写为:

(3.4)
因此,一次测验中,一个团体的实测分数之间的变异 性是由与目的有关的变异数( ) 、与测量目的无
关的变异数( ),和测量误差变异数( )所
决定的。
对经典测验理论的评价
优点
以真分数模型为理论框架,使用少量的定义,依据弱假 设(或弱势假设)形成。

1.信度系数 最常用
指同一被试样本所测得的两组资料的相关系
的 数。理论上,是真分数方差与实得分数的方差的
信 比值。 度
xx
ST2
S
2 X
( 0≤rxx≤1)
第一节 信度的概念
2.信度指数

真分数标准差与实得分数的标准差的比值称
验 信度指数。它是信度系数的平方根。

rXT =
ST SX
=
rxx
两次施测期间被试的学习效果没有差别。
第二节 信度评估的方法
二、复本信度 等值性系数

以两个等值但题目不同的测验(复本)来测

量同一群体,然后求得被试者在两个测验上得分 的相关系数。

《成本与管理会计》小测验及答案04第四章 本量利分析 小测验

《成本与管理会计》小测验及答案04第四章 本量利分析 小测验

小测验(单项选择题)1.本量利分析是分析()在产品的销量、售价和单位变动成本或固定成本变动时的性态以及它们之间的关系。

A.总收入和总成本B.总收入、总成本和营业利润C.总收入、总成本、营业利润和现金流D.总收入2.本量利分析中的保本点销售量在数值上等于()。

A. 固定成本除以总收入B. 固定成本除以单位贡献毛益C. 收入减变动成本D. 总收入除以变动成本3.对于经营杠杆较低的公司,下列说法正确的是()。

A.固定成本高,变动成本低B.销量的变动幅度大于净利润的变动幅度C.亏损的可能性比高杠杆公司更大D.相对于高杠杆公司经营风险较低4.下列关于固定成本的说法中,正确的是()。

A.长期来看可以视为变动成本B.会降低经营杠杆C.会降低亏损的风险D.在图表中是一条斜线5.如果产品组合中各产品销售比例发生变化,则()。

A.净利润不会改变B.保本点会变化C.每种产品的单位贡献毛益会上升D.每种产品的单位贡献毛益会下降6. 生产单一品种产品的企业,保本销售额等于()。

A.保本销售量×单位利润B.固定成本总额/贡献毛益率C.固定成本总额/(单价一单位变动成本)D.固定成本总额/单位贡献毛益7.从本量利分析图上可知,对单一产品分析时,()。

A.单位变动成本越大,总成本线斜率越大,保本点越高B.单位变动成本越大,总成本线斜率越小,保本点越高C.单位变动成本越小,总成本线斜率越小,保本点越高D.单位变动成本越小,总成本线斜率越大,保本点越低8.产品的单价与单位变动成本上升的百分率相同,其他条件不变,则保本销售量()。

A.上升B.下降C.不变D.不确定9.运动器材公司威尔公司只生产一种篮球,单价60元,单位变动生产成本40元,单位销售管理费用5元,销量为50000件,则其产品贡献毛益为()元。

A.650000B.750000C.850000D.95000010.艾马妮公司生产钱包,单价40元,固定成本为40000元,变动成本占销售单价的75%,在预计销量为5000件时,艾马妮公司的安全边际是()元。

第六章 测验的项目分析

第六章 测验的项目分析
难度 区分度 猜测问题 多选题的项目分析
• 信度和效度分析是对测验质量的整体评价。 • 项目分析是对测验中每一个测题的质量进 行的分析。 • 项目分析的目的是通过分析改进项目统计 量进而提高测验的信度和效度。 • 项目分析包括分析质的分析和量的分析。
第一节 项目的难度
一、难度的意义
• 难度一般是指测验项目的难度,当然 也可指一个测验的难度。后者是其所 包含的所有测题难度的综合指标。我 们这里所讲的是项目的难度。 • 从心理学角度看,难度是被试在作答 项目时心智操作感到的难易程度。
• 提出者 – 美国测验学家:伊贝尔(L. Ebel)
测题鉴别指数与评价标准
区分度(D) 0.40以上 0.30-0.39 评 价
非常良好 良好,如能改进则更佳
0.20-0.29
0.19以下
尚可,仍需再改进
劣,必须淘汰或加以修改
极端组的划分
• 高低组的比率介于25%---33% • 标准化测验采用27% • 样本人数过少时,可以用50%作为分界点。 • 此方法只利用了一部分信息,精确性差一 些。
(二)非0、1记分项目
X P X max
某题的 平均得分
该题的 满分值
例4-4:某试卷中一 论述题为20分,10 名参加测验者得分为 10、18、14、8、 18、3、14、10、 9、8。试问该题的 难度是多少?
112 X 11 .2 10 11 .2 P 0.56 20
• 2、极端分组法
三、区分度与难度的关系
• 难度是区分度的必要条件
– 难度愈接近.50,试题区别作用愈大。 – 较难项目,对高水平被试区分能力高 – 较易项目,对低水平被试区分能力高
– 中等项目,对中等水平被试区分能力高

心理测量试题

心理测量试题

心理测量试题(98,00-05,07)一九九八年下半年北京市高等教育自学考试心理测量试卷一、判断题(正确的在题后括号内划“√”错误的划“Х”。

每小题1分,共10分)1、内容效度没有数量化的指标,有的只是一些理论推理和判断。

()2、评估项目好坏最方便的方法,以被试者答对或通过每个项目的百分数来估计。

()3、建立良好的主、被试协调关系,可以控制主被试交互作用引起的误差。

()4、赖斯是标准化成就测验的始创者。

()5、临床观察和记录不能作为测验题目的来源。

()6、16PF是采用理论推演法编制的人格问卷。

()7、能力区分量表(DAS)适用于2岁半——5岁11个月。

()8、常模样本数目选择要看总体的数目,一般而言,要是全国性的常模,一般要求200-300人为宜。

()9、在其他条件均等的条件下,测验越长,信度越高。

()10、武德沃斯设计的“个人资料调查表”是智力测验。

()二、单项选择题(在每小题的四个备选答案中选出一个正确的答案,并将正确答案的号码填在题干后的括号内。

每小题1分,共10分)1.在某次测验中,小张的得分为90分,在班上的百分等级是85,那么,在全班同学中有百分之几的人得分比小张低?()A.10 B.15 C.85 D.902.根据多年的研究结果,一般的能力测验和成就测验的信度系数都在( )以上.A.0.90B.0.80C.0.70D.0.603.在测验题目合成和编排时,可以下考虑( )A.长度B.难度C.顺序D.上述都不对4.一般不受应试技巧与练习影响的测验有( )A.成就测验B.智力测验C.人格测验D.认知能力测验5.当那些未经过训练的被试或测验应和者认为某测验是有效的测验时,该测验具有( )A.内容效度B.构思效度C.表面效度D.效标效度6.一般能力倾向测验GATB共包括( )A.11个分测验B.12个分测验13个分测验 D.14个分测验7.( )可用于对儿童学习障碍的测评.( )A.考夫曼教育成就.B.格雷伏斯C.加州心理量表D.发展程序表8.项目鉴别力以P=?为高( )A.P=1.0B.P=0.90C.P=0.50D.P=0.309.总加评定法是由( )于1932年所设计的.( )A.荷兰德B.里克特C.艾森克D.史特明10.下列哪种方法下属于主体测验?( )A.会谈B.Q-分类C.语句完成测验D.语义区分测验三、多项选择题(在每小题的五个备选答案中,选出二至五个正确的答案,并将其号码分别填在题干后的括号内,多选、少选、错选均无分。

心理学研究方法04(附参考答案)

心理学研究方法04(附参考答案)

心理学研究方法2004(附参考答案)2004年北京师范大学心理学院研究生入学考试试题心理学研究方法一、填空题1.算术平均数的所用是描述了一组数据的____。

2.在正态分布中,标准差为______时百分等级数为_____。

3.误差包括随机误差和___,他会影响___。

4.在选择题中,增加题目数量会影响____。

二、1.什么是速度测验和难度测验?两者的区别是什么?2.有人说:“t检验适用于样本容量小于30的情况。

Z检验适用于大样本检验”,谈谈你对此的看法。

3.简述两个你所了解的测验名称及其用途。

4.学业考试成绩为x,智力测验分数为y,已知这两者的rxy=,IQ=100+15z,某学校根据学业考试成绩录取学生,录取率为15%,若一个智商为115的学生问你他被录取的可能性为多少,你如何回答他?5.如果两总体中的所有个体都进行了智力测验,这两个总体智商的平均数差异是否还需要统计检验?为什么?6.选择统计检验程序的方法时要考虑哪些条件,才能正确应用统计检验方法分析问题?7.哪些测量和统计的原因会导致两个变量之间的相关程度被低估?8.举例阐述信号监测论在测量感受性方面的优势及其应用领域。

9.视觉试验的额外变量有哪些?如何有效的控制这些变量?10.简述反应时测量技术的基本思想及其在心理学实验研究中的应用。

三、1.传统心理物理实验方法测量感受性时会产生哪些方面的误差。

请分析可能影响获得可靠数据的因素即可采取的措施。

2.举例阐述在一个2[组间]*3[组内]的混合实验中采用哪些统计方法对两个因素的数据变化趋势、因素的主效应、交互作用进行详细和深入的分析?如果交互作用显著,应如何进行进一步的分析,并对统计结果进行解释。

3.什么是常模参照测验和标准参照测验?比较其异同,并举例说明。

参考答案2004年北京师范大学心理学院研究生入学考试试题心理学研究方法一、填空题1.算术平均数的所用是描述了一组数据的______。

2.在正态分布中,标准差为______时百分等级数为16。

心理测量4项目分析

心理测量4项目分析

.40
.39
.35
.34
.33
.34
.36
.34
.31
.30
.27
.26
.24
.62
.57
.54
.56
.50
.51
.53
.57
.51
.52
.50
.49
.44
.51
.31
.28
.25
.27
.20
.21
.20
.56
.57
.49
.49
.44
.44
.40
.71
.65
.64
.60
.52
.52
.52
.77
.64
– 在人格测验中,类似的指标是“通俗性”。即 取自相同总体样本中,能在答案方向上回答 该题的人数。
– 两种指标的计算方法是相同的
– 难度的计算 • 二分法记分的项目(1、0记分) – 公式(通过率):P=R/N×100% »P 指项目的难度(通过率) »R 答对或通过该项目的人数 »N 全体被试人数
– 区分度与难度呈现的是一种曲线(倒“U”的关系 )。
• 难度为0.5时,区分度最高 • 难度较高或较低时,区分度中等 • 非常高或非常低的难度时,区分度也很低
– 不同水平被试中区分度与难度的关系
• 较难的题目对高水平被试有较高的区分度 • 中等难度的题目对中水平被试有较高的区分度 • 较容易的题目对低水平被试有较高的区分度
举例:第一题10名被试中8人答对, 其难度为:
P1=8/10×100% =80%
• 样本例数较大时的计算方法 – 根据测验总成绩将被试分为三组 » 高分组(NH):分数最高的27% » 中间组:分数居中的46% » 低分组(NL):分数最低的27% – 计算高分和低分组的通过率 – 计算两组平均通过率作为难度指标 公式:P=(PH+PL)/2 » P 指难度(通过率) » PH 指高分组通过率 » PL 指低分组通过率

四种类型性格测试及结果分析

四种类型性格测试及结果分析

四种类型性格测试及结果分析性格测试是一种帮助人们了解自己性格特点的工具,可以提供有关个人兴趣、价值观和行为偏好的信息。

通过参与性格测试,人们可以更好地认识自己,发现自己的优势和劣势,并找到适合自己的职业和生活方式。

本文将介绍四种常见的性格测试及其结果分析,分别是Myers-Briggs Type Indicator (MBTI) 测验、Big Five 人格特质测验、DISC 行为风格测验和Enneagram 九型人格测验。

1. Myers-Briggs Type Indicator (MBTI) 测验MBTI测验是目前最为广泛应用的性格测试之一,通过测量人们在四个维度上的特点来确定其性格类型。

这四个维度分别是:- 内向 (I) vs 外向 (E)- 感觉 (S) vs 直觉 (N)- 思考 (T) vs 情感 (F)- 判断 (J) vs 知觉 (P)根据这四个维度,MBTI测验将人们分为16种不同的类型,如ISTJ、ENFP等。

每种类型都有自己的特点和倾向。

MBTI测验的结果可以帮助人们更好地了解自己的决策方式、信息获取方式、人际交往方式等。

例如,ISTJ(内向-感觉-思考-判断)类型的人通常更加注重细节、有条理且守时,适合从事需要组织能力和执行力的工作。

2. Big Five 人格特质测验Big Five 人格特质测验是另一种经典的性格测试方法,将人的性格特征分为五个维度:- 外向性 (Extraversion)- 宜人性 (Agreeableness)- 责任心 (Conscientiousness)- 情绪稳定性 (Emotional Stability)- 开放性 (Openness to Experience)每个维度都包含了相应的子特质。

通过对这五个维度的测量,人们可以了解自己在各个维度上的得分,从而得出相应的性格类型。

这种测验的结果可以帮助人们了解自己的社交倾向、忍耐度、干练程度等,有助于职业发展和个人成长。

90项症状评定量表结果分析

90项症状评定量表结果分析

1、测验1为90项症状评定量表的结果
(1)SCL-90总分为90个项目评分之和,反映病情严重程度,其变化能反映病情演变。

总均分和因子分分值的意义。

1-2:提示心理健康/无对应的因子症状。

2-3:提示亚健康心理状态/有对应因子表现的轻度症状。

3-4:提示有心理健康问题/有对应因子表现的中度症状。

4-5:提示有严重心理健康问题/有对应因子表现的重度症状。

(2)该测验的结果与分析如下:
①SCL-90总均分2.1提示亚健康。

②SCL抑郁因子分3.3提示大部分时间有抑郁症状。

③SCL焦虑因子分2.3提示有时有焦虑症状。

④SCL其他因子分4.4提示抑郁症状重度。

心理咨询班-智力测验(04-7-19)

心理咨询班-智力测验(04-7-19)
7
(二)离差智商
1 、由 Wechsler 提出,它是用统计学的标准 分概念来计算智商,表示被试者的成绩偏离 同年龄组平均成绩的距离(以标准差为单 位),每个年龄组IQ均值为100,标准差为15。 计算公式为IQ=100+15(X- M )/S

公式中为M样本成绩的均数(某人所在年龄组的平均 分数), X 为被试者的成绩(某人实得分数),S 为 样本成绩(年龄组分数)的标准差,( X- M)/S 是 标准Z分数的计算公式。
2018/7/13
21. 造语句 22. 正确答案
23. 对答问句 24. 描画图样 25. 剪纸 26. 指出谬误 27. 数学技巧 28. 方形分析(一) 29. 心算(三) 30. 迷津 31. 时间计算 32. 填字 33. 盒子计算 34. 对比关系
38. 语句重组(一) 39. 倒背数目
9
2018/7/13
(三)智力分类和分级

智力可以按一定标准来分出种类和等 级。现代心理测量学用统计的方法分出 智力的各种因素,如言语智力和操作智 力等;从智力理论上又分为流体智力和 晶体智力,也有的把智力分为抽象智力、 具体智力和社会智力等。目前智力主要 采用IQ分级方法,这也是国际常用的分
级方法。
智力测验
2018/7/131 Nhomakorabea
智 力 测 验 ( intelligence test) 是 评 估个人一般能力的方法,它是根据有关 智力概念和智力理论经标准化过程编制 而成。 智力测验在临床上用途很广,不仅在研 究智力水平,能够对人的智力水平的高 低作出评估,而且在研究其它病理情况 时都是不可缺少的工具,如神经心理评 估。临床上多用个别智力测验,教育和 某些研究也用团体智力测验。

90项症状清单(SCL-90)实验报告

90项症状清单(SCL-90)实验报告

90项症状清单 (SCL-90) 实验报告一、实验目的通过实验了解受试心理健康状况,掌握个别施测的使用方法。

掌握90项症状清单的原理、实施、记分与结果解释方法。

二、实验材料大学生心理测验系统三、实验步骤3.1 进入大学生心理测验系统后再点击进入人格特点测评项目。

3.2 点击测试项目名称即90项症状清单(SCL-90),进入90项症状清单界面。

3.3 输入被试信息,确定后桌面弹出测验指导与窗口,认真阅读指导语:①在这个问卷测试当中有90个问题,请你依次回答这些问题,答案选项包括“无”、“轻度”、“中度”、“重度”和“极重度”五个选项,每一测题只能选择一个答案;② 不可漏掉任何测题;③该问卷测试评定的是现在或最近一周的实际感觉;④本测验不计时间,但应凭自己的直觉反应进行作答,不要迟疑不决,拖延时间。

确定阅读完毕后开始测试。

3.4 按照出现题目的先后顺序作答,直至答题完毕。

四、实验结果4.1 受试信息姓名:XXX 性别:女年龄:20 文化程度:本科测验耗时:00:03:044.2 受试结果测试结果原始分平均分参考诊断均分±标准差总分370 129.96±38.76总均分 4.11 1.44±0.43阴性项目数0 24.92±18.41阳性项目数90 65.08±18.33阳性项目平均分 4.11 2.60±0.59躯体化55 4.58 极重 1.37±0.48强迫状态45 4.50 极重 1.62±0.58人际关系敏感33 3.67 重 1.65±0.51抑郁51 3.92 重 1.50±0.59焦虑41 4.10 重 1.39±0.43敌对26 4.33 重 1.48±0.56恐怖27 3.86 重 1.23±0.41偏执23 3.83 重 1.43±0.57精神病性40 4.00 重 1.29±0.42其它项目29 4.14 重图3为受试SCL90的轮廓图五、实验结果分析5.1 SCL-90因子分析:躯体化:反映主观的躯体不适感强迫症状:反映临床上的强迫症状群。

教育测验的编制与实施

教育测验的编制与实施
按照测验形式分类
按照测验的形式,可以将教育测验分为笔试测验、口试测验和实操测验。笔试测验主要通 过书面形式进行,口试测验则通过口头形式进行,实操测验则需要学生实际操作来展示自 己的技能和能力。
测验编制的基本原则
目的性原则
科学性原则
测验编制应紧扣教学目标和学习要求,确 保测验内容与教学和学习目标相一致。
激励学生进步
测验结果可以作为学生自我比较和 进步的动力,激励学生不断努力提 高自己的成绩。
教师专业发展与教学改进
教师专业培训
改进教学方法
Hale Waihona Puke 教育测验的编制和实施需要教师具备 一定的专业知识和技能,因此可以促 进教师的专业培训和进修。
根据学生的表现和反馈,教师可以调 整自己的教学方法和策略,提高教学 效果和质量。
确定测验目的
明确测验的目标和用途,如评估学生的学习水平、选拔优秀学生等。
设计测验蓝图
根据测验目的,确定测验的内容、题型、难度和时间分配等,确保测 验能够全面、准确地反映学生的能力。
制定评分标准
为每个题目制定详细的评分标准,确保评分过程客观、公正。
培训施测人员
对施测人员进行培训,确保他们了解测验的目的、内容、施测流程和 评分标准。
猜测因素等属性。通过项目分析可以对题目进行筛选和改进,提高测验
的整体质量。
02
难度系数
难度系数是指被试者在该题目上的通过率,难度系数过高或过低都会影
响测验的鉴别力和可靠性。在编制测验时,应合理设置题目的难度系数,
以使测验结果更加准确可靠。
03
区分度
区分度是指题目对不同水平被试者的鉴别能力,高区分度的题目能够更
测验的类型
按照测验目的分类

心理测量量表汇总及总结(打印版)

心理测量量表汇总及总结(打印版)

心理测量量表汇总及总结(打印版)二、三级)心理与行为问题评估名称适用范围版本及结构评定方法评定时间评分标准结果解释缺点SCL-9090项症状清单(1975)1、精神科和心理咨询门诊了解就诊者或B的心理问题;2、躯体疾病B的精神症状;3、调查不同职业群体的心理问题共项90题躯体化、强迫症、人际关系、抑郁、焦虑、敌对、恐怖、偏执、精神病性、其他总分:各单项加总总均分:总分/90阳性项目数:单项分≥2,呈现症状阳性症状均分=(总分-阴性项目数分)/阳性项目数最近1周5级1没有2很轻3中度4偏重5严重总分-90项相加反映病情严重程度因子分(0-4)全国常模总分>160,阳性项目数大于43项,或任一因子分>2分,可考虑筛选阳性,需进一步检查1/量表项目全面性不够,缺乏情绪高涨、思维飘忽等项目,使其在躁狂症或精神分裂症求助者中的应用受限2/不适用于诊断心理疾病SDS抑郁自评量表(1965)抑郁症的轻重程度和治疗中的变化,特别适用于发现抑郁症病人具有抑郁症状的成人20题10个正向10个反向:2、5、6、11、12、14、16-18、20总粗分X=20项相加标准分Y= X1、25后取整最近1周4级评分123453分分界值53-62轻度抑郁63-72中度抑郁>72重度抑郁1、用于治疗评估,不能用于诊断2严重阻滞症状的抑郁病人,评定有困难。

3、临床分级,除参考量表分值以外,主要应根据临床症状,特别是要害症状的程度来划分,量表分值仅能作为一项参考指标而非绝对标准。

SAS焦虑自评量表焦虑的轻重程度及治疗中的变化具有焦虑症的成年人20题15个正向5个反向5、9、13、17、19粗分X=20项相加标准分Y =X1、25后取整最近1周4级评分123450分界值50-59轻度焦虑60-69中度焦虑大于69重度焦虑1、用于治疗评估,不能用于诊断2、由于焦虑是神经症的共同症状,在各类神经症鉴别中作用不大;CBCL儿童行为量表(1970)1、筛查儿童、青少年社会能力和行为、情绪问题;2、识别和评价行为和情绪问题高危儿童;4种表格我国修订4-16岁家长用表1、老师、家长和年长儿童自评三种方式2共113项,3部分1、最近半年2、一次评定约30分钟左右第一部分不记分第二部分除个别外需记分、0-2分3级评分总粗分高行为问题越大。

测验的目标分析范文

测验的目标分析范文

测验的目标分析范文测验是一种用于评估个体知识、技能和能力的工具。

它可以衡量各种不同的方面,包括学术知识、职业能力、情商和心理状态等。

通过测验,我们可以了解一个人在特定领域的熟练程度,从而从教育、职业和心理角度对其进行评估和指导。

本文将对测验的目标进行分析,以便更好地理解测验的作用和意义。

此外,测验还可以用于评估职业技能和能力。

在招聘过程中,用人单位通常会要求应聘者参加能力测验,以评估他们是否具备必要的技能和知识。

这些测验可以包括各种题型,如选择题、填空题、演示和操作等,以测试应聘者在职位相关领域的专业技能和实际应用能力。

通过这些测验,用人单位能够更好地了解应聘者的能力,从而作出更准确的招聘决策。

此外,测验还可以用于评估个体的情商和心理状态。

情商测验被广泛应用于评估个体的情绪智力和社交能力。

通过这些测验,心理专家可以了解个体的情绪管理能力、情绪认知、社交技巧等方面的状况,从而帮助他们更好地处理情绪问题和人际关系。

心理状态测验则用于评估个体的心理健康和心理障碍的状况,如抑郁、焦虑等。

通过这些测验,心理专家可以制定针对性的治疗计划,以提供必要的支持和干预。

除了上述目标外,测验还可以用于性格和兴趣评估、人格测定、语言能力测试等方面。

它们可以帮助个体更好地了解自己的个性特点、兴趣爱好和语言状况,从而为教育、职业和个人发展提供指导和支持。

总而言之,测验的目标是评估个体的知识、技能和能力水平,以便为他们提供更有针对性的教育、职业和心理支持。

通过学术测验,我们可以评估学生在不同学科中的掌握情况;通过职业测验,我们可以评估应聘者的专业技能和实际应用能力;通过情商和心理状态测验,我们可以评估个体的情绪智力和心理状况。

通过这些测验,我们可以更好地了解个体的需求和问题,为他们提供更有效的帮助和指导。

试卷主要考察项目说明

试卷主要考察项目说明

试卷主要考察工程说明一、归档材料按照《河南工业大学测验工作办理规定》中测验材料归档的要求,测验材料归档有试卷袋和材料袋。

试卷袋内装:学生测验试卷、平时成就及依据、成就单、考场记录表;材料袋内装:A、B样卷〔试题库、试卷库、结课作业等没有B样卷〕、尺度答案及评分尺度、试卷阐发、试做试卷、《河南工业大学课程查核命题审批表》。

一是考察试卷袋总数要与参加测验的班数一致〔每班或每个考场1个试卷袋〕、每个试卷袋内的试卷份数要与该班参加测验的学生人数一致;二是考察试卷袋和材料袋内材料是否齐全和尺度,出格是试做试卷是否真实和客不雅、《河南工业大学课程查核命题审批表》中试做信息栏的填写是否详实。

二、试题质量1. 命题尺度,符合大纲要求〔1〕测验内容不超出教学大纲的要求,不出偏题怪题。

〔2〕测验内容要涵盖本课程的根底理论、根本常识和根本技能。

〔3〕题型力求多样化,不同课程的测验题型应按照其课程特点和课程要求等确定;在题型多样化的同时,也要注意不要采用不适合本课程的题型。

〔4〕试题要包管科学性,标题问题应通俗易懂,便于考生对试题的理解。

〔5〕试卷的分数分配比例与教学大纲学时分配比例的保持根本一致。

实际操作时,可将试卷中每章分数所占总分数的比率与教学大纲中每章学时占总学时的比率进行比拟。

2. 题量适当在命题时控制题量适当有必然难度,一般是按照学生的平时暗示〔作业、辅导、课堂提问等〕和近几年的测验情况来把握,考后对题量做出判断。

一般不该有考生在一半测验时间内完成答卷,在3/4测验时间内完成答卷的考生人数不该大于总考生人数的20%;在此前提下,≥80%的考生在测验时间内完成答卷为题量适当,≥60%的考生在测验时间内完成答卷为题量根本适当。

题量与试题难易程度有必然关系。

3. 难易程度测验前对试卷难易程度预测是一个仍未解决的难题,目前遍及采用的是考后对试卷的难易程度进行评估,其难易程度用难度系数P暗示,计算方法为P=班或专业平均分/试卷总分P越大难度越小,一般认为:P=0.60~0.69为适中,P=0.50~0.59为偏难,P=0.75~0.80为偏易,P<0.50为过难,P>0.80为过易。

测验项目的区分度

测验项目的区分度
答错该题的被试在总分上(或效标分数上) 的平均得分;St全体被试的总分(或效标分 数的标准差);p为答对该题的人数百分比; q答错该题的人数百分比,q=1-p;y为正态 分布下答对百分比所在位置的曲线高度。
• 二列相关的显著性检验:用Z检验。 • Z=rb/[(1/y)* (pq/n)1/2 ]
• 3 φ 相关 • 适用于两个变量是二点分配的资料,即都
测验项目的区分度
项目区分度的意义
1 区分度,是指测验项目对被试心理品 质水平差异的区分能力 2 项目区分度,是指测验项目对被试的 心理特性的区分能力
具有良好区分度的项目,能将不同水平的被试区分开来,也就是 说,在该项目上水平高的被试得高分,水平低的被试得低分。反 之,区分度低的项目则对不同水平被试不能很好地鉴别,水平高 与水平低的被试,所得分数差不多,甚至正好相反。所以测量专 家们把试题的区分度称为测验是否具有效度的“指示器”,并作 为评价项目质量,筛选项目的主要指标与依据。必须指出:评价 测验项目区分度高低倚赖于对被试水平的准确测量,通常称作为 内部效标
(3)分组标准影响鉴别指数值D
• 4)被试样本的同质性程度影响区分度 值的大小 被试团体越具有同质性,即
个体之间水平越接近,其测题的区分度值 就越小。反之,若是施测于具有较大异质 性的被试团体,即使是对另外一同质团体 来说区分度很小的项目,也可能具有很高 的区分度。另一方面,区分度也是相对于 不同水平的被试团体的。所以,项目的区 分度大小是针对特定团体而言的。
二列相关
• 两个变量都是正态连续变量,其中一个变 量被人为地分成两类
• 点二列相关和二列相关的区分是,二分的 变量总体是否为正态,正态则用二列相关, 非正态则用点二列相关。
• 计算二列相关的公式是: • rb= [(Xp-Xq)/ St]* (pq/y)

第三章 教育测验的试题分析

第三章 教育测验的试题分析
P PH PL 2
其中,PH 表示高分组通过率。 PL 表示低分组通过 率。
19
三、测验难度水平的确定 • 在理论上来说,常模参照测验要求试题难度适中,
即大多数题目的难度值在0.3至0.7之间,使整个 测验的平均难度值为0.5左右。 • 但在实际中,并非如此。
20
• 第一,所有试题平均难度值为0.5,这是针对非选择 类试题(也叫构造类试题)而言的,因为这类试题不 存在猜测。
27
• 二、区分度的计算 – 1. 分组法 (主客观题皆如此)
D PH PL
PH表示高分组在该题上的通过率;PL表示低分组在该 题上的通ቤተ መጻሕፍቲ ባይዱ率。
28
• 例1:高中物理测验的被试共18人,高分组和低 分组各为5人,第5题高分组5个人全部答对,低 分组只有1人答对,则区分度是多少?
29
• D值的取值范围在[-1,1]之间。D值越大,表明试题的 区分度越好。一般标准如下:
16
• 2. 主观题难度的估计 – (1)通过率
P X W
其中,P表示该题的难度值,表示所有被试在该题 上得分的平均数。W表示该题的满分分数。
17
• 例4:一组被试在某道题上的得分分别是2、5、9、 10、4、8、7、5、3、0,该题的满分为10分。问: 该题的难度值是多少?
18
– (2)分组法
30
2. 试题-整体相关法 • 判断试题区分度的另一种方法是计算试题的得分
与整体测验得分的相关系数,即试题-整体测验相 关性(item-total correlation)。 • 其基本原理见黄光扬《教育测量与评价》p69。
31
– (1)客观题
点二列相关
rpb
Xp Xq St

教学测量与评价名词解释

教学测量与评价名词解释

教学测量与评价名词解释教学测量与评价名词解释1. 测量:根据一定的法则使用量具对事物的特征进行定量描述的过程2. 教学测量:根据一定的法则使用量具对教师教与学生学的过程进行定量描述的过程3. 常模参照测验:以常模作为评价测验分数之标准的测验4. 标准参照测验:按照具体的行为标准水平对被试的测验结果作出直接解释的测验5. 项目分析:指对特定受测者在个别测验项目上所做反应的统计特征的计算和检验6. 难度:被试完成测验项目任务所遇到的困难程度7. 区分度:测验项目对所测量的心理特征的区分能力8. 误差:测量过程中由那些与测量目的无关的变化因素所产生的一种不准确(效度)或不一定(信度)的测量效应9. 真分数:把反映被试某种心理特质真正水平的那个数值10. 标准化:指测量的编制、实施、记分以及测量分数的解释程序的一致性11. 常模:常模团体的分数分布12. 信度:测量结果的可靠性、一致性、可信性、稳定性的程度13. 复本信度:用水平测验A、B对同一组被试在最短时间内施测两次所得结果的一致性14. 效度:实际测出的心理特质与所要测量的心理特质的程度15. 构想效度:测验实际测到所要测量的理论结构或特质的程度16. 效标:衡量一个测验是否有效的外在标准,它是独立于测验并可以从实践中直接获得我们所感兴趣的行为17. 导出分数:针对原始分数进行统计处理后获得的分数18. 内容效度:测验实际测到的内容与所要测量的内容之间的吻合程度19. 导出分数:针对原始分数进行统计处理后获得的分数20. 百分等级分数:在常模团体中低于该分数的人数百分比21. 标准分数:以平均数为参照点,标准差为单位表示的分数22. T量表:<量表:能够使事物的特征数量化的数字的连续体(T量表没找到)>23.比率智商:智力年龄与实际年龄的比率24.心理年龄:被试智力发展水平的年龄25.形成性评价:通过观察、活动记录、测验、问卷调查和咨询等形式对学生的学习进展进行持续评价教育测量与评价名词解释(上)(转)2017-04-09 15:32 | #2楼1、统计:就是“统而计之”对所考察事物的量的取值在其出现的全部范围内作总体的把握,全局性的认识。

内容效度

内容效度
内容效度
项目对欲测的内容或行为范围取样的适当程度
01 概念
目录
02 验证程序
03 验证方法
04 应用
05 与表面效度的区别
内容效度又称逻辑效度,是指项目对欲测的内容或行为范围取样的适当程度,即测量内容的适当性和相符性。 成就测验和熟练测验特别注重这种效度。由于这种衡量效度的方法必须针对课程的目标和内容,以系统的逻辑方 法详细分析题目的性能,故又称课程效度或逻辑效度。
一个测验要有内容效度必须具备的条件
1.要有定义得完好的内容范围。所谓内容范围,可以是一个明确而有限的题目总体(如20以内的加减法), 也可以是具体的知识和技能,也可以是复杂的行为,如中小学生的心理健康的特点和表现。成就测验主要目的是 测量学生在某一学科中学习的效果,此种测验的内容范围容易确定,但人格测验、兴趣测验等,测验的内容范围 较难确定。
不同的被试团体在测验上的得分和对每题的反应存在较大差异,一般说,高年级比低年级的水平要高,如果 总分和题目的通过率随着年级而增高,则说明测验对于教学具有内容效度
应用
作为一种方法,内容效度较为适合于评价教育成就测验和职业选拔测验。在这种测验中,测验内容应是知识、 技能和实际工作的代表性样本。内容效度不仅是评价教育成就测验和职业选拔测验的较好方法,而且也是编制任 何测验都应加以考虑的基本方面。内容效度对标准参照测验更为重要,因为在标准参照测验中我们主要关心的是 被试对一定范围内的知识、技能掌握得如何。
内容效度既具有一定的优点,也有一定的局限。它的主要缺点是缺乏可靠的数量指标,因而妨碍了各测验间 的相互比较。
与表面效度的区别
表面效度(Face Validity):指外行人从表面上看测验是否有效,测验题目与测验目的是否一致。表面效度 不是真正的效度指标,但它容易和内容效度搞混。

项目反应理论简介

项目反应理论简介

项目反应理论的挑
05
战与未来发展
挑战与问题
01
模型参数的识别和估 计
项目反应理论依赖于对模型参数的准 确识别和估计,然而在实际应用中, 由于数据质量、样本大小等因素的影 响,可能会出现参数估计不准确的问 题。
02
模型的假设条件
项目反应理论是基于一些假设条件, 如局部独立性和正态分布等,然而在 实际应用中,这些假设条件可能会被 违反。
02
心概念
刺激与反应
1 2
刺激
指能够引起和激发个体反应的外部环境因素。
反应
指个体对刺激做出的行为或心理上的回应。
3
反应规则
指在特定刺激下,个体如何做出反应的规律。
反应者与环境
01
反应者
指受到外部刺激并做出反应的个 体或系统。
02
03
环境
交互作用
指反应者所处的外部条件和影响 因素。
指反应者和环境之间的相互影响 和作用。
更具有广泛适用性。
模型的适用性
03
未来研究可以开发适用于更广泛任务或测验的模型,论与实践的结合
要点一
针对具体应用场景进行模型设计 和优化
项目反应理论在教育、心理学、医学等领域都有广泛的应 用,未来研究可以针对这些具体应用场景进行模型设计和 优化,以提高模型的适用性和实用性。
项目反应理论简介
汇报人: 2023-11-29
目 录
• 项目反应理论概述 • 项目反应理论的核心概念 • 项目反应理论的应用领域 • 项目反应理论的研究与发展 • 项目反应理论的挑战与未来发展
01
项目反应理论概述
定义与背景
项目反应理论是一种心理测量理论,它为理解和描述个体在特定测验项目上的反应行为提供了一个框 架。该理论是心理测量学领域的重要支柱之一,被广泛应用于教育和临床诊断等领域。

测验项目实施方案怎么写

测验项目实施方案怎么写

测验项目实施方案怎么写一、引言。

测验项目实施方案是指为了达成特定目标而进行的一系列计划和活动的总体安排。

它是一个组织或团队为了实现某种目标或解决某种问题而采取的行动方案。

本文将从测验项目实施方案的制定、实施和评估三个方面进行详细介绍。

二、测验项目实施方案的制定。

1.明确项目目标和范围。

在制定测验项目实施方案之前,首先需要明确项目的目标和范围。

明确项目的目标是为了确保项目的实施能够有针对性和方向性,而明确项目的范围则是为了避免项目实施过程中出现范围不清、任务不清晰的问题。

2.制定详细的工作计划。

制定详细的工作计划是测验项目实施方案制定的重要环节。

工作计划需要包括项目的时间安排、任务分工、资源配置等内容,以确保项目实施过程中能够有条不紊地进行。

三、测验项目实施方案的实施。

1.组织实施团队。

在项目实施阶段,需要组织一个专业的实施团队来负责项目的具体实施工作。

实施团队需要具备相关的专业知识和经验,以确保项目能够按计划进行。

2.监控项目进度。

在项目实施过程中,需要不断监控项目的进度,及时发现和解决项目实施中的问题和风险,以确保项目能够按时按质完成。

四、测验项目实施方案的评估。

1.收集项目数据。

在项目实施完成后,需要收集项目的相关数据,包括项目实施过程中的各项指标、数据和反馈意见等,以便对项目进行评估。

2.评估项目成果。

根据收集到的项目数据,对项目的实施成果进行评估,分析项目的实施效果和存在的问题,为今后类似项目的实施提供经验和借鉴。

五、总结。

测验项目实施方案的制定、实施和评估是一个系统性的工作,需要全面、细致地进行规划和实施。

只有通过科学的实施方案,合理的项目管理和有效的评估机制,才能确保项目能够顺利实施并取得预期的效果。

六、结语。

通过本文的介绍,相信大家对测验项目实施方案的制定、实施和评估有了更深入的了解。

希望大家在今后的工作中,能够根据实际情况制定科学合理的测验项目实施方案,确保项目的顺利实施和取得良好的效果。

  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

上一页
下一页
难度对测验结果的影响
思考与练习二:
下面五套测验测量的都是同一种心理属性,题目数 量一样,记分方法一样。从理论上讲,下面哪套测 验的鉴别力最好?( ) 测验A:题目的难度均在 0.4~0.6之间 测验B:题目的难度均匀地分布在 0.2~0.8之间 测验C:绝大数题目的难度都在 0.2以下 测验D:绝大数题目的难度都在 0.8以上 测验E:题目的难度集中在 0.2 与 0.8两端。
难度对测验结果的影响
上一页 下一页
题目的难度分布对测验分数分布的影响?
A:题目难度在0.25~0.75间均匀分布 扁平的对称分布(多数测验的追求) B:题目的难度大都>0.80 负偏态分布。哪类测验希望这样? A B C D
C:题目的难度大都<0.20 正偏态分布。哪类测验希望这样?
D:题目间相关都很低,难度在0.50左右 分数:尖峰的对称分布(不希望的) E:题目间高度相关,题目难度相近, 分数:双峰或多峰分布(不希望的)
上一页 下一页
2.多级评分项目的难度计算(公式见下页)
这类题目题目的评分有三个以上分值。 在能力测验中,这类题目可以根据被试的答案与标准 答案的接近程度,评定出多个分值。如:测验中的名 词解释、简答、论述、案例分析、作文、列举等题目 在非能力测验中,这类项目一般有多个程度(或层次) 不同的答案选项,根据选项的程度(或层次),评定相 应的分值。例如: 我喜欢可以拆开的玩具: A.完全符合、B.部分符合、C.完全不符合 我的思想似乎:A.走在了时代前面;B.一般;C.比较 保守
多级评分题: D =
5) 将计算出的鉴别指数与评价标准比较,筛选试题。
上一页 下一页
计算方法目录
项目区分度统计方法:点二列相关
适合分析二级评分题与测验总分、多级效标变量的 相关。
r pb
X p Xq St
pq
Xp 为题目答对者的测验总分(或效标)均分 Xq 为题目答错者的测验总分(或效标)均分 St 为全体测试对象的测验总分(或效标)的标准差 p 为题目答对者的比率,p 为题目答错者的比率 rpb 与积差相关的计算结果基本相同,可用积差相关代替
上一页 下一页
难度的计算
(三)测验难度对测验结果的影响
1.对测验分数分布形态影响 2.对测验信度的影响 3.对测验鉴别和区分能力的影响
上一页
下一页
难度分析
1.测验难度对测验分数分布形态的影响
如果测验项目是同质的,项目间相关在0.25~0.70间,那么 题目难度在0.25~0.75间均匀分布,测验难度适中时, 测验分数会出现什么情况?(如下页图例A) 扁平的、近似正态的对称分布,分数的离散程度较大。 题目难度大多在0.80以上,测验难度较小时,测验分 数的分布会出现什么情况? (如下页图B) 负偏态分布:高分偏多且较接近,低分少且较分散 题目难度大多在0.20以下,测验难度较大时,测验分 数的分布会出现什么情况? (如下页图C) 正偏态分布:低分偏多且较接近,高分少且较分散 艾伯尔的实验研究
以测验总分为标准,估算区分度、筛选题目,可以 提高测验的内部一致性和信度。 以效标为标准,可以提高测验的准则关联效度。
区分度的统计指标:鉴别指数、相关系数 鉴别指数、相关系数系数越大,区分度越好。
上一页
下一页
区分度分析
(二)项目区分度的计算与分析
研究者提出了50多种统计方法。 常用的统计方法和指标有:
上一页
下一页
(四)测验题目难度分布的要求
测验题目的难度分布:是指各种难度的题目数量 在题目总数中所占比率的情况。 确定项目的难度分布,要考虑两个重要因素:测 验目的和项目间的相关程度
测验目的和任务不同,对题目的难度要求也不同; 项目间的相关越高,项目的难度分布范围应越广。
不同类别测验对题目难度的要求: 目标参照测验 针对普通群体的常模参照测验 选拔性测验 针对少数特殊群体的标准化测验
上一页 下一页
一、项目分析的目的和任务
项目分析?就是根据具有代表性的被试样本的测验 数据,对每个题目进行质量分析。主要包括: 项目的难度分析 项目的区分度分析 项目间的相关分析 项目的答案选项分析 目的和任务?
对测验题目进行筛选、修订,保留质量较好的题目, 删除品质较差的题目, 以保证测验的效度、鉴别力和信度。
上一页 下一页
难度分布要求
选拔性(或筛选)测验:难度要求
测验目的:选拔或筛选出某方面能力水平较高(或 较低)的少数人。 测验题目的难度: 应向选拔率(筛选率)方向靠近。 思考与练习:如果要从2000人的总体中选拔出能力 水平较高的100人,并进一步区分其能力水平高低, 那么测验题目的难度多大比较合适? 选拔率:100/2000 = 0.05 题目难度系数:0.3或0.2以下 使测验分数分布为:正偏态
上一页 下一页
难度分布要求
三、项目的区分度(鉴别力)分析
(一)什么是测验项目的区分度 (二)如何计算和分析项目的区分度 (三)测验的区分度与信度的关系
(四)项目的区分度与难度的关系
上一页
下一页
(一)什么项目的区分度(discrimination)
也称鉴别力,是指测验题目在测验所要测量的心理 特性上,对被试差异的区分程度或鉴别能力。 判断项目区分度的好差,主要是考察题目得分与测 验总分或效标的一致性程度。
当测试人数非常多,而对难度的精确度要求不高时, 可以采用面步骤和方法计算题目的难度系数:
1.可将被试按总分高低排列, 然后取得分最高的27% 作为高分组,取得分最低的27%的被试作为低分组。 2.分别计算题目对于两组被试的难度系数: PH 和 PL ( PH 和 PL的计算方法?) 3.根据下面公式,计算题目对于被试总体的难度系数:
上一页 下一页
难度分析
目标参照测验:难度分布
测验目的:判断教学目标是否实现 题目难度要求:以教学目标的要求为标准,即: 教学计划和目标要求学生形成什么样的心理品 质和行为表现、能解决什么样的问题,就编制相应 的问题情境、评定项目。例如,
课程要求学生能对一个测验的信度作出估计和评价, 就可编制这样的题目:列出一组被试在某测验中的 各题得分,要求学生计算出信度系数,并对该信度 水平作出好差评价。
上一页 下一页
二、测验项目的难度分析
(一)什么是测验项目的难度 (二)如何计算题目的难度 (三)测验难度对测验结果的影响 (四)测验的适宜难度分布 (五)测验题目平均难度的计算 若各题满分值一样,可计算各题难度算术平均数 若各题满分值不一样,可采用下面步骤和方法: • 先计算各题满分值在总分中所占比率(即权重), 然后将各题难度乘以权重,再求和及计算各题 难度系数的加权平均数。举例 • 或者用被试样本的测验均分除以测验满分值
——艾伯尔:《教育测量纲要》第302页
(江西师大1984年中译本)
上一页 下一页
难度对测验结果的影响
3.测验的难度对测验鉴别力的影响
鉴别学生能力水平的高低,区分出他们之间的差异, 是心理与教育测验的主要功能。 判断测验的鉴别和区分能力主要看哪些统计指标? 测验分数的分布形态、离散程度等 测验题目的难度对测验的鉴别能力有什么影响?
上一页 下一页
(一)什么是测验项目的难度
项目的难度(difficulty)是指测验的项目(或试题) 难易程度,通常用 P 表示。 在能力测验中,它就是指试题的难度水平。 在非能力测验(如个性、态度等测验)中,难度被 称为“通俗性”、“流行性”水平,指被试样本 中所选答案的倾向性。
上一页
下一页
难度分析
(二)项目难度的计算
1、二级评分项目的难度计算
2、多级评分项目的难度计算
3、大规模测验的项目难度计算
4、二级评分项目难度系数的校正
上一页
下一页
难度分析
1、二级评分法题目的难度计算公式
这类项目属客观题,一般是答对给1分,答错给0分. 难度计算公式: P = R/N [即:试题通过率] R 为其中的答对人数 N 代表总体(或被试样本)人数 练习:在一次200人参加的测验中,第一道单项选 择题的答对人数为60人,第二道题目的答对人数为 150人,两道题目的难度系数分别是多少? 第一道:P= ? 第二道:P= ?
CP=(KP-1)/(K-1)
CP为校正后的难度;K为备选答案数目; P为由题目得分直接计算出的难度(即通过率)。 校正目的:比较答案选项数不同的题目的难度 练习1:一个四选一题目的难度系数为0.60;一个是 非判断题的难度为0.70。哪个题目的难度大? CP=(4*0.60-1)/(4-1)=0.467 CP=(2*0.70-1)/(2-1)=0.40
上一页
下一页
难度分布要求
针对普通群体的常模参照测验:难度要求
测验目的:对大规模群体的个体水平进行区分和鉴别 对于能力和特性水平测验: 题目的难度分布 应接近正态分布, 绝大多数题目的难度 应在0.25~0.75之间; 平均难度在0.50左右
对于个性、态度测验:
各个项目被选答案的 评定等级的次数分布 应接近正态分布
上一页 下一页
E
思考与练习一:
试预测下面三个测验的分数的离散程度大小变化: 测验一:题目的难度都在 0.5左右; 测验二:题目的难度均匀地分布在0.2~0.8之间; 测验三:题目的难度集中在0.2、0.8两端。 哪套测验分数的离散程度较小 哪套测验分数的离散程度较大?
上一页
下一页
难度对测验结果的影响
1.鉴别指数 2.项目得分与总分的相关:积差相关、点二列相关 3.项目对总分离散程度的影响分析:方差、标准差 4.项目的效标关联效度分析: 积差相关、点二列相关、Φ相关、四分相关
相关文档
最新文档