第四章心理测验的难度与区分度
《心理测量学》复习思考题答案
(0076)《心理测量学》复习思考题答案第一章心理测量概述一、解释1.测量:按照一定法则给事物指派数字。
2.心理测验:实质上是行为样本的客观的和标准化的测量。
3.量表:具有参照点和单位的用以测量某种事物以确定其数量的连续体。
二、填空1./2.无论是物理特性的测量,还是精神特性的测量,都必须具有(参照点)和(单位)两个要素。
3.量表可以分为(类别量表)、(等级量表)、(等距量表)和(比率量表)四级水平。
4.要求被试按平时的习惯作出反应而无正确答案的测验称为(典型行为测验)。
5.以预先确定的教学内容为标准,考查被试对于指定的教学目标中的内容或技能掌握程度的测验称为(目标参照测验)。
三、单项选择1.心理测量的参照点是(①)。
①人定零点②绝对零点③人定零点和绝对零点④不能确定2. 一般而言,心理测验的分数属于(②)。
①类别量表②等级量表③等距量表④比率量表3.狭义的心理测量是指以(②)为工具的测量。
]①调查②测验③实验④口试四、判断分析1.心理测量主要用于对人的精神特性的直接测量。
(×)分析:人的心理行为变化无法直接测出,只能通过个人在活动中(具体讲就是对测验题目)的反应来间接推断人的某种精神特性的状况。
2.由于心理测量属于等级量表,因而在应用中只能使用等级量表适用的统计方法。
(×)分析:虽然心理测量属于等级量表,但在应用时可以采取变通的方式:①假设量表上的单位是相等或近似相等,其前提是常态分布的假设;②把测验分数转换到一个有相等单位的量表上,即把原始分数转换成标准分数。
这样就可以使用等距量表的统计方法。
3,在对心理测验进行区分时,应主要看编制者的目的和测验的实际内容。
(√)分析:由于测验的编制者给要测量的特性所下的操作性定义不同,因而区分测验时不能只看测验的名称,而应主要看编制者的目的和测验的实际内容。
五、简答1.心理测量的特点是什么&答案要点:①心理测量没有绝对零点,只有人定零点。
信度、效度、区分度、难度的使用
信度、效度、难度、区分度及其在试卷分析中的使用教学测量(instructional measurement)是考核教学成效的一种方法。
这是借助于一定的手段与方式,对学生的学习成绩(简称学绩)进行探察,并以一定的数量来表示的考核办法。
2. 在教学测量中应注意什么(1)教学测量的目的在于考核教学成效,也就是考察教学目标的完成情况。
因此,教学测量的目标应以教学目标为依据,测量目标应与教学目标一致,而不能偏离教学目标(2)教学测量的对象是学生内在的能力与品德等的形成状况,它不可能像物理测量那样直接进行,只能借助于一定的手段与方式间接进行。
(3)教学成效是通过量化的学绩进行考察的。
也就是说,教学成效是以学生的学习成绩为直接考察依据的,而学绩是以一定的数量来表示的,因此命题的合理性与评分的客观性是有效教学测量的一个重要影响因素教学评价(instructional evaluation)就是依据教学目标,对学绩测验所得测量结果进行分析及解释。
它主要包含以下两个方面的工作。
(1)教学评价必须对学绩测验数据所表明的教学成效作出确切的诊断。
(2)教学评价必须对教学的成败原因进行分析,并对今后教学工作的改进方面作出明确的规定。
评价(估)的功能:为家长提供信息,为选拔提供信息,为学生提供信息,为教师提供信息,为学校(间)提供信息教学目标,有时也称为行为目标,是指对学生在一段时间教学后应该掌握的技能与概念的陈述。
❖信度信度指的是测量结果的稳定性程度,信度是衡量一个量表质量高低的重要指标。
信度不高的量表是不能使用的。
3.常见的信度种类(1)重测信度(2)复本信度(3)分半信度(4)同质信度(内部一致性信度)(5)评分者信度影响信度的因素♦被试♦主试者♦施测情境♦测量工具信度是指考试的可靠性,即考试结果的可信程度。
信度高的试题很少受到外部因素的影响,对任何学生的多次测定都会产生比较稳定的、前后一致的结果。
提高试卷信度的因素大致可包括以下几种情况:(1)使用ABC卷随机抽取试题。
第四章-心理测验的难度与区分度教案资料
心理测量学
江西师大心理与教育统计测量中心
1、相关系数法
(1)点二列相关法
心理测量学
江西师大心理与教育统计测量中心
1、相关系数法
(2)积差相关法
心理测量学
江西师大心理与教育统计测量中心
2、极端分组法(鉴别指数法)
二、区分度的计算
1、相关系数法
点二列相关 积差相关
2、用极端分组法计算区分度:
D表示区分度 PH表示高分组的难度 PL表示低分组的难度
D=PH—PL
1、相关系数法
该方法的基本思想是,若题目有好的区分度, 则高能力的被试在该题上应得高分,低能力 被试应得低分,即被试在题目上的得分应与 测验总分相一致。
(把 和 代入P=(PH+PL)/2 ,计算这个题目的难度系数。
难度计算实例
例4-1 下表是随机抽取22名被试在某数学测验中四道题目的得分情况,每 题的满分分别为1分、2分、3分和4分,请分析其难度。
哪道题最难?
三、难度系数变换
上述所得难度系数,不论是得分率还是失 分率,都属于顺序变量,不具有相等的单 位,因此,通过p值比较并不能客观指出题 目难度之间的差异大小 。
好坏的成分 不同测验,目的不同,难度值不同。
奥林匹克测验?选择补习功课的学生?
第四章 心理测量的难度与区分度
2 第二节 项目的区分度
心理测量学
一、区分度的定义
定义:
指测验对考生实际水平的区分程度或测验对被 试特质差异的区分能力,用符号D表示。
具有良好区分度的测验,实际水平高的应该得高 分,实际水平低的应该得低分。所以,区分度又 叫鉴别力。
信度效度难度区分度分析
信度效度难度区分度分析在教育测量和评估领域,信度、效度、难度和区分度是四个非常重要的概念。
它们对于衡量测试的质量、评估学生的学习成果以及改进教学方法都具有至关重要的意义。
接下来,让我们逐一深入探讨这四个概念。
信度,简单来说,就是指测试结果的稳定性和可靠性。
如果我们对同一批学生在相同的条件下进行多次相同的测试,得到的结果应该是相近的。
就好比用同一把尺子去测量一个物体的长度,每次测量的结果都应该差不多。
信度主要包括重测信度、复本信度和内部一致性信度等。
重测信度是在不同时间对同一批被试进行重复测量。
比如,今天对一群学生进行了一次数学测验,一周后再用相同的测验对他们进行测试,如果两次测试的成绩相近,说明这个测验的重测信度较好。
然而,重测可能会受到记忆、练习等因素的影响。
复本信度则是使用两个平行的测验(即内容、形式、难度等方面都相似)对同一批被试进行测量。
如果两个测验的结果一致性高,就表明复本信度良好。
但要编制两个高质量的平行测验并非易事。
内部一致性信度通常通过计算测验内部各个项目之间的相关程度来衡量。
例如,一份试卷中的各个题目,如果它们在测量同一个知识点或能力方面表现出较高的一致性,那么这份试卷的内部一致性信度就比较高。
常用的计算方法有克朗巴赫α系数等。
效度是指测试能够准确测量出所要测量的东西的程度。
好比射箭要射中靶心,测验也要准确测量到我们期望测量的内容。
效度主要包括内容效度、结构效度和效标关联效度。
内容效度关注的是测验内容是否涵盖了所要考查的知识和技能范围。
比如,一场语文考试如果能够全面考查学生的字词、语法、阅读理解和写作能力,那么它在内容效度方面就表现较好。
为了确保内容效度,出题者需要对教学大纲和课程目标有清晰的理解。
结构效度考察的是测验是否能够反映出所假设的理论结构或心理特质。
比如,一个智力测验是否真正测量了智力的各个方面,而不仅仅是某些表面的表现。
这需要通过复杂的统计分析和理论研究来验证。
效标关联效度则是将测验结果与一个外在的标准进行比较。
第4章 测验的项目分析
二级评分IRT模型 例:逻辑斯蒂模型 单参数模型(拉希模型);双参数模型 和三参数模型。 多级评分IRT模型 连续型IRT模型
优点及运用
能力参数估计的不变性。 即个体独立于测验 项目参数估计的不变性。 即测验独立于个体 提供被试能力估计值的精确度指标 被试能力和项目难度在同一量表上,为 测验编制、测题分数的报告和解释提供 了便利。
三、区分度与难度的关系
四、区分度的相对性
(一)不同的计算方法,所得区分值不同 (二)样本容量大小影响相关法区分度值的 大小 (三)分组标准影响鉴别指数值(D ) (四)被试样本的同质性程度影响区分度值 的大小
第三节
猜测问题与猜测率
一、客观测验题中的猜测问题与猜测率 (一) 客观测验题中的猜测问题 (二)猜测率 (三)猜测误差的来源 二、项目难度受猜测影响的校正 CP=(KP-1)/(K-1)或 CP=P-q/(K-1) 式中CP为校正后通过率,P为实际通过率,K为备选 答案数目;q=1-p。 S=R-W/(K-1)式中S为校正后的得分,R为被试 答对的项目数,W为被试答错的项目数,K为项目的 选项数目。
(二)非二分法记分项目的难度
X
全体考生在该题上均分;
X max
该题的满分。
整个试卷的难度计算: 试卷的难度是指一份试卷的总体难易程度,其由试卷 中每道题的难度决定。其计算办法为:将每道题目的难度 与满分值相乘的积相加,然后将其总和除以试卷的满分值, 所得的商即为整个试卷的难度。
例题
例1. 在200个学生中,答对某项目的人数为120 人,则该项目的难度为多少? 例2. 在370名被试中,选为高分组和低分组的被 试各有100人,其中高分组有70人答对第1题,低 分组有40人答对第1题,求第1题的难度。 例3. 数学测验的第七题满分为15分,该题考生的 平均得分为9.6分,则该题的难度是多大?
心理测量的复习大纲
心理测量的复习大纲心理测量大纲.第一章:第一节一般测量概述1、测量的概念:依据一定的法则使用量具对事物的特征进行定量描述的过程。
2、影响测量精确的因素:一、测量对象本身的性质。
①确定型(物体的长度)。
②随机型(人的短时记忆容量)③模糊型,即事物本身的量是模糊不定的(人的性格特征)二、测量的精确度取决于测量工具的精确性。
3、根据测量的性质和不同的特点,可以将不同形式的测量大致分为4种类型。
①物理测量:及对事物物理特征的测量。
长度,重量等。
②生理测量:对机体生理特征的测量。
如对动植物各种化学成分含量的测量。
③社会测量:即对社会现象的测量,如人口普查。
④心理测量:对人的心理特征的测量。
如智力、人格测量。
4、任何测量都必须具备两个基本要素:参照点和测量的单位。
其中参照点分为绝对参照点和相对参照点。
5、测量的量表:能够使事物的特征数量化的数字的连续体就是量表。
量表可以分为四种:①命名量表:用数字代表事物或用数字对事物进行分类。
命名量表又分为名称量表(用数字指代个别事物)和类别量表(用数字指代事物种类)。
②顺序量表:按照事物的大小,等级,程度而排列数字的量表。
③等距量表:不仅能够指代事物的类别,等级而且具有相等的单位。
等距量表的数字是一个真正的数量,这个数量中各个部分的单位是相等的。
因此可以对其进行加减运算。
等距量表没有绝对的零点。
它的零点是人们假定的相对零点。
对于等距量表的两个数不能进行乘除运算。
④比率量表:除了具有类别、等级、等距的特征外,还有绝对的零点。
第二节心理与教育测量的性质1.、心理与教育测量的定义:依据一定的心理学和教育学原理,使用测验对人的心理特质和教育成就进行定量描述的过程。
其独特的性质:①心理与教育测量依据的法则在很大程度上只是一种理论,很难达到如同物理测量依据的法则那样普遍被人们接受的水平。
②心理与教育测量的对象是人的心理特质和教育成就。
③心理与教育测量的量具市有关领域的专家编制,经过长期的试用,修订,完善而逐渐形成的标准化测验。
学校心理健康教育(第2版)第四章 学生常见心理问题的识别与评估
心理评估与心理测验是有区别的,区别主要体现在以下几点
1.资料收集方法不同
心理评估包括了测量与测验在内,但不限于测量和测验;它强调多种方法的综合 运用,并强调不能把任何一种方法收集到的资料绝对化。
2.评定量表
评定指由熟知被试行为的第三者依照长期观察的结果对被试行为进行评估。评 定量表则是指通过观察,给事件、行为或特质一个评定分数的标准化程序。临床中 常用的评定量表有:美国精神病学会出版的《精神疾病诊断与统计手册》 (Diagnostic and Statistical Manual of Mental Disorders,简称DSM)、世界卫 生组织出版的《国际疾病分类》(International Classification of Diseases,简称 ICD)、我国出版的《中国精神疾病分类方案与诊断标准》(CCMD)和《心理卫生评 定量表手册》等。学校心理健康教育中的常用评定量表有精神症状评定量表、生活 事件量表、应对方式量表和社会支持量表等。
因问题性质、目的和对象的不同,访谈法具有不同的形式,如结构性访谈和非 结构性访谈、个人访谈和团体访谈、指导性访谈和非指导性访谈等。
访谈法运用面广,能够简单直接地收集多方面资料,是心理评估中应用广泛的 方法之一。
(二)心理评估的基本态度和原则
1.基本态度
(1)连续性观点。连续性观点是指在进行心理评估时,要明确正常心理和异常心 理之间没有绝对界限,它们是一个渐变的连续体,区别往往是相对的。
3.整合模式
医学模式过分强调正常与非正常间质的区别,而多元模式则过分依赖统计分析, 缺乏明确的理论支持,二者均存在一定缺陷。学生的某些心理现象可能是分布在一 个连续体上的,而另一些则可能更适合做质的区分。如果能够将两种方法结合起来, 将有助于提高学校心理评估的水平。因此,目前在学校心理评估中,更强调对学生 的心理特性与机能进行定性与定量相结合的综合评估模式。
心理测验的难度与区分度课件
目标人群的各种情况。
难度与区分度在心理测验修订中的应用
定期修订心理测验
根据实践反馈和理论依据,定期对测验进行修订,以保持其效度 和信度。
难度与区分度的调整
根据修订结果,对测验的难度和区分度进行必要的调整,以优化测 验性能。
验证修订后的测验
对修订后的测验进行充分验证,以确保其能够有效地评估目标人群 的心理特质和行为表现。
高区分度的题目能够更好地识 别被试的优点和不足,有助于
指导个体的发展和干预。
低区分度的题目则难以准确区 分被试的不同水平,影响测验
的有效性和可靠性。
区分度是编制心理测验的重要 指标之一,对于评估和改进心
理测验具有重要意义。
04
心理测验的难度与区分度 关系
难度与区分度的关系
难度和区分度是心理测验中两 个重要的指标,它们之间存在 密切的关系。
难度与区分度在心理测验解释中的应用
1 2 3
解释测验分数
根据测验的难度和区分度,为个体提供准确的分 数解释,以帮助他们了解自己的心理特质和行为 表现。
提供反馈和建议
根据个体的情况,为个体提供有针对性的反馈和 建议,以帮助他们改善自己的心理状态和行为表 现。
应用于实践
将心理测验及其解释结果应用于实际情境中,如 选拔、培训、心理咨询等,以支持个体的职业发 展和个人成长。
通过实测数据统计、专家评审等方 法,对测验题目的难度水平进行评 估,以保证测验质量。
03
心理测验的区分度分析
区分度概念的界定
区分度是指测验题目对被试心理 品质的鉴别能力。
区分度是衡量题目质量的主要指 标之一,也是编制心理测验的重
要环节。
区分度高的题目能够较好地区分 被试的心理品质,低区分度的题
《心理测量与评估》复习各章节复习重点精编版
《心理测量与评估》复习资料第一章绪论●典型行为测验:根据不同性格特征的典型行为为依据进行测验,用于测定个体符合什么样的典型特征。
●测量的要素:测量参照点、测量单位●心理测量概述:按规则给所参考对象的心理特性,在一定性质的量度系统,即量表上指定值的活动。
●心理评估概述:就是使用测验、行为观察、晤谈、个案资料研究和其他测评程序(如评定量表、问卷),为达到对个人及少数人(如某个家庭的成员)作出深入的心理评价,从而来进行收集和整合资料的活动。
心理评估是临床心理工作的重要组成部份。
●心理测验的基本功能:认识和鉴定个别差异的功能、描述性功能、诊断的功能、预测的功能、评价的功能;●如何正确看待心理测验:一是要认识到心理测验是心理学的重要研究方法,是决策的辅助工具;二是认识到测验作为研究方法与测量工具尚不完善。
第二章心理测量中的统计技术●常用集中量数:包括算数平均、中数、众数等。
集中量数是用来描述数据集中趋势的特征数量;●常用差异量数:用来描述数据离散程度的特征量数。
第三章测验到编制、实施与评分●练习效应:任何一个测验在第二次应用时,都会有练习效应而使得成绩有所提高。
●测验焦虑:指被试因接受测验而产生的一种忧虑和紧张情绪,它会影响测验结果的真实性。
●教练测验:指针对着测验内容与形式进行专门的教学和辅导。
●关于测验分数的解释:涉及两个问题:一是如何看待测验分数的意义;二是将测验分数的意义告诉被试及有关方面。
心理测验的结果分数,正如考试分数一样,只有对此加以解释和分析,才有意义。
分数并不代表一切,还需要结合你的具体实际进行观察。
参加测验不仅只是测量出一个分数,更要对结果进行有效的评价和专业解释。
对于不同的人而言,得到一个相同的测验结果分数,意义其实并不一样。
如果单纯获得自己的测验结果,而没有进一步的分析解释,那就不会有太多的意义。
其实,更应该明白,心理测验的结果分数并不是一个数值点,其实是一个分布范围。
在看自己的测验结果分数的时候,如果只拿到一个具体的数字,那么你就需要进一步索要分数的波动范围,以及详细的结果说明●测验编制的一般程序:1)确定测验目的2)拟定测验编制计划3)开发测验项目4)预测与项目分析5)合成测验6)测验的标准化7)测验质量的检验8)编写测验手册●测验标准化:指测验的内容、施测、评分及解释分数的规范化、一致性与科学性。
心理测量:测验题目的难度与难度分布控制
控制试卷难度分布是在控制题目难度的前提下进行的,它主要是通过控制不同难 度题目的比例来达到所需的难度分布。
选拔性测验 常模参照测验 标准参照测验
难、易题目所占比例应充分考虑选拔的比例
中等难度题目的比例要高, 而偏难偏易的题目比例要低
不同难度题目的比例应结合“目标”本身来确定
三、合理难度分布及其控制
二、难度的计算方法
二、难度的计算方法
(一)得分率法 得分率指所有被试在该题目上的平均得分占题目满分的百分比。 计算公式为:
二、难度的计算方法
的取值范围为[0,1] 的值越大,题目越容易;值越小,题目越难。
二、难度的计算方法
(二)极端分组法 根据测验总分排序 高低分组 高分组和低分组的得分率 两组得分率的均值
2.对试卷难度分布的控制
控制试卷难度分布是在控制题目难度的前提下进行的,它主要是通过控制不同难 度题目的比例来达到所需的难度分布。
共同学习,未来可期
3 难度对题目区分度的影响
题目过难或过易均会导致题目的区分度很低, 只有题目难度适中时才可能有较高的区分度。
三、合理难度分布及其控制
(二)合理难度及合理难度分布
取决于测验的目的及所测特质的性质等多方面因素。 在常模参照测验中,对所有被试而言,合理项目难度为0.5左右,
分布范围应控制在0.3至0.7之间。 在标准参照测验中,对于恰好合格的被试而言。难度为0.5左右,
过难
过易
三、合理难度分布及其控制
2 难度对测验分数离散程度的影响
测验过难或过易,被试间的差异较小,即测验分数的离散程度很小。 只有当测验趋近中等难度时,测验分数分布范围较广,离散程度才会较大。 分数分布范围较广,测验信度较高,反之信度较低。 题目难度集中在0.5附近最佳,集中在两端最差。
第四章人力资源管理中的心理测量技术
第四章-人力资源管理中的心理测量技术一、心理测量的原理(一)心理测量和心理测验1、心理测量:是将人的智力、人格、兴趣、情绪等心理特征按一定规则表示成数字,并赋予这些数字一定解释的过程。
一、心理测量的原理(一)心理测量和心理测验2、心理测验:是心理测量的工具。
测验是测量一个行为样本的系统程序。
(1)标准化心理测验。
按照严格科学程序编制和使用具有统一尺度并对误差做严格控制的测验。
优点,减少主观因素影响,测量准确客观;标准统一,便于对不同的人比较;同一测验可反复使用。
(2)人事测量:是心理测量技术在人事管理领域中的应用(招聘、考核、晋升、培训等)。
一、心理测量的原理(二)心理测验类型1、按测验内容:(1)能力测验:实际能力和潜在能力。
1)成就测验:判断个人在某方面所表现的实际能力。
2)性向测验:判断个人将来有可能表现出来的潜在能力。
(2)人格测验:性格、气质、兴趣、态度、情绪、动机和价值观等,两种方式:限定答案客观式自陈量表和不限定答案主观式投射测验。
(二)心理测验类型2、按测验方式:纸笔、操作、口头和情境测验3、按同时施测人数:个别测验和团体测验4、按测验目的:描述性、诊断性和预测性测验5、按测验领域:教育测验、职业测验、临床测验6、按测验解释:常模参照测验和标准参照测验7、按测验难度:速度测验、难度测验8、按测验要求:选优性测验、典型性测验一、心理测量的原理(三)心理测验的技术标准1、信度:稳定性或可信性,同一心理测量中几次测量结果一致性。
2、效度:指一个测验的测验结果与被测验者行为公认标准之间相关程度。
内容关联效度、效标关联效度、构想关联效度等。
一、心理测量的原理(H)心理测验的技术标准3、难度:指测验的各个题目的难易程度和区分度。
4、标准化和常模(1)标准化步骤。
1)选定所需要的测验题;2)抽样选定标准化样本进行测试;3)施测程序标准化;4)从测试结果中建立常模。
(2)常模:该测试标准化样本的平均数。
难度、区分度、信度和效度的一般说明
其中:XH为高分组的平均得分(前27%),XL为低分组的平均得分(后27%)o (2)客观性试题的难度
A、基本公式法:P=1-R∕N 其中:R为答对人数,N为全体人数。 B极端分组法:P=I-(PH+PL)/2
其中:PH=RH/n叫高分组通过率,RH为高分组答对人数,n为总人数的前27%。PL=RL∕n叫低分组通过率,RL 为低分组答对人数。
②客观性试题:D=PH-PL,或D=RH-RL/n
③一般也可以用D=XH—XL/X满计算。
其中:XH为高分组某试题的平均分,XL为低分组某试题的平均分,X满为该题的满分。
三、信度
信度是指测得结果的一致性或稳定性,稳定性越大,意味着测评结果越可靠。相反,如果用某套试题对同一应 试者先后进行两次测试,结果第一次得80分,第二次得50分,结果的可靠性就值得怀疑了。
二、区分度 区分度是区分应试者能力水平高低的指标。试题区分度高,可以拉开不同水平应试者分数的距离,使高水平者 得高分,低水平者得低分。而区分度低则反映不出不同应试者的水平差异。 试题的区分度与试题的难度直接相关。通常来说,中等难度的试题区分度较大。另外,试题的区分度也与应试 者的水平密切相关,试题难度只有等于或略低于应试者的实际能力,其区分性能才能充分显现出来。 1、区分度指标的评价 -1.00≤D≤+1.00,区分度指数越高,试题的区分度就越强。一般认为,区分度指数高于0.3,试题便可以被接受。
信度通常以两次测评结果的相关系数来表示。相关系数为1,表明测评工具如试卷完全可靠;相关系数为0,则表 明该试卷完全不可靠。一般来说,要求信度在0.7以上。
1、评价信度的方法
(1)再测信度。它是指将同一试卷在相同的条件下,对同一组考生先后实施两次,两次测评结果的相关系数。
第四章 测量信度
五、评分者信度
评分者信度(Scorer
Reliability)指的是
多个评分者给同一批被试作答情况进行评分
的一致性程度。它主要用于主观性作品的评
价过程中,如论述题评分、作文题评分、歌
唱比赛的评分、设计作品的评分等。
评分者信度的计算方法
1、当评分者人数为2时,评分者信度等于两者 评分的相关系数(积差相关或等级相关)。 2、当评分者人数大于2时,评分者信度采用肯 德尔和谐系数计算。 W = 12 [∑R2i –(∑Ri)2 / N] / [ K2 ( N3–N )] 其中K是评分者人数,N是被评的对象数,Ri 是第i个被评对象的被评等级之和。
采用复本信度的条件
要构造出2份或2份以上真正平行的测验。 被试有条件接受两次以上的测验。
复本信度的优缺点
优点:
1、减少了记忆效应和练习效应。 2、适用于追踪研究的多次测量。 3、减少了辅导的可能性。
缺点:
1、编制复本测验的难度较大。 2、被试要有接受两次以上测验的条件和意愿。
三、分半信度
第一节 信度的定义
一、什么是信度
信度指测量结果的稳定性、一致性程度。一个好的 测量工具必须具备好的信度,也就是说它多次测量 的结果应该相对的稳定、一致。
信度反映的是测量中随机误差的大小,随机误差小, 则信度高;反之,则信度低。
测验题目本身并不能提供信度的估计值,信度统计 来自于测验分数。也就是说,在检验信度之前必须 要实施心理测验,以获得测验分数。
遗忘和练习的效果基本相互抵消;(3)在两次施测 的间隔期内,被试所要测查的心理特质没有获得更多 的学习和训练;(4)被试有条件接受两次相同的测 验,取决于时间、经费等因素。
心理学专业综合考试大纲(科目347北师大版)
2014年专业学位研究生入学考试《心理学专业综合》考试科目命题指导意见一、考试性质《心理学专业综合》是2014年应用心理硕士(MAP)专业学位研究生入学考试的科目之一。
《心理学专业综合》考试要力求反映考生的基本素质和综合能力,选拔具有发展潜力的优秀人才入学,为国家培养从事某一特定职业所必需的心理学技能的应用型高级专业人才,以解决都市压力、公共安全、灾害救助、危机防御等方面的实际问题。
二、考试要求测试考生对于心理学专业的基本概念、基础知识的掌握情况和运用能力。
三、考试内容第一章心理学导论一、心理学概述(一)心理学的研究对象(二)心理学的研究方法1.观察法2.实验法3.测验法4.调查法5.个案法(三)主要的心理学流派1.构造主义心理学2.机能主义心理学 3.行为主义心理学 14.格式塔学心理学 5.精神分析 6.人本主义心理学7.认知心理学二、心理和行为的生物学基础(一)神经系统的基本结构1.神经元2.突触3.周围神经系统和中枢神经系统(二)大脑皮层及其机能1.大脑皮层感觉区及其机能2.大脑皮层运动区及其机能3.大脑皮层言语区及其机能4.大脑两半球单侧化优势(三)脑机能学说1.定位说2.整体说3.机能系统说4.机能模块说三、意识和注意(一)意识与无意识1.意识的含义2.意识的种类3.意识的功能4.睡眠与梦(二)注意概述1.注意的含义 22.注意的功能3.注意的种类(三)注意的生理机制和外部表现1.注意的生理机制2.注意的外部表现(四)注意的品质1.注意广度2.注意稳定性3.注意分配4.注意转移(五)注意的认知理论1.注意选择的认知理论 2.注意分配的认知理论四、感觉(一)感觉概述1.感觉的含义2.感觉的种类3.感觉测量4.感觉现象(二)视觉1.视觉的含义2.视觉现象3.视觉的生理基础4.视觉理论(三)听觉1.听觉的含义2.听觉现象3.听觉的生理基础 34.听觉理论(四)其他感觉五、知觉(一)知觉概述1.知觉的含义2.知觉的组织原则(二)知觉的特征1.知觉选择性2.知觉整体性3.知觉理解性4.知觉恒常性(三)空间知觉1.形状知觉2.大小知觉3.深度知觉4.方位知觉(四)时间知觉和运动知觉1.时间知觉2.运动知觉(五)知觉的信息加工1.自下而上加工和自上而下加工2.模式识别理论(六)错觉1.错觉的含义2.错觉的种类 3.错觉产生的原因 4六、记忆(一)记忆概述1.记忆的含义2.记忆的过程3.记忆的种类4.记忆的神经生理机制(二)感觉记忆1.感觉记忆的含义2.感觉记忆的信息加工3.感觉记忆的特征(三)短时记忆与工作记忆1.短时记忆的含义 2.短时记忆的信息加工 3.短时记忆信息的存储与提取4.短时记忆的特征5.工作记忆(四)长时记忆1.长时记忆的含义2.长时记忆的信息加工3.长时记忆的信息存储与提取4.长时记忆的特征(五)遗忘1.遗忘的含义2.遗忘曲线3.遗忘理论4.影响遗忘的因素七、思维(一)思维概述 51.思维的含义2.思维的特征3.思维的种类4..思维的过程(二)概念1.概念的含义2.概念的种类3.概念的形成4.概念的掌握(三)推理1.推理的含义2.推理的种类(四)问题解决1.问题解决的含义 2.问题解决的思维过程 3.问题解决的策略 4.影响问题解决的因素(五)创造性思维1.创造性思维的含义2.创造性思维的特征3.创造性思维的基本过程4.影响创造性思维的因素(六)表象1.表象的含义2.表象的特征3.表象的种类4.表象理论(七)想象1.想象的含义2.想象的种类 63.想象的功能八、言语(一)言语概述1.言语的含义2.言语的功能3.言语的种类(二)言语活动的中枢机制1.言语运动中枢2.言语听觉中枢3.言语视觉中枢(三)言语感知和理解1.言语感知 2.言语理解 3.句子理解 4.语篇理解 5.影响言语理解的因素九、情绪和情感(一)情绪和情感概述1.情绪和情感的含义2.情绪和情感的功能3.情绪和情感的关系(二)情绪和情感的种类1.情绪的种类2.情感的种类(三)表情1.表情的含义 2.表情的种类 7(四)情绪的脑中枢机制(五)情绪理论 1.早期的情绪理论2.情绪的认知理论十、动机、需要与意志(一)动机概述1.动机的含义2.动机的功能3.生物动机和社会动机4.动机与行为效率的关系5.动机的理论(二)需要1.需要的含义2.需要的种类3.需要的层次理论(三)意志1.意志的含义2.意志的特征3.意志行动过程4.意志行动中的动机冲突 5.意志的品质十一、能力(一)能力概述1.能力的含义2.能力与知识、技能的关系3.能力、才能与天才 8(二)能力的种类和结构1.能力的种类2.能力的结构(三)智力理论1.智力因素说2.智力结构理论3.智力的信息加工理论(四)智力发展的差异1.智力发展的一般趋势 2.智力发展的差异性 3.影响智力发展的因素十二、人格(一)人格概述1.人格的含义2.人格的特征(二)人格理论1.人格特质理论 2.人格类型理论 3.精神分析人格理论4.人本主义人格理论(三)气质1.气质的含义2.气质的类型3.气质的理论(四)性格1.性格的含义 2.性格的特征 3.性格的类型 94.性格与气质的关系5.认知风格(五)影响人格形成与发展的因素参考书目:《普通心理学(修订版)》.彭聃龄著.北京师范大学出版社.2004.《心理学与生活(16版)》.格里格,津巴多著.王垒,王甦等译,人民邮电出版社.2003.第二章现代心理与教育统计学一、描述统计(一)统计图表 1.统计图 2.统计表(二)集中量数1.算术平均数2.中数3.众数(三)差异量数1.离差与平均差2.方差与标准差3.变异系数(四)相对量数1.百分位数2.百分等级3.标准分数(五)相关量数1.积差相关2.等级相关 103.肯德尔等级相关4.点二列相关与二列相关5.φ相关二、推断统计(一)推断统计的数学基础1.概率2.正态分布3.二项分布t4.分布F5.分布6.样本平均数分布7.抽样原理与抽样方法(二)参数估计1.点估计、区间估计与标准误2.总体平均数的估计 3.标准差与方差的区间估计(三)假设检验1.假设检验的原理2.样本与总体平均数差异的检验3.两样本平均数差异的检验4.方差齐性的检验5.相关系数的显著性检验(四)方差分析1.方差分析的原理与基本过程2.完全随机设计的方差分析3.随机区组设计的方差分析4.协方差分析 5.多因素方差分析 116.事后检验(五)统计功效与效果量(六)一元线性回归分析1.一元线性回归方程的建立、检验及应用2.可化为一元线性回归的曲线方程(七)卡方检验1.拟合度检验2.独立性检验(八)非参数检验1.独立样本均值差异的非参数检验2.相关样本均值差异的非参数检验(九)多元统计分析初步1.多元线性回归分析2.主成分分析3.因素分析参考书目:《现代心理与教育统计学》.张厚粲,徐建平著.北京师范大学出版社.2004.《心理与行为科学统计》.甘怡群著.北京大学出版社.2005.《行为科学统计》.FrederickJ. Gravetter,Larry B. Wallnau著.王爱民,李悦译.中国轻工业出版社.2008.第三章心理测量学一、心理测量的基本理论(一)心理测量的基础1心理测量的基本概念.2心理测量的特征与分类.(二)经典测量理论 1经典测量理论模型. 12 2测量的信度与效度.信度的定义;信度系数的估计;信度的影响因素与改进。
试题的难度、区分度、信度和效度
试卷的难度、区分度、信度和效度一.试卷的难度(一)什么是难度难度是指试卷的难易程度,是评价考试的一个非常重要的一个指标。
一个题目,如果大部分考生都能答对,那么这个题目的难度就小;如果大部分考生都不能答对,那么这个题目的难度就大。
客观题难度计算公式:P(难度指数)=试卷答对人数/考生人数;主观题难度计算公式:P=试卷平均得分/试卷满分。
试卷难度计算公式:P=为平均分,K 为试卷满分值。
易、中、难的标准为:易:P≥0.7,中:0.4≤P≤0.69,难:P≤0.39; P值越大,难度越低,P值越小,难度越高。
一般来说,难度值平均在0.5最佳,难度值过高或过低,都会降低测验的信度。
(二)难度的计算(1)客观性试卷难度P(这时也称通过率)计算公式:P=k/N(k为答对该题的人数,N为参加测验的总人数)(2)主观性试卷难度P计算公式:P=X/M(X为试卷平均得分;M为试卷满分)(3)适用于主、客观试卷的计算公式:P=(PH +PL)/2(PH、PL分别为试卷针对高分组和低分组考生的难度值)步骤为:①将考生的总分由高至低排列;②从最高分开始向下取全部试卷的27%作为高分组;③从最低分开始向上取全部试卷的27%作为低分组;④计算。
(三)试卷难度的一般要求就高考来说,难度以适中为宜,单个试卷的难度以0.3--0.7之间为好,整卷以0.5--0.6之间为最佳。
一般将难度值大于和等于0.7的试卷定为容易题;大于0.4和小于0.7的定为中档题;小于和等于0.4的试卷定为难题。
命题时难度一般要按一定比例分配,如3:6:1或3:5:2。
二.试卷的区分度(一)什么是区分度区分度是指考试卷目对考生心理特征的区分能力。
区分度高的试卷能将不同水平的考生区分开来,水平高的考生得高分,水平低的考生得低分。
区分度高的1考试,优秀、一般、差三个层次的学生都有一定比例,如果某一分数区间学生相对集中,高分太多或不及格太多的考试,区分度则低。
(二)区分度的计算1.单个选择题目区分度的计算将全体考生总分从高到低排列,将总分最高的27%考生定为高分组,总分最低的27%考生定为低分组,分别计算两组考生在某道题目上的通过率,两个通过率之差就是这道题的区分度(又叫鉴别指数)。
心理测量:测验题目的区分度及其提高
二、区分度的计算方法
(一)相关系数法
2.积差相关:
适用于题目为多级计分题, 测验总得分(或效标分数)为连续变量
或
二、区分度的计算方法
(二)鉴别指数法 1 根据测验总分排序
2 高低分组
3 高分组和低分组的得分率
4 高分组的得分率减去低分组的得分率
二、区分度的计算方法
题目区分度的取值范围为 [-1, 1]
测验题目的区分度及其提高
目录
CONTENTS
1······区分度的定义 2······区分度的计算方法 3······区分度的评价标准及其提高
一、区分度的定义
是指题目的难易程度 区分度( discrimination )指题目对被试特质差异的区分能力。
若所有被试在某个题目上均答对或均答错,则此题目不能 区分不同特质的被试,即此题目无区分能力。
心理测量中通常将被试在某一题目上的得分与其测验总得分间的相关系数作为 题目区分度的指标。
二、区分度的计算方法
得分率法
01
极端分组法
02
二、区分度的计算方法
(一)相关系数法 通过计算被试在某一题目上的得分与测验总得分间的相关系数来计算该题目的区分度。
1.点二列相关: 适用于二值计分题,测验总得分为连续变量
三、区分度评价标准及其提高
(三)提高题目区分度的方法
01 控制好题目难度。
保证题目所测心理特质与全测验 02 所测心理特质的一致性。
03 题目的语言表述准确规范,题干及答案无歧义。
04 借助选项分析提供的信息对不良选项进行修改,以提高题目的区分能力。
共同学习,未来可期
01 当r=0时,题目不能区分出高低能力被试,D=0,该题目无区分能力 02 当r>0时,高能力者得高分、低能力者得低分,D>0,该题目积极的区分能力 03 当r<0时,高能力者得低分、低能力者得高分,D<0,该题目也有区分能力,
心理测量4 项目分析
注意事项
当测验用于选拔或诊断时,应该多选择难度 值接近录取率的项目。 测验为选择题时,难度值应大于随机猜测概 率水平。
难度等于概率水平,说明题目可能太难;或题意 不清,被试凭猜测作答。 难度(通过率)低于概率水平,说明题目有系统 偏差。 是非题难度值0.75时最合适,四选一题目0.63时 最合适。
16
鉴别指数的判断
因为高分组条目总得分上高于低分组,理论上他们每 个条目的通过率也要高于低分组。
D>0时,D越大,说明该条目区分两种水平(组)的 能力越强
D<0则反映高分组的得分反而低于低分组,说明该条 目有问题。
伊贝尔(L. Ebel, 1965)关于鉴别指数评价项目性能 的标准:
鉴别指数(D) 0.40以上 0.30~0.39 0.20~0.29 0.19及以下
11
测验的难度 测验的难度取决于组成测验项目的难度 通过观察测验分数的分布,可以进行直观检验。 如果测验难度适中,分数的分布应当接近常 态分布; 如果测验偏难,分布呈正偏态(图13-4,A) 如果测验偏容易,分布呈负偏态(图13-4,B) 测验偏难或偏容易时,可以通过增加或减少不同 难易程度的条目来解决。
公式:
rpq
Xp Xq St
pq
rpq 点二列相关系数 X p 为与二分变量通过组相对应的连续变量的平均数
X q 为与二分变量未通过组相对应的连续变量的平均数
St 为连续变量的标准差 p 通过组人数与总人数之比(通过率)
q 未通过组人数与总人数之比(未通过率)
举例(例9):
19
二列相关
适用于两个连续变量,但其中一个变量被人为分 成两类。
理论上最大区分度(以总分对半划分高、低分组时)
第四章 心理测验的难度与区分度
①增加选择题选择项的个数(一般不少于 四个) 。 ②增加干扰项的迷惑性。 ③控制存在猜测行为的总题量,以保证猜 测误差控制在较小范围。 ④如有特殊需要,还可采用警告、扣分等 方式控制被试的猜测行为。
心理测量学 江西师大心理与教育统计测量中心
第四章
心理测量的难度与区分度
4
第四节 选择题选项分析与修改
心理测量学
江西师大心理与教育统计测量中心
二、选项分析的方法及选项修改原则
2、对于正确答案
主要考察高分组和低分组被试在正确答案上 的选答率是否是正差,及这一差距是否足够大。 只有当高分组和低分组被试在正确答案上的选 答率是正差,且这一差距足够大时,这时题目 质量较佳。
心理测量学
江西师大心理与教育统计测量中心
二、选项分析的方法及选项修改原则
3、对于干扰项
考察高分组和低分组被试在干扰项上的选答率 是否是负差,及这一差距是否足够大。只有当 高分组和低分组被试在正确答案上的选答率是 负差,且这一距差足够大时,这时干扰项的设 置比较合理,否则干扰项设置不合理,应对干 扰项进行删除或修改。
心理测量学
江西师大心理与教育统计测量中心
第四章 项目分析
第四章
1
项目分析
第一节 项目的难度 第二节 项目的区分度 第三节 题目的猜测度与控制 第四节 选择题选项分析与修改
2
3
4
心理测量学
第四章
项目
1
第一节 项目的难度
心理测量学
P X / X max
一、难度的定义
难度定义
难度difficulty:指项目的难易程度,即就是 被试完成题目或项目任务时所遇到的困难程度 定量刻画被试作答一个题目所遇到的困难程度 的量数,就叫题目的难度系数,也常称为难度 值,用符号P表示。
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
以两端组被试得分率的均值为难度系数
P=(PH+PL)/2 ((12))两按从组被高人试分数的往分总下别分找占,,总将找人全出数体高的被分2试组7PPP%:HL者;::。题从由低高目分高低分难组组到分度被被低 往试试进高的的行找得得排,分分序找率率。出低分组 (3)分别计算高分组、低分组的被试在该题目上的平均得分。 (4)代入公式分别计算高分组和低分组被试在同一个题目上 的难度系数。
第四章 项目分析
第四章 项目分析
1
第一节 项目的难度
2 第二节 项目的区分度
3 第三节 题目的猜测度与控制
4 第四节 选择题选项分析与修改
第四章 项目
1
第一节 项目的难度
PX/Xmax
一、难度的定义
难度定义
难度difficulty:指项目的难易程度,即就是 被试完成题目或项目任务时所遇到的困难程度
其基本假设是测验得高分的被试即为高能力 被试,测验得低分的被试即为低能力被试。
1、相关系数法
(1)点二列相关法
1、相关系数法
(2)积差相关法
2、极端分组法(鉴别指数法)
基本思想:
3、题目区分度计算实例
例4-2 下表是随机抽取22名被试在某语文测验中四道题目的 得分情况,四题满分分别为1分、3分、5分和60分,其中第 4题为作文题,请计算四题的区分度。
难度系数 :p
定量刻画被试作答一个题目所遇到的困难程度 的量数,就叫题目的难度系数,也常称为难度
值,用符号P表示。
二、难度系数计算方法 P:题目难度 X拔:被试在某题目上 的平均得分
Xmax:该题目的满分
以全体被试得分率为难度系数
以全体被试通过率为难度系数
P=K/N
P:题目难度
K:答对人数 N:全体被试人数
是评价试题质量,筛选试题的主要指标与依据
区分度的分类
正区分(D>0)
称积极区分,指实际水平高的考生得了高分, 实际水平低的考生得了低分
负区分(D<0),
称消极区分,实际水平高的考生得了低分,实 际水平低的学生得了高分
零区分(D=0)
指实际水平高低与得分之间没有太大的关系, 呈现出零相关
Z值存在负值不易理解,因此做如下转换
难度Z值转换公式:Δ=13+4Z
Δ:第1题题目:Δ难=1度3+;4*1Z.0:4=由17p.1转6 换来的标准分数
思第考2题::ΔΔ=的13取+4值*0范.67围=1?5.68
第 13-题--:-2Δ5=13+4*0.39=14.56
第4题:Δ=13+4*0.25=14 第5题:Δ=13+4*(-0.25)=12 第6题:Δ=13+4*(-0.59)=9.64
(5)把 和 代入P=(PH+PL)/2 ,计算这个题目的难度系数。
难度计算实例
例4-1 下表是随机抽取22名被试在某数学测验中四道题目的得分情况,每 题的满分分别为1分、2分、3分和4分,请分析其难度。
哪道题最难?
三、难度系数变换
上述所得难度系数,不论是得分率还是失 分率,都属于顺序变量,不具有相等的单 位,因此,通过p值比较并不能客观指出题 目难度之间的差异大小 。
四、题目的难度分布
P的取值范围为:0≤P≤1 当P=0时,试题的实际困难程度最大(所有
的考生都得0分) 当P=l时,试题的实际难度最小(所有的考生
都全对)。
常模参照测验难度分布
要尽可能地区分被试的个别差异,测验结 果就尽可能拉开距离 。
P值尽量接近0.50 为宜
思考:P等于1或0时,以为着什么,是否还可以 区分被试?
难度等距转换实例
题号 1 2 3 4 5 6
答对率 0.15 0.25 0.35 0.40 0.60 0.70
难度Z值 1.04 0.67 0.39 0.25 -0.25 -0.84
难度差异 --
0.பைடு நூலகம்7 0.28 0.14 0.50 0.59
思考:
Z分数为负值时,说明 试题难还是容易?
难度等距转换公式
Eg:三个题目难度系数分别为0.5、0.6、0.7, 三个题目之间难度差是否相等?
• 可知第一题最难,第二题次之,第三题最容易 • 难度系数相差都是10%,但并不代表第一题 与
第二题难度只差等于第二题与第三题难度之差
难度系数变换办法
假设每个试题所要测量的潜在特质或能力是呈正 态分布的,然后就可以根据正态分布曲线,将试题 的难度系数P作为正态曲线下的概率面积,转换 成具有相等单位的等距量表,即Z分数(标准分数) 量表。
实验表明:
所有题目的难度系数分布在0.30至0.70之间, 并且整个测验的平均难度系数在0.50左右时, 测验对被试有较大的鉴别力,测验分数也 接近正态分布
标准参照测验难度分布
目的是检验被试是否已达到教学目标规定的掌握程度 教师期望学生都能够在教学之后掌握所有的教学内容 通过率达到1.00时,所有学生都掌握了教学内容。 如果教学是有效的,多数试题的难度系数P值都会很大, 难度系数反映的是教学质量的好坏的成分多于试题质量的
好坏的成分 不同测验,目的不同,难度值不同。
奥林匹克测验?选择补习功课的学生?
第四章 心理测量的难度与区分度
2 第二节 项目的区分度
一、区分度的定义
定义:
指测验对考生实际水平的区分程度或测验对被 试特质差异的区分能力,用符号D表示。
具有良好区分度的测验,实际水平高的应该得高 分,实际水平低的应该得低分。所以,区分度又 叫鉴别力。
二、区分度的计算
1、相关系数法
点二列相关 积差相关
2、用极端分组法计算区分度:
D表示区分度 PH表示高分组的难度 PL表示低分组的难度
D=PH—PL
1、相关系数法
该方法的基本思想是,若题目有好的区分度, 则高能力的被试在该题上应得高分,低能力 被试应得低分,即被试在题目上的得分应与 测验总分相一致。
3、题目区分度计算实例
三、区分度的评价标准
1965年美国测量学家伊贝尔根据长期经验提出 如下标准:
四、区分度与测验信度、难度的关系
区分度与信度关系
信度 区分度
0.949 0.50
0.915 0.40
0.84 0.30
0.63 0.20
0.42 0.16
0.00 0.1225
此表是1962年R.L.艾伯发表的,这里是假定全部试题的 难度均为0.50时所预测的信度系数。里面的区分度指的 是平均值。可见,要想达到理想的测验信度,提高区分度 是一个好方法。