教育科学研究方法:测量方法
合集下载
相关主题
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
(三)外部效度
当研究者想把某个特定研究的结论应用到研究中所 使用的特定人群和环境之外的人群或环境时,需要 对结果进行概化。 科学的全部思想都建立在概化思想的基础上。
1。你进行过选民登记吗? 2。你参加过投票吗? 3。你为政治运动捐过款吗? 4。你为政治运动工作过吗? 5。你自己参加过竞选议员吗?
二、李克特量表(Likert Scaling)
指数的一种特殊形式。1932年美国社会心理 学家李克特在原有指数形式上改进完成的。 由一组对某事物的态度或看法的陈述组成, 回答者对这些陈述的回答被分成“非常同意、 同意、不知道、不同意、非常不同意”五类, 或者“赞成、比较赞成、无所谓、比较反对、 反对”五类。 能够更清楚地反映人们在态度上的差别。 提出了帮助研究者从量表中消除有问题的项 目的方法。 教育研究中用得最多的一种量表形式。
3。折半信度或内部一致性信度:将每个人 的测量情况分成两半(常常分为奇数题和偶 数题),并发表计分,然后计算这两组分数 之间的相关系数。 全部测验的信度可用: 斯皮尔曼-布朗公式:信度=2*一半测验的信 度/(1+一半测验的信度) KR20、KR21或ą系数。
信度的标准
对于用于研究目的的测验来说,信度系数应 该至少等于0.70,并最好比它更高。
4。专家标记出没有被任何题目所测量的目 标变量; 5。专家评价测验根据形式的恰当性; 6。研究者根据专家意见重新修改,并将修 改后的测验交给专家; 7。如此反复多次,直到专家对测验中的所 有题目都没有疑问为止。
准则效度
也称实用效度或效标关联效度,指用新编测 验所得到的分数与其他工具(常常称为效标) 所得到分数之间的关系。 效标是一个判断标准,是指能够用来检验某 一工具上的分数的第二工具。 如学业能力测验与学年平均分 自尊问卷与老师对学生的自尊评价
在指数中,每一个具体陈述在对概念的测量 中具有同等地位,占有同等的比重,即它们 在反映人们的态度方面是“等值的”;彼此 间不存在特定的顺序结构。
表中每个陈述所表达的态度方向与记分的方 向应该保持一致。
贝利生育意愿指数
同意 不同意
1。结婚的主要原因之一是要生孩子。 2。只生一个是错误的,因为独生子女是在孤独中成长,并且由于五 兄弟姐妹而忧郁。 3。生育孩子是一个妇女所能具有的最深刻的经历之一。 4。两种性别的孩子至少都有一个比仅有一种性别的孩子好。 5。没有孩子的妇女决不会感到完全满足。 6。男人直到他业已证明自己成为了孩子的父亲时,才算是“真正的男 人”。 7。未结婚的、或者结婚了而没有孩子的男人可能是同性恋者。 1 1 0 0 1 1 1 0 0 0 1 1 0 0
定比测量
等比测量或比例测量,具有绝对零点,数据 可进行加减运算,还能够进行乘除运算。 如收入、年龄、出生率等
测量层次不同,数据的数学特征不同,采用 的统计方法不同。 尽可能对教育现象进行高层次测量,因为高 层次测量包含的信息更多,而且高层次测量 的结果容易转化为低层次的测量结果,反之 则不行。
第二节
指数与量表
一、指数和量表的概念 二、李克特量表 三、鲍格达斯社会距离量表 四、语义差异量表
一、指数和量表的概念
对概念的复合测量可以有两种主要的方式:指数 (index)和量表(scale)。 在教育研究中,这种复合测量可以将多项指标概括 为一个分数,因而可以有效地缩减资料数量,并有 效地区分出人们在这些概念或态度上的程度差别。 1。指数 一个指数就是由多个不同的回答所构成的一个简单 累加的分数。 它是由一组有关事物的态度或看法的陈述构成,回 答者发表对这些陈述同意或不同意的意见,然后按 照某种标准将回答在全部陈述上的得分加总,就得 到了该回答者对这一事物态度量化结果。
测量方法
第一节 第二节 第三节 测量的概念与层次 指数与量表 效度与信度
第一节
测量的概念与层次
一、测量的定义 二、测量的层次 三、测验的定义
一、测量的定义
测量就是依据某种法则给事物分派数字。 ——史蒂文斯 测量就是根据一定的法则,将某种事物或现 象所具有的属性或特征用数字或符号表示出 来的过程。 测量的作用在于确定一个特定分析单位的特 定属性的类别或水平。
例:请你对下列看法发表意见
1。婚事应该尽量办得简单一些
2。结婚是人生大事,婚事应该办 得隆重、热闹、花再多钱也值得 3。就是有钱,婚事也不应该大操 大办 4。为了不让别人笑话,就是借钱 也要把婚事办得像个样子。
非常同意 同意 无所谓 不同意 很不同意
第三节 测量的信度与效度
表面效度
也称内容效度、内容关联效度或逻辑效度,指测量 的内容和形式或测量指标与测量目标之间的适合性 和逻辑相符性。 通常由专家来判断测验的内容和形式与所要测量的 变量和被试样本的定义的一致性程度。 1。研究者在一张纸上写出他想测量的变量的定义; 2。将定义、编制好的测验和未来样本的描述交给一 个或几个专家; 3。专家标记出没有测量到1个或几个目标变量的题 目;
二、测量的层次
1定类测量 类别测量或定名测量,是一种分类体系,即将研 究对象的不同属性或特征加以区分,标以不同的 名称或符号,确定其类别。如性别。 数学特征是等于或不等于,测量层次最低 所分类别必须既具有穷尽性,又具有互斥性。 对称性,指甲对乙的关系也就是乙对甲的 关系 传递性,指的是如果甲与乙同类,而乙与丙同类, 那么甲一定与丙也同类。
练习
如何解释内部效度与工具效度之间的区别?
练习
在下面每种情况中,存在哪种影响内部效度因素? 1。教实验英语课程的老师和教常规英语的老师都 对各自的学生进行了前测和后测。 2。志愿辅导3年级学生阅读的8年级学生与那些没 有参与辅导活动的比较组的学生相比,在他们自己 的阅读分数上表现出了更大的提高。 3。某经济落后地区一所学校的学习成绩最差的10% 的学生,被选来参加一个内容丰富的特殊学习计划。 该计划包括特殊的游戏、额外的资料、特别的快餐、 特别彩印的资料和新课本等。在计划实施6个月后, 学生们在成就测验上的分数明显提高。
(二)内部效度
内部效度指因变量的测量差异与自变量有直 接关系,不是由某些其他偶然变量引起的。 如在高中生中,接受探究式教学的人在批判 性思维测验上比那些接受讲授式教学的人的 平均得分更高。那么得分上的这种差异是否 是由方法上的差异造成的呢?(学生、课程、 教师)
影响内部效度的因素
1。被试特征:选择偏向,如年龄、力量、成熟 度、性别、种族、协调性、词汇量、速度、智力、 宗教信仰、政治信仰等,几乎无穷尽。 2。被试的缺失:丢失被试。因此,研究的实际 样本并不是所以被挑选到的被试,而仅仅是那些 我们能够从他们那里得到数据的人。 3。研究场所:地点因素 的影响 4。研究工具的使用: 1)工具的耗损:工具特性的变化,如允许对经 过做不同解释、疲劳等 2)数据收集者特征:性别、年龄、语言模式 3)数据搜集者偏见:无意识地歪曲数据
效度是研究者基于其所收集到的信息所做出 的具体推论的恰当性、有意义性和有用性。 恰当性指推论应该是与研究目的相关的。 有意义性指推论说明了以某种工具所获得的 信息的一些意义。 有用性指推论能够帮助研究者做出与其想要 发现东西的相关程度。 测量效度有3种类型:表面效度、准则效度和 构造效度。
5。测验:警觉与努力、练习 6。个人经历:意外事件的干扰 7。成熟:被试的改变是由事件流逝引起的 8。被试的态度:被试看待研究以及参与研究的方 式 9。回归:一般说,如果一组被试因为在前测中不 寻常的低(或高)成绩蓓挑选出来的,那么在随后 的测验中,他们将得到更接近于Βιβλιοθήκη Baidu均数的分数,而 无论在者期间发生了什么事情。 10。操作:分派不同个体操作不同的方法;一些人 对一种方法有偏爱。
分辩力的计算方法
1。根据受测对象的总分排序; 2。取总分最高的25%和总分最低的25%的人, 计算这两个部分人在每条陈述上的平均得分; 3。将这两个平均得分相减,所得的差就是这 条陈述的分辨力系数。 4。分辨力系数越大,分辨力越高; 5。删除分辨力系数为负数的陈述; 6。删除分辨力系数小者。
测量的四个要素
1测量的客体 即测量的对象,“测量谁”? 2测量的内容 即测量客体的某种属性或特征,“测量什么”? 3测量的法则 怎么测量? 即用数字或符号表达事物各种属性或特征的操作 规则, 或是某种具体的操作程序和区分不同特征和属性 的标准 4数字或符号 即用来表示测量结果的工具,“如何表示”?
李克特量表的编制程序
1。围绕要测量的态度或主题,以赞成或反对的 方式写出与之相关的看法或陈述若干条(一般为 20—30条)。对每个陈述都给予五个答案,并根 据赞成或反对的方向分别赋以1、2、3、4、5分。 2。在所要测量的总体中选择一部分对象(一般 不少于20人)进行试测。 3。统计每位受测者在每条陈述上的得分以及每 人在全部陈述上的总得分。 4。计算每一陈述的分辩力,删除分辩力不高的 陈述,保留分辩力高的陈述,形成正式量表。
定序测量
等级测量或顺序测量,按照某种特征或标准 将对象区分为强度、程度或等级不同的序列。 如名次,文化程度等。 数学特征是大于或小于 具有对称性(类别区分)和传递性 还具有不对称性 数字只单纯表示大小
定距测量
等距测量或区间测量,既可以区分事物或现象 之间的不同类别、不同等级,还能够确定它们 之间不同等级的间隔距离和数量差别。如智商, 出生年份,温度等。 它没有绝对零点。 数据可进行加减运算
一、信度 二、效度 三、内部效度
一、信度
信度(reliability)即可靠性,或一致性、稳 定性,指采取同样的方法对同一对象重复进行测 量时,其所得结果(分数)相一致的程度。 大部分信度指标都以相关系数(r)表示。 1。再测信度:间隔一定的时间对同一组被试两 次施测同一个测验,所得分数之间的相关系数。 2。复本信度:研究者在同一时间内,用同一工 具的两种不同但是等价的形式对同一组被试施测, 所得分数之间的相关系数。
构造效度
也称构想关联效度,是指所获得的全部证据 与理论上的预测一致的程度。 1。清晰地定义所测量的变量; 2。基于某种潜在的理论,形成有关具有“许 多”或“很少”的变量值的人,在某种特定 情景中将如何表现的假设; 3。对假设进行逻辑和实证的检验。 如“诚实性”测验与拾金不昧 如“婚姻满意度”测验与主动承担家务
二、效度(validity)
(一)工具(测量)效度 (二)内部效度 (三)外部效度
(一)工具(测量)效度
效度也称测量的有效度或准确度,是指测量 工具或测量手段能够准确测量出所要测量的 变量的程度,或者说能够准确、真实地度量 事物属性的程度。 效度指的是测量标准或所用的指标能够如实 反映某一概念真正含义的程度。
三、测验的定义
测验是测量一个行为样本的一种程序。 1。测验所测量的是行为,是被测者对测验 题目所做出的反应,并不是直接测量了被测 者本身的某种属性。 2。一个测验所包含的只是全部这类题目的 一个样本。 3。测验是一种程序。
练习
对人们的婚姻状况、受教育年限、学术水平 的测量属于哪一层次的测量?
8。妇女的首要职责是做母亲,只有在不影响其母亲职责时,才谈得上
她的事业。 9。没有孩子的夫妇实在可怜。 1 1 0 0
2。量表
一个量表是一种具有结构强度顺序的复合测 量,即全部陈述或项目都是按照一定的结构 顺序来安排,以反映出所测量的概念或态度 具有的各种不同的程度。
政治参与程度量表
是的 不是的