测量及量表设计
合集下载
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
如做数学考试,考题从常识上看是数学知识,而不是别的知识。如果经济学考试试卷中有很 复杂的数学运算,那么试卷的表面效度就不够好,到底是考数学呢?还是考经济学呢?
内容效度是指测量在多大程度上涵盖了被测量概念的全部内涵,测量工具代表概念定义 的内容越多,内容效度就越高。凭经验判断。
如测量学生的英语四级水平,按大纲要求,不能超,也不能过于简单。 例:对餐馆的形象测评,应当是餐馆全面的形象,包括硬件、软件环境、人等。
度
度
致
性
表内 准 构 面容 则 建 效效 效 效 度度 度 度
信度
信度()是指在测量中可以避免随机误差,从而提供前后一致的数据的程度。 信度可用不同时间重复测量的结果或不同测量方法所给出的结果之间的一致性来测量。 具体方法有: 重测信度() 复本信度( ) 内部一致性( )
信度的检验
非常
非常
不同意 不同意 不一定 同意 同意
哈佛是美国最高学府
12 3 4 5
哈佛经济系是全美最好的 1 2 3 4 5
非中性描述
语义差异量表
语义差异量表( )是由一组意义相反的词组成的评价量表。例如:
请从以下几个方面对某学院学生作出评价
012345
传统
+-+-+-+-+-+ 前卫
保守
+-+-+-+-+-+ 开放
(哪一个更好?)
例:如何测评学生的学习态度?如何测评学生的综合表现?
从测量过程来考虑:包括概念的形成、组成性定义、操作性定义、量表。 “学习态度”涉及可观察的方面包括考勤、作业完成情况、回答问题情况、笔记等等。 “综合表现”涉及多方面,德育量化表。
测量尺度
定类尺度( ) 定序尺度( ) 定距尺度( ) 定比尺度( )
这里完备性和排他性指的是什么?
定序尺度
定序尺度的数字不仅代表类别,而且还表示按某种特征或属性排列的高低、大小和先后顺序。 必须注意,这一尺度的间距不能准确代表其测量的特征量的间距长短。 对于定序变量,可计算其众数、中位数、但不能进行加、减、乘、除等运算。
定序变量,举类似的例子
在本次运动会中,经管系获得男子团体第2名,女子团体第1名,总排名第2。 在本次参加测试的10个同学中,有2个同学并列第4名,3个同学并列第5,A同学获得第7名。
大气压下水的沸点定义为摄氏100度,中间等分来标定摄氏温度。
例 :品牌忠诚度的测量
1. 概念:对某品牌心理及行为的偏向性。 2. 定义:对某种品牌相对于同类其他品牌的偏好程度。 3. 操作性定义:(1)一年内重复购买的次数;(2)一年内在该品牌上消费量;(3)一年
内该品牌消费量在同类物品中占的百分比。 4. “尺子”:问卷。
重测信度,是用同一测量工具在不同的时间对同一群受试者前后测量两次,然后计算两次测 量分数的相关系数,相关系数越大说明两次测量的一致性越高。相隔的时间不应该太长。
复本信度,是用两个完全等值的(平行的)复本对同一群受试者进行测试,计算两种复本测 量分数的相关系数,相关系数越大说明两个复本构成带来的变异越小。如考试中使用的A、 B卷。
定距尺度
定距尺度不仅具备定类和定序尺度的所有功能,而且还要求尺度上间距代表所测量特征量的 间距。
对于定距变量,除了计算其众数、中位数、均数外,还可以进行加减运算,但相乘或除却没 有意义,因为这类尺度的零点是人为规定的。
例如:考试分数、温度等。
例:托福评分规则 (人为规定零点)
听力50个题目,一共计68分。错第1个题目扣2分,以后每个题目扣一分。 语法40个题目,一共计67分,错第1个题目扣3分,错第2个题目扣2分,以后每个1分。 阅读50个题目。一共计68分,错第1个扣2分,以后每个1分。
定距变量,举类似的例子
请对食堂菜品作出评价,1表示很不满意,5表示很满意。如果态度不是很极端,选择中间的 值。
质量 1 2
3
4
5
价格 1 2
3
4
5
定比尺度
定比尺度( )不仅具备前三种尺度的所有功能,而且还有自然零点,因此可以进行加减乘 除运算。
例:体重、年龄、高度、面积、距离、回报率、时间间隔等等。
教师的授课水平 本院老师的授课水平 客座教授的授课水平 课程设置的合理性
教务人员的服务水平 教学设施的水平 机房的计算机数量 机房上网速度
中性描述
非常不好
1 1 1 1
1 1
不太好
一般
比较好
非常好
2
3
4
5
2
3
4
5
2
3
4
5
2
3
4
5
2
3
4
5
2
3
4
5
量表
量表( )是美国社会心理学家(. )于1932年在原有的总加量表基础上改进而成。其形式如 下:
连续评分量表 列举评分量表
Likert量表 语义差异量表 中心量表
成对比较
口味测试
软饮料的盲测只能代表个人对比较对象的偏好,其结果并不能代表市场表现的好坏。
用排序量表测量啤酒品牌的偏好
啤酒品牌偏好排序
啤酒品牌 1、青岛 2、燕京 3、雪花 4、哈尔滨 5、珠江
偏好排序 3 1 4 2 5
用固定总数量表测量香皂各属性的重要性
三个细分市场测量平均值
项目 柔和度 泡沫 收缩 价格 芳香 包装 湿润 清洁能力 总得分
市场1 8 2 3 53 9 7 5 13
100
市场2 2 4 9 17 0 5 3 60
100
市场3 4 17 7 9 19 9 20 15
100
连续评分量表
连续评分量表用一条直线上的位置来表示调查对象的打分,其形式如下:
1. 级别数 2. 平衡 非平衡 3. 奇数/偶数级别 4. 强制 非强制 5. 措辞描述 6. 形式
一般 5~9级. 一般用平衡式. 如果存在中性回答,用奇数量表. 对于有调查对象没有意见的情形,用非强制性量表。 描述尽可能靠近要选择的答案类别. 尝试多种,选个最好的.
测量误差
M测量值,A实际值,E误差
驯从
+-+-+-+-+-+ 叛逆
善于动手 +-+-+-+-+-+ 善于动嘴
认真务实 +-+-+-+-+-+ 好高骛远
中心量表 语义差异量表的变通形式。例如:
+5 +4 +3 +2 +1 质量 -1 -2 -3 -4 -5
+5 +4 +3 +2 +1 服务 -1 -2 -3 -4 -5
设计量表需要考虑的问题
无
4. 经济学的考卷有一些主观题,不同的老师批改。
无
有
提高信度的办法
严格遵循科学、客观和中立的原则; 测量工具的一致性; 问卷的概念、描述、格式、印刷清晰传达,不产生歧义。为此,要选择合适的测量工具,
尽可能利用成熟的测量指标或方法;事先进行探索性研究和预测试。 测量过程的一致性和稳定性; 提出明确的要求;必要的人员培训;良好的现场指导与监督。
在新秀中排名第一
他在每48分钟的效率得分为29.16分
在全联盟排第13位
定距
定类
定序
定序
定距
测量技术
营销中常用的测量技术通常可分为两类: 比较性方法:根据不同对象的比较获得某一种特征的相对值 非比较方法:对每个对象进行独立测量
比较测量
测 量 技 术
非比较测量
成对比较 排序量表 固定总数量表 Q分类法
例:通过购买意愿预测将来的购买量。(预测效度)
构建效度 测量具有理论基础。(内在的经济规律) 例:水银温度计,利用了水银热胀冷缩的原理。 例:需求的价格弹性测量。 例:客户满意度的测量(客户满意度理论模型)。
汇报结束 谢谢大家!
请各位批评指正
44
测量误差( )由于概念的定义、界定、指标选择和实际测量方面的误差,导致变量测量值和真 实值之间的差距。
随机误差( )测量过程中不确定因素造成的误差,它是短暂的和不稳定的。 系统误差( )测量中产生的持续性误差,主要是测量设备和测量过程的缺陷产生的。
信度与效度
测量结果的Baidu Nhomakorabea估
信度
效度
重
复
内
测
本
在
信
信
一
测量及量表设计
1
学习内容
理解测量的基本概念和测量过程 掌握四种测量尺度的概念、特点 掌握基本的测量技术,会设计几种主要的量表 了解测量误差来源和分类 理解测量的信度和效度
测量及测量过程
测量的定义
按照特定的规则给待测对象的属性赋值,使之量化。
Q: 企业如何测量一个学生的基本数据?
性别、年龄、身高、体重、生源地、毕业院校、社会活动职务、英语成绩、笔试与 面试成绩……
折半信度(),测量内在一致性。只用一个测量工具对同一群受试者实施一次测量,但将奇 数题和偶数题分开计分(或者随机对半分割),再计算两部分试题分数之间的相关系数。
例:下面的测量有信度吗?为什么?
1. 用一把零点刻错了的钢尺测量。
有
2. 用一把橡皮筋做成的尺子测量。
3. 用一个失去弹性的弹簧秤测量。
效度
效度()指的是测量工具和过程能够避免随机误差和系统误差的程度。它反映了所测量的东 西是不是真正要测量的。
信度好是效度好的必要条件,但不是充分条件,即有效的测量数据必须是可信的,但可信的 测量数据不一定有效。
通常情况下效度不高的主要原因: 设计方面的问题,调查的并不是所要研究的问题。 回答者有意(或无意)回答错误。
请问您如何给当代商城的购物环境打分?
最差
最好
0
10
可以画出刻度,直观,但转化成数据麻烦
列举评分量表
请您对以下几方面的质量进行评价,请用1至5分表示您的评价。1分表示非常不好,5分表示 非常好。如果您的态度没有那么极端,请用1和5之间的其他数字来表示。请注意,我们这里 指的是各个因素的整体情况,而不是针对某个老师或某个课程。(请您认真为每个因素打分, 因为这些因素对我们的研究都非常重要,谢谢)
测量过程是从抽象概念到形成度量“尺子”的过程。 概念的形成 概念的界定(组成性定义) 概念的可操作化(操作性定义) 量表的定制
例 :温度的测量
1. 温度概念:区分冷热。 2. 温度的定义:物体的冷热程度的物理量; 3. 温度的操作性定义:根据热胀冷缩的原理,用标准物体长度的变化来表
征温度; 4. 温度计定制:把水银柱在标准大气压下水的冰点定义为摄氏0度,把标准
说出下面数据是定类、定序、定距、还是定比变量?
姚明
性别:男 身 高:2.29米
定类
体 重:140.7公斤(310磅) 定 比
出生年月:1980-9-12
2002年第1轮第1顺位被选中。
定比
定距
定序
姚明在火箭队穿11号球衣,打5号位
在新秀赛季82场比赛中,每场8.2个篮板和1.74次盖帽,姚明的效率 得分为17.65分
讨论下面问题,如何构建测评项目,使之有效度
1. 对学生在校表现的评估 2. 婚姻中介提供的个人资料
准则效度或效标效度是指测量结果与一些标准之间的一致性程度,这些标准能够精确表 示被测概念。准则效度分为:预测效度和共变效度(测量指标与同时存在的或将来的指 标之间的关系,计算相关系数)。
例:评价学生的学习状况的指标是平时成绩。平时成绩和高考成绩有很好的相关性。高 考成绩选拔人才是有效的。(共变效度)
定类尺度
定类尺度( )是各类尺度中最低的一种,可以用数字和符号表示,仅区分不同类别的成员。 对于定类变量,可计算其频数、百分比、众数,而不能进行其他运算。设计这类尺度应注意 其完备性和互斥性。
例如:房间号、手机号、身份证号等。
定类变量,请举类似的例子
您的性别: 男 女 您毕业后去向是: 读研 工作 出国 其他
效度的检验
一般来说,无法对效度进行直接检验,只能用下列方法进行间接验证: 主观效度:包括内容效度和表面效度; 准则效度:包括共变效度和预测效度; 构建效度:测量工具是否反映概念和命题的内部结构。
表面效度 是指测量效果和人们头脑中的印象或学术界形成的共识之间的吻和程度,吻合程度 高,表面效度就高。凭经验判断。
内容效度是指测量在多大程度上涵盖了被测量概念的全部内涵,测量工具代表概念定义 的内容越多,内容效度就越高。凭经验判断。
如测量学生的英语四级水平,按大纲要求,不能超,也不能过于简单。 例:对餐馆的形象测评,应当是餐馆全面的形象,包括硬件、软件环境、人等。
度
度
致
性
表内 准 构 面容 则 建 效效 效 效 度度 度 度
信度
信度()是指在测量中可以避免随机误差,从而提供前后一致的数据的程度。 信度可用不同时间重复测量的结果或不同测量方法所给出的结果之间的一致性来测量。 具体方法有: 重测信度() 复本信度( ) 内部一致性( )
信度的检验
非常
非常
不同意 不同意 不一定 同意 同意
哈佛是美国最高学府
12 3 4 5
哈佛经济系是全美最好的 1 2 3 4 5
非中性描述
语义差异量表
语义差异量表( )是由一组意义相反的词组成的评价量表。例如:
请从以下几个方面对某学院学生作出评价
012345
传统
+-+-+-+-+-+ 前卫
保守
+-+-+-+-+-+ 开放
(哪一个更好?)
例:如何测评学生的学习态度?如何测评学生的综合表现?
从测量过程来考虑:包括概念的形成、组成性定义、操作性定义、量表。 “学习态度”涉及可观察的方面包括考勤、作业完成情况、回答问题情况、笔记等等。 “综合表现”涉及多方面,德育量化表。
测量尺度
定类尺度( ) 定序尺度( ) 定距尺度( ) 定比尺度( )
这里完备性和排他性指的是什么?
定序尺度
定序尺度的数字不仅代表类别,而且还表示按某种特征或属性排列的高低、大小和先后顺序。 必须注意,这一尺度的间距不能准确代表其测量的特征量的间距长短。 对于定序变量,可计算其众数、中位数、但不能进行加、减、乘、除等运算。
定序变量,举类似的例子
在本次运动会中,经管系获得男子团体第2名,女子团体第1名,总排名第2。 在本次参加测试的10个同学中,有2个同学并列第4名,3个同学并列第5,A同学获得第7名。
大气压下水的沸点定义为摄氏100度,中间等分来标定摄氏温度。
例 :品牌忠诚度的测量
1. 概念:对某品牌心理及行为的偏向性。 2. 定义:对某种品牌相对于同类其他品牌的偏好程度。 3. 操作性定义:(1)一年内重复购买的次数;(2)一年内在该品牌上消费量;(3)一年
内该品牌消费量在同类物品中占的百分比。 4. “尺子”:问卷。
重测信度,是用同一测量工具在不同的时间对同一群受试者前后测量两次,然后计算两次测 量分数的相关系数,相关系数越大说明两次测量的一致性越高。相隔的时间不应该太长。
复本信度,是用两个完全等值的(平行的)复本对同一群受试者进行测试,计算两种复本测 量分数的相关系数,相关系数越大说明两个复本构成带来的变异越小。如考试中使用的A、 B卷。
定距尺度
定距尺度不仅具备定类和定序尺度的所有功能,而且还要求尺度上间距代表所测量特征量的 间距。
对于定距变量,除了计算其众数、中位数、均数外,还可以进行加减运算,但相乘或除却没 有意义,因为这类尺度的零点是人为规定的。
例如:考试分数、温度等。
例:托福评分规则 (人为规定零点)
听力50个题目,一共计68分。错第1个题目扣2分,以后每个题目扣一分。 语法40个题目,一共计67分,错第1个题目扣3分,错第2个题目扣2分,以后每个1分。 阅读50个题目。一共计68分,错第1个扣2分,以后每个1分。
定距变量,举类似的例子
请对食堂菜品作出评价,1表示很不满意,5表示很满意。如果态度不是很极端,选择中间的 值。
质量 1 2
3
4
5
价格 1 2
3
4
5
定比尺度
定比尺度( )不仅具备前三种尺度的所有功能,而且还有自然零点,因此可以进行加减乘 除运算。
例:体重、年龄、高度、面积、距离、回报率、时间间隔等等。
教师的授课水平 本院老师的授课水平 客座教授的授课水平 课程设置的合理性
教务人员的服务水平 教学设施的水平 机房的计算机数量 机房上网速度
中性描述
非常不好
1 1 1 1
1 1
不太好
一般
比较好
非常好
2
3
4
5
2
3
4
5
2
3
4
5
2
3
4
5
2
3
4
5
2
3
4
5
量表
量表( )是美国社会心理学家(. )于1932年在原有的总加量表基础上改进而成。其形式如 下:
连续评分量表 列举评分量表
Likert量表 语义差异量表 中心量表
成对比较
口味测试
软饮料的盲测只能代表个人对比较对象的偏好,其结果并不能代表市场表现的好坏。
用排序量表测量啤酒品牌的偏好
啤酒品牌偏好排序
啤酒品牌 1、青岛 2、燕京 3、雪花 4、哈尔滨 5、珠江
偏好排序 3 1 4 2 5
用固定总数量表测量香皂各属性的重要性
三个细分市场测量平均值
项目 柔和度 泡沫 收缩 价格 芳香 包装 湿润 清洁能力 总得分
市场1 8 2 3 53 9 7 5 13
100
市场2 2 4 9 17 0 5 3 60
100
市场3 4 17 7 9 19 9 20 15
100
连续评分量表
连续评分量表用一条直线上的位置来表示调查对象的打分,其形式如下:
1. 级别数 2. 平衡 非平衡 3. 奇数/偶数级别 4. 强制 非强制 5. 措辞描述 6. 形式
一般 5~9级. 一般用平衡式. 如果存在中性回答,用奇数量表. 对于有调查对象没有意见的情形,用非强制性量表。 描述尽可能靠近要选择的答案类别. 尝试多种,选个最好的.
测量误差
M测量值,A实际值,E误差
驯从
+-+-+-+-+-+ 叛逆
善于动手 +-+-+-+-+-+ 善于动嘴
认真务实 +-+-+-+-+-+ 好高骛远
中心量表 语义差异量表的变通形式。例如:
+5 +4 +3 +2 +1 质量 -1 -2 -3 -4 -5
+5 +4 +3 +2 +1 服务 -1 -2 -3 -4 -5
设计量表需要考虑的问题
无
4. 经济学的考卷有一些主观题,不同的老师批改。
无
有
提高信度的办法
严格遵循科学、客观和中立的原则; 测量工具的一致性; 问卷的概念、描述、格式、印刷清晰传达,不产生歧义。为此,要选择合适的测量工具,
尽可能利用成熟的测量指标或方法;事先进行探索性研究和预测试。 测量过程的一致性和稳定性; 提出明确的要求;必要的人员培训;良好的现场指导与监督。
在新秀中排名第一
他在每48分钟的效率得分为29.16分
在全联盟排第13位
定距
定类
定序
定序
定距
测量技术
营销中常用的测量技术通常可分为两类: 比较性方法:根据不同对象的比较获得某一种特征的相对值 非比较方法:对每个对象进行独立测量
比较测量
测 量 技 术
非比较测量
成对比较 排序量表 固定总数量表 Q分类法
例:通过购买意愿预测将来的购买量。(预测效度)
构建效度 测量具有理论基础。(内在的经济规律) 例:水银温度计,利用了水银热胀冷缩的原理。 例:需求的价格弹性测量。 例:客户满意度的测量(客户满意度理论模型)。
汇报结束 谢谢大家!
请各位批评指正
44
测量误差( )由于概念的定义、界定、指标选择和实际测量方面的误差,导致变量测量值和真 实值之间的差距。
随机误差( )测量过程中不确定因素造成的误差,它是短暂的和不稳定的。 系统误差( )测量中产生的持续性误差,主要是测量设备和测量过程的缺陷产生的。
信度与效度
测量结果的Baidu Nhomakorabea估
信度
效度
重
复
内
测
本
在
信
信
一
测量及量表设计
1
学习内容
理解测量的基本概念和测量过程 掌握四种测量尺度的概念、特点 掌握基本的测量技术,会设计几种主要的量表 了解测量误差来源和分类 理解测量的信度和效度
测量及测量过程
测量的定义
按照特定的规则给待测对象的属性赋值,使之量化。
Q: 企业如何测量一个学生的基本数据?
性别、年龄、身高、体重、生源地、毕业院校、社会活动职务、英语成绩、笔试与 面试成绩……
折半信度(),测量内在一致性。只用一个测量工具对同一群受试者实施一次测量,但将奇 数题和偶数题分开计分(或者随机对半分割),再计算两部分试题分数之间的相关系数。
例:下面的测量有信度吗?为什么?
1. 用一把零点刻错了的钢尺测量。
有
2. 用一把橡皮筋做成的尺子测量。
3. 用一个失去弹性的弹簧秤测量。
效度
效度()指的是测量工具和过程能够避免随机误差和系统误差的程度。它反映了所测量的东 西是不是真正要测量的。
信度好是效度好的必要条件,但不是充分条件,即有效的测量数据必须是可信的,但可信的 测量数据不一定有效。
通常情况下效度不高的主要原因: 设计方面的问题,调查的并不是所要研究的问题。 回答者有意(或无意)回答错误。
请问您如何给当代商城的购物环境打分?
最差
最好
0
10
可以画出刻度,直观,但转化成数据麻烦
列举评分量表
请您对以下几方面的质量进行评价,请用1至5分表示您的评价。1分表示非常不好,5分表示 非常好。如果您的态度没有那么极端,请用1和5之间的其他数字来表示。请注意,我们这里 指的是各个因素的整体情况,而不是针对某个老师或某个课程。(请您认真为每个因素打分, 因为这些因素对我们的研究都非常重要,谢谢)
测量过程是从抽象概念到形成度量“尺子”的过程。 概念的形成 概念的界定(组成性定义) 概念的可操作化(操作性定义) 量表的定制
例 :温度的测量
1. 温度概念:区分冷热。 2. 温度的定义:物体的冷热程度的物理量; 3. 温度的操作性定义:根据热胀冷缩的原理,用标准物体长度的变化来表
征温度; 4. 温度计定制:把水银柱在标准大气压下水的冰点定义为摄氏0度,把标准
说出下面数据是定类、定序、定距、还是定比变量?
姚明
性别:男 身 高:2.29米
定类
体 重:140.7公斤(310磅) 定 比
出生年月:1980-9-12
2002年第1轮第1顺位被选中。
定比
定距
定序
姚明在火箭队穿11号球衣,打5号位
在新秀赛季82场比赛中,每场8.2个篮板和1.74次盖帽,姚明的效率 得分为17.65分
讨论下面问题,如何构建测评项目,使之有效度
1. 对学生在校表现的评估 2. 婚姻中介提供的个人资料
准则效度或效标效度是指测量结果与一些标准之间的一致性程度,这些标准能够精确表 示被测概念。准则效度分为:预测效度和共变效度(测量指标与同时存在的或将来的指 标之间的关系,计算相关系数)。
例:评价学生的学习状况的指标是平时成绩。平时成绩和高考成绩有很好的相关性。高 考成绩选拔人才是有效的。(共变效度)
定类尺度
定类尺度( )是各类尺度中最低的一种,可以用数字和符号表示,仅区分不同类别的成员。 对于定类变量,可计算其频数、百分比、众数,而不能进行其他运算。设计这类尺度应注意 其完备性和互斥性。
例如:房间号、手机号、身份证号等。
定类变量,请举类似的例子
您的性别: 男 女 您毕业后去向是: 读研 工作 出国 其他
效度的检验
一般来说,无法对效度进行直接检验,只能用下列方法进行间接验证: 主观效度:包括内容效度和表面效度; 准则效度:包括共变效度和预测效度; 构建效度:测量工具是否反映概念和命题的内部结构。
表面效度 是指测量效果和人们头脑中的印象或学术界形成的共识之间的吻和程度,吻合程度 高,表面效度就高。凭经验判断。