8第八章 测量量表
08章 量表和常模
• 改进方法
– 适当扩大样本容量,减小抽样误差 – 与分层抽样法或其他方法配合使用
8 量表和常模 20
• 不同的抽样方式,会有不同的计算标准误 的公式,在计算标准误时还要考虑有限总 体与无限总体之分。
8 量表和常模
21
三. 常模
• 常模是测验分数的总体分布形态, 一般用测验分数的平均数和标准差来表 示,它能对个体的分数加以解释。 • 常模就是各种导出分数,由于这些 导出分数具有相等的单位,所以它能比 较各种不同的分数。 • 常模具有相对性,只能用来解释 一个测验范围内的情况。 •
8 量表和常模
BACK
9
第二节 标准化样组和常模
• 标准化样组 • 以一个能代表全域的样组作为 测验对象,测试后所得分数经过统 计,转换,最后构成了一个测验的 常模。 • ?:行为样组与标准化样组
8 量表和常模 10
• 行为样组:测验的题目应有代表性
• 标准化样组,也叫常模团体:主要指被试,
及被试的平均分数。
• 分层非比例抽样 • 特点
– 分布较均匀:各层都有被 抽取的机会,抽样误差更 小,代表性更强 – 在总体分布不均匀时,该 方法效果更好
8 量表和常模 19
(四)分组抽样(整群抽样)
• 以“群”抽样单位抽样 • 特点
– 组织形式简便易行,不会打乱学校或单位的正常秩序
• 不足
– 样本分布不均匀,抽样误差较大
Xc=R + O/k Xc= R-W/(k-1)
8 量表和常模
6
• -------------------------------------------------------• 被试 做对题数 忽略题数 错误数 修正分数(1) 修正分数(2) • ----------------------------------------------------------------------------------------• 甲 14 0 6 14+0/4=14 14-6/3=12 • 乙 14 6 0 14+6/4=15.5 14-0/3=14 • 丙 14 3 3 14+3/4=14.75 14-3/3=13 • -----------------------------------------------------------------------------------------
(整理)心理与教育测量重点全部
第一章心理与教育测量概论1、测量就是依据一定的法则使用量具对事物的特征进行定量描述的过程。
所谓一定的法则,是指任何测量都要建立在科学规则和科学原理基础之上,并通过科学的方法和程序完成测量过程。
所谓事物的特征,是指所要测量的事物的特定属性。
所谓量具,是指测量中所使用的工具。
所谓定量描述,是指任何测量的结果总是对事物特征的量的确定。
2、任何测量都必须具备两个基本要素,即测量的参照点和测量的单位。
参照点有两种,一种是绝对参照点,即以绝对的零点作为测量的起点。
另一种是相对参照点,即以人为确定的零点为测量的起点。
理想的测量单位应当具备两个条件:一是要有确定的意义,二是要有相等的价值。
3、测量量表分为4种:1)命名量表,是最低水平的量表,它只是用数字代表事物或对事物进行分类;2)顺序量表,如第1名,第2名;3)等距量表,不仅能代表事物的类别,等级,而且具有相等的单位,等距量表没有绝对的零点;4)比率量表,是最高水平的测量量表,有绝对的零点。
心理与教育测量的量表属于顺序量表。
心理与教育测量属于顺序量表。
★4、心理测验实质上是对行为样本的客观的和标准化的测量。
编制一个测验应当具备下列4个基本条件:1)行为样本。
从人的大量行为中抽取与欲测量的心理特质直接有关的一组行为进行测量,并依据对这一组行为的测量结果推断其心理特质和教育成就。
这一组被抽取出来的,作为直接的测量对象的行为就是行为样本。
2)标准化标准化就是指测验的编制、实施、记分以及测量分数解释的程序的一致性。
测验的标准化要具备下列条件:a、测验内容的标准化;b、施测条件的标准化;c、评分规则的标准化;d、测验常模的标准化。
3)难度或应答率4)信度和效度5、心理与教育测验的种类:按测量对象:智力测验、能力倾向测验、成就测验、人格测验。
按测量方式:个别测验,团体测验。
按测验内容的形式:文字测验,非文字测验按测验功能:成就测验与预测测验,难度测验与速度测验,描述测验与诊断测验。
第八章——教育测验法
教育测验概述
☑教育测验法的含义与功能 ☑教育测验法的主要类型 ☑教育测验法的优点和局限
教育测验法的含义与功能
测验就是研究者运用数量化的方法对儿童的 心理某个方面的发展或学生的学习结果进行测定 和评价。
测验法是研究者根据研究的需要,运用客观 性的测量工具来收集有关儿童身心发展和学习结 果的数量化资料,通过对资料的分析来揭示教育 活动的效果,探索教育活动的规律的研究方法。
评价功能
9
教育测验的主要类型
按照测验的编制来源不同
标准化测验指教育部门 专门组织人力,由教育 专家或学者们所编制的, 适用于大规模范围内评 定个体心理特征或水平 的测验。
自编测验又称非标准化 测验。是教育者根据教 学的需要,仿照标准化 测验的形式,自行设计、 编制的测验。
标准化测验
自编测验
10
按照测验对象的数量分类
4
3
方便省力
可以根据常模直接
进行对比研究
16
1
3
局限
难以进行定性分析
对研究者有较高要求
2
难以揭示变量之间的因果关系
标准化测验
☑标准化测验的含义 ☑标准化测验的实施 ☑我国常用的学前儿童标准化 测验工具
思考:
标准化测验的内涵
使用由专家编制的测量量表,并按统 一的步骤进行的测验就是标准化测验。
——美国 梅伦斯
★测验概念的具体含义有以下几点: (1)测验是按照一定的标准和程序进行的; (2)测验是根据标准化程序来测量个体的某种行为, 由一系列能引起个体反应的项目组成; (3)一个测验所测量的只是一个人的一部分行为。
测验的三个基本要素: ➢测验的参照点:由测量编制者所确定的数据单 位的起点,是对不同儿童在某个方面的差异进 行比较的标准。绝对和相对 ➢测量单位:测量编制者所设计的表征被试间差 异的距离。 ➢测量规则:包括对测量步骤的规定、评分的标 准、测量结果数量化的方法等。
第八章 诚信测试
第四节 诚信测试的方法
• 诚信测试的分类 • 设计诚信测试量表
一、诚信测试的分类
• 外显性诚信测试 • 以个性 又称目的明确的测试,课直接测量被试者 对不诚信行为的态度或具体地询问以往的 违法及不诚信行为,主要考察价值观和态 度方面的诚信。 • 测试题通常非常直接地询问应聘者对一些 令人反感的非法行为的意见,以及他们对 假设情景的反应。 • 假设前提是,不诚信的个体对待这些行为 的态度与诚信的个体是不同的。
四、人际欺骗理论
• 将说谎者与欺骗对象的交互作用作为研究 方向 • 强调说谎者与欺骗对象之间的人际互动以 及说谎发生的心理过程 • 认为某些个人特质(社会技能、自我监控 和激励程度)会影响欺骗性沟通的过程及 结果。 • 决定说谎者是否欺骗成功的四个因素 – 焦虑、自我表现的常态、谎言的复杂程 度、怀疑程度
三、真实监控理论
• 人们把记忆归为真实经验或想象经验的过程就叫 真实监控。 • 核心是基于真正体验到的记忆,而非虚构的记忆。 • 理论基础是关于记忆和记忆过程的描述。 • 局限性 – 亲身经历过的事件与想象的事件在记忆质量方 面的差异会随着时间的流逝而减少。 – 如果人们尽量设想可能发生过什么,想象的事 件会变得更生动、更具体。
外显性诚信测试样本示例
• 请用下面的代码指出每个句子所描述的行为和态度贴近 你的程度: • A=非常准确 B=准确 C=说不准 D=不准确 E=非常不准确 • 1.大多数本性是不诚信的。 • 2.工作的时候,我会去拿一些自己想要的东西。 • 3.如果能不被发现的话,公司里大部分员工都会早退。 • 4.如果员工不想上班就请病假,这时很平常的事情。 • 5.人类天生就喜欢从别人那里偷取东西。 • 6.我在工作中经常受到诱惑想拿东西。 • 说明:A=5分 B=4分 C=3分 D=4分 E=5分
测量量表
————非常重要
锁定5点量表—表现
请从以下几个方面为阿比餐厅的表现打分,1分表 示差,而5分表示非常好。
差
非常好
A菜单上产品丰富
12345
B价格合理
12345
C地理位置到你家方便 1 2 3 4 5
任选一家快餐连锁店(比如麦当劳、肯德
基等),设计一份量表以测量该连锁店分
店的表现。使用单边标签量表来测量该连 锁店的至少5个你认为比较重要的特性。在 量表中需要包含一定的说明性文字。
合计
1.60
2.85
2.15
1.40
B(2.85)>C(2.15)>A(1.60)>D(1.40)
麦克是麦克食品便利店的老板。他对店里销售低迷的状况 很担心。他在一本营销教科书上看到一家店的形象会影响 其吸引目标顾客的能力。他联系了一家调研公司,要求他 们做一次调研来测量其商店形象。请你负责设计问卷测量 商店形象的部分。
——非常满意
——比较满意
——中立
——比较不满意
——非常不满意
单边标签量表——使用频率
你多久买一次西式快餐?
—————从不
—————不经常
—————偶尔
—————十分经常
—————非常经常
单边标签量表——重要性
干洗店的当天可取服务对你来说有多重要?
————不重要
————有点重要
————重要
————十分重要
时间方便 —;—;—;—;—;—;— 时间不方便
高贷款利率 —;—;—;—;—;—;— 低贷款利率
——表示银行A
——表示银行B
斯坦普尔量表
又称中心化量表,它将单独一个形容词放在 量表的中间,评分从-5到+5共有10个级别, 没有中立点,同时测量态度的方向和强度。 这种量表通常被垂直地展示,要求调查对象 选择一个适当的数字,来指出每一项目对物 体描述得精确或不精确的程度。
第八章 测量研究
(3)等距变量 等距变量除能表明量的相对大小外,还具 有相等的单位。能把事物作等距的分等, 具有等距性 (4)比率变量 比率变量除了具有量的大小、相等单位外, 还有绝对零点。能测量事物差异的比例关 系,具有可加性。
不同水平的测量使用的统计方法也不同 类别测量 次数,百分比,2,列联相关 等级测量 中位数,百分位数,等级相关, 秩次检验 等距测量 均数,标准差,积矩相关,T检 验,F检验 比率测量 几何均数,等比量数
(二)种类 (1)称名量表 称名变量只说明某一事物与其他事物在名称、 类别或属性上的不同,并不说明事物与事物之 间差异的大小、顺序的先后及质的优劣。 只能对事物进行分类,具有区分性 (2)顺序变量 顺序变量是指可以就事物的某一属性的多少或 大小按次序将各事物加以排列的变量,具有等 级性和次序性的特点。 能把事物分等,具有等级或序列性
2、与信度的关系 信度是效度的必要条件,不是充分条 件 3、效度的种类 (1)内容效度:测验题目对所要测的内容 的覆盖程度,即测验题目对有关内容或行 为范围取样的适当性和代表性。
(2)预测效度(predictive validity) 也称效标(criterion)关联效度 通过将测验与某种外在标准作比较来确定 的。 如两个量表测验之间的相关——SCL-90与 EPQ、MMPI
9 .你宁愿单独一人而不愿和其它小朋友在一道玩吗?
10.有很多念头占据你的头脑使你不能入睡吗?
11.你在学校曾违反过规章吗? 12.你喜欢其它小朋友怕你吗? 13.你很活泼吗? 14.有许多事情使你烦恼吗? 15.在上生物课时你喜欢杀动物吗? 16.你曾拿过别人的东西(甚至一个大头针、一粒钮扣) 吗? 17.你有许多朋友吗? 18.你有无缘无故地觉得“真是难受”吗? 19.有时你喜欢逗弄动物吗? 20.别人叫你时,你有过装作没听见的事吗? (节选)
学前教育研究方法,章节测试第八章
第八章如何运用教育测量一、单项选择题1.教育研究中的测量通常是凭借教育测验得以实现,测验结果的可靠性和稳定性被称为A.信度B.效度C.难度D.区分度【解析】:A 本题考查的知识点是信度的内涵信度指测验结果的可靠性和稳定性,即同一个测验对同一组被试,所得测量的一致性程度。
效度指测验的有效性和准确性,难度指题目的难易程度,区分度指测验题目对所测量特性的区分程度或鉴别能力。
2.在学前教育研究中,代表不同水平测量的量表中层次最高、包含信息最多的是A.称名量表B.顺序量表C.等距量表D.比率量表【解析】:D3.计算区分度的方法是A.以通过率计算B.以某题得分与该题总分之间的相关来表示C.以标准差计算D.以极端分组差异来表示【解析】:B 本题考查的知识点是区分度的计算方法。
区分度指测验题目对所测量特性的区分程度或鉴别能力。
区分度的计算常以某题的得分与该题总分之间的相关来表示,也可以测验中高分组与低分组在某一题目上得分的平均数的差异来表示。
4.在教育测量中,可鉴定一个测量工具用来测量某种属性是否有效的是A.信度B.效度C.难度D.区分度【解析】:B 本题考查的知识点是效度的内涵。
效度指测验的有效性和准确性,即一种测验在多大程度上达到了测量目标。
效度所要鉴定的是一个测量工具用来测量某种属性是否有效。
对某个目标有效的测验,对其他目标就不一定准确有效。
5.难度是衡量测验题目质量的重要指标,计算难度的方法不包括A.以通过率计算难度B.以平均数计算难度C.以标准差计算难度D.以极端分组计算难度【解析】:C难度是指题目的难易程度,它是衡量测验题目质量的一个重要指标。
计算难度主要有三种方法:(1)以通过率计算难度;(2)以平均数计算难度;(3)以极端分组计算难度。
二、多项选择题6.估计测验信度的主要类型有A.重测信度B.复本信度C.结构信度D.分半信度E.评分者信度【解析】:ABDE7.随着对国外测验的不断引进、修订,测量法越来越多地得到运用。
测量量表——精选推荐
第八章测量量表学习目标课程回顾上一章节中我们讨论了如何将企业研究中的一般观念转化为有效的、可测量的概念。
本章主要讨论测量量表的类型、建构等相关议题。
量表的基本概念第一节评点量表与等级量表第一节评点量表与等级量表一、评点量表(rating scales)二、等级量表(ranking scales) 1、二分量表(dichotomous scale) 2、类别量表(category scale) 3、李克特量表(likert scale) 9 、Stapel量表(staple scale) 第三节量表的信度与效度第三节量表的信度与效度一、衡量的信度影响信度的主要因素影响信度的主要因素评估信度的方法(1)复测信度(2)复本信度(3)折半信度 3、建立可靠的测量标准可靠的测量标准是指持有相同看法或感受的受访者在接受对同一研究变量的测量时,会产生相同或相近的答案。
而不可靠测量标准的产生原因一般为:如问题的提示语或解说词不够明确;调查人员对不同受访者所做的问题陈述方式不一;受访者对问题中的某些措辞有不同的理解等。
一般而言,在时间允许的情况下,调研人员有必要在展开市场调查时进行可靠度评估,尽量选用可靠的测量标准。
4、可靠度评估的步骤通常,第一次测量的可靠认为是可以接受的。
二、衡量的效度(1)内容效度内容效度(content validity)的建立是要确保量表中,包含了能够衡量该概念的适当且具代表性的题项。
量表内的项目愈能代表该概念的主要领域或共通性,则其内容效度愈好。
简单来说,内容效度也代表了将概念拆解成构面与要素的过程是否完善的指标。
一般来说,量表的内容效度通常会透过评审小组的认可。
Kidder与Judd(1686)曾举例说明,某个用来衡量“语言障碍”的量表是否具有内容效度,可交由一群专家来评估(如专业的语言治疗师)。
表面效度(face validity)一般被视为内容效度的基本且最低的要求。
表面效度系指当某些题项被设计来衡量某个概念时,至少要看起来像在衡量此概念。
第八章 量表与测量法
第八章量表与测量法学习要求:了解量表的形式、作用和制作方法;了解测验、社会计量法、民意测验这几种调查手段的内容、程序、特点及适用范围,能够在实际调查中运用这些手段和技术。
量表、测验、社会计量法、民意测验都是采用定量测量工具的调查手段,它们与问卷法有相似之处且都用于收集数据资料,但在许多方面又与问卷法不同。
第一节量表法一、量表的作用和形式量表是适用于调查人们主观态度的测量工具,它由一组问题构成,用以间接测量人们在某一态度或观念上的状况。
量表一般用于测验和问卷调查中。
态度是个人的心理倾向,它是一种很难直接观测的变量。
最常用的态度量表是总加量表(也称利克特量表)。
它的基本形式是给出一组问题,要求被调查者对每一问题表明其“同意”“不同意”或“不表态”(也可分为五级或七级回答);然后,根据每一个人的回答来计分,每个人在所有问题上的得分总加起来可以得出一个总分,这一分数可用来衡量其在某一态度或观念上的倾向性。
从计分方式上看,总加量表类似一个综合指标。
二、总加量表的制作总加量表的制作过程是:(1)根据调查内容挑选一组有关的问题(一般为10-30个);? (2)规定回答的类别和计分标准;(3)试调查,请一些人回答这组问题;? (4)计量各题的分辨力,删除分辨力不高(即回答趋于一致)的题目;(5)保留分辨力较高的题目(一般为5—20个)组成量表。
第二节? 测验法测验在社会调查研究中是测量人们行为、态度及心理特征的程序和方法。
测验的类型包括:(1)能力与成就测验,如测量智力、管理能力、工作绩效等等。
(2)人格与动机测验,如气质、性格、兴趣、需要等方面。
(3)态度与价值观念测验,如思想倾向、政治观点、认知、意见、世界观等方面。
测验的程序:(1)选取受测者;(2)让受测者对一组预先设计好的刺激(问题、情景、图象等)作出反应;(3)测量这种反应,用一个指标来说明受测者的反应程度;(4)用这一指标来推论受测者在某一行为和态度方面的状况。
第八章 量表与测验法
测验是一种标准化的程序。所谓测验的标准化,包括两方面的内容,一是测验必须经过标准化的程序进行编制,二是使用时必须按标准化的程序使用。
(一)测验的编制 1.根据测验目的确定测验目标, 2.分析这些测验目标所包含的心理过程或心理特性,弄清这种过程和特性由哪些因素构成。3.搜集相关的经验材料, 4.编选测验项目,编选时应考虑的因素有:(1)测验时间;(2)测验项目的数量;(3)测验刺激的形式;(4)计分的方法。 5.将编选好的项目先进编排,制成测验草案。编排的一般原则是先按试题类型分类,然后由易到难地进行排列。
第四节 民意测验
一、民意测验的概念
民意测验会问题的意见和态度的调查方法,其目的存在于通过对大量样本的问卷调查来精确反映社会舆论或一般民意动向。
二、民意测验的作用
它的主要作用是: 1.客观及时地反映社会舆论和大众心理的一般状况。 2.为制订或评价政策、措施提供依据。3.对大众心理进行分析和预测
(二)量表的类型 量表可根据它的测量内容分类。 在社会调查研究中,量表不仅限于测量人们的态度,它还用于测量人们的能力、智力、性格、素质、工作成绩、社会地位、生活水平等等。因而可区分出态度量表、能力量表、智力量表、人格量表等类型。
量表还可以分为调查量表与测验量表。量表主要用于问卷调查和测验中。而在测验中通常是要精确观测个人的某一特征(如智力、能力、成绩),它的分析重点是个人,因此量表设计要严格、精确且具有较高的信度和效度。这就需要设计大量题目。与此相反,问卷调查中的量表题目较少,效度不要求很高。 社会调查中最常用的一种量表是总加量表。
三、测验的功能与应用
(一)测验有两种基本的功能: 一是预测,即通过测验,可知道不同类别的人之间的差异。根据这个差异,就可在某种程度上预见到不同类别的人在将来的活动中存在何种差异。 二是诊断,它注重的是个人的特性,即个人特性之间的差异。现代的测验方法主要来源于心理测验。
第八章社区常用心理评估
第一节 智 力 评 定
一个分测验中的各项目得分相加,称分测验的 粗分(或称原始分)。粗分按手册上相应用表可 转化成平均数为10,标准差为3的量表分。分 别将6个言语测验和5个操作测验的量表分相加, 便可得到言语量表分与操作量表分。再将两者 相加,便可得到全量表分。最后,根据相应用 表换算成言语智商、操作智商和总智商。由于 测验成绩随年龄变化,各年龄组的智商根据标 准化样本单独计算,查被试者的智商一定要查 相应的年龄组。
第一节 智 力 评 定
10.图形识别 由4个标准图形和90个包 括4种标准图形在内的各种图形组成的分 测验,主要用于测验被试者的视觉分辨 能力、注意力及瞬时记忆能力,同时还 测验手的书写速度及视觉一运动的协调 性、灵活性和精细动作的准确性。
第一节 智 力 评 定
CISA采用离差智商的概念:编制者根据不同分测验的 交流方式组合成言语能力量表和操作能力量表,提出 了能力商(ability qu()tient,AQ)的概念;同时根据因素 分析的结果,把含有相同智力因素的量表组成为A(语 言一理解)、B(数字一逻辑)、C(知觉一组织)和D(注意 一分辨)四种智力因素量表?并提出智力因素商 (intelligence。factor quotient,IFQ)的概念。在相关概 念的基础上,CISA建立了各分测验量表分、能力商、 智力因素商、智商 和百分位等级等各种常模,有助于 评估被试者的智力及各种智力因素和能力发展的水平 和平衡性。第一节 智 Nhomakorabea 评 定
此外,在WAIS—RC的手册中.还附有各 分测验的粗分转换成年龄量表分的表格。 年龄量表分也是以10为平均数、以3为标 准差的标准分数,但它不是与被试总体 比较,而是按年龄组的成绩分别计算的。 年龄量表分主要用于临床诊断,其意义 与前述用于计算智商的量表分有所不同。
量表
2.有效测量的条件
准确性 完备性 互斥性
一、测量的含义
3.测量的过程 提出测量的概念(特性) 在测量开始之前,调查人员必须说明要研究的 概念。
将概念转换为操作性定义 操作性定义就像一本指导手册,具体指出调查 人员为了测量所研究的概念必须做些什么。
选择测量指标 将概念转换成操作性定义的最终产物就是具体 测量指标,指标被用来说明概念的具体属性。
李克特量表的制作与使用
• 量表的制作程序是:
• (1)根据所要测量的内容或变量,收集大量与这 一内容有关的问题,初步筛选出一定数量的正负 态度的问题或陈述(正负语句数目一般相同,语 句一般为10-30个问题)作为初步量表.
• (2)确定问题的类别和计分标准
• 回答的类别可分为五个等级,也可分为七个等级, 三个等级或两个等级(同意与不同意);
4、测量的四个层面
• 1、类别测量----识别性别、商店类型、品 牌号、广告等类型的事物 • 操作----计数 • 2、顺序测量----新产品的名称、包装、竞 争品牌等态度、观点、偏好等 • 操作----计数、顺序 • 3、定距测量----温度、智商、态度 • 操作----计数、顺序、加减 • 4、定比测量----年龄、重量、收入 • 操作----计数、顺序、加减、乘除
估计信度的方法主要有:再测信度、复本信度、折半信度。
信度的作用
• 信度是衡量一个测验量表质量高低的重要指标 。信度不合要求的量表是不能使用的,信度的 作用主要表现在: • A.信度反映测量中的随机误差大小; • B.信度对每个测量结果具有直接的意义,可以 通过区间估计办法指出测量的精度; • C.不同测量结果可以通过信度进行比较。信度 在使用中需要注意的一个测量可能有多个信度 估计值。
测量量表与问卷调查法
测量量表与问卷调查法第三节测量量表一、测量(一)概念测量是按照规则给对象或者事件赋值,如直尺、停表之类的器具,是用来测定高度、速度等数量的。
(二)基本要素1、测量的基本要素有4个:(1)对象——指我们所感兴趣的,要研究的事物或者物体(2)标记——指被测量对象的某种特征记号,如性别、年龄、学习成绩等(3)符号——指代表对象具有某种特征程度的符号,如考试分数(4)规则——分派各类符号到各类事物上的标准与方法,如使用百分制(5)2、测量要素间的关系(P-98, 图5.4)图5.4 测量要素间的关系3、例子,P-98总结:由例子能够看出,关于同一个对象A,使用不一致的测量法则,得到的测量结果是不一致的。
好的测量法则就能够得到客观可靠地测量结果,差的法则往往会得到无效或者存在偏差的结果。
二、教育技术研究测量法则的建立通常来说,关于稳固可见的现象,测量的法则容易建立与使用。
如正常人的性别容易测量,能够明确的用0或者1表示。
在教育技术研究中,对教师学生的态度、行为,学习效果的测量法则建立,却不是件轻而易举的事,但建立法则有困难并不等于无法测量,只要具备如下3个条件就能够进行测量,能测量也就必定能建立法则。
建立测量法则的3个条件:1、现象或者行为确实客观存在;2、现象或者行为具有同一性与差异性同一性:是指测量对象本质属性的表现,这是区分事物的根据;差异性:同一类事物,其本质属性的表现程度有所差异,这些差异性的存在决定了测量的必要。
例:年龄是人类的一种同一性的表现,在一组测试样本中存在年龄上的差异就存在测量的必要与可能。
三、测量的参照标准1、要建立一个好的测量法则,务必使通过测量所获得的一系列数字(如考试分数)或者符号(如品质等级)能够得到科学解释与评价,能够真正实现有意义的使用,这就务必把测量法则建立在一定的参照标准上,并以此标准来判别测量结果的高低或者优劣。
2、常用的3种参照标准:(1)目标参照标准(决定性评价)——具体的目标(2常模参照标准(相对性标准)——集体平均水平(3)自我参照标准(自我性评定)——自身在某一时期或者状态的特征四、测量量表的类型(一)量表定义:量表是指根据特定的法则,把数值分派到受试者、事物或者行为上,以测量其特征标志程度的数量化工具。
测量量表
n
ij
nij N
对于这里模型有
W 1
i
多因素排序量表举例
您认为该课件产生效果的原因是哪些?将原因的代号按重要
的程度填在表中: A.解决了学习的重点和难点问题 B.声音、图片、活动图像给学生创设学习的情境 C.画面清晰、稳定,无干扰 D.比老师传统教学省时,但收效更大 位次
代号
第一位
C同意
32 100 % 64 % 50
C不同意
18 100 % 36 % 50
(2)单向评等量表
单向评等量表是对提出问题的量度等级,以两端为极 端,中间按程度单向顺序排列.例如,对于测量影视媒
介的内容是否被理解、被接受时,采用单向评等量
表模型。在这个模型中,每个等级都给予等级分值。 等级可划分为5级或4级、3级。对于4等级,其等级 分值便记为4、3、2、1。
问题
Q
百分率
C同意 n1 100 % N
n1 C同意
N2
C不同意
C不同意
n2 n 100% 1 1 100% N N
其中N=n1+n2
C同意———同意反应的百分率, C不同意———不同意反应的百分率,
n1——表示同意的人数, n2 ——表示不同意的人数。
例一: 有50份问卷,其中对某问题表示同意的有32人, 不同意的有18人。 计算同意和不同意反应的百分率。 上述情况 N=50,n1=32,n2=18,因此
双向评等量表模型之二
等级 响 aj 应 问题 人 n Qi 数 ij Q1 Q2 Q3 a1 太快+2 n11 n21 n31 a2 稍快+1 n12 n22 n32 a3 合适0 n13 n23 n33 a4 稍慢-1 n14 n24 n34 a5 太慢-2 F1 F2 F3
测量量表
依赖、天真、外露、幼稚 及自我陶醉,缺乏自知力 脱离一般社会道德规范, 蔑视社会习俗,常有复仇 攻击观念 具备另一性别特点 多疑、孤独、烦恼及过分 敏感;T分超70则可能存在 偏执妄想 紧张、焦虑、反复思考、 强迫思维、恐怖、内疚 感。 不恰当的情感反应、少 语、特殊姿势、怪异行 为、行为退缩、情感脆弱 联想过多过快、活动过 多、观念飘忽、夸大而情 绪高昂、情感多变 内向、胆小、退缩、不善 交际、屈服、过分自我控 制、紧张、固执、自罪 逃避现实。若前399题中原 始分超过22,则提示临床 量表不可信 追求过分完美的回答。原 始分超过10分,不可信 被试不认真、理解错误, 或伪装疾病;若测验有 效,高分则表示精神病程 度高。 对测验态度的一种衡量, 目的有二:1、测受测者的
记
1、按14个量 分别记分; 2、Q量表(包 多选的题目) 399题版本超 22分或566版 超过30分,则 卷无效; 3、L量表共1 题,其原始分 过10分,测试 果不可信;
4、须加K分的 表:Hs+0.5K Pd+0.4K,
也可 ⑦Pt(精 使用 神衰 弱)、 ⑧Sc(精 神分裂 症)、 ⑨Ma(轻 躁狂)、 ⑩Si(社 会内向) 4个效度 量 表;Q(不 能回答的 问 题),L(说 谎分 数),F(诈 病),K(校 正分) 卡氏16种 人格因素 测验 (16PF) 人 格 测 验 美国 187 卡特 个题 尔教 目。 授编 制 印在一本小册子上, 初中 因素 因 另有答卷纸一张。 名称 素 以上 A 名 乐 称 文化 每题有三个可供选择 群性 L 的答案,只能选择一 的青 B 个;不可漏掉任何一 壮年 聪 怀 疑 题;尽量不选择中性 慧性 性 和老 答案。 C M 年 稳 幻 本测验没有时间限 人。 定性 想 制。 E 性 恃 N 属于 强性 世 故 团体 F 兴 性 实 奋性 O 忧 施, G 有 也可 恒性 虑 性
第八章 测量与量表.ppt
使用等距量表得到的数据可以求算术平均值、 标准差和相关系数,也可以利用t检验、F检验 等参数统计分析法。
4、等比量表
等比量表除了具备上面三种量表的功能之 外,还有一个绝对零点或原点。
例子:面积、距离、货币单位、汇报率、 时间间隔等数据。
等级顺序量表
等级顺序量表是可比较的,因为应答者被 要求用一个条款来判断另一个。
表 等级量表实例
下面的卡片中列举的是两类产品,每类产 品项下各有七种品牌,请你根据对各品牌 的喜爱程度进行排序,分别给予1到7个等 级,等级1表示你最喜爱的品牌,依次类 推,等级7表示你最不喜欢的品牌。
请注意:一个等级号码只能用于一个品牌。
2、量表技术的类型
量表技术
比较量表
非比较量表
配对比较
常量和
连续评分量表
分项评分量表
等级排序 Q分类及其他
Likert
语义差异
斯坦普尔
配对比较量表
在配对比较量表中,受测者被要求对一系 列对象两两进行比较,根据某个标准在两 个被比较中的对象中做出选择。配对比较 量表也是一种使用很普遍的态度测量方法。 它实际上是一种特殊的等级量表,不过要 求排序的是两个对象,而不是多个。
这家广告代理商设计了53张照片——从1800张照片中挑选出来的,代表了 BBDO所谓的“情绪世界”,而不只是让消费者从简单的列表中挑选或者 是用自己的语言书写。每一组照片代表着6名参与者各自不同的表情,从 高兴(顽皮)到厌恶(反感),共包含了26个类别的情绪。
该系统如何工作呢?正如大部分的文本测试一样,先向参与者展示某个单 一的广告或一组场景,然后再给出一份问卷,测试他们是否记住品牌名称 或者文本要点。在这一过程中的任何一点,调研人员都要分发照片,并要 求他们都不要写下或者谈论广告场景,而是迅速的将照片进行分类,留下 任何或者所有能够反映出他们在看过广告之后的感受的照片。
8第八章 测量量表
范例4
不同意 不赞成 同意 非常不 也不同 同意 意 1 2 3 4 非常同 意 5
接着,可将每位受试者在这些题项上的 答案加总,而这些题项通常是用来衡量 特定概念或变项(如范例4)。此种量表 一般采用的是区间量尺,而在量表中任 何两点之间地差距是相等的。
范例5
使用前述的李克特量表,指出你赞成下列每一个叙述的程度:
范例7
你和你的房地产代理人之间的相处有多愉快? 非常愉 快 7 6 5 4 3 2 1 非常不愉快
6、列举式评点量表 (itemized rating scale)
范例8(i)
底下每一题皆使用下列量表作答,并于题项右边的底线上标示你的答案。 不可能 2 中等 3 可能 4 非常可 能 5
非常不 可能 1
项目分析方法 涉及计算每个 量表问题在高 分群体和低分 群体中的平均 得分
用于处理怎样处理 多维的内容范围; 怎样找出那些探索 性研究没有发现的 基础维度
你怎样看待__公司的形象? 1.作为一个工作的场所? 差_ _ _ _ _好
2.作为市政建设的主办方? 差 _ _ _ _ _ 好 3.对生态环境的关注? 差_ _ _ _ _好
范例9
总分为一百点,请以分配的方式,指出你 在选择香皂时,对下列五个特性之重视程度 香味 颜色 形状 大小 泡沫的质地 总点数 100
8、多等级清单量表 (multiple rating list scale)
多等级清单量表与数值量表类似,但在两个方面 有所不同: (1)它允许评价者循环回答 (2)它的编排允许看到结果,其优点是应答者的 评价清楚的展现在研究人员和面前,这种尺度产 生与区间数据。
图形评点量表是利用图形的呈现可帮助受试者在 量表中,指出其答案之所在位置,使研究人员能 够识别很小的差异。藉由在标线上相称的点做记 号(如下所示),帮助受试者在量表上表达他们 对特定问题的回答。虽然以下范例看起来好像是 区间量尺,但该量表实为顺序量尺。 特点:该量表的优点是容易作答,并可透过量 表中标识点旁的简短叙述作为导引评点的位置, 且此一作法较抽象的分类来得好。表情量表 (face scale)也是一种图形评点量表,其是将 表情的差距以图案从微笑到悲伤加以呈现,让 受试者评定他们在一些事情上的感受,例如, 对工作的感觉。
经济学第八章测量量表
比较
日常生活 中
对象: 物
内容:长短高低轻重等
特点: 对象稳定
工具: 尺子 秤等
调研中的测量 人的特征
行为 、态度等 变化
量表
经济学第八章测量量表
二、量表及类型
(一)、什么是量表:
是测量的工具,由一系列结构化的 符号和数字构成,按照一定的规则分配 给适用于量表的个人(包括他们的行为、 态度)。
微差别。 举例:1、2
经济学第八章测量量表
2、等级顺序量表:
评比量表是一种非比较的、绝对 值评价方法,被调查者根据自己主观 的认识对某一种因素做出评价,而等 级顺序量表是一种相对值的评价方法, 向被访者提供几个不同因素,由被访 者根据对这些因素的不同认识划分等 级。
经济学第八章测量量表
特征:比较性,将一种事物与其他比 较,按对某种特征的反映强弱排序。 不怕不识货,就怕货比货。
缺点:仅提供顺序信息,不清楚为什 么会这样排序,不清楚相邻两者之间 差距多大。
举例
经济学第八章测量量表
3、配对比较量表
连接 指被访者按一定的要求从一组的两个客体
中选出一个。 优点:选择容易;克服了顺序误差问题。 缺点:当客体数量较多时配对比较的数量
以几何级增加,因而易使人烦。
经济学第八章测量量表
第 八 章 态度测量
经济学第八章测量量表
态度和行为之间的一般关系: 顾客的态度越积极,使用产品的可
能性越大; 顾客的态度越消极,使用产品的可
能性越小;
经济学第八章测量量表
人们对一种产品的态度越是不赞成, 他们停止使用它的可能性就越大;
那些从未尝试使用某产品的人们的态 度将在均值左右呈正态分布;
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
11、共识性量表(consensus scale)
共识性量表是由评审小组依据与欲测量概念的切题程度或相关程度 来挑选特定的题项,并经由信度与效度的检验之后发展而成。其中, 塞斯通等距量表就是一种共识性量表,在挑选出题项后,使用大量 叙述概念的卡片,让评审小组评定该叙述句距离欲研究概念有的接 近程度。然而,由于该量表需要长时间的发展,因此,很少用来衡 量组织的概念。
图形评点量表是利用图形的呈现可帮助受试者在 量表中,指出其答案之所在位置,使研究人员能 够识别很小的差异。藉由在标线上相称的点做记 号(如下所示),帮助受试者在量表上表达他们 对特定问题的回答。虽然以下范例看起来好像是 区间量尺,但该量表实为顺序量尺。 特点:该量表的优点是容易作答,并可透过量 表中标识点旁的简短叙述作为导引评点的位置, 且此一作法较抽象的分类来得好。表情量表 (face scale)也是一种图形评点量表,其是将 表情的差距以图案从微笑到悲伤加以呈现,让 受试者评定他们在一些事情上的感受,例如, 对工作的感觉。
返回
第一节 评点量表与等级量表
二、等级量表(ranking scales)
1、配对比较量表 (paired comparison scale) 2、强迫选择量表 (forced ranking scale) 3、比较量表 (comparative scale)
配对比较量 表
“下面列出的每对双座跑车中,如果你必须选择出一个, 请选择出你比较喜欢的一个,并在旁边做上记号。” _BMWZ3 _Chevrolet corvette _Porsche Boxster _Porsche Boxster _Chevrolet corvette _Porsche Boxster _BMWZ3 _Dodge Viper _Chevrolet corvette _Dodge Viper _Dodge Viper _BMWZ3 “根据你的偏好顺序对雷达的探测特点进行排序,在最喜欢 的旁边标上1,在第二个喜欢的旁边标上2,等等” _使用人员程序设计 _无线设施 _体积小 _长距离预警 _最少的错误预警 “与你以前的互助基金业相比,新的基金的业绩:” 好 大致相同 差 _ _ _ _ _ 1 2 3 4 5 返回
范例9
总分为一百点,请以分配的方式,指出你 在选择香皂时,对下列五个特性之重视程度 香味 颜色 形状 大小 泡沫的质地 总点数 100
8、多等级清单量表 (multiple rating list scale)
多等级清单量表与数值量表类似,但在两个方面 有所不同: (1)它允许评价者循环回答 (2)它的编排允许看到结果,其优点是应答者的 评价清楚的展现在研究人员和面前,这种尺度产 生与区间数据。
4.作为少数民族人士的雇主?差 _ _ _ _ _ 好
优点:设计简单、成本低廉,可以提供由于而充分的信息。 缺点;设计方法是主观的,设计的问题无普遍性。
返回
下表显示了同义词典研究的结果
强迫选择量 表
比较量表
第二节 测量量表制定
consensus scaling 共识 量表 item analysis scaling 项目 分析 量表
arbitrary scale 主观 决断 量表
factor scale
因素 量表
通过收集适合 给定主题的问 题来设计主观 决断量表
共识量表要求 问题由一组裁 判选出,然后 在三个方面进 行评价
BRM讲义
——如何理解研究方法
主讲人:ecust 陈洪安 教授
1
第八章 测量量表
学习目标
学习了本章之后,应该能够达到如下目标:
如何及何时,使用不同方式的评点量表与等级量表?
建构衡量尺度的五种方式。
如何建立量表衡量的信度和效度?
课程回顾
•
上一章节中我们讨论了如何将企业研 究中的一般观念转化为有效的、可测量 的概念。
范例7
你和你的房地产代理人之间的相处有多愉快? 非常愉 快 7 6 5 4 3 2 1 非常不愉快
6、列举式评点量表 (itemized rating scale)
范例8(i)
底下每一题皆使用下列量表作答,并于题项右边的底线上标示你的答案。 不可能 2 中等 3 可能 4 非常可 能 5
非常不 可能 1
3、李克特量表(likert scale)
李克特量表是评分加总量表(summated rating scale)的变种中最常用的一种量表,加总量表有 一些陈述,应答者利用数值表示对每一个陈述的 赞成或反对程度,这些数值可以加总来测量应答 者的态度,一般一个可靠的李克特量表要求包括 20-25个适当构造的、有关态度对象的问题。在 下面的例子中,对每一个陈述被设计为五点量表, 如下所示之定位点(anchors)是用来检查受试 者对叙述句的赞成或不赞成程度有多强烈。
•
本章主要讨论测量量表的类型、建构 等相关议题。
量表的基本概念
定义 一种测量工具,常被用来测量调查对象如何 感觉或思考某事物,研究者借助它来测量某 个建构的强度、方向、层次。 以一个连续体的方式来排列回答值或观察值 ,然后对其结果加以分析 。 量表的构建旨在创造以顺序、等距、比率形 式测量变项的数字分数,而数字的指派有助 于人们进行量化思考。 量表不仅有助于概念的概念化与操作化过程 ,而且量表产生量化测量,可以和其他变量 一起被用来检验假设。 优点 方法
(1)我将在12个月内换工作 (2)我最近将负担起新的任务 (3)我将可能在12个月内离开公司 注:以上为有中立点(neutral point)的平衡式评点量表(balanced rating scale)
范例8(ii)
请在下列题项上圈选出最接近你的感觉之数字
完全没 兴趣 1
有一点 兴趣 2
有中等 程度的 兴趣 3
范例4
不同意 不赞成 同意 非常不 也不同 同意 意 1 2 3 4 非常同 意 5
接着,可将每位受试者在这些题项上的 答案加总,而这些题项通常是用来衡量 特定概念或变项(如范例4)。此种量表 一般采用的是区间量尺,而在量表中任 何两点之间地差距是相等的。
范例5
使用前述的李克特量表,指出你赞成下列每一个叙述的程度:
你有车子吗? □是 □否
2、类别量表(category scale)
多选项-单一选择量表允许评价者选 择一个或几个选项,在上表中,我们 用一个问题测量7个指标,可能所有7 个家装设计的来源都在考虑之中,当 考虑了所有应答者的选项时,这种选 项的积累特点是有效的。
多选项-单一 选择量表 (multiple choice, singleresponse scale)
范例6
有反应的――――――――――――――――――――没有反应的 美丽的―――――――――――――――――――――丑陋的 勇敢的―――――――――――――――――――――胆小的
5、数值量表(numerical scale)
数值量表中每个数值表度点之间的间距是相等的,共有的点作为极端点 的标志。应答者量表中选择一个数字写在每个问题旁边。如果例子中包含 无数个有关员工业绩的问题,这种方法可以既提供重要性的绝对度量,又 提供被评价的不同问题的相对度量(排序)。数值量表跟语意差别量表很 类似,也经常被当作区间量尺来使用,不过其不同之处在于数值量表提供 五点或七点量表,并且将极端的形容词放在两端,如下所示。
非常有 兴趣 4
你会如何评定你对改变目前组织 政策的兴趣 1 2 3 4
注:此为没有中立点的不平衡式评点量表(unbalanced rating scale)
7、固定或常数总和评点量表 (fixed or constant sum rating scale)
受试者必须在欲评点的变项之间分配点数,但是当要均衡或加总许多方面时, 应答者的耐心和精确度都会受到影响。这种尺度的优点是它与百分比的相容 性和可以对连续的数据进行比较并做出选择。如下所示(该量表较偏向具有 顺序量尺的特性)。
text in here
1、二分量表 (dichotomous scale)
二分量表又称为简单分类量表(simple category scale),提供两个相互排斥的回答选 项,通常以“是”或“否”来做回答,但是有 时也可以时是“重要”和“不重要”,“同意” 和“不同意”,或另外一套不连续的种类。如 以下范例(其采用名目量尺来标志受试者地回 答)。 范例1
项目分析方法 涉及计算每个 量表问题在高 分群体和低分 群体中的平均 得分
用于处理怎样处理 多维的内容范围; 怎样找出那些探索 性研究没有发现的 基础维度
你怎样看待__公司的形象? 1.作为一个工作的场所? 差_ _ _ _ _好
2.作为市政建设的主办方? 差 _ _ _ _ _ 好 3.对生态环境的关注? 差_ _ _ _ _好
9 、Stapel量表(staple scale)
范例10
请根据以下所提之观点,评价你上司的能力如何,并圈选出适合数字。 +3 +3 +3 +2 +2 +2 +1 +1 +1 采用现代化的技术 产品创新 人际关系的技巧 —1 —1 —1 —2 —2 —2 —3 —3 —3
10、图形评点量表 (graphic rating scale)
目的
Hale Waihona Puke 第一节 评点量表与等级量表 第二节 测量量表制定 第三节 量表的信度与效度
第一节 评点量表与等级量表
一、评点量表(rating scales)
二、等级量表(ranking scales)
一、评点量表(rating scales)
1、二分量表(dichotomous scale) 2、类别量表(category scale) 3、李克特量表(likert scale) 4、语意差别量表 text (semantic differential scale) 5、数值量表(numerical scale) in here 6、列举式评点量表 (itemized rating scale) 7、固定或常数总和评点量表(fixed or constant sum rating scale) 8、多等级清单量表(multiple rating list scale) 9 、Stapel量表(staple scale) 10、图形评点量表(graphic rating scale) 11、共识性量表(consensus scale) 12、其他量表