第10章信度效度分析
合集下载
相关主题
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
信度效度分析
1
信度
一、信度的意义 所谓信度是衡量没有误差的程度, 也是测验结果的一致性(consistency) 程度,信度是以衡量的变异理论为基 础。
2
二、衡量误差的意义与来源 衡量误差可分为系统性误差及随机性误差。一般而 言,大部份的误差是系统性的(从偏差而来)。所谓系统 性误差也被视成常数性(constant)误差。而随机性误差 (random error)则不是一种常数性误差,其原因可能来自 情境因素,或者被受测者一时的情绪而影响。衡量误 差可能的来源如下: 1.由回应者(respondent)产生的误差 2.由情境因素产生的误差 3.由衡量者产生的误差 4.由衡量工具产生的误差
关系数即为复本信度。
6
4.库李信度(Kuder-Richardson reliability) 目的在于分析问项间的一致性。在估计信度上,最常用的 是库李二十号公式: pq k rKR 20 ( )(1 ) 2 k 1 S 其中K:表示整份测验的题数
pq :表整个测验中每题答对与答错百分比乘
积之总合
S2:表示测验总分的变异量
7
Lຫໍສະໝຸດ Baidu J.Cronbach另创系数,其公式如下:
2 S k i 2 k 1 S i 2 S ij
其中, :为估计的信度
K :测验的总题数
S Sij :题目与另一题目之共变数
8
20
分析结果2/2
21
效度1/2
量表的效度类型有三种:内容效度、效标关联效 度与建构效度。
–
–
内容效度 内容效度是指测量内容的适切性。 效标关联效度 效标关联效度是指测量工具的内容具有预测或估计的 能力。
22
效度2/2
建构效度 建构效度(或称构念效度)指问卷或量表能测量到理论上的 构念或特质之程度。建构效度有两类:收敛效度与区别效 度。而检测量表是否具备建构效度,最常使用之方法为因 素分析法。同一因素构面中,若各题目之因素负荷量 (factor loading)愈大(一般以大于0.5为准),则愈具备「收 敛效度」。若问卷题目在非所属因素构面中,其因素负荷 量愈小(一般以低于0.5为准),则愈具备「区别效度」。
总变异量的解释,在Principalcomponents的方法 及eigenvalue>1的原则萃取下,共萃取出五个因素, 累积解释变异量达65.041%。
Total Variance Explained Initial Eigenvalues Component Total % of Variance Cumulative % 1 4.674 31.159 31.159 2 1.519 10.127 41.287 3 1.346 8.974 50.261 4 1.210 8.064 58.325 5 1.008 6.717 65.041 6 .926 6.170 71.211 7 .730 4.867 76.078 8 .674 4.494 80.573 9 .603 4.020 84.593 10 .540 3.598 88.191 11 .462 3.083 91.274 12 .390 2.599 93.872 13 .334 2.226 96.098 14 .316 2.108 98.206 15 .269 1.794 100.000 Extraction Method: Principal Component Analysis. Extraction Sums of Squared Loadings Total % of Variance Cumulative % 4.674 31.159 31.159 1.519 10.127 41.287 1.346 8.974 50.261 1.210 8.064 58.325 1.008 6.717 65.041 Rotation Sums of Squared Loadings Total % of Variance Cumulative % 3.233 21.551 21.551 1.953 13.022 34.573 1.639 10.928 45.501 1.611 10.738 56.239 1.320 8.802 65.041
度是将受测题目分成两半,然后再以 前半段之题目与后半段之题目做相 关,若相关程度很高就代表折半信度 很高,是考验衡量的同构型。
5
3.复本信度(equivalent-forms method):为了
让不同程度的受测者能够明确了解问卷题
目的意思,有时候同一个测验中有甲、乙 卷两种以上的复本,由一组受试者先用甲 卷进行测试,同组人或另外一个人再用乙 卷进行测试,用这两种测验的结果求其相
– – –
1.点选Analyze/Data Reduction/Factor
2.程序操作
3.分析结果
24
范例二
2.程序操作
25
分析结果-1
KMO=0.806,Bartlett’s test Chi-sq = 426.339 (Sig=0.000<0.05),代表数据适合进行因素分析。
KMO and Bartlett's Test Kaiser-Meyer-Olkin Measure of Sampling Adequacy. Bartlett's Test of Sphericity Approx. Chi-Square df Sig. .806 426.339 105 .000
衡量發展程序包含: 量測發展 (-) 區別效度 1.對構念範圍的定義 程序 2.問項發展程序 註:+表示正相關,-表示負相關
圖 8—6
14
信度效度與其他相關因素的關係
資料來源:Paul Peter & Gilbert A. Churchill (1986), “Journal of Marketing Research”, 23 (February), p.1-10.
11
3.建构效度(construct validity):如果研究者要了 解某种衡量工具真正要衡量的是什么,那即是关心 它的建构效度。
4.学说效度(nomological validity):学说效度有时被 称为“通则化的效度(lawlike validity)”,学说效度 是基于对构念和从理论建构的正式假设而来的衡量 项目的明确调查。
16
信度2/2
量表信度的考验方法为Cronbachα系数,判定α系 数之准则如下:
– – –
所有问卷题目一起执行计算Cronbachα系数。 各题目单独逐题检查。 每个因素构面针对其所属问卷题目,执行计算 Cronbachα系数。
范例一
17
范例一
某研究设计一份有关“商店服务属性”之问卷初 稿,为慎重起见,选取30位受测者进行前测(结 果如数据文件:服务属性前测.sav)。请问这些题 项在测试结果后,是否具备内部一致性?
13
信度和效度及其影响因素 之关系
二、影响信度效度之因素
抽樣特性包含: 1. 樣本大小 2. 回覆率 3. 樣本的本質 4. 標的的種類 5. 蒐集資料的方法 6. 研究的種類 衡量特性包含: 1. 問項的數目 2. 問項的困難度 3. 使用尺度的種類 4. 使用幾點量表 5. 使用何種符號 抽樣特性 (+) (+) (-) (+) 量測特性 (+) 信度 (-) (+) 學說效度 (+) 收斂效度
2 i :测验的总变异数
共变量矩阵(因素一)
Sc6 Sc6 Sc7 Sc8 Sc9 1.047 0.992 0.667 0.643 1.630 1.052 0.988 1.247 0.961 1.218 Sc7 Sc8 Sc9
利用上述之公式,我们可以求得因素一之α值为:
4 1.047 1.630 1.247 1.218 1 4 1 1.047 ........ 1.218 2 0.992 ..... 0.961 0.8985
9
效度 一、效度的意义 所谓效度是指衡量的工具是否能真正 衡量到研究者想要衡量的问题。
10
二、效度的种类 1.内容效度(content validity): 以研究者的专业知识来主观判断所选择的尺度是 否能正确的衡量研究所欲衡量的东西。
2.效标关联效度(criterion-related validity): 所谓效标关联效度是指使用中的衡量工具和其他 的衡量工具来比较两者是否具有关联性。
3
三、以数学的观点来解释误差
四、衡量信度的方法
1.再测信度(test-retest method):再测信
度是让同一组受测者,在前后两个时
间内测验两次,以其两次测验的结果 求其相关系数,而此系数称为再测信 度(test-retest reliability)。
4
2.折半信度(split-half method):折半信
量表之信度与效度
潜在变数的衡量,通常是以量表或问卷做为测量 工具,评估量表优良与否的准则为信度与效度。 壹、信度 贰、效度
15
信度1/2
信度系指测验结果(受试者的回答)的稳定性及可 靠性(可相信的程度)。信度的衡量有三种类型: 稳定性、等值性与内部一致性。
– –
–
稳定性:用同一种测验对同一群受试者,前后施测两 次,然后依据两次测验分数计算相关系数。 等值性:交替使用一套测验的多种复本,再根据一群 受试者每个人在各种复本测验之得分,计算相关 系数。 内部一致性:指量表能否测量单一概念,同时反映组成 量表题项之内部一致性程度。
– – –
1.点选Analyze/scale/reliability analysis 2.程序操作 3.分析结果
18
范例一
2.程序操作
19
分析结果1/2
α系数=0.7984,代表十五道题目测量结果之内部 一致性具高可信度。若是想要再提高信度,可 由”CorrectedItem-Total correlation” 及”Cronbach Alpha if item Deleted”两栏数字来 判断删除那些题目可提高内部一致性,价格 的”CorrectedItem-Total correlation”数字-0.0693 表示「价格」与总分间的相关非常的低,如果将 之删除,则可提高α系数至0.8156。
12
信度和效度及其影响因素 之关系
一、信度和效度的关系
图 8— 5 信度和效度的关系图示
数据源:Duane Dav is (2004), “Business Research for Decision Making” , sixth edition, p.188.
情况一,弹痕分散于靶内各处,并无一致性可言,以衡量 的术语来说即是无信度无效度。 情况二,虽然弹痕很集中,即具有一致性,但是并没有在 靶中心,以衡量的观点来看,则是有信度无效度。 情况三,才是好的衡量,同时具有效度及信度。
–
–
范例二 范例三
23
范例二
某研究探讨有关大卖场”商店服务属性”所应包 含的内容,该研究藉由文献回顾及专家学者的删 选,设计十五道题目并以五等量表为衡量尺度的 问卷,以衡量”商店服务属性”。今抽取97位受 访者,请其填写问卷。请问该测量结果对于”商 店服务属性”的内容,是否具备建构效度?(资料 文件:商店服务属性.sav)
26
分析结果-2
因素一包含6个变量,但 「商店印象」问项在因素 一中之负荷量小于0.5,不 具收敛效度,且其在因素 二中之负荷量亦达0.457, 也不具备区别效度。至于 「质量」问项亦有相同问 题,因此必须将此两变项 删除,重新执行因素分析。
a Rotated Component Matrix
Component 3 4 服 務態 度 .814 .169 4.277E-02 -.127 整 齊乾 淨 .767 9.363E-02 .245 .102 氣 氛服 務 .742 .143 .115 .372 內 外裝 潢 .673 .192 9.826E-02 3.690E-02 商 店印 象 .493 .457 .398 .120 品質 .460 2.764E-02 -.413 .409 售 後服 務 1.585E-02 .760 -1.223E-02 .217 結 帳速 度 .368 .658 -3.563E-02 -.101 信 賴度 .493 .608 .124 .235 購 物便 利 9.755E-02 -5.452E-03 .824 -3.401E-03 取 得便 利 .207 4.903E-02 .665 .121 價格 .128 3.085E-03 7.654E-02 .774 種 類多 寡 -9.231E-03 .188 6.579E-02 .711 廣 告吸 引 .252 -.136 .273 .136 營 業時 間 .113 .461 5.819E-02 -.109 Extraction Method: Principal Component Analysis. Rotation Method: Varimax with Kaiser Normalization. a. Rotation converged in 15 iterations. 1 2
1
信度
一、信度的意义 所谓信度是衡量没有误差的程度, 也是测验结果的一致性(consistency) 程度,信度是以衡量的变异理论为基 础。
2
二、衡量误差的意义与来源 衡量误差可分为系统性误差及随机性误差。一般而 言,大部份的误差是系统性的(从偏差而来)。所谓系统 性误差也被视成常数性(constant)误差。而随机性误差 (random error)则不是一种常数性误差,其原因可能来自 情境因素,或者被受测者一时的情绪而影响。衡量误 差可能的来源如下: 1.由回应者(respondent)产生的误差 2.由情境因素产生的误差 3.由衡量者产生的误差 4.由衡量工具产生的误差
关系数即为复本信度。
6
4.库李信度(Kuder-Richardson reliability) 目的在于分析问项间的一致性。在估计信度上,最常用的 是库李二十号公式: pq k rKR 20 ( )(1 ) 2 k 1 S 其中K:表示整份测验的题数
pq :表整个测验中每题答对与答错百分比乘
积之总合
S2:表示测验总分的变异量
7
Lຫໍສະໝຸດ Baidu J.Cronbach另创系数,其公式如下:
2 S k i 2 k 1 S i 2 S ij
其中, :为估计的信度
K :测验的总题数
S Sij :题目与另一题目之共变数
8
20
分析结果2/2
21
效度1/2
量表的效度类型有三种:内容效度、效标关联效 度与建构效度。
–
–
内容效度 内容效度是指测量内容的适切性。 效标关联效度 效标关联效度是指测量工具的内容具有预测或估计的 能力。
22
效度2/2
建构效度 建构效度(或称构念效度)指问卷或量表能测量到理论上的 构念或特质之程度。建构效度有两类:收敛效度与区别效 度。而检测量表是否具备建构效度,最常使用之方法为因 素分析法。同一因素构面中,若各题目之因素负荷量 (factor loading)愈大(一般以大于0.5为准),则愈具备「收 敛效度」。若问卷题目在非所属因素构面中,其因素负荷 量愈小(一般以低于0.5为准),则愈具备「区别效度」。
总变异量的解释,在Principalcomponents的方法 及eigenvalue>1的原则萃取下,共萃取出五个因素, 累积解释变异量达65.041%。
Total Variance Explained Initial Eigenvalues Component Total % of Variance Cumulative % 1 4.674 31.159 31.159 2 1.519 10.127 41.287 3 1.346 8.974 50.261 4 1.210 8.064 58.325 5 1.008 6.717 65.041 6 .926 6.170 71.211 7 .730 4.867 76.078 8 .674 4.494 80.573 9 .603 4.020 84.593 10 .540 3.598 88.191 11 .462 3.083 91.274 12 .390 2.599 93.872 13 .334 2.226 96.098 14 .316 2.108 98.206 15 .269 1.794 100.000 Extraction Method: Principal Component Analysis. Extraction Sums of Squared Loadings Total % of Variance Cumulative % 4.674 31.159 31.159 1.519 10.127 41.287 1.346 8.974 50.261 1.210 8.064 58.325 1.008 6.717 65.041 Rotation Sums of Squared Loadings Total % of Variance Cumulative % 3.233 21.551 21.551 1.953 13.022 34.573 1.639 10.928 45.501 1.611 10.738 56.239 1.320 8.802 65.041
度是将受测题目分成两半,然后再以 前半段之题目与后半段之题目做相 关,若相关程度很高就代表折半信度 很高,是考验衡量的同构型。
5
3.复本信度(equivalent-forms method):为了
让不同程度的受测者能够明确了解问卷题
目的意思,有时候同一个测验中有甲、乙 卷两种以上的复本,由一组受试者先用甲 卷进行测试,同组人或另外一个人再用乙 卷进行测试,用这两种测验的结果求其相
– – –
1.点选Analyze/Data Reduction/Factor
2.程序操作
3.分析结果
24
范例二
2.程序操作
25
分析结果-1
KMO=0.806,Bartlett’s test Chi-sq = 426.339 (Sig=0.000<0.05),代表数据适合进行因素分析。
KMO and Bartlett's Test Kaiser-Meyer-Olkin Measure of Sampling Adequacy. Bartlett's Test of Sphericity Approx. Chi-Square df Sig. .806 426.339 105 .000
衡量發展程序包含: 量測發展 (-) 區別效度 1.對構念範圍的定義 程序 2.問項發展程序 註:+表示正相關,-表示負相關
圖 8—6
14
信度效度與其他相關因素的關係
資料來源:Paul Peter & Gilbert A. Churchill (1986), “Journal of Marketing Research”, 23 (February), p.1-10.
11
3.建构效度(construct validity):如果研究者要了 解某种衡量工具真正要衡量的是什么,那即是关心 它的建构效度。
4.学说效度(nomological validity):学说效度有时被 称为“通则化的效度(lawlike validity)”,学说效度 是基于对构念和从理论建构的正式假设而来的衡量 项目的明确调查。
16
信度2/2
量表信度的考验方法为Cronbachα系数,判定α系 数之准则如下:
– – –
所有问卷题目一起执行计算Cronbachα系数。 各题目单独逐题检查。 每个因素构面针对其所属问卷题目,执行计算 Cronbachα系数。
范例一
17
范例一
某研究设计一份有关“商店服务属性”之问卷初 稿,为慎重起见,选取30位受测者进行前测(结 果如数据文件:服务属性前测.sav)。请问这些题 项在测试结果后,是否具备内部一致性?
13
信度和效度及其影响因素 之关系
二、影响信度效度之因素
抽樣特性包含: 1. 樣本大小 2. 回覆率 3. 樣本的本質 4. 標的的種類 5. 蒐集資料的方法 6. 研究的種類 衡量特性包含: 1. 問項的數目 2. 問項的困難度 3. 使用尺度的種類 4. 使用幾點量表 5. 使用何種符號 抽樣特性 (+) (+) (-) (+) 量測特性 (+) 信度 (-) (+) 學說效度 (+) 收斂效度
2 i :测验的总变异数
共变量矩阵(因素一)
Sc6 Sc6 Sc7 Sc8 Sc9 1.047 0.992 0.667 0.643 1.630 1.052 0.988 1.247 0.961 1.218 Sc7 Sc8 Sc9
利用上述之公式,我们可以求得因素一之α值为:
4 1.047 1.630 1.247 1.218 1 4 1 1.047 ........ 1.218 2 0.992 ..... 0.961 0.8985
9
效度 一、效度的意义 所谓效度是指衡量的工具是否能真正 衡量到研究者想要衡量的问题。
10
二、效度的种类 1.内容效度(content validity): 以研究者的专业知识来主观判断所选择的尺度是 否能正确的衡量研究所欲衡量的东西。
2.效标关联效度(criterion-related validity): 所谓效标关联效度是指使用中的衡量工具和其他 的衡量工具来比较两者是否具有关联性。
3
三、以数学的观点来解释误差
四、衡量信度的方法
1.再测信度(test-retest method):再测信
度是让同一组受测者,在前后两个时
间内测验两次,以其两次测验的结果 求其相关系数,而此系数称为再测信 度(test-retest reliability)。
4
2.折半信度(split-half method):折半信
量表之信度与效度
潜在变数的衡量,通常是以量表或问卷做为测量 工具,评估量表优良与否的准则为信度与效度。 壹、信度 贰、效度
15
信度1/2
信度系指测验结果(受试者的回答)的稳定性及可 靠性(可相信的程度)。信度的衡量有三种类型: 稳定性、等值性与内部一致性。
– –
–
稳定性:用同一种测验对同一群受试者,前后施测两 次,然后依据两次测验分数计算相关系数。 等值性:交替使用一套测验的多种复本,再根据一群 受试者每个人在各种复本测验之得分,计算相关 系数。 内部一致性:指量表能否测量单一概念,同时反映组成 量表题项之内部一致性程度。
– – –
1.点选Analyze/scale/reliability analysis 2.程序操作 3.分析结果
18
范例一
2.程序操作
19
分析结果1/2
α系数=0.7984,代表十五道题目测量结果之内部 一致性具高可信度。若是想要再提高信度,可 由”CorrectedItem-Total correlation” 及”Cronbach Alpha if item Deleted”两栏数字来 判断删除那些题目可提高内部一致性,价格 的”CorrectedItem-Total correlation”数字-0.0693 表示「价格」与总分间的相关非常的低,如果将 之删除,则可提高α系数至0.8156。
12
信度和效度及其影响因素 之关系
一、信度和效度的关系
图 8— 5 信度和效度的关系图示
数据源:Duane Dav is (2004), “Business Research for Decision Making” , sixth edition, p.188.
情况一,弹痕分散于靶内各处,并无一致性可言,以衡量 的术语来说即是无信度无效度。 情况二,虽然弹痕很集中,即具有一致性,但是并没有在 靶中心,以衡量的观点来看,则是有信度无效度。 情况三,才是好的衡量,同时具有效度及信度。
–
–
范例二 范例三
23
范例二
某研究探讨有关大卖场”商店服务属性”所应包 含的内容,该研究藉由文献回顾及专家学者的删 选,设计十五道题目并以五等量表为衡量尺度的 问卷,以衡量”商店服务属性”。今抽取97位受 访者,请其填写问卷。请问该测量结果对于”商 店服务属性”的内容,是否具备建构效度?(资料 文件:商店服务属性.sav)
26
分析结果-2
因素一包含6个变量,但 「商店印象」问项在因素 一中之负荷量小于0.5,不 具收敛效度,且其在因素 二中之负荷量亦达0.457, 也不具备区别效度。至于 「质量」问项亦有相同问 题,因此必须将此两变项 删除,重新执行因素分析。
a Rotated Component Matrix
Component 3 4 服 務態 度 .814 .169 4.277E-02 -.127 整 齊乾 淨 .767 9.363E-02 .245 .102 氣 氛服 務 .742 .143 .115 .372 內 外裝 潢 .673 .192 9.826E-02 3.690E-02 商 店印 象 .493 .457 .398 .120 品質 .460 2.764E-02 -.413 .409 售 後服 務 1.585E-02 .760 -1.223E-02 .217 結 帳速 度 .368 .658 -3.563E-02 -.101 信 賴度 .493 .608 .124 .235 購 物便 利 9.755E-02 -5.452E-03 .824 -3.401E-03 取 得便 利 .207 4.903E-02 .665 .121 價格 .128 3.085E-03 7.654E-02 .774 種 類多 寡 -9.231E-03 .188 6.579E-02 .711 廣 告吸 引 .252 -.136 .273 .136 營 業時 間 .113 .461 5.819E-02 -.109 Extraction Method: Principal Component Analysis. Rotation Method: Varimax with Kaiser Normalization. a. Rotation converged in 15 iterations. 1 2