spss因子分析理论原理及操作分析
合集下载
相关主题
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
因子分析基本原理
• 用少数几个抽象的因子,去描述多个指标或者因素(原变量)之间的 联系,将相互之间关系比较密切的变量归为同一个类别之中,每一类 变量就变成了一个因子。 • 因子分析的基本步骤:
1. 因子分析的前提条件——信度与效度检验 原因:因子分析的主要仸务是对原变量进行浓缩,将原变量中的信息重叠 部分提取并综合成因子。 前提条件:原变量内部一致性高、原有变量存在较强的相关关系。 检验方法:克朗巴哈α(Cronbach‘s Alpha)系数、KMO检验和Bartlett检 验等方法 2. 因子提取:将原有变量综合成几个少数的因子——因子分析的核心 3. 使因子具有命名解释性 4. 计算个样本的因子得分
旅游学刊论文
实例操作
• 案例数据来源 • *************** • A1到F4关于游客公平感知的因子分析
实例操作
• STEP 1 检验是否可进行因子分析——信度与效度检验 1.信度检验 方法:采取布朗巴哈α系数(Cronbach‘s Alpha) 操作步骤:analyze→scale →reliability Analysis
C5
D1 D2 D3 D4 D5 E1 E2 E3 F1 F2 F3 F4
因子方差贡献——主成分分析法
Total Variance Explained
Initial Eigenvalues Component 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 Total 15.025 1.136 1.038 .856 .742 .623 .606 .515 .445 .415 .381 .363 .348 .324 .265 .252 .237 .234 .208 .198 .193 .164 .155 .144 .135 % of Variance 60.101 4.543 4.150 3.424 2.966 2.490 2.426 2.059 1.781 1.659 1.523 1.454 1.392 1.294 1.058 1.008 .949 .937 .832 .792 .771 .654 .621 .576 .540 Cumulative % 60.101 64.644 68.794 72.218 75.184 77.674 80.100 82.159 83.940 85.599 87.122 88.576 89.968 91.262 92.320 93.328 94.277 95.214 96.045 96.837 97.608 98.262 98.884 99.460 100.000 Total 15.025 1.136 1.038 .856 .742 .623 Extraction Sums of Squared Loadings % of Variance 60.101 4.543 4.150 3.424 2.966 2.490 Cumulative % 60.101 64.644 68.794 72.218 75.184 77.674 Total 4.502 4.249 3.169 2.776 2.670 2.051 Rotation Sums of Squared Loadings % of Variance 18.009 16.997 12.677 11.106 10.682 8.203 Cumulative % 18.009 35.006 47.684 58.790 69.472 77.674
•总个案数为377,其中有效个 案356个,排除个案21个
•由信度分析结果可知, Cronbach’sα系数为0.972, 系数值很高,表明问卷的内 部一致性好,即信度好,该 问卷(用于因子分析的数据) 有很高的使用价值。
效度检验
2.效度检验 目的:检验原有变量相关性 方法:KMO and Bartlett's Test KMO and Bartlett's Test
• 因子
将众多的原始变量综合成较少的几个综合指标,这些综合指标就是因子。 特点: • 因子个数k小于原变量个数k——信息简化 • 因子能够反映原有变量大部分信息——因子分析的有效性 • 因子之间的线性关系不显著——因子之间相互独立 • 因子可以进行命名——有利于对因子分析结果进行解释评价
因子载荷
• 对于因子模型:xi=ai1f1+ai2f2+…+aikfk+εi(i=1,2,3…,p)
信度与效度
• 信度
• 目的:测量的是数据的可靠程度 • 工具:spss软件中信度检验中Cronbach‘s α系数进行内部一致性信度 检验,考察的问题是否测验了相同的内容 • 指标:α系数大于0.7说明测量的内部一致性较高。
• 效度
• 目的:检验的是研究的效果(有效性),是否达到预期目标 • 工具:运用spss软件进行因子分析 • 前提:对数据是否能进行因子分析进行检验,采用KMO值和Bartlett球形 检验。 • KMO值越大,越接近于1,则说明该数据库越适合进行因子分析。 • Bartlett,一般认为P<0.001时,否定原假设,即认为变量间的相关矩阵 不是单位矩阵,各变量间具有一定的相关性,可以进行因子分析。
• 共同度量是评价xi信息丢失程度的重要指标。如果大部分原有变量的 变量共同度均较高(如高于0.7)则说明提取的因子能够很好的反应 原有变量的大部分信息(如70%以上),也可以说是衡量因子分析效 果的指标。
因子的方差贡献
• 因子分析模型中,第j列因子负载的平方和gj²称为因子fj对所有原变量 的贡献。 • gj²=a1j²+a2j²+…+apj² (j=1,2,3…,k) • 表示同一个因子fj对个变量所提供的方差贡献总和,反映因子fj对原有 变量方差的解释能力。 • 因子方差贡献的值越高,就说明这个因子的重要性越高。
Case Processing Summary
N Cases Valid Excluded(a) Total 356 21 377 % 94.4 5.6 100.0 Cronbach's Alpha .972 N of Items 25
Reliability Statistics信度检验
a Listwise deletion based on all variables in the procedure.
Extraction Method: Principal Component Analysis.
因子方差贡献——主成分分析法
Initial Eigenvalues Component 1 2 3 4 Total 15.025 1.136 1.038 .856 .742 .623 .606 .515 .445 % of Variance Cumulative % 60.101 60.101 4.543 4.150 3.424 2.966 2.490 2.426 2.059 1.781 64.644 68.794 72.218 75.184 77.674 80.100 82.159 83.940 Extraction Sums of Squared Loadings Total 15.025 1.136 1.038 .856 .742 .623 % of Variance Cumulative % 60.101 60.101 4.543 4.150 3.424 2.966 2.490 64.644 68.794 72.218 75.184 77.674 Rotation Sums of Squared Loadings Total 4.502 4.249 3.169 2.776 2.670 2.051 % of Variance Cumulative % 18.009 18.009 16.997 12.677 11.106 10.682 8.203 35.006 47.684 58.790 69.472 77.674
共同度量
• 因子分析模型中,第i行因子负载(相关系数aij,j=1,2,…,k)的平 方和,共同度量( Communality ),记为hi²=∑aij²。原变量的方差可以 由两个部分来解释:
1. 共同度。所有公因子对变量xi方差说明的比例,变量共同度越接近1,则 全部公因子解释了变量xi的大部分方差,丢失的信息较少; 2. 部分特殊因子对变量方差的贡献ε²,不能被全体公因子解释的部分,ε² 越小,则说明丢失的信息越少。
概念理解
• 因子分析
• 用几个少数的抽象的变量(因子)来表示其基本的数据结构。 • 前提:变量相关、以最少的信息丢失为前提。 • 目的:寻求变量基本结构、对变量进行分类、简化观测数据、用少数的 变量解释研究复杂的问题。 • 方法:通过现在变量测量潜在抽象的变量,通过具体指标测评抽象因子 的统计分析。
SPSS因子分析
大纲
• • • • 基本概念理解 因子分析原理 案例解读 实例操作
因子分析的数学模型
x1=a11f1+a12f2+a13f3+…+a1kfk+ε1 x2=a21f1+a22f2+a23f3+…+a2kfk+ε2 … xp=ap1f1+ap2f2+ap3f3+…+apkfk+εp
• 其中x1,x2,…,xp为p个原有变量,是均值为零,标准差为1的标准化 变量,F1,F2,…,Fk为k个因子变量,k<p,表示成矩阵形式为: X=AF+ε 。 • A为因子载荷矩阵,aij是第i个原有变量在第j个因子变量上的负荷。 • ε为特殊因子,表示原有变量不能被公因子所解释的部分。
因子分析的应用——案例
• • • • • • • 复合型文化遗产旅游产品开収路径分析_以福建马尾船政文化为例 供需双方对景区文化偏好的差异性研究_以天柱山风景区为例 家庭生命周期与旅游态度的关联研究_以长沙市居民为例 旅游目的地非功用性定位研究_以目的地品牌个性为分析指标 世界遗产地旅游企业环境行为及其驱动机制_张家界饭店企业实证 饮食旅游动机对游客满意度和行为意向的影响研究 转型期居民对城市公园免费开放的感知分析_以广州市为例
• 其中,aij为因子载荷,表示第i个变量在第j个因子上的负荷。在因子 不相关的前提下,因子载荷aij是变量xi与因子fi的相关系数,反映了变 量xi与因子fi的相关程度,也反映了因子fj对变量xi的重要程度:
因子负载越大,说明第i个变量与第j个因子的关系越密切,该因子对变量 重要程度越高 因子负载越小,说明第i个变量与第j个因子的关系越疏远,该因子对变量 重要程度越小。
Kaiser-Meyer-Olkin Measure of Sampling Adequacy. .966 Bartlett's Test of Sphericity Approx. Chi-Square df Sig. 7994.942 300 .000
•KMO=0.966>0.6,说明因子分析的 效果很好; •Bartlett球形检验值为7994.942, P=0.000<0.001,否定原假设,即认 为变量间的相关矩阵不是单位矩阵, 各变量间具有一定的相关性,可以 进行因子分析。
1.000 1.000 1.000 1.000 1.000 1.000 1.000 1.000 1.000 1.000 1.000 1.000 1.000 1.000 1.000 1.000 1.000
.719
.834 .802 .812 .826 .757 .709 .781 .751 .742 .764 .788 .825 .835 .834 .783 .760 .801
Communalities共同度
Initial A1 A2 A3 A4 B1 B2 B3 B4 C1 C2 C3 C4 1.000 1.000 1.000 1.000 1.000 1.000 1.000 Extraction .722 .754 .735 .705 .816 .750 .813
1.000
STEP2:因子提取
• 操作:Analyze→Data Reduction→Factor
• 结果分析 Fact Analysis
Communalities共பைடு நூலகம்度——公因子方差
Initial总方差绝对值为1,Extraction提取的因子的总方差 越接近于1,则,子对原有变量方差可解释的比例越大,信息 丢失越少。 由Communalities分析结果可知: •所有24个原始变量的共同度都超过了0.7,其中还有10个原 有变量的共同度超过了0.8。 •提取的因子解释了原有变量方差的大部分,超过70%,信 息缺失少。