SPSS因子分析和主成分分析论文精选文档

合集下载

主成分分析和因子分析的SPSS实现比较

主成分分析和因子分析的SPSS实现比较

主成分分析和因子分析的SPSS实现比较主成分分析和因子分析是多元统计方法中关系密切的两种方法,应用范围十分广泛,可以解决经济、教育、科技、社会等领域中的综合评价问题。

主成分分析采用降维的思想,将研究对象的多个相关变量(指标)综合为少数几个不相关的变量,反映原变量提供的主要信息。

因子分析是主成分分析的推广和发展,它将具有错综复杂关系的变量综合为数量较少的几个因子,以再现原始变量与因子之间的相互关系,同时根据不同因子还可以对变量进行分类,它属于多元分析中处理降维的一种统计方法。

但是,在许多论文中用SPSS进行综合分析时,出现这两种方法运用混淆的错误。

比如,主成分分析中对变量进行了因子旋转,因子分析的公因子系数错误等问题。

本文就此对主成分分析和因子分析的异同进行比较,并在SPSS和DPS软件上如何实现给予说明。

一、主成分分析与因子分析的异同点两者的相同点:1、思想一致:都是降维的思想;2、应用范围一致:都要求变量之间具有不完全的相关性;3、数据处理过程一致:数据的无量纲化,求相关系数矩阵的特征值和特征向量,通过累计贡献率确定主成分个数、因子个数;4、合成方法一致:都没有考虑原始变量之间的关系,直接用线性关系处理变量与主成分和因子之间的关系。

两者的不同点:1、方差损失上:主成分解释了原始变量的全部方差,无方差损失;因子模型中除了有公因子外还有特殊因子,公因子只解释了部分信息,有方差损失;2、唯一性:主成分分析不存在因子旋转,主成分是唯一的;因子分析进行因子旋转,解不唯一;3、实际意义:主成分没有实际意义;公因子有实际意义;4、应用:主成分侧重信息贡献、影响力综合评价;因子分析侧重成因清晰性的综合评价。

二、SPSS上的实现1、主成分分析在SPSS上的实现(1)将原始数据无量纲化。

传统主成分分析进行无量纲化处理的方法是“中心标准化”,这在SPSS中通过Analyse-DescriptiveStatistics-Descriptive中Save standardized values as variables执行。

主成分分析与因子分析(四):因子分析概述

主成分分析与因子分析(四):因子分析概述

主成分分析与因子分析(四):因子分析概述前面的文章我们介绍了使用SAS实现主成分分析。

从这篇文章开始介绍因子分析。

前面讨论的主成分分析是对现有的随机变量通过线性变换生成新的随机变量,由于新生成的随机变量是按照对变异贡献的大小排序的,因此仅仅考察前几个主成分就可以实现分析目的,使问题得到了简化。

因子分析的目的也是寻找潜在的少数几个(少于原始随机变量数目)新的变量,以便在实际工作中可以采取更合理的方案或措施,并揭示隐藏在数据中的基本规律。

主成分分析考察和解释的是方差,也就是数据的变异程度,而因子分析却是从随机变量协方差也就是相关性的角度进行研究的。

公共因子与特殊因子因子就是前面所说的试图寻找到的潜在的、个数较少、反映原始随机变量相关性的新随机变量。

前面介绍的主成分可以由原始变量线性表示,是可以观测的。

与主成分不同,因子往往不能像主成分一样,由原始变量线性表示,因此是不可观测的。

在因子分析中,因子可以分为公共因子和特殊因子。

对原始数据若干个指标都起作用的称之为公共因子,仅仅对某个指标起作用的称之为特殊因子。

例如,对若干名高中学生的语文、数学与英语成绩进行分析,通过分析,得知每个科目的成绩和一个变量都相关,我们称这个变量为智力。

这个变量“智力”是虚构出来的、不可观测的,即因子。

该因子反映了三个科目成绩的变异,因此,是一个公共因子。

每个科目的成绩除了和智力相关,可能还和其他因素相关。

我们将其他因素笼统地用另外一个虚拟变量来表示,这个虚拟变量称为特殊因子。

因子分析的计算过程因子分析过程可以分为:因子载荷计算、因子旋转与因子得分三个部分。

因子载荷的计算方法主要有主成分法、主轴因子法、最小二乘法、极大似然法以及因子提取法。

这些方法求解的出发点不同,所得的结果也不尽相同。

在对因子载荷进行计算后,就要结合求解问题的背景去分析公共因子的意义了。

如果公共因子的实际意义不明显,可以尝试着进行因子旋转。

经过旋转,因子的结构会发生变化。

运用spss做因子分析与主成分分析 (1)

运用spss做因子分析与主成分分析 (1)

• 怎么解释这两个主成分。前面说过主成分 是原始六个变量的线性组合。是怎么样的 组合呢?SPSS可以输出下面的表。
a Com ponent Matr ix
Component 1 2 3 4 MATH -.806 .353 -.040 .468 PHYS -.674 .531 -.454 -.240 CHEM -.675 .513 .499 -.181 LITERAT .893 .306 -.004 -.037 HISTORY .825 .435 .002 .079 ENGLISH .836 .425 .000 .074 Extraction Method: Principal Component Analysis. a. 6 components extracted. 5 .021 -.001 .002 .077 -.342 .276 6 .068 -.006 .003 .320 -.083ቤተ መጻሕፍቲ ባይዱ-.197



可以看出,因子分析和主成分分析都依赖于原始 变量,也只能反映原始变量的信息。所以原始变 量的选择很重要。 (因子要相关,不能完全独立)另外,如果原始 变量都本质上独立,那么降维就可能失败,这是 因为很难把很多独立变量用少数综合的变量概括。 数据越相关,降维效果就越好。 在得到分析的结果时,并不一定会都得到如我们 例子那样清楚的结果。这与问题的性质,选取的 原始变量以及数据的质量等都有关系 在用因子得分进行排序时要特别小心,特别是对 于敏感问题。由于原始变量不同,因子的选取不 同,排序可以很不一样。
因子分析概述

定义:因子分析以最少的信息丢失为前提,将 众多的原有变量综合成较少几个综合指标,名 为因子。通常,因子有以下几个特点
因子个数远远少于原有变量的个数 因子能够反映原有变量的绝大部分信息 因子之间的线性关系不显著(即独立的)

基于SPSS的主成分分析与因子分析的辨析

基于SPSS的主成分分析与因子分析的辨析
#p),而 #1>#2, ...,#p≥0 是相关矩阵的特征根, 其相应的特征向 量为。所以求主成分的过程实际上就是求相关矩阵的特征 值和特征向量的过程。主成分个数的确定有两个标准: 累计 贡献率达到 85%以上; 或在特征根的均值以上。可见建立主 成分模型是不需要因子载荷量的。
总第 89 期
问题探讨
Extraction Sums of Squared Loadings
Total
% of Variance Cumulative %
10.837
43.348
43.348
5.802
23.207
66.555
2.060
8.240
74.795
注: 为了与卢书上的内容相对应在此只列出了所选定三个主成分。
因子载荷量是主成分变量与原变量的相关系数, 其绝 对值大小刻画了某主成分的主要经济意义及其经济成因, 能 够 反 映 出 主 成 分 与 各 变 量 间 的 亲 疏 关 系 。在 主 成 分 分 析 中, 为我们对主成分做出合理的经济解释提供了重要依 据。经济意义上解释不清, 数量上的计算再好也是没用的。 主 成 分 的 载 荷 A=(aij)p×p 与 特 征 向 量 u=(uij)p×p 之 间 的 关 系 为
Hale Waihona Puke 特征向量矩阵必须再根据公式( *) 来计算求得。在确定 主成分个数 m 后( m<p) 即可 建 立 主 成 分 模 型 y=u!z( 取 其 前 m 个变量, 其中 z 为原始变量标准化后的数据向量) 。即:
y1=0.08321zv1+0.29039zv2+0.23622zv3+0.14924zv4+...+ 0.07235zv22- 0.23282zv23- 0.04911zv24- 0.23237zv25

主成分分析、因子分析实验报告--SPSS

主成分分析、因子分析实验报告--SPSS

主成分分析、因子分析实验报告--SPSS主成分分析、因子分析实验报告SPSS一、实验目的主成分分析(Principal Component Analysis,PCA)和因子分析(Factor Analysis,FA)是多元统计分析中常用的两种方法,旨在简化数据结构、提取主要信息和解释变量之间的关系。

本次实验的目的是通过使用 SPSS 软件对给定的数据集进行主成分分析和因子分析,深入理解这两种方法的原理和应用,并比较它们的结果和差异。

二、实验原理(一)主成分分析主成分分析是一种通过线性变换将多个相关变量转换为一组较少的不相关综合变量(即主成分)的方法。

这些主成分是原始变量的线性组合,且按照方差递减的顺序排列。

主成分分析的主要目标是在保留尽可能多的数据信息的前提下,减少变量的数量,从而简化数据分析和解释。

(二)因子分析因子分析则是一种探索潜在结构的方法,它假设观测变量是由少数几个不可观测的公共因子和特殊因子线性组合而成。

公共因子解释了变量之间的相关性,而特殊因子则代表了每个变量特有的部分。

因子分析的目的是找出这些公共因子,并估计它们对观测变量的影响程度。

三、实验数据本次实验使用了一份包含多个变量的数据集,这些变量涵盖了不同的领域和特征。

数据集中的变量包括具体变量 1、具体变量 2、具体变量 3等,共X个观测样本。

四、实验步骤(一)主成分分析1、打开 SPSS 软件,导入数据集。

2、选择“分析”>“降维”>“主成分分析”。

3、将需要分析的变量选入“变量”框。

4、在“抽取”选项中,选择主成分的提取方法,如基于特征值大于1 或指定提取的主成分个数。

5、点击“确定”,运行主成分分析。

(二)因子分析1、同样在 SPSS 中,选择“分析”>“降维”>“因子分析”。

2、选入变量。

3、在“描述”选项中,选择相关统计量,如 KMO 检验和巴特利特球形检验。

4、在“抽取”选项中,选择因子提取方法,如主成分法或主轴因子法。

基于SPSS统计软件的因子分析法及实证分析

基于SPSS统计软件的因子分析法及实证分析

基于SPSS统计软件的因子分析法及实证分析一、本文概述随着信息技术的迅猛发展,数据分析已经成为众多领域决策和研究的核心工具。

其中,因子分析法作为一种降维技术,在提取和分析大量数据中的潜在结构、识别并解释关键变量间的关联性方面,展现出强大的实用性。

本文旨在探讨基于SPSS统计软件的因子分析法及其在实证分析中的应用。

我们将首先介绍因子分析法的基本原理及其在统计学中的地位,然后详细阐述在SPSS软件中实现因子分析的步骤和方法,最后通过实证分析案例来展示因子分析法在解决实际问题中的应用效果。

本文的目的不仅在于为读者提供一套系统的因子分析操作指南,更希望通过实证分析来揭示因子分析法在实际研究中的价值,为相关领域的学者和实践者提供有益的参考和启示。

二、因子分析法的理论基础因子分析法是一种多元统计分析方法,它的理论基础主要源自于数理统计学、线性代数以及心理测量学等领域。

该方法通过研究众多变量之间的内部依赖关系,找出控制所有变量的少数几个随机变量去描述多个变量或因素之间的联系。

这些少数几个随机变量被称为“因子”或“潜在变量”,它们能够反映原有变量的大部分信息。

因子分析法的核心在于通过降维技术简化数据结构,即通过对原始变量的相关矩阵或协方差矩阵内部结构的研究,找出能够解释大部分变量变异的少数几个公共因子。

这些公共因子是原始变量的线性组合,彼此之间互不相关,并且每个原始变量都可以表示为这些公共因子的线性组合加上一个特殊因子。

特殊因子代表了原始变量中不能被公共因子解释的部分。

因子分析法的数学模型可以表示为: = AF + ε,其中是原始变量向量,A是因子载荷矩阵,F是公共因子向量,ε是特殊因子向量。

因子载荷矩阵A的元素j表示第i个原始变量在第j个公共因子上的载荷,即第i个原始变量与第j个公共因子之间的相关程度。

在因子分析过程中,通常需要进行几个关键步骤,包括:计算相关矩阵或协方差矩阵,估计因子载荷矩阵,进行因子旋转以改善因子的解释性,以及计算因子得分以便进行后续的统计分析。

主成份分析因子分析毕业论文终稿

主成份分析因子分析毕业论文终稿

主成份分析因子分析毕业论文终稿学科分类号110 黑龙江科技大学本科学生毕业论文题目主成分与因子分析对黑龙江省城市经济发展水平的评价The principal components and factor analysisof urban economic development levelevaluation of heilongjiang province姓名学号院(系)理学院专业、年级数学与应用数学指导教师2014年6月12日摘要经济是指一个国家国民经济的总称。

我们要提高某地方人民的生活水平,要更好更快地发展某个地区,就必须充分了解这个地区现有的经济发展状况。

因此,现有的经济发展状况研究对将来的发展有着非常重要的指导意义。

主成分分析也称主分量分析,就是设法将原来指标重新组合成一组新的互相无关的几个综合指标来代替原来指标。

因子分析是主成分分析的推广和发展,它也是将具有错综复杂关系的变量综合为数量较少的几个因子,以再现原始变量与因子的相互关系,同时根据不同因子还可以对变量进行分类。

主成分分析与因子分析都是多元分析中处理降维的一种统计方法。

本文通过学习与查阅相关资料找到黑龙江省12个地级市的10个具有代表性指标,运用spss统计分析软件对这些指标进行主成分分析和因子分析得到特征值、方差贡献率及公共因子等相关数据。

并利用这些数据对12个市经济水平划分等级。

关键词主成分分析因子分析经济spss统计分析软件IAbstractEconomy refers to the floorboard of the national economy of a country. We will improve the level of a local people's life, to somewhere better and faster development, we must fully understand the current situation of economic development. Therefore, the existing research on the development of future economic development has a very important guiding significance.Principal component analysis (also called principal component analysis, is to try the original index combined into a new set of several comprehensive index instead of the original index has nothing to do with each other, at the same time, according to the actual need to recommend a few less comprehensive response as much as possible the original information of indicators. Is a generalization of the principal component analysis and factor analysis, it is also will have the intricate relationship between variables comprehensive to a small number of several factors, and to recreate the relationship of the original variables and factor, at the same time according to different factors can also categorize variables,. Principal component analysis and factor analysis is a multivariate analysis of a statistical method of dealing with the dimension reduction. In this article, through learning and access to relevant data found nine representative indexes of 12 cities in heilongjiang province, using the SPSS statistical analysis software to the indicators of principal component analysis and factor analysis of the characteristic value, the variance contribution rate and public factor and related data. And using the data of 13 cities economic grade level.Key words Principal component analysis Factor analysis Economic SPSS statistical analysis softwarII目录摘要 (I)Abstract (II)第1章绪论 (1)1.1 选题的背景和提出 (1) (1) (2)1.2 选题的意义和目的 (3) (3) (3)1.3 主成分分析和因子分析的发展及应用 (4) (4) (4)1.4 本文主要研究内容 (5)第2章主成分与因子分析 (6)2.1 主成分分析的内容 (6) (6) (6) (8)2.2 主成分分析的求解方法和数学模型 (8)2.3 主成分分析的基本步骤 (11)2.4 因子分析的内容 (13) (13) (13)III2.5 因子分析的求解方法和数学模型 (14) (14) (15) (16)2.6 计算步骤 (16)第3章主成分与因子分析在黑龙江省城市经济水平研究中的应用 (17)3.1主成分分析法 (18)3.2 因子分析法 (22)3.3 综合评价结果分析 (26)结论 (28)致谢 (29)参考文献 (30)IVContentsAbstract....................................................................................... 错误!未定义书签。

应用统计学因子分析与主成分分析案例解析+SPSS操作分析[1]--001

应用统计学因子分析与主成分分析案例解析+SPSS操作分析[1]--001

应用统计学因子分析与主成分分析案例解析+SPSS操作分析[1]--001因子分析与主成分分析摘要:通过搜集相关数据,采用因子分析法和主成份分析法,对我国各个省市自治区经济发展基本情况的八项指标进行分析。

具体采用的指标只有:GDP、居民消费水平、固定资产投资、职工平均工资、货物周转量、居民消费价格指数、商品零售价格指数、工业总产值。

这是一个综合分析问题,八项指标较多,用主成分分析法进行综合评价。

关键词:由于样本数比较多,这里不再给出,可参见factor1.sav文件引言:因子分析是寻找潜在的起支配作用的因子模型的方法。

因子分析是根据相关性大小把变量分组,使得同组内的变量之间相关性较高,但不同的组的变量相关性较低。

每组变量代表一个基本结构,这个基本结构称为公共因子。

对于所研究的问题就可试图用最少个数的不可测的所谓公共因子的线性函数与特殊因子之和来描述原来观测的每一分量。

通过因子分析得来的新变量是对每个原始变量进行内部剖析。

因子分析不是对原始变量的重新组合,而是对原始变量进行分解,分解为公共因子和特殊因子两部分。

具体地说,就是要找出某个问题中可直接测量的具有一定相关性的诸指标,如何受少数几个在专业中有意义、又不可直接测量到、且相对独立的因子支配的规律,从而可用各指标的测定来间接确定各因子的状态。

基本步骤:在SPSS中进行因子分析的步骤如下:选择“分析---降维---因子分析”,在弹出的对话框里(1)描述---系数、KMO 与Bartlett 的球形度检验 (2)抽取---碎石图、未旋转的因子解(3)旋转---最大方差法、旋转解、载荷图(4)得分---保存为变量、显示因子得分系数矩阵 (5)选项---按大小排序 点击确定得到如下各图图3-1图3-2KMO 和 Bartlett 的检验取样足够度的 Kaiser-Meyer-Olkin 度量。

.620 Bartlett 的球形度检验近似卡方 231.285df 28 Sig..000图3-3公因子方差初始 提取 GDP1.000 .945 居民消费水平 1.000 .799 固定资产投资 1.000 .902 职工平均工资 1.000 .873 货物周转量 1.000 .857 居民消费价格指数1.000.957相关矩阵GDP 居民消 费水平 固定资产投资 职工平均工资 货物周转量 居民消费价格指数商品价格指数 工业总产值相关GDP1.000.267.951 .187 .617 -.273 -.264 .874 居民消费水平 .267 1.000 .426.716 -.151 -.235 -.593 .363 固定资产投资 .951 .426 1.000 .396.431 -.280 -.359 .792 职工平均工资 .187.716.396 1.000 -.357 -.145 -.543 .099 货物周转量 .617 -.151.431 -.3571.000 -.253 .022.659居民消费价格指数 -.273 -.235 -.280 -.145 -.253 1.000.763 -.125商品价格指数 -.264 -.593 -.359 -.543 .022 .763 1.000 -.192 工业总产值.874.363.792.099.659-.125 -.192 1.000商品价格指数 1.000 .928工业总产值 1.000 .904提取方法:主成份分析。

SPSS因子分析的优秀文档

SPSS因子分析的优秀文档

主成分分析
正如二维椭圆有两个主轴,三维椭球有三 个主轴一样,有几个变量,就有几个主成 分。 选择越少的主成分,降维就越好。什么是 标准呢?那就是这些被选的主成分所代表 的主轴的长度之和占了主轴长度总和的大 部分。有些文献建议,所选的主轴总长度 占所有主轴长度之和的大约85%即可, 其实,这只是一个大体的说法;具体选几 个,要看实际情况而定。
25000 10000 9000 25000
5
6 7 8 9 10 11 12
4000
8200 1200 9100 9900 9600 9600 9400
12.8
8.3 11.4 11.5 12.5 13.7 9.6 11.4
1600
2600 400 3300 3400 3600 3300 4000
主成分分析实例P330 -不旋转
市场研究中的顾客偏好分析
在市场研究中,常常要求分析顾客的偏好和当前市场的产品与顾 客偏好之间的差别,从而找出新产品开发的方向。顾客偏好分析 时常用到主成分分析方法(因子没有旋转)。 例子P330:数据来自SAS公司,1980年一个汽车制造商在竞争 对手中选择了17种车型,访问了25个顾客,要求他们根据自己的 偏好对17种车型打分。打分范围0~9.9, 9.9表示最高程度的偏 好。data13-02a(17×25:17个case,25个变量V1-V25) 菜单:Analyze-Data Reduction-Factor Variables :V1-V25 Extraction:method:Principal components Extract:Number of factors:3 要三个主成分



比较有用的结果:两个主成分(因子)f1,f2及因子载荷矩阵(Component Matrix),根据该 表可以写出每个原始变量(标准化值)的因子表达式: Pop0.581f1 + 0.806f2 School 0.767f1 - 0.545f2 employ 0.672f1 + 0.726f2 Services 0.932f1 - 0.104f2 house 0.791f1 - 0.558f2 每个原始变量都可以是5个因子的线性组合,提取两个因子f1和f2,可以概括原始变量所包 含信息的93.4%。 f1和f2前的系数表示该因子对变量的影响程度,也称为变量在因子上的 载荷。 但每个因子(主成分)的系数(载荷)没有很明显的差别,所以不好命名。因此为了对因子 进行命名,可以进行旋转,使系数向0和1两极分化,这就要使用选择项。

spss因子分析论文

spss因子分析论文

因子分析法在城市市政设施评价方面的应用刘建红(华北科技学院基础部计算B091)摘要:本论文主要说明主因子分析在城市市政设施评价方面的应用,运用功能强大的数据分析软件SPSS,简化计算方法,通过输入数据来源,得出各个评价图表,来分析在城市市政设施建设方面哪些因子更重要。

本文引入31个地区的城市市政设施的六项指标,年末实有道路长度(km),年末实有道路面积(万平方米),城市桥梁(座),城市排水管道长度(km),城市污水日处理能力(万平方米),城市路灯(盏)。

运用数据分析软件SPSS,得到在市政设施各个指标的相关性表,主成分表,及因子负荷矩阵,来反映各个因子的相关性,各个变量的变异可以由哪些因子解释。

通过因子的所占比重,可以看出城市市政设施哪些指标更重要。

关键字:因子分析法,SPSS,数据分析,相关性1、背景论述因子分析法的形成和发展已经有很长历史了,最早应用于研究解决心理学和教育方面的问题,目前这一方法应用范围已经十分广泛,在经济学、社会学、考古学、生物学、医学、地质学,以及体育科学等各个领域都取得了显著的成就。

因此,运用数据分析软件SPSS来处理这些城市市政设施的各项指标,就可以快速、准确得到主要因子,从而简化了人工计算的繁琐,使得因子分析法在生活领域的各个方面得到了广泛推广。

2、因子分析的基本原理因子分析的核心思想指通过建立一个从高维空间到低维空间的线性映射, 使该映射保持样本点在高维空间中的某些结构, 用降维的思想把多指标转化为少数几个综合指标。

少数几个不可测的综合指标通常被称为公共因子,因子分析是根据相关性的大小将原始变量分组, 使组内变量相关性较高, 组间变量相关性较低。

其每组变量代表一个公共因子, 它反映了问题的一个方面、一个维度。

进而利用几个公共因子的方差贡献率作为权重来构造综合评价函数, 简化众多原始变量、有效处理指标间的重复信息。

但若求出的各公共因子的典型代表变量不很突出, 则应通过适当方法进行因子旋转, 以求能较好的解释公共因子,常用正交旋转来解释公共因子。

应用统计学因子分析与主成分分析案例解析+SPSS操作分析[1]--001.doc

应用统计学因子分析与主成分分析案例解析+SPSS操作分析[1]--001.doc

因子分析与主成分分析摘要:通过搜集相关数据,采用因子分析法和主成份分析法,对我国各个省市自治区经济发展基本情况的八项指标进行分析。

具体采用的指标只有:GDP、居民消费水平、固定资产投资、职工平均工资、货物周转量、居民消费价格指数、商品零售价格指数、工业总产值。

这是一个综合分析问题,八项指标较多,用主成分分析法进行综合评价。

关键词:由于样本数比较多,这里不再给出,可参见factor1.sav文件引言:因子分析是寻找潜在的起支配作用的因子模型的方法。

因子分析是根据相关性大小把变量分组,使得同组内的变量之间相关性较高,但不同的组的变量相关性较低。

每组变量代表一个基本结构,这个基本结构称为公共因子。

对于所研究的问题就可试图用最少个数的不可测的所谓公共因子的线性函数与特殊因子之和来描述原来观测的每一分量。

通过因子分析得来的新变量是对每个原始变量进行内部剖析。

因子分析不是对原始变量的重新组合,而是对原始变量进行分解,分解为公共因子和特殊因子两部分。

具体地说,就是要找出某个问题中可直接测量的具有一定相关性的诸指标,如何受少数几个在专业中有意义、又不可直接测量到、且相对独立的因子支配的规律,从而可用各指标的测定来间接确定各因子的状态。

基本步骤:在SPSS中进行因子分析的步骤如下:选择“分析---降维---因子分析”,在弹出的对话框里(1)描述---系数、KMO与Bartlett的球形度检验(2)抽取---碎石图、未旋转的因子解(3)旋转---最大方差法、旋转解、载荷图(4)得分---保存为变量、显示因子得分系数矩阵(5)选项---按大小排序点击确定得到如下各图图3-1相关矩阵GDP 居民消费水平固定资产投资职工平均工资货物周转量居民消费价格指数商品价格指数工业总产值相关GDP 1.000 .267 .951 .187 .617 -.273 -.264 .874 居民消费水平.267 1.000 .426 .716 -.151 -.235 -.593 .363 固定资产投资.951 .426 1.000 .396 .431 -.280 -.359 .792 职工平均工资.187 .716 .396 1.000 -.357 -.145 -.543 .099 货物周转量.617 -.151 .431 -.357 1.000 -.253 .022 .659 居民消费价格指数-.273 -.235 -.280 -.145 -.253 1.000 .763 -.125 商品价格指数-.264 -.593 -.359 -.543 .022 .763 1.000 -.192 工业总产值.874 .363 .792 .099 .659 -.125 -.192 1.000图3-2KMO 和 Bartlett 的检验取样足够度的 Kaiser-Meyer-Olkin 度量。

利用spss进行因子分析(r型)

利用spss进行因子分析(r型)

利用SPSS进行因子分析(R型)【例】与主成分分析的数据相同:全国30个省市的8项经济指标。

因子模型是一个封闭方程,通常采用主成分求解,称为“主因解”。

上次讲述的“利用SPSS进行主成分分析”的过程,实际上是因子分析的第一步。

在主成分分析基础上,加上因子旋转,就可完成基于主成分分析的所谓因子分析。

当然也可通过另外的途径进行因子分析,在此暂不涉及。

第一步:录入或调入数据(见图1)。

图1 录入工作表中的原始数据第二步,进行主成分分析(参见主成分分析部分,在此从略)。

第三步,因子正交旋转的系统设置。

沿着主菜单的“Analyze→Data Reduction→Factor…”路径打开因子分析选项框(图2),完成主成分分析的设置或过程以后,单击Rotation(旋转)按钮,打开“Factor Analysis: Rotation”(因子分析:旋转)选项单(图3),在Method(方法)栏中选中Varimax(方差极大正交旋转)复选项,此时Display(展示)栏中的Rotated Solution(旋转解)将被激活为系统默认态,选中Loading Plot(s)(载荷图)复选项,将会在输出结果中给出因子载荷图式。

注意此时的Maximum Iterations for Convergence(迭代收敛的最大次数)为系统默认的25次,如果数据变量较多或样本较大,经过25次迭代可能计算过程仍然未能收敛,需要改为50次、100次乃至更多,否则SPSS无法给出计算结果。

迭代次数越多,计算时间也就越长。

在多数情况下,不足25次迭代计算过程就会收敛。

图2 因子分析选项框图3 因子旋转对话框注意:与上述Maximum Iterations for Convergence(迭代收敛的最大次数)有关的设置是Extraction(提取)对话框中的迭代次数设置(图4),如果今后工作中修改了图3所示的迭代次数仍然未能给出结果,那就意味着图4所示的迭代次数设置没有增加;反过来也是一样。

(仅供参考)SPSS中的主成分分析与因子分析

(仅供参考)SPSS中的主成分分析与因子分析

主成分分析与因子分析及SPSS实现(一):原理与方法一、主成分分析(1)问题提出在问题研究中,为了不遗漏和准确起见,往往会面面俱到,取得大量的指标来进行分析。

比如为了研究某种疾病的影响因素,我们可能会收集患者的人口学资料、病史、体征、化验检查等等数十项指标。

如果将这些指标直接纳入多元统计分析,不仅会使模型变得复杂不稳定,而且还有可能因为变量之间的多重共线性引起较大的误差。

有没有一种办法能对信息进行浓缩,减少变量的个数,同时消除多重共线性?这时,主成分分析隆重登场。

(2)主成分分析的原理主成分分析的本质是坐标的旋转变换,将原始的n个变量进行重新的线性组合,生成n个新的变量,他们之间互不相关,称为n个“成分”。

同时按照方差最大化的原则,保证第一个成分的方差最大,然后依次递减。

这n个成分是按照方差从大到小排列的,其中前m个成分可能就包含了原始变量的大部分方差(及变异信息)。

那么这m个成分就成为原始变量的“主成分”,他们包含了原始变量的大部分信息。

注意得到的主成分不是原始变量筛选后的剩余变量,而是原始变量经过重新组合后的“综合变量”。

我们以最简单的二维数据来直观的解释主成分分析的原理。

假设现在有两个变量X1、X2,在坐标上画出散点图如下:可见,他们之间存在相关关系,如果我们将坐标轴整体逆时针旋转45°,变成新的坐标系Y1、Y2,如下图:根据坐标变化的原理,我们可以算出:Y1 = sqrt(2)/2 * X1 + sqrt(2)/2 * X2Y2 = sqrt(2)/2 * X1 - sqrt(2)/2 * X2其中sqrt(x)为x的平方根。

通过对X1、X2的重新进行线性组合,得到了两个新的变量Y1、Y2。

此时,Y1、Y2变得不再相关,而且Y1方向变异(方差)较大,Y2方向的变异(方差)较小,这时我们可以提取Y1作为X1、X2的主成分,参与后续的统计分析,因为它携带了原始变量的大部分信息。

至此我们解决了两个问题:降维和消除共线性。

  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

S P S S因子分析和主成分分析论文精选文档 TTMS system office room 【TTMS16H-TTMS2A-TTMS8Q8-基于因子分析的我国经济发展状况实证分析摘要:选取了2013年我国31个省、直辖市、自治区经济发展的10项指标作为研究对象,运用因子分析的方法,利用spss对数据进行计算,依据因子分析的结果对我国各省的经济发展做出综合评价,得出了这31各省份经济发展状况的综合排名,广东、江苏、山东、浙江、北京排在前5位,是中国各省、直辖市、自治区沿海经济发展较好的地区;甘肃、海南、青海、宁夏、西藏排在后5位,是西部地区经济发展较落后的地区,较为客观反映了中国各省、直辖市、自治区的综合经济实力,为中国各省、直辖市、自治区今后的经济发展提供了理论依据。

关键词:经济发展;因子分析;综合评价;主成分法一、引言我国地域辽阔,由于历史、地理位置及经济基础等原因,各地经济发展水平差异很大。

改革开放以来,特别是实施西部大开发、振兴东北地区等老工业基地、促进中部地区崛起、鼓励东部地区率先发展的区域发展总体战略以来,各地经济社会发展水平有了很大提高,人民生活也有了很大改善。

但区域发展不协调、发展差距拉大的趋势仍未根本改变。

本文从我国31 个省市自治区经济的发展视角入手,运用对应分析方法对我国各地区经济发展状况进行统计分析,用以说明我国各地区经济发展不协调的现状。

由于衡量各地区经济发展的指标有很多,故选取了比较有代表性的十个指标。

二、相关统计指标与数据的选取本文运用了因子分析的方法对我国31个省、直辖市、自治区的经济发展状况进行评价。

选取了10项经济指标:第一产业增加值(X1);第二产业增加值(X2);第三产业增加值(X3);地方财政预算收入(X4);地方财政预算支出(X5);固定资产投资额(X6);社会消费品零售总额(X7);货物进出口总额(X8);在岗职工平均工资(X9);城乡居民储蓄年末余额(X10)。

X2,X3,X4 反映的是经济总量中构成三大产业的不同增加值;X5,X6 反映的是地方财政预算收支;X7 反映的是居民的购买能力;X8反映的是对外贸易;X9,X10反映的是居民的收入与储蓄。

本文数据资料来源于《中国统计年鉴》(2013年),具体数据资料见表1。

三、数据分析过程(一)相关性分析用SPSS21.0数据处理系统将10项经济指标处理后,得到相关系数矩阵、巴特利特球度检验和KMO检验方法进行分析。

分析结果见表2和表3。

根据表2原有变量的相关系数矩阵,可以看到:大部分的相关系数都较均大于0.3,各变量呈较强的线性关系,能够从中提取公共因子,适合进行因子分析。

Bartlett检验的F值等于541.977,F值显着,Sig.(显着性)小于0.005,表明所取的数据满足正态总体分布;KMO值等于0.74,大于0.7,说明变量之间的相关性可以被其他变量解释,因此适合做因子分析。

(二)提取主因子根据原有变量的相关系数矩阵,采用主成分分析法提取因子并选取大于1的特征值,得出公因子差和分析结果如下表4。

从表中可以看出,10个变量的共同度基本都在80%以上,即这些变量的信息丢失较少,变量都能被因子解释,本次因子提取的总体效果较理想。

一般情况下,确定因子个数时,累计贡献率达到85%以上,本文提取特征值大于1的特征值,得到2个主因子代替原来的10 个因子累计贡献率达90.22%,因此取出的2个主因子基本上包括了X1~X10的大量信息。

分析结果见表5。

表5 解释的总方差成份初始特征值提取平方和载入旋转平方和载入合计方差的 %累积 %合计方差的 %累积 %合计方差的 %累积 %17.06870.68170.6817.06870.68170.681 6.84268.41768.4172 1.95419.54190.222 1.95419.54190.222 2.18021.80590.2223.397 3.97194.1934.291 2.91297.1065.122 1.22198.3276.074.74399.0707.049.48599.5558.032.32399.8789.008.07899.95610.004.044100.00由表5可知,第一个公因子的方差贡献率为70.681%,前两个公共因子的累计方差献率已达到90.22>85%,即前两个公共因子已代表了原始数据的绝大部分信息。

因子分析效果较理想。

在因子旋转后总的累计方差贡献率没有改变,没有影响到原有变量的共同度,但重新分配了各个因子解释原有变量的方差,改变了各因子的方差贡献,使得因子更易于理解。

图1图1中,横坐标为因子数目,纵坐标为特征值。

可以看到:第一个因子的特征值较高,对解释变量的贡献最大;第三个以后的因子特征值都较小,对解释原有变量的贡献很小,已经成为可被忽略的“高山脚下的碎石”,因此提取两个因子适合的。

(三)因子旋转及公因子命名因为因子意义不明显,对初始因子进行旋转。

本文采用旋转因子模型的方法是方差最大正交旋转,旋转后,得到因子载荷矩阵(见表6)。

由旋转后的因子载荷矩阵可以看出,第1主因子第二产业增加值(X2)、第三产业增加值(X3)、地方财政预算收入(X4)、地方财政预算支出(X5)、社会消费品零售总额(X7)、货物进出口总额(X8)、城乡居民储蓄年末余额(X10)这7个指标上的载荷较大,集中反映了第二、三产业、地方财政收入与支出、社会消费品零售、货物进出口、城乡居民储蓄这7个方面,因此将其定义为Fac1。

第2主因子在在岗职工平均工资(X9)这个指标上的载荷较大,因此,第2因子可定义为在岗职工工资Fac2。

这2个主因子的性质及其顺序较好地体现了影响我国各省、直辖市、自治区经济发展的因素,也完全符合社会经济发展的规律。

另外还可以看到:这两个因子的实际含义比较模糊。

表6 旋转后因子模型成份12X1.362.798X2.815.402X3.978.051X4.989-.062X5.923.267X6.754.591X7.957.239X8.876-.346X9-.261.880X10.970.060(四)计算因子得分为了考察各省、直辖市、自治区的经济发展状况,并对其进行分析和综合评价,采用回归法求出因子得分函数,由系数矩阵将2个主因子表示为10项指标的线性组合。

因子得分的函数为:2个主因子分别从不同的方面反映了我国各省、直辖市、自治区经济发展状况,但单独使某一主因子并不能对我国各省、直辖市、自治区经济发展状况作出综合的评价,因此按各公因子对应的方差贡献率为权数计算综合统计量为:通过计算可以得到综合因子得分,并对各城市的综合因子得分排序(见表7)。

5432110987654321060.0880.0346.0239.0591.0267.0062.0051.0402.0798.02970.0261.0876.0957.0754.0923.0989.03978.0815.0362.01X X X X X X X X X X Fac X X X X X X X X X X Fac ++-+++-++=+-+++++++= 21218.0684.0Fac Fac Fac +=从上述因子分析看第二、三产业、地方财政收入与支出、社会消费品零售、货物进出口、城乡居民储蓄、在岗职工平均工资成为我国各省、直辖市、自治区2013年经济发展差异的主要解释成分,从统计意义上看,它们解释了这种差异90.22%的程度。

深入分析还可以得出因子中的第一产业、外贸是我国各省、直辖市、自治区发展的前提条件,反映地方财政收入与支出可以理解国家、地方实施西部大开策略的资金投入力度。

表7是由加权的最后因子得分表达式计算出的我国各省、直辖市、自治区的综合因子得分,从结果看,还是符合我国西部城市经济发展实际情况的。

第一主因子反映第二、三产业、地方财政收入与支出、社会消费品零售、货物进出口、城乡居民储蓄方面,广东、江苏、山东排在前3位;第二主因子反映在岗职工平均工资方面,山东、河南、河北排在前3位。

2个主要因子的综合因子得分中,广东、江苏、山东、浙江、北京排在前5位,这也是中国各省、直辖市、自治区沿海经济发展较好的地区,这些地区经济发展速度较快,第二、第三产业发达,地方财政收入与支出、社会消费品零售、货物进出口、城乡居民储蓄都相对较高;甘肃、海南、青海、宁夏、西藏排在后5位,这也是西部地区经济发展较落后的地区,相应的财政收入与支出、居民消费水平相对较低,进出口贸易不是很发达,制约了该地区经济的发展。

四、结论及建议本文通过对我国31个省、直辖市、自治区经济发展状况的因子分析。

证实了影响我国经济发展状况的因素主要有2大类, 分别是第二、三产业、地方财政收入与支出、社会消费品零售、货物进出口与城乡居民储蓄、在岗职工平均工资方面。

这2个主因子的方差贡献率达90.22%。

我国经济发展既有差异也有相似性,广东、江苏、山东、浙江、北京经济发展的整体水平最高,甘肃、海南、青海、宁夏、西藏的经济发展状况已经存在比较突出的问题。

我国的经济发展的差异已经相当显着,在一定时期内还有可能继续扩大,可以从第二、三产业、地方财政收入与支出、货物进出口方面寻求突破,通过具体的针对性措施刺激第二、三产业、对外贸易的发展,调整产业结构,为外商提供较多的优惠政策。

同时,政府还可以进一步加强对经济落后地区的财政支出,推动我国经济均衡发展。

参考文献[1]薛薇.基于SPSS的数据分析[M] .北京:中国人民大学出版社, 2006:107 -121.[2]于秀林, 任雪松.多元统计分析[M] .北京:中国统计出版社, 2006:171 -184.[3]Johnson.实用多元统计分析[M] .北京:清华大学出版社, 2004:388 -425.[4]刘新华.因子分析中数据正向化处理的必要性及其软件实现[J] .重庆工学院学报:自然科学版, 2009,23(9):152 -155.[5]刘照德.因子分析在企业技术创新能力评价中的应用[J] .重庆师范大学学报:自然科学版, 2006, 23(2):75 -89.[6]韩芳艳, 张孝友.重庆市上市公司财务业绩评价—基于21家公司2007年财务数据的因子分析[J] .重庆三峡学院学报, 2009, 25(2):110 -113.[7]聂勇.因子分析在我国工业企业经济效益分析中的应用[J] .重庆文理学院学报:自然科学版, 2009, 28(1):35 -38.[8]叶宗文.重庆城镇居民消费结构变动的因子分析[J] .重庆师范大学学报:自然科学版, 2004, 21(4):71 -73.[9]刁英, 王亚慧.基于因子分析的陕西省各市经济发展状况分析[J] .工业技术经济, 2009, 28 (9):116-119.[10] 陈超, 邹滢.SPSS中文版常用功能与应用实例精讲[M] .北京:电子工业出版社, 2009:316 -317.[11] 王志勇, 冯杰.基于灰色聚类的海上目标威胁等级评估[J] .四川兵工学报, 2009, 30(3):46 -49.[12] 吕佳.基于动态隧道系统的K-means聚类算法研究[J] .重庆师范大学学报:自然科学版, 2009, 26(1):73 -77.[13] 李小亮, 刘新平.基于聚类分析和对应分析的旅游动机行为模式[J] .重庆工商大学学报:自然科学版,2008, 25(4):350 -353.。

相关文档
最新文档