spss因子分析实例
SPSS因子分析报告实例操作步骤
SPSS因子分析实例操作步骤实验目的:引入2003~2013年全国的农、林、牧、渔业,采矿业,制造业电力、热力、燃气及水生产与供应业,建筑业,批发与零售业,交通运输、仓储与邮政业7个产业的投资值作为变量,来研究其对全国总固定投资的影响。
实验变量:以年份,合计(单位:千亿元),农、林、牧、渔业,采矿业,制造业电力、热力、燃气及水生产与供应业,建筑业,批发与零售业,交通运输、仓储与邮政业作为变量。
实验方法:因子分析法软件:spss19、0操作过程:第一步:导入Excel数据文件1.open data document——open data——open;2、 Opening excel data source——OK、第二步:1、数据标准化:在最上面菜单里面选中Analyze——Descriptive Statistics——OK (变量选择除年份、合计以外的所有变量)、2.降维:在最上面菜单里面选中Analyze——Dimension Reduction——Factor ,变量选择标准化后的数据、3.点击右侧Descriptive,勾选Correlation Matrix选项组中的Coefficients与KMO and Bartlett’s text of sphericity,点击Continue、4、点击右侧Extraction,勾选Scree Plot与fixed number with factors,默认3个,点击Continue、5、点击右侧Rotation,勾选Method选项组中的Varimax;勾选Display选项组中的Loding Plot(s);点击Continue、6、点击右侧Scores,勾选Method选项组中的Regression;勾选Display factor score coefficient matrix;点击Continue、7、点击右侧Options,勾选Coefficient Display Format选项组中所有选项,将Absolute value blow改为0、60,点击Continue、8、返回主对话框,单击OK、输出结果分析:1、描述性统计量Descriptive StatisticsN Minimum Maximum Mean Std、 Deviation农、林、牧、渔业11 3、27 9、73 7、6645 1、97515采矿业11 、6 9、5 5、008 2、7092制造业11 、44 7、07 2、6900 2、2240511 3、36 15、05 10、3545 3、22751电力、热力、燃气及水生产与供应业建筑业11 1、79 23、51 7、8955 6、18302批发与零售业11 2、10 18、52 9、1018 5、50553交通运输、仓储与邮政业11 、82 8、39 2、7891 2、20903Valid N (listwise) 11该表提供分析过程中包含的统计量,表格显示了样本容量以及11个变量的最小值、最大值、平均值、标准差。
如何利用SPSS做因子分析等分析(仅供参考)
我就以我的数据为例来做示范,仅供参考一、信度分析(即可靠度分析)1.分析——度量——可靠度分析图 12.然后就会弹出上图1的框框。
在这里,你可以对所有的问题进行可靠度分析,如果是这样,那你只需要选中所有的问题到右边这个白色的框框,然后点击“统计量”,按照右边这个图进行打钩。
然后点“继续”。
之后就点“确定”图2 3.接着去“输出1”这个框看分析结果,你就会看到很多分析结果,其中有一个就是右图,那第一个0.808就是你所选择进行分析的数据的信度。
如果你想把每一个维度的数据进行独立的信度分析,那道理也是一样的。
二、因子分析在做因子分析之前首先要判断这些数据是否适合做因子分析,那这里就需要进行效度检验,不过总共效度检验是和因子分析的操作同步的,意思就是说你在做因子分析的时候也可以做效度检验。
具体示范如下:1.分析——降维——因子分析图 2一般来说,咱们做因子分析的时候是为了把那些具有共同属性的因子归类成一类,说的简单点就是要验证咱们所选取的每一个维度下面的题目是属于这个维度,而非其他维度的。
那一般来说,因子分析做出来的结果就是你原本有几个维度,最终分析结果就会归类成几个公因子。
2.一般来说,自变量的题目和因变量的题目是要独立分析的。
我的课题是“店面形象对顾客购买意愿的影响”那自变量就是店面形象的那些维度,因变量就是顾客购买意愿。
3.将要做分析的题目选择到右边的白框之后,就如下图打钩:“抽取”和“选项”两个不用管他。
然后就点“确定”4.按照上述步骤操作下来之后,就可以去“输出1”看分析结果。
首先看效度检验的结果:这里要看第一行和最后一行的数据,第一行数据为0.756,表明效度较高,sig为0.000,这两个结果显示这份数据完全可以做因子分析。
那就去看因子分析的结果。
5.看下面这张图,看“初始特征值”这一项下面的“合计”的数值,有几个数据是>1,那就表明此次因子分析共提取了几个公因子。
下图所示,有5个数据是>1,这表明可以提取5个公因子。
SPSS因子分析实例操作步骤
SPSS因子分析实例操作步骤实验目的:引入2003~2013年全国的农、林、牧、渔业,采矿业,制造业电力、热力、燃气及水生产和供应业,建筑业,批发和零售业,交通运输、仓储和邮政业7个产业的投资值作为变量,来研究其对全国总固定投资的影响。
实验变量:以年份,合计(单位:千亿元),农、林、牧、渔业,采矿业,制造业电力、热力、燃气及水生产和供应业,建筑业,批发和零售业,交通运输、仓储和邮政业作为变量。
实验方法:因子分析法软件:操作过程:第一步:导入Excel数据文件1.open data document——open data——open;2. Opening excel data source——OK.第二步:1.数据标准化:在最上面菜单里面选中Analyze——Descriptive Statistics——OK (变量选择除年份、合计以外的所有变量).2.降维:在最上面菜单里面选中Analyze——DimensionReduction——Factor ,变量选择标准化后的数据.3.点击右侧Descriptive,勾选Correlation Matrix选项组中的Coefficients和KMO and Bartlett’s text of sphericity,点击Continue.4.点击右侧Extraction,勾选Scree Plot和fixed number with factors,默认3个,点击Continue.5.点击右侧Rotation,勾选Method选项组中的Varimax;勾选Display选项组中的Loding Plot(s);点击Continue.6.点击右侧Scores,勾选Method选项组中的Regression;勾选Display factor score coefficient matrix;点击Continue.7.点击右侧Options,勾选Coefficient Display Format选项组中所有选项,将Absolute value blow改为,点击Continue.8.返回主对话框,单击OK.输出结果分析:1.描述性统计量该表提供分析过程中包含的统计量,表格显示了样本容量以及11个变量的最小值、最大值、平均值、标准差。
SPSS因子分析实例操作步骤
SPSS因子分析实例操作步骤实验目的:引入2003~2013年全国的农、林、牧、渔业,采矿业,制造业电力、热力、燃气及水生产和供应业,建筑业,批发和零售业,交通运输、仓储和邮政业7个产业的投资值作为变量,来研究其对全国总固定投资的影响。
实验变量:以年份,合计(单位:千亿元),农、林、牧、渔业,采矿业,制造业电力、热力、燃气及水生产和供应业,建筑业,批发和零售业,交通运输、仓储和邮政业作为变量。
实验方法:因子分析法软件:spss19.0操作过程:第一步:导入Excel数据文件1.open data document——open data——open;2. Opening excel data source——OK.第二步:1.数据标准化:在最上面菜单里面选中Analyze——Descriptive Statistics——OK (变量选择除年份、合计以外的所有变量).2.降维:在最上面菜单里面选中Analyze——DimensionReduction——Factor ,变量选择标准化后的数据.3.点击右侧Descriptive,勾选Correlation Matrix选项组中的Coefficients和KMO and Bartlett’s text of sphericity,点击Continue.4.点击右侧Extraction,勾选Scree Plot和fixed number with factors,默认3个,点击Continue.5.点击右侧Rotation,勾选Method选项组中的Varimax;勾选Display选项组中的Loding Plot(s);点击Continue.6.点击右侧Scores,勾选Method选项组中的Regression;勾选Display factor score coefficient matrix;点击Continue.7.点击右侧Options,勾选Coefficient Display Format选项组中所有选项,将Absolute value blow改为0.60,点击Continue.8.返回主对话框,单击OK.输出结果分析:1.描述性统计量Descriptive StatisticsN Minimum Maximum Mean Std. Deviation农、林、牧、渔业11 3.27 9.73 7.6645 1.97515采矿业11 .6 9.5 5.008 2.7092制造业11 .44 7.07 2.6900 2.22405电力、热力、燃气及水生产和11 3.36 15.05 10.3545 3.22751供应业建筑业11 1.79 23.51 7.8955 6.18302批发和零售业11 2.10 18.52 9.1018 5.50553交通运输、仓储和邮政业11 .82 8.39 2.7891 2.20903Valid N (listwise) 11该表提供分析过程中包含的统计量,表格显示了样本容量以及11个变量的最小值、最大值、平均值、标准差。
SPSS因子分析报告实例操作步骤
SPSS因子分析实例操作步骤实验目的:引入2003~2013年全国的农、林、牧、渔业,采矿业,制造业电力、热力、燃气及水生产和供应业,建筑业,批发和零售业,交通运输、仓储和邮政业7个产业的投资值作为变量,来研究其对全国总固定投资的影响。
实验变量:以年份,合计(单位:千亿元),农、林、牧、渔业,采矿业,制造业电力、热力、燃气及水生产和供应业,建筑业,批发和零售业,交通运输、仓储和邮政业作为变量。
实验方法:因子分析法软件:spss19.0操作过程:第一步:导入Excel数据文件1.open data document——open data——open;2. Opening excel data source——OK.第二步:1.数据标准化:在最上面菜单里面选中Analyze——Descriptive Statistics——OK (变量选择除年份、合计以外的所有变量).2.降维:在最上面菜单里面选中Analyze——Dimension Reduction——Factor ,变量选择标准化后的数据.3.点击右侧Descriptive,勾选Correlation Matrix选项组中的Coefficients和KMO and Bartlett’s text of sphericity,点击Continue.4.点击右侧Extraction,勾选Scree Plot和fixed number with factors,默认3个,点击Continue.5.点击右侧Rotation,勾选Method选项组中的Varimax;勾选Display选项组中的Loding Plot(s);点击Continue.6.点击右侧Scores,勾选Method选项组中的Regression;勾选Display factor score coefficient matrix;点击Continue.7.点击右侧Options,勾选Coefficient Display Format选项组中所有选项,将Absolute value blow改为0.60,点击Continue.8.返回主对话框,单击OK.输出结果分析:1.描述性统计量Descriptive StatisticsN Minimum Maximum Mean Std. Deviation农、林、牧、渔业11 3.27 9.73 7.6645 1.97515采矿业11 .6 9.5 5.008 2.7092制造业11 .44 7.07 2.6900 2.22405电力、热力、燃气及水生产和11 3.36 15.05 10.3545 3.22751供应业建筑业11 1.79 23.51 7.8955 6.18302批发和零售业11 2.10 18.52 9.1018 5.50553交通运输、仓储和邮政业11 .82 8.39 2.7891 2.20903Valid N (listwise) 11该表提供分析过程中包含的统计量,表格显示了样本容量以及11个变量的最小值、最大值、平均值、标准差。
spss因子分析案例
spss因子分析案例SPSS因子分析是一种用于探索或验证潜在结构的数据分析方法。
它将一组观测变量分解为几个潜在变量(或因子),以便更好地理解这些变量之间的关系。
假设我们有一个数据集,其中包含了一些心理测量量表的数据。
我们对这些测量量表进行因子分析,以了解是否可以将它们归类为几个互相关联的潜在因子。
我们将使用SPSS进行因子分析。
首先,我们打开SPSS,并加载数据集。
然后,我们选择'Analyze'菜单下的'Dimension Reduction',再选择'Factor'。
在'Factor'对话框中,我们将选择要进行因子分析的测量量表变量,并将它们添加到'Variables'框中。
然后,我们单击'Extraction'选项卡。
在'Extraction'选项卡中,我们需要选择一个因子抽取方法。
常用的方法包括主成分分析和最大似然估计。
在本例中,我们选择最大似然估计。
然后,我们单击'Rotation'选项卡。
因子旋转是为了使因子之间更易解释。
我们可以选择'Varimax'或'Promax'旋转方法。
在本例中,我们选择'Varimax'。
接下来,我们单击'Summary'选项卡,然后单击'Continue'。
最后,我们单击'OK'按钮开始进行因子分析。
SPSS将计算因子分析,并提供一个结果表。
在结果表中,我们可以看到每个测量量表变量在每个因子上的载荷值。
载荷值表示变量与因子之间的关联强度。
我们还可以看到每个因子的解释方差比例。
这个比例表示每个因子解释了多大比例的变量的方差。
我们希望尽可能多的方差被解释,以便更好地理解数据。
此外,结果表还提供了每个因子的特征值。
特征值表示因子的重要性,越大的特征值表示该因子在解释数据中起到更重要的作用。
利用spss进行因子分析(r型)
利用SPSS进行因子分析(R型)【例】与主成分分析的数据相同:全国30个省市的8项经济指标。
因子模型是一个封闭方程,通常采用主成分求解,称为“主因解”。
上次讲述的“利用SPSS进行主成分分析”的过程,实际上是因子分析的第一步。
在主成分分析基础上,加上因子旋转,就可完成基于主成分分析的所谓因子分析。
当然也可通过另外的途径进行因子分析,在此暂不涉及。
第一步:录入或调入数据(见图1)。
图1 录入工作表中的原始数据第二步,进行主成分分析(参见主成分分析部分,在此从略)。
第三步,因子正交旋转的系统设置。
沿着主菜单的“Analyze→Data Reduction→Factor…”路径打开因子分析选项框(图2),完成主成分分析的设置或过程以后,单击Rotation(旋转)按钮,打开“Factor Analysis: Rotation”(因子分析:旋转)选项单(图3),在Method(方法)栏中选中Varimax(方差极大正交旋转)复选项,此时Display(展示)栏中的Rotated Solution(旋转解)将被激活为系统默认态,选中Loading Plot(s)(载荷图)复选项,将会在输出结果中给出因子载荷图式。
注意此时的Maximum Iterations for Convergence(迭代收敛的最大次数)为系统默认的25次,如果数据变量较多或样本较大,经过25次迭代可能计算过程仍然未能收敛,需要改为50次、100次乃至更多,否则SPSS无法给出计算结果。
迭代次数越多,计算时间也就越长。
在多数情况下,不足25次迭代计算过程就会收敛。
图2 因子分析选项框图3 因子旋转对话框注意:与上述Maximum Iterations for Convergence(迭代收敛的最大次数)有关的设置是Extraction(提取)对话框中的迭代次数设置(图4),如果今后工作中修改了图3所示的迭代次数仍然未能给出结果,那就意味着图4所示的迭代次数设置没有增加;反过来也是一样。
SPSS因子分析法-内容及案例
实验课:因子分析实验目的理解主成分〔因子〕分析的根本原理,熟悉并掌握SPSS中的主成分〔因子〕分析方法及其主要应用。
因子分析一、根底理论知识1 概念因子分析〔Factor analysis〕:就是用少数几个因子来描述许多指标或因素之间的联系,以较少几个因子来反映原资料的大局部信息的统计学分析方法。
从数学角度来看,主成分分析是一种化繁为简的降维处理技术。
主成分分析〔Principal ponent analysis〕:是因子分析的一个特例,是使用最多的因子提取方法。
它通过坐标变换手段,将原有的多个相关变量,做线性变化,转换为另外一组不相关的变量。
选取前面几个方差最大的主成分,这样到达了因子分析较少变量个数的目的,同时又能与较少的变量反映原有变量的绝大局部的信息。
两者关系:主成分分析〔PCA〕和因子分析〔FA〕是两种把变量维数降低以便于描述、理解和分析的方法,而实际上主成分分析可以说是因子分析的一个特例。
2 特点〔1〕因子变量的数量远少于原有的指标变量的数量,因而对因子变量的分析能够减少分析中的工作量。
〔2〕因子变量不是对原始变量的取舍,而是根据原始变量的信息进展重新组构,它能够反映原有变量大局部的信息。
〔3〕因子变量之间不存在显著的线性相关关系,对变量的分析比拟方便,但原始局部变量之间多存在较显著的相关关系。
〔4〕因子变量具有命名解释性,即该变量是对某些原始变量信息的综合和反映。
在保证数据信息丧失最少的原那么下,对高维变量空间进展降维处理〔即通过因子分析或主成分分析〕。
显然,在一个低维空间解释系统要比在高维系统容易的多。
3 类型根据研究对象的不同,把因子分析分为R 型和Q 型两种。
当研究对象是变量时,属于R 型因子分析;当研究对象是样品时,属于Q 型因子分析。
但有的因子分析方法兼有R 型和Q 型因子分析的一些特点,如因子分析中的对应分析方法,有的学者称之为双重型因子分析,以示与其他两类的区别。
4分析原理假定:有n 个地理样本,每个样本共有p 个变量,构成一个n ×p 阶的地理数据矩阵 :当p 较大时,在p 维空间中考察问题比拟麻烦。
SPSS因子分析(因素分析)——实例分析
SPSS因子分析(因素分析)——实例分析SPSS因子分析(因素分析)——实例分析SPSS(Statistical Package for the Social Sciences)是一种广泛应用于数据分析的软件工具,其中的因子分析(Factor Analysis)被广泛用于统计学和社会科学领域的研究。
本文将通过一个实例分析来介绍SPSS因子分析的基本原理和步骤。
1.研究背景在实施因子分析之前,首先需要明确研究背景和目的。
假设我们正在研究消费者购物行为,并希望确定出不同因素对于购物偏好的影响。
2.数据收集和准备在进行因子分析前,需要收集并准备相关数据。
假设我们已经收集到了100位消费者的关于购物行为的调查问卷数据,包括10个关于购物偏好的变量。
在SPSS中,我们可以将这些数据输入到一个数据矩阵中,每一行代表一个消费者,每一列代表一个变量。
3.因子分析设置在SPSS中,通过导航菜单选择适当的分析工具来进行因子分析。
在设置选项中,我们可以选择因子提取方法(如主成分分析、极大似然法等)和旋转方法(如方差最大旋转、斜交旋转等)等。
根据实际情况,我们可以调整这些参数以获得最佳结果。
4.因子提取在因子分析的第一步中,SPSS会计算每个变量的因子载荷矩阵,并根据设定的准则提取出主要因子。
因子载荷表示了每个变量与每个因子之间的关联程度,值越大表示关联程度越高。
通过因子载荷矩阵,我们可以判断每个变量对于哪个因子具有较高的影响。
5.因子旋转因子旋转可用于调整因子载荷矩阵,以使其更易于解释。
旋转后的因子载荷矩阵通常会呈现出更简洁、更有意义的结果。
在SPSS中,我们可以选择合适的旋转方法并进行旋转操作。
6.因子解释和命名在完成因子分析后,我们需要对结果进行解释和命名。
根据因子载荷矩阵和旋转结果,我们可以确定每个因子代表了哪些变量,并为每个因子赋予一个描述性的名称,以便于后续的数据分析和报告撰写。
7.结果解读最后,根据因子分析的结果,我们可以进行一系列的统计推断和解读。
SPSS操作方法:因子分析
实验指导之四因子分析的SPSS操作方法以例13.1为例进行因子分析操作。
1.在SPSS的数据编辑窗口(见图1)点击Analysize →Data Reduction →Factor,打开Factor Analysis对话框如图2.图1 因子分析操作图2 Factor Analysis 对话框将参与因子分析的变量依次选入Variables框中。
例13.1中有8个参与因子分析的变量,故都选入变量框内。
2.单击Descriptives 按钮,打开Descriptives对话框如图3所示。
✧Statistics栏,指定输出的统计量。
图3 Descriptives对话框Univariate descriptives 输出每个变量的基本统计描述;Initial solution 输出初始分析结果。
输出主成分变量的相关或协方差矩阵的对角元素。
(本例选择)✧Correlation Matrix栏指定输出考察因子分析条件和方法。
Coefficients相关系数矩阵;Significance levels 相关系数假设检验的P值;Determinant 相关系数矩阵行列式的值;KMO and Bartlett´s test of Sphericity KMO和巴特利检验(本例选择)巴特利检验是关于研究的变量是否适合进行因子分析的检验. 拒绝原假设意味着适合进行因子分析.KMO值等于变量间单相关系数的平方和与单相关系数平方和加上偏相关系数平方和之比, 值越接近1, 意味着变量间的相关性越强,越适合进行因子分分析, KMO值越接近0, 则变量间的相关性越弱. 越不适合进行因子分析.Inverse 相关系数矩阵的逆矩阵;Reproduced 再生相关阵;Anti-image 反映象相关矩阵。
3.单击Extraction 按钮,打开Extraction对话框选项,见图4。
图4 Extraction对话框✧Method栏,指定因子分析方法。
SPSS因子分析报告实例操作步骤
SPSS因子分析实例操作步骤实验目的:引入2003~2013年全国的农、林、牧、渔业,采矿业,制造业电力、热力、燃气及水生产和供应业,建筑业,批发和零售业,交通运输、仓储和邮政业7个产业的投资值作为变量,来研究其对全国总固定投资的影响。
实验变量:以年份,合计(单位:千亿元),农、林、牧、渔业,采矿业,制造业电力、热力、燃气及水生产和供应业,建筑业,批发和零售业,交通运输、仓储和邮政业作为变量。
实验方法:因子分析法软件:操作过程:第一步:导入Excel数据文件1.open data document——open data——open;2. Opening excel data source——OK.第二步:1.数据标准化:在最上面菜单里面选中Analyze——Descriptive Statistics——OK (变量选择除年份、合计以外的所有变量).2.降维:在最上面菜单里面选中Analyze——Dimension Reduction——Factor ,变量选择标准化后的数据.3.点击右侧Descriptive,勾选Correlation Matrix选项组中的Coefficients和KMO and Bartlett’s text of sphericity,点击Continue.4.点击右侧Extraction,勾选Scree Plot和fixed number with factors,默认3个,点击Continue.5.点击右侧Rotation,勾选Method选项组中的Varimax;勾选Display选项组中的Loding Plot(s);点击Continue.6.点击右侧Scores,勾选Method选项组中的Regression;勾选Display factor score coefficient matrix;点击Continue.7.点击右侧Options,勾选Coefficient Display Format选项组中所有选项,将Absolute value blow改为,点击Continue.8.返回主对话框,单击OK.输出结果分析:1.描述性统计量Descriptive StatisticsN Minimum Maximum Mean Std. Deviation 农、林、牧、渔业11采矿业11 .6制造业11 .44电力、热力、燃气及水生产和11供应业建筑业11批发和零售业11交通运输、仓储和邮政业11 .82Valid N (listwise) 11该表提供分析过程中包含的统计量,表格显示了样本容量以及11个变量的最小值、最大值、平均值、标准差。
SPSS因子分析——实例分析
SPSS因子分析——实例分析SPSS因子分析是一种统计方法,用于探索多个变量之间的相关性和结构。
它可以帮助研究者发现潜在的因素或维度,简化数据分析,并揭示变量之间的潜在关系。
本文将通过一个实例来介绍如何使用SPSS进行因子分析。
假设我们有一个关于消费者购买行为的调查问卷,包含了多个变量,如购买频率、购买金额、购买渠道等。
我们想要通过因子分析来探索这些变量之间的潜在结构,并识别出潜在的因素。
首先,我们需要将原始数据导入SPSS软件。
在SPSS的"变量视图"中,我们可以将每个变量名称输入到空白单元格中,并为每个变量选择适当的测量尺度(如定类尺度、定序尺度、定距尺度)。
然后,切换到"数据视图",在每一行中输入被调查者的数据。
接下来,我们需要进行因子分析的前提检测。
在SPSS的"分析"菜单中,选择"数据采样"并点击"样本界限",以确保我们选择的样本大小是否足够。
然后,我们选择"统计"中的"相关性",点击"双变量"并检查变量之间是否存在显著的相关性。
如果我们的数据满足以上要求,我们可以继续进行因子分析。
在SPSS的"分析"菜单中,选择"数据准备",点击"描述统计"并选择"频数",以检查每个变量的分布情况。
然后,我们再次选择"分析"中的"数据准备",点击"因子"并选择"提取方法"。
在弹出的对话框中,我们可以选择合适的提取方法,如主成分分析、极大似然估计等。
这些方法之间的选择要根据具体情况而定。
接下来,我们需要选择合适的因子数。
在"因子提取"对话框中,点击"因子"并输入我们认为合适的因子数。
(完整版)SPSS因子分析法-例子解释
因子分析的基本概念和步骤一、因子分析的意义在研究实际问题时往往希望尽可能多地收集相关变量,以期望能对问题有比较全面、完整的把握和认识。
例如,对高等学校科研状况的评价研究,可能会搜集诸如投入科研活动的人数、立项课题数、项目经费、经费支出、结项课题数、发表论文数、发表专著数、获得奖励数等多项指标;再例如,学生综合评价研究中,可能会搜集诸如基础课成绩、专业基础课成绩、专业课成绩、体育等各类课程的成绩以及累计获得各项奖学金的次数等.虽然收集这些数据需要投入许多精力,虽然它们能够较为全面精确地描述事物,但在实际数据建模时,这些变量未必能真正发挥预期的作用,“投入”和“产出”并非呈合理的正比,反而会给统计分析带来很多问题,可以表现在:计算量的问题由于收集的变量较多,如果这些变量都参与数据建模,无疑会增加分析过程中的计算工作量。
虽然,现在的计算技术已得到了迅猛发展,但高维变量和海量数据仍是不容忽视的。
变量间的相关性问题收集到的诸多变量之间通常都会存在或多或少的相关性.例如,高校科研状况评价中的立项课题数与项目经费、经费支出等之间会存在较高的相关性;学生综合评价研究中的专业基础课成绩与专业课成绩、获奖学金次数等之间也会存在较高的相关性。
而变量之间信息的高度重叠和高度相关会给统计方法的应用带来许多障碍。
例如,多元线性回归分析中,如果众多解释变量之间存在较强的相关性,即存在高度的多重共线性,那么会给回归方程的参数估计带来许多麻烦,致使回归方程参数不准确甚至模型不可用等。
类似的问题还有很多.为了解决这些问题,最简单和最直接的解决方案是削减变量的个数,但这必然又会导致信息丢失和信息不完整等问题的产生.为此,人们希望探索一种更为有效的解决方法,它既能大大减少参与数据建模的变量个数,同时也不会造成信息的大量丢失.因子分析正式这样一种能够有效降低变量维数,并已得到广泛应用的分析方法。
因子分析的概念起源于20世纪初Karl Pearson和Charles Spearmen等人关于智力测验的统计分析。
SPSS因子分析(因素分析)——实例分析
SPSS因子分析(因素分析)——实例分析提起因子分析那是老生常谈,分析人士大都喜欢讨论主成分与因子分析。
我也凑个热闹,顺便温习温习,时间长了就会很模糊。
一、概念探讨存在相关关系的变量之间,是否存在不能直接观察到的但对可观测变量的变化其支配作用的潜在因子的分析方法就是因子分析,也叫因素分析。
通俗点:原始变量是共性因子的线性组合。
二、简单实例现在有12个地区的5个经济指标调查数据(总人口、学校校龄、总雇员、专业服务、中等房价),为对这12个地区进行综合评价,请确定出这12 个地区的综合评价指标。
点击下载三、解决方案1、不同地区的不同指标不同,这导致目前我们拥有的5个指标数据很难对这12个地区给一个明确的评价。
所以,有必要确定综合评价指标,便于对比。
因子分析是一种选择,当然还有其他的方法。
5个指标即为我们分析的对象,直接选入。
2、描述统计选项卡。
我们要对比因子提取前后的方差变化,所以选定“初始分析结果”;现在是基于相关矩阵提取因子,所以,选定相关矩阵的“系数”;比较重要的还有KMO和球形检验,它告诉我们数据是不是适合做因子分析。
选定。
其他选择自定。
3、抽取选项卡。
提取因子的方法有很多,最常用的就是主成分法。
这里选主成分。
关于特征值,不想解释太多,这和显著性水平一样,都是统计学的一个基本概念。
因为参与分析的变量测度单位不同,所以选择“相关矩阵”,如果参与分析的变量测度单位相同,则考虑选用协方差矩阵。
4、是否需要旋转?因子分析要求对因子给予命名和解释,对因子旋转与否取决于因子的解释。
如果不经旋转因子已经很好解释,那么没有必要旋转,否则,应该旋转。
这里直接旋转,便于解释。
至于旋转就是坐标变换,使得因子系数向1和0靠近,对公因子的命名和解释更加容易。
5、要计算因子得分,就必须先写出因子的表达式。
而因子是不能直接观察到的,是潜在的。
但是可以通过可观测到的变量获得。
前面说到,因子分析模型是原始变量为因子的线性组合,现在我们可以根据回归的方法将模型倒过来,用原始变量也就是参与分析的变量来表示因子。
(完整版)SPSS因子分析法-例子解释
因子分析的基本概念和步骤一、因子分析的意义在研究实际问题时往往希望尽可能多地收集相关变量,以期望能对问题有比较全面、完整的把握和认识。
例如,对高等学校科研状况的评价研究,可能会搜集诸如投入科研活动的人数、立项课题数、项目经费、经费支出、结项课题数、发表论文数、发表专著数、获得奖励数等多项指标;再例如,学生综合评价研究中,可能会搜集诸如基础课成绩、专业基础课成绩、专业课成绩、体育等各类课程的成绩以及累计获得各项奖学金的次数等。
虽然收集这些数据需要投入许多精力,虽然它们能够较为全面精确地描述事物,但在实际数据建模时,这些变量未必能真正发挥预期的作用,“投入”和“产出”并非呈合理的正比,反而会给统计分析带来很多问题,可以表现在:计算量的问题由于收集的变量较多,如果这些变量都参与数据建模,无疑会增加分析过程中的计算工作量。
虽然,现在的计算技术已得到了迅猛发展,但高维变量和海量数据仍是不容忽视的。
变量间的相关性问题收集到的诸多变量之间通常都会存在或多或少的相关性。
例如,高校科研状况评价中的立项课题数与项目经费、经费支出等之间会存在较高的相关性;学生综合评价研究中的专业基础课成绩与专业课成绩、获奖学金次数等之间也会存在较高的相关性。
而变量之间信息的高度重叠和高度相关会给统计方法的应用带来许多障碍。
例如,多元线性回归分析中,如果众多解释变量之间存在较强的相关性,即存在高度的多重共线性,那么会给回归方程的参数估计带来许多麻烦,致使回归方程参数不准确甚至模型不可用等。
类似的问题还有很多。
为了解决这些问题,最简单和最直接的解决方案是削减变量的个数,但这必然又会导致信息丢失和信息不完整等问题的产生。
为此,人们希望探索一种更为有效的解决方法,它既能大大减少参与数据建模的变量个数,同时也不会造成信息的大量丢失。
因子分析正式这样一种能够有效降低变量维数,并已得到广泛应用的分析方法。
因子分析的概念起源于20世纪初Karl Pearson和Charles Spearmen等人关于智力测验的统计分析。
SPSS因子分析法-例子解释
因子分析的根本概念和步骤一、因子分析的意义在研究实际问题时往往希望尽可能多地收集相关变量,以期望能对问题有比拟全面、完整的把握和认识。
例如,对高等学校科研状况的评价研究,可能会搜集诸如投入科研活动的人数、立项课题数、工程经费、经费支出、结项课题数、发表论文数、发表专著数、获得奖励数等多项指标;再例如,学生综合评价研究中,可能会搜集诸如根底课成绩、专业根底课成绩、专业课成绩、体育等各类课程的成绩以及累计获得各项奖学金的次数等。
虽然收集这些数据需要投入许多精力,虽然它们能够较为全面准确地描述事物,但在实际数据建模时,这些变量未必能真正发挥预期的作用,“投入〞和“产出〞并非呈合理的正比,反而会给统计分析带来很多问题,可以表现在:计算量的问题由于收集的变量较多,如果这些变量都参与数据建模,无疑会增加分析过程中的计算工作量。
虽然,现在的计算技术已得到了迅猛开展,但高维变量和海量数据仍是不容无视的。
变量间的相关性问题收集到的诸多变量之间通常都会存在或多或少的相关性。
例如,高校科研状况评价中的立项课题数与工程经费、经费支出等之间会存在较高的相关性;学生综合评价研究中的专业根底课成绩与专业课成绩、获奖学金次数等之间也会存在较高的相关性。
而变量之间信息的高度重叠和高度相关会给统计方法的应用带来许多障碍。
例如,多元线性回归分析中,如果众多解释变量之间存在较强的相关性,即存在高度的多重共线性,那么会给回归方程的参数估计带来许多麻烦,致使回归方程参数不准确甚至模型不可用等。
类似的问题还有很多。
为了解决这些问题,最简单和最直接的解决方案是削减变量的个数,但这必然又会导致信息丧失和信息不完整等问题的产生。
为此,人们希望探索一种更为有效的解决方法,它既能大大减少参与数据建模的变量个数,同时也不会造成信息的大量丧失。
因子分析正式这样一种能够有效降低变量维数,并已得到广泛应用的分析方法。
因子分析的概念起源于20世纪初Karl Pearson和Charles Spearmen等人关于智力测验的统计分析。
SPSS因子分析经典案例
SPSS因子分析经典案例因子分析已经被各行业广泛应用,各种案例琳琅满目,以前在百度空间发表过相关文章,是以每到4至6月,这些文章总会被高校毕业生扒拉一遍,也总能收到各种魅惑的留言,因此,有必要再次发布这经典案例以飨读者。
什么是因子分析?因子分析又称因素分析,传统的因子分析是探索性的因子分析,即因子分析是基于相关关系而进行的数据分析技术,是一种建立在众多的观测数据的基础上的降维处理方法。
其主要目的是探索隐藏在大量观测数据背后的某种结构,寻找一组变量变化的共同因子。
因子分析能做什么?人的心理结构具有层次性,即分为外显和内隐.但是作为具有同一性的个体来说,内隐的方面总是和外显的方面相互作用,内隐方面制约着外显特征。
所以我们经常说,一个人的内在自我会在相当程度上决定他的外在行为特征,表现为某些行为倾向具有高度的一致性或相关性。
反过来说,我们可以通过对个体进行系统的观察和测量,从一组高度相关的行为倾向(可观测)中,探索到某种稳定的内在心理结构(潜存在),这就是因子分析所能做的。
ﻫ具体来说主要应用于:(1)个体的综合评价:按照综合因子得分对case进行排序;(2)调查问卷效度分析:问卷所列问题作为输入变量,通过KMO、因子特征值贡献率、因子命名等判断调查问卷架构质量;(3)降维处理,结果再利用:因子得分作为变量,进行聚类或其他分析。
案例描述:高中大家都读过吧,那是一个以成绩论英雄的时代,理科王子、文科小生是时代标签。
为什么我们会将数学、物理、化学归并为理科,其他的归并为文科,有没有数据支持?今天我们将用科学的方法找到答案。
ﻫ100个学生数学、物理、化学、语文、历史、英语成绩如下表(部分),请你来评价他们。
这是一个有趣的案例,你可以客观的观测到每一科目的成绩,但你可以直接看到理科、文科的情况吗?6个科目的成绩是我们观测到的外在表现,隐藏在其中的公共因子你找到了吗?如果我们针对6科目做降维处理,会得到什么结果,拭目以待。
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
一.研究目的:为了研究农民收入,我们选取了其中7种主要影响因素,包括财政用于农业的支出的比重(%),第二、三产业从业人数占全社会从业人数的比重(%),非农村人口比重,乡村从业人员占农村人口的比重(%),农业总产值占农林牧总产值的比重(%),农作物播种面积(千公顷),农村用电量(亿千瓦时)。
(数据见最后一页)
二.研究变量:在经济生活中,根据以上分析,我们在影响农民收入因素中引入7个变量。
即设置变量:x1-财政用于农业的支出的比重,x2-第二、三产业从业人数占全社会从业人数的比重,x3-非农村人口比重,x4-乡村从业人员占农村人
农村口的比重,x5-农业总产值占农林牧总产值的比重,x6-农作物播种面积,x7
—
用电量。
一、研究方法:SPSS中的因子分析。
具体操作步骤
(1)定义变量:x1-财政用于农业的支出的比重,x2-第二、三产业从业人数占全社会从业人数的比重,x3-非农村人口比重,x4-乡村从业人员占农村人口的
农村用电比重,x5-农业总产值占农林牧总产值的比重,x6-农作物播种面积,x7
—
量。
(2)导入数据:
file-open-data
(3)变量标准化Analyze-Descriptive Statistics-Descriptives
"
勾选Save standardized values as variables保存变量,再点击ok,就完成了对变量的标准化。
(3)因子分析
Analyze—Dimension Reduction—Faction
点击右侧的Description选项,选择Statistics选项组中的initial solution,勾选Correlation Matrix 选项组中的Coefficients和KMO and Bartlelts test of sphericity,点击Continue。
点击右侧Extraction选项,其中Method选Principal components,Analyze选择Correlation matrix,Display中选择Unrotated factor solution,Extract如图,点击Continue.
:
点击右侧Rotation选项,勾选Method选项组中的Varimax,Display中的两个选项都勾选,点击Continue。
点击右侧Scores,如图勾选,点击点击Continue。
最后点击options,默认
)
(4)结果分析
KMO and Bartlett's Test
Kaiser-Meyer-Olkin Measure of Sampling Adequacy..725
Bartlett's Test of Sphericity Approx. Chi-Square
df21
Sig..000
可以从此表中看出KMO统计量为,大于最低标准,说明适合做因子分析,Bartlet球形检验,p<,适合做因子分析。
,
2.主成分列表
可以从此表中看出前2个主成分特征值较大,它们的累积贡献率达到了%,故选择前2个公共因子。
@
Zscore(乡村从业人员占农村
.977
人口的比重)
Zscore(农业总产值占农林牧
.943
总产值的比重)
.909
·
Zscore: 农作物播种面积(千
公顷)
Zscore: 农村用电量(亿千瓦
.918
时)
Extraction Method: Principal Component Analysis.
结果显示,每一个指标变量的共性方差都在以上,说明这2个公共因子能够很好地反应原始各项指标变量的绝大部分内容。
~
4.载荷散点图Array从载荷散点图可以看出,第一公共因子能很好解释变量x1-财政用于农业的支出的比重,
变量x5-农业总产值占农林牧总产值的比重,第二公共因子能很好地解释变量x2-
第二、三产业从业人数占全社会从业人数的比重,x3-非农村人口比重,x4-乡村从业人员占农村人口的比重,x6-农作物播种面积,x7
农村用电量。
—
~
5.旋转后的因子载荷图
(亿千瓦时)在因子一上有较大载荷,财政用于农业的支出的比重、农业总产值占农林牧总产值的比重咋因子二上有较大载荷。
故因子一可称为农业基本发展条件,因子二可称为政府支持情况。
,
6.历年农民收入总得分降序表
其中F=f1*+f2*
年份f1f2总分F
>
1.
'
【
-0.
`
@
数据:
%。