应用统计学复习题
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
主成分分析是考虑各指标间的相互关系,利用降维的思想把多个指标转换成较少的几个互不相关的综合指标,从而使进一步研究变得简单的一种统计方法。
它的目的是希望用较少的变量去解释原始资料的大部分变异,即数据压缩,数据解释。常被用来寻找判断事物或现象的综合指标,并对综合指标所包含的信息进行适当的解释。
2、 主成分分析基本思想?
主成分分析就是设法将原来指标重新组合成一组新的互相无关的几个综合指标来代替原来指标。同时根据实际需要从中可取几个较少的综合指标尽可能多地反映原来的指标的信息。
3、 设p 个原始变量为 ,新的变量(即主成分)为 , 主成分和原始变量之间的关系表示为?
⎪⎪⎩⎪⎪⎨⎧+++=+++=+++=m
mm m m m m m m m x l x l x l y x l x l x l y x l x l x l y ...............22112222121212121111 4、 在进行主成分分析时是否要对原来的p 个指标进行标准化?SPSS 软件是否能对数据自
动进行标准化?标准化的目的是什么?
需要进行标准化,因为因素之间的数值或者数量级存在较大差距,导致较小的数被淹没,导致主成分偏差较大,所以要进行数据标准化。 进行主成分分析时SPSS 可以自动进行标准化。标准化的目的是消除变量在水平和量纲上的差异造成的影响。
5、 求解步骤
⏹ 对原来的p 个指标进行标准化,以消除变量在水平和量纲上的影响
⏹ 根据标准化后的数据矩阵求出相关系数矩阵
⏹ 求出协方差矩阵的特征根和特征向量
⏹ 确定主成分,并对各主成分所包含的信息给予适当的解释
6、 因子分析基本思想?
因子分析是通过对变量之间关系的研究,找出能综合原始变量的少数几个因子,使得少数因子能够反映原始变量的绝大部分信息,然后根据相关性的大小将原始变量分组,使得组内的变量之间相关性较高,而不同组的变量之间相关性较低。因此,因子分析属于多元统计中处理降维的一种统计方法,其目的就是要减少变量的个数,用少数因子代表多个原始变量。
因子分析的基本思想是通过对变量相关系数矩阵内部结构的研究,找出能够控制所有变量的少数几个潜在随机变量去描述多个显在随机变量之间的相关关系,换句话说,因子分析是把每个可观测的原始变量分解为两部分因素,一部分是由所有变量共同具有少数几个公共因子构成的,另一部分是每个原始变量独自具有的,即特殊因子部分,对于所研究的问题就可试图用最少个数的不可观测的公共因子的线性函数与特殊因子之和来描述原来观测的每一分量。
7、 设p 个原始变量为 ,要寻找的m 个因子(m k m m m m k k km m m x a f a f a f e x a f a f a f e x a f a f a f e =++ +=++ +=+++ p 21p x x x ,,, 21p 21p y y y ,,, 21k 21k x x x ,,, 212 1m f f f ,,, 21 因子分析是从多个变量指标中选择出少数几个综合变量指标,以较少的几个因子反映原始资料的大部分信息的一种降维的多元统计方法。 9、 求解步骤 1) 对原始数据标准化 2) 建立相关系数矩阵R (因子提取) 3) 求R 的单位特征根λ与特征向量U ; 4) 因子旋转求因子载荷矩阵A ; 5) 写出因子模型X=AF+E 6)建立因子得分矩阵P 7)写出因子得分模型F=P ’X (因子提取的方法:主成分法、不加权最小平方法、加权最小平方法、最大似然法、主轴因子法;旋转方法为:方差最大正交旋转、四次方最大正交旋转、平方最大正交旋转、斜交旋转、Promax :该方法在方差最大正交旋转的基础上进行斜交旋转) 10、 什么是变量共同度?写出变量共同度的表达式。什么是公共因子方差贡献率?写出 公共因子方差贡献率表达式。 变量共同度指该变量的方差可以由公共因子解释的百分比,22212...i i i im D a a a =+++ 公共因子方差贡献率指该因子能解释的方差占全部变量方差的比例,反映第j 个公因子 的相对重要程度22212(...)/j j j kj V a a a k =+++ 11、 因子分析中KMO 检验主要检验什么?KMO 越接近1,变量间的相关性越强。KMO 在0.8以上,说明该问题适合做因子分析。 KMO 检验统计量是用于比较变量间简单相关系数偏和相关系数的指标。当所有变量间的简单相关系数平方和远远大于偏相关系数平方和时,KMO 值接近1,KMO 越接近1,变量间的相关性越强。当所有变量间的简单相关系数平方和接近0时,KMO 值接近0.KMO 值越接近于0,意味着变量间的相关性越弱,原有变量越不适合作因子分析。0.9以上表示非常适合;0.8表示适合;0.7表示一般;0.6表示不太适合;0.5以下表示极不适合。 Bartlett 球度检验:以变量的相关系数矩阵为基础,假设相关系数矩阵是单位阵(对角线元素不为0,非对角线元素均为0)。如果相关矩阵是单位阵,则各变量是独立的,无法进行因子分析。 12、 因子分析中公因子个数确定的依据是什么?因子分析中因子旋转(factor rotation)的 目的是什么?什么是因子得分(factor score)? 依据:特征根大于1或碎石图上下降速度较快的特征根的数目; 旋转目的:使因子载荷系数向±1或0靠近,从而更清楚地看出各因子与原始变量的相关性大小,实际意义方便解释。 因子得分就是每个观测量的共同因子的值。根据因子得分系数和原始变量的标准化值可以计算每个观测量的各因子的分数,因子得分=x1*对应权重+x2*对应权重+…+xn*对应权重,根据因子得分我们可以写出因子表达式。 13、 简述因子分子与主成分分析的区别。 主成分分析和因子分析是两种把变量维度降低以便于描述、理解和分析的方法;因子分析是主成分分析的推广和发展,主成分分析可以看成是因子分析的特例; 因子分析先确定因子个数,主成分分析是做出来看,是一种探索性分析; 在SPSS 分析中,因子分析必须进行因子旋转,主成分分析不一定要旋转。故公共因子