多元统计分析第二章
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
第二章主成分分析
一、填空题
1.主成分分析是通过适当的变量替换,使新变量成为原变量的线性组合,并寻求降维的一种方法。
2.主成分分析的基本思想是_将原来众多具有一定相关性的指标重新组合成一组新的相互无关的综合指标来代替原指标_____________。
3.主成分的协方差矩阵为____对称_____矩阵。
4.主成分表达式的系数向量是______相关矩阵特征值_________的特征向量。
5.原始变量协方差矩阵的特征根的统计含义是___主成分的方差_____________。
6.原始数据经过标准化处理,转化为均值为0____,方差为__1__的标准值,且其____协方差____矩阵与相关系数矩阵相等。
7.因子载荷量的统计含义是__第k个样本主成分与第j个变量样本之间的相关系数___(根号下懒么大*u下标kj)________________________。
10.SPSS中主成分分析采用___因子分析_命令过程。
二、简答题
4.简述主成分分析的适用范围及基本步骤。
利用较少主成分,得到较多的信息量;以各个主成分为分量,就得到一个更低维的随机向量;主成分分析的作用就是在较低数据“维数”的同时又保留了原数据的大部分信息;
相关系数矩阵特征值和特征向量主成分选取和建立主成分模型综合评价。
三、计算题
1.在一项研究中,测量了376只鸡的骨骼,并利用相关系数矩阵进行主成分分析,见下表:
(1)计算前三个主成分各自的贡献率和累积贡献率。
(2) 对于y4,y5,y6的方差很小这一点,你怎样对实际情况作出推断。主成分中舍弃,方差小,包含信息量少 2.在一项对杨树的性状的研究中,测定了20株杨树树叶,每个叶片测定了四个变量:叶长(x1),2/3处宽(x2),1/3处宽(x3),1/2处宽(x4)。这四个变量的相关系数矩阵的特征根和标准正交特征向量分别为:
)
7930.0,5513.0,2519.0,0612.0(007
.0)
1624.0,5589.0,7733.0,2516.0(049.0)
0824.0,2695.0,0984.0,9544.0(024.1)
5814.0,5577.0,5735.0,1485.0(920.244332211--='=--='=-='=---='=U U U U λλλλ
写出四个主成分,计算它们的贡献率。
Z1=0.1485x1-0.5735x2-0.5577x3-0.5814x4(以下类似) Z2=0.9544x1-0.0984x2+0.2695x3+0.0824x4 Z3= Z4=
贡献率:w=lanmeda(1-4)求和 1的贡献率=2.920/(2.920+1.024+0.049+0.007)(以下类似)
3.对纽约股票市场上的五种股票的周回升率x1,x2,x3,x4,x5进行了主成分分析,其中x1,x2,x3分别表示三个化学工业公司的股票回升率,x4,x5表示两个石油公司的股票回升率,主成分分析是从相关系数矩阵出发进行的,前两个特征根和对应的标准正交特征向量为:
)582.0,526.0,260.0,509.0,240.0(809.0)
421.0,421.0,470.0,457.0,464.0(857.22
211--='=='=U U λλ
(1) 计算这两个主成分的方差贡献率。同上问
(2) 能否对这两个主成分的意义作一个合理的解释,并给两个主成分命名。
1反应的是
命名:一,化学工业公司股票回升率
二 石油公司股票回升率
四、SPSS 操作题
3.根据下列某地区11年数据
(1) 计算地区总产值、存储量和总消费的相关系数矩阵。
相关矩阵a
(2)求特征根及其对应的特征向量。
(3)求出主成分及每个主成分的方差贡献率;
(4)利用主成分方法建立y与x1,x2,x3的回归方程(取两个主成分)。