多元统计分析——典型相关分析实验报告
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
多元统计分析实验报告
课程名称多元统计分析实验成绩
实验内容典型相关分析指导老师
姓名专业班级
一、实验目的
典型相关分析(Canonical correlation)又称规则相关分析,用以分析两组变量间关系的一种方法;两个变量组均包含多个变量,所以简单相关和多元回归的解惑都是规则相关的特例。典型相关将各组变量作为整体对待,描述的是两个变量组之间整体的相关,而不是两个变量组个别变量之间的相关。本文旨在通过分析农业基础用品投入量与农产品产量数据,利用典型相关分析分析两者的关系,同时达到熟练使用SPSS软件进行典型相关分析操作的目的。
二、实验数据
本文使用2002-2011年全国农产品产量与农业基础用品投入量数据,如表2-1所示。第一组数据为农产品产量(由左到右依次为,粮食产量X1、油料产量X2、糖料产量X3、蔬菜产量X4),第二组数据为农业基础用品投入量(由左到右依次为,农用塑料薄膜使用量Y1、农用柴油使用量Y2、农药使用量Y3)。
表2-1 2011-2011年全国农产品产量与农业基础用品投入量数据
由于cancorr不能读取中文名称,所以变量名均需为英文名。将表2-1数据转换为能够进行典型相关分析形式的数据,如表2-2所示。
表2-2 典型相关分析数据(农产品产量与农业基础用品投入量数据)
三、实验过程
SPSS 16.0并未提供典型相关分析的交互窗口,只能直接在syntax editor 窗口呼叫SPSS的CANCORR程序来执行分析。
选择【File】—【New】—【Syntax】,弹出Syntax对话框,在对话框中写入调用Cancorr程序,如图3-1所示。
图3-1 Syntax窗口调用CONCORR函数
四、实验结果
表4-1为第一组数据,即农产品产量之间的相关关系表。从表中可以看出,粮食产量(X1)与蔬菜产量(X4)有较高的相关关系,相关系数高达0.9035;粮食产量(X1)与糖料产量(X3)相关关系也较大,相关系数为0.8081;油料产量(X2)与蔬菜产量(X4)的相关关系较大,为0.7442。
表4-1 农产品产量之间的相关关系
表4-2为农业基础用品投入量指标之间的相关关系表,从表中可以看出,农用塑料薄膜使用量(Y1)、农用柴油使用量(Y2)、农药使用量(Y3)两两之间具有较高的相关性,相关系数均大于0.85,其中农用塑料薄膜用量(Y1)与农药使用量(Y3)之间的相关系数为0.9883,接近于完全正相关。这说明这些指标之间存在互补的关系,与实际情况相符合。
表4-2 农业基础用品投入量之间的相关关系
表4-3为农业基础用品投入量与农产品产量指标之间的相关关系表。由表中可以看出,农业基础用品投入量与农产品产量之间存在正相关的关系,也即农业基础用品投入量增加对各类农产品产量增加均有促进作用。其中,农业基础用品投入量各指标的增加对粮食产量(X1)的影响最大,即投入量增加会带来粮食产量的大幅增加。这些均与实际情况相符合。
表4-3 农业基础用品投入量与农产品产量之间的相关关系
表4-4为典型相关系数表。表中显示,第一典型相关变量的相关系数为0.996,第二典型相关变量的相关系数为0.851,第三典型相关变量的相关系数为0.718。
表4-4 典型相关系数
表4-5为典型相关系数的显著性检验表。表4-5中从左至右分别为Wilks的统计量、卡方统计量、自由度和伴随概率。从表中可以看出,在0.05的显著性水平下,三对典型变量中只有第一对典型相关是显著的。
表4-5 典型相关系数的显著性检验
由于数据单位并不统一,所以我们主要观察标准化后的典型变量的系数,来分析两组典型变量之间的关系。
表4-6为标准化后的第一组数据的典型变量系数表。由表4-6可以看出,第一个典型变量为:
43211787.0002.0248.0391.0x x x x X --+-=
由于4x 的系数-0.787绝对值最大,故反映农产品产量的第一典型变量主要由蔬菜产量(X4)决定。
表4-6 标准化的第一组数据典型相关变量系数表
表4-7为标准化后的第二组数据的典型变量系数表。由表4-7可以看出,第
一个典型变量为:
3211280.0168.0416.1y y y Y ++-=
由于1y 的系数-1.416绝对值最大,故反映农业基础用品投入量的第一典型变量主要由农用塑料薄膜使用量(Y1)决定。
表4-7 标准化的第一组数据典型相关变量系数表
表4-8为典型冗余分析表。表中第一部分CV1-1显示,关于农产品产量的第一个典型变量能够解释农产品产量原始数据的70.2%的变化;表中第二部分CV2-1显示,关于农业基础用品投入量的第一个解释变量能够解释农产品产量原始数据的69.7%的变化;表中第三部分CV2-1显示,关于农业基础用品投入量的第一个典型变量能够解释农业基础用品投入量原始数据的86.6%的变化;表中第四部分CV1-1显示,关于农产品产量的第一个典型变量能够解释农业基础用品投入量原始数据的85.9%的变化。
表4-8 典型冗余分析表
五、实验总结
通过对2002-2011年全国农产品产量与农业基础用品投入量数据进行典型相关分析,我们发现,农业基础用品投入量与农产品产量存在正相关关系。在某一范围下,增加农业基础用品投入量,农产品产量会得到增加。其次,农产品之间存在互补的关系,粮食产量、油料产量、糖料产量以及蔬菜产量均存在正相关关系,且相关系数较大;农业基础用品投入量之间也存在正相关关系,农业塑料薄膜使用量的增加会得到农用柴油使用量以及农药使用量增加的配合。典型相关分析结果与实际情况较为符合。
与此同时,通过该实验的联系,我对典型相关分析的操作更加熟练,对结果的分析理解也更加深刻。