应用多元统计分析课程论文
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
《应用多元统计分析》课程论文
论文题目: 《江苏省各地区物流产业发展的综合评价》**: ***
学院: 信息与网络工程学院
专业: 信息与计算科学
班级: 2013级1 班
学号: **********
****: ***
2015年11月30日
安徽科技学院教务处
摘要
现代意义上的物流管理出现在20世纪80年代,人们发现利用跨职能的流程管理的方式去观察,分析和解决企业经营中的问题非常有效,通过分析物料从原材料运到工厂,流经生产线上每个工作站,企业可以消除很多看似高效率却实际上降低了效率的局部优化行为。物流产业的实质体现为技术密集和劳动密集相结合,是具有第三产业特征的跨地区、跨行业、跨部门特点的产业形式。物流产业对经济增长,特别是区域经济增长和区域产业协作的推动,都有着不可替代的重大意义,在区域经济、产业布局研究过程中,都不能忽视物流产业在其中的基础保障作用。本文在构建江苏省沿江地区物流产业发展综合指标体系的基础上,运用多元统计分析中的主成分分析方法,因子分析作为比较,判断本问题哪种方法更为适合,对江苏省沿江地区20个地市的物流发展现状进行了综合评价,为江苏省各地市物流产业主管部门制定相应政策提供一定的理论依据,旨在提高江苏省沿江地区整体物流发展水平。
【关键词】主成分分析;因子分析;物流产业;综合评价
一、引言
随着经济全球化持续发展、科学技术水平不断提高以及专业化分工进一步深化,经济的快速增长对物流业产生了巨大的需求,促使物流业以及与物流相关的交通运输、仓储配送和邮电通信业等都有较快的发展。同时,作为经济增长的“加速器”物流业的快速发展将会改变国民经济增长方式,降低国民经济的运行成本,促进了经济的可持续发展。物流对于经济增长的影响以及物流业与经济增长之间的关系已经成为物流领域的一个研究重点。本文拟从主成分分析的角度出发,以江苏省数据为例来探讨哪些因素是物流发展的主要因素,对江苏省物流产业发展现状进行综合评价,从而为江苏省乃至全国的物流产业的发展提供一定的启示。
二、模型的建立
2.1 主成分分析
主成分分析也称分量分析是把原来多个变量化为少数几个综合指标的一种统计分析方法,由于多个变量之间往往存在着一定程度的相关性,因此从数学角度来看,这是一种降维处理技术。以各个主成分为分量就得到一个更低维的随机向量。因此通过主成分分析既可以降低维数又保留了原数据的大部分信息。假定
有n 个地理样本,每个样本共有p 个变量描述,这样就构成了一个n×p 阶的数据矩阵
⎪
⎪⎪⎪⎪⎭⎫
⎝⎛=x x x x x x x x x np n n p p x (2)
12222111211 (1) 可是如此多的变量,我们如何从这么多变量的数据中抓住主要的变量作为指标呢?
要解决这一问题,自然要在p 维空间中加以考察,这是比较麻烦的。为了克服这一困难,就需要进行降维处理,即用较少的几个综合指标来代替原来较多的变量指标,而且使这些较少的综合指标既能尽量多地反映原来较多指标所反映的信息,同时它们之间又是彼此独立的。那么,这些综合指标(即新变量)应如何选取呢?显然,其最简单的形式就是取原来变量指标的线性组合,适当调整组合系数,使新的变量指标之间相互独立且代表性最好
如果记原来的变量指标为x 1,x 2,…,x p ,它们的综合指标——新变量指标为z 1,z 1,…,z m (m ≤p )。则
⎪⎪⎩⎪⎪
⎨
⎧+++=+++=+++=x l x l x l z x l x l x l z x l x l x l z p mp m m m p p p
p (2)
2112222121212121111(2)
在(2)式中,系数l ij 由下列原则来决定:
(1)z i 与z j (i ≠j ;i ,j =1,2,…,m 相互无关);
(2)量。z 1是x 1,x 2,…,x p 的一切线性组合中方差最大者;z 2是与z 1
不相关的x 1,x 2,…,x p 的所有线性组合中方差最大者;……;z m 是与z 1,
z
2
,……z m 1-都不相关的x 1,x 2,…,x p 的所有线性组合中方差最大者。
这样决定的新变量指标z 1,z 2,…,z m 分别称为原变量指标x 1,x 2,…,
x p的第一,第二,…,第m主成分。其中,z
在总方差中占的比例最大,z2,
1
z3,…,z m的方差依次递减。在实际问题的分析中,常挑选前几个最大的主成分,这样既减少了变量的数目,又抓住了主要矛盾,简化了变量之间的关系。
从以上分析可以看出,找主成分就是确定原来变量x j(j=1,2,…,p)在诸主成分z i(i=1,2,…,m)上的载荷l ij(i=1,2,…,m;j=1,2,…,p),从数学上容易知道,它们分别是x1,x2,…,x p的相关矩阵的m个较大的特征值所对应的特征向量。
主成分分析是社会经济问题中研究应用最多的多元统计方法之一,其原理是利用降维的思想,在保证原始数据信息损失最小的前提下,将原来指标重新组合成一组新的互相无关的几个综合指标,这几个综合指标是原始指标的线性组合。并且保留了原始指标的主要信息,彼此间又互不相关,使复杂的问题简单化,抓住主要矛盾进行分析。
基本步骤为:确定分析变量,收集数据;原始数据的标准化处理;由标准数据求协方差矩阵;求R的特征值、特征向量和主成分的方差贡献率;提取主成分;求主成分分值,计算综合分值。
2.1.1数据选取以及指标来源
根据上文主成分分析的基本原理,本文以江苏省为例,考虑到统计数据可获得性,本文选取“地区生产总值”作为物流需求规模影响指标;选取“公路里程以及民用汽车拥有量”作为物流供给的影响因素;选取“第一、第二、第三产业的产值”作为产业结构的影响因素。具体选择的指标为:
x1:地区生产总值,单位:亿元;
x2:第一产业产值,单位:亿元;
x3:第二产业产值单位:亿元;
x4:第三产业产值单位:亿元;
x5:公路里程,单位:公里;
x6:以及车辆拥有量,单位:万辆;
其中,三大产业不仅考虑了区域经济总量,还考虑了江苏省经济结构对物流需求规模影响。(具体的原始数据见表1所示)