基于spss应用的产业结构与物流需求量相关性分析
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
现代城市产业结构与物流需求量的相关性分析
基于SPSS软件的应用
哈尔滨工业大学
耿兆欣
2010/12/27
现代城市产业结构与物流需求量的相关性分析
——基于SPSS软件的应用
一、研究背景与数据来源
产业结构最基本的分类是三大产业的划分,产业结构变化的一般规律是先发展基础第一产业,而后工业比重上升,随着科技的进步,第三产业比重逐渐上升,第一产业比重下降。我国各地区经济发展水平差距很大,产业结构的差异性也很明显。一般来说,第三产业越发达,经济体制越完善,经济发展较快,那么,物流需求量是否也与城市的产业结构有关?
对此,应用《城市数据统计年鉴2008》和SPSS软件,对代表性城市的相关变量进行横截面分析。免除了年度数据的变量可能存在自相关的问题。与产业结构有关的变量有第一产业比重、第二产业比重、第三产业比重。与物流需求量有关的变量有货运总量、客运总量。同时,引入其他可能相关的经济变量。
操作:城市名称、第一产业比重、第二产业比重、第三产业比重、市辖区人口总量、地区生产总值、城市固定投资比、固定投资总额、市辖区人口总量、市辖区平均工资等变量输入。
二、样本筛选与变量检验
《城市统计年鉴》包含了287个重要城市的数据,一方面,较大的数据量一般可以保证较强的样本独立性,增加分析结果的可信度;另一方面,也可能削弱样本的代表性,这在分析经济数据中体现的较为明显。比如,有一些内陆城市是靠单一资源发展,或单纯政策性扶持而发展,不符合现代城市的定义。一般来说,经济结构比较成熟的城市发展历史比较悠久,人口较多,经济总量规模较大。虽然,按照人口与经济总量作为筛选标准,可能会在分析中漏掉若干具有代表性的现代城市,但是这样能够保证在较好的整体一致性前提下,避免逐个分析,可称之为一种有效率的“次优选择”。样本确定之后,进行各个变量的独立性分析。
操作:1、“数据”—“选择个案”勾选if,在窗口中输入:
总值>= 5000000 & 市辖区人口>= 100
2、“分析”—“描述统计”—P-P图(部分具体操作见附录三)
经筛选,符合标准的样本为91个,符合样本个数大于6倍变量个数的一般要求,且各个变量基本服从独立分布。各变量的P-P图如下。
三、按产业结构的样本分组(聚类分析)
产业结构表现的首要特征是三大产业在地区生产总值中的比重,根据经验,产业结构可以分成三类,分别以三大产业为侧重。因而,选择第一产业比重、第二产业比重、第三产业比重作为聚类分析的变量。为保证结果的可靠性,分别进行k值聚类法和系统聚类法分析。
此题中三个变量的量纲一致,所以,在系统聚类分析中,不需要考虑标准化的问题。从聚类的结果来看,系统聚类分类过于极端,,有一个样本属于第一类,一个样本属于第三类,其他均属于第二类。而k值聚类法的分类中各组样本个数较为均匀(如下表)。系统聚类优于k值聚类的一个重要特征是可以进行标准化处理,而此三个变量量纲完全一致,系统分析没有了这种优越性。因此,可以选择k值聚类法的结果作为分组依据。
K值聚类结果:
由输出结果观察,显著性水平明显小于0.05,聚类结果通过。k值聚类的1类为侧重于第三产业,2类侧重于第二产业,3类侧重于第一产业,分别在赋值中标的为:1=现代化,2=工业化,3=农业化
相关操作:“分析”—“分类”—系统聚类法/k值聚类法
四、相关性的初步分析(单因素方差分析,因子分析)
分析前提:在市场经济体制下,可以放宽条件,假设市场出清,那么,一个地区的物流
需求可以看做物流量的实际发生额。
物流总量=货运总量+客运总量
物流需求量=货运总量+客运总量
物流总量=物流需求量
货运总量与客运总量的量纲不同,不能进行简单的加总,先分别讨论。
按照常规的分析,一个城市的第三产业比重越大,服务业越发达,服务业的重要组成部分--物流需求量应该比较大,这在独立样本T检验中得到了初步验证。
相关操作:“分析”—“比较均值”—“单因素方差分析”,因变量输入“货运总量”和“客运总量”,因子输入“产业结构分组”。
结果为:
从“描述”里可以看出各组均值明显不等,且AN0VA表明各组变量显著不相等。初步通过分析。
进一步,为了分析的整体性,货运总量与客运总量可以采用因子得分的形式合并,货运总量与客运总量存在一定的相关性(0.512,在0.1的水平上显著相关),因此可以进行因子分析。利用因子分析计算因子得分,构造新变量s。因子得分只表明了样品的相对位置,虽然没有其他实际意义,在这里可以作为物流总量的抽象值代表,分析变量之间的相关性。因子分析的结果如下。KMO的值为0.5,基本符合要求。
五、相关性的进一步探讨(简单相关、偏相关与回归方程分析)
经济是一个联系的整体,影响物流需求量的还有其他因素。例如,经济实力,人口规模,政策导向,开放程度,消费者收入水平。或许这些变量的作用对于物流需求量的影响更为明显。因而,进一步引入地区生产总值、地区总人口、固定资产投资总额,城市固定资产投资比,地区平均收入等变量进一步探讨。
从简单的双相关分析中可以发现,s与第一产业比重比较明显负相关,与第三产业比较明显正相关,为了简化数据,新设变量:
“三一产业比”=第三产业比重/第一产业比重
由因子得分s与三一产业比的相关性分析看出,这两个变量不显著相关。于是,放弃这个变量,仍然采用第三产业,第一产业单独分析。
把讨论的全部变量代入回归分析,采用entry方法,可得
运用entry的方法,在0.05的显著性水平下,只有两个变量符合要求,即城市固定资产比(0.035)和市辖区人口(0.01)。另一方面,这些变量的方差膨胀因子(VIF)只有固定资产投资比一项大于且接近10,说明变量之间的共线性并不明显。自变量具有较强的分析价值。
回归方程的改进:
由于方程的显著性不够明显,考虑选择新的回归方法,剔除一些变量,优化方程。
Forward方法的部分结果为(stepwise方法的结果与之相同):
Backward方法的部分结果为: