港口集装箱吞吐量影响因素研究
合集下载
相关主题
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
1 单因素分析
1. 1 数据来源 因素分析法是依据分析指标与其影响因素的
关系, 从数量上确定各因素对分析指标影响方向 和影响程度的一种方法。因素分析法既可以全面 分析各因素对某一经济指标的影响, 又可以单独 分析某个因素对经济指标的影响。
一般认为影响港口集装箱运输的主要因素包 括: 港口的地理位置、腹地经济、政策环境、港口通 过能力和集疏运系统等。其具体内容包括: 地区 GD P、工业 总产 值、地区 总人 口、货运 量、社 会消 费 品总额和外贸进出口额等。
笔者分别在国内的三大经济区域 ( 长三角经
济圈、环渤海经济圈、珠三角经济圈 ) 选取具有代 表性的上海港、青岛港和广州港作为 研究对象。 并收集了 1996~ 2006年的上述港口集装箱吞吐 量数据, 以及上海、江苏、浙江、山东和广东五省市 1996~ 2006年的 GDP、总人口数、工业总产值、社 会商品零售总额、外贸进出口额、第一产业值、第 二产业值、第三产业值、铁路货运量、公路货运量 和总货运量等数据。由于上海港的直接经济腹地 为长三角地区, 青岛港和广州港的直接经济腹地 分别为山东省和广东省, 其货物吞吐量的 90% 以 上来自本省, 因此, 影响上海港集装箱吞吐量因素 的数据为上海市、江苏省和浙江省的总和, 青岛港 和广州港则以本省数据为基础。 1. 2 单因素分析关系图
2 重要影响因素提取
2. 1 计算方法 主成 分 分 析 ( principal com ponen ts analysis,
PCA ) 也称 为主 分量 分析 [ 5 ] , 由 HOTELL ING 于 1933年首先提出。它是一种通 过降维把多个变 量 ( 指标 )化为少数几个综合变量 (综合指标 ) 的
表 2 长三角地区 1996~ 2006年相关指标数据的标准 化
年份 /年 1 996 1 997
X1 - 1. 07 - 0. 92
X2 - 1. 48 - 1. 23
X3 - 0. 85 - 0. 82
X4 - 1. 16 - 0. 99
X5 - 0. 89 - 0. 85
X6 - 0. 95 - 0. 72
2008年 12月
相关系数 R 都在 0. 90以上, 说明港口集装箱吞吐 量和这些单个影响因素均存在较好的相关性 [ 2] 。 国内已有采用某一单因素 来构建预测模 型的研 究, 如采用 GDP 作为惟一的影响因素, 利用灰色 理论建立集装箱吞吐量预测模型 [ 3] 。但是, 由于 港口集装箱吞吐量受多因素的影响, 如果仅仅从 单因素分析, 忽略其他影响指标, 就很难剖析影响 港口集装箱吞吐量的机理, 从而影响预测的准确 性。而在考虑多影响因素 的多元回归统 计分析 中, 往往容易产生两方面问题: 一方面为了避免遗 漏重要信息而考虑尽可能多的指标; 另一方面随 着考虑指标的增多增加了问题的复杂性。同时, 由于各指标均是对同一事物的反映, 不可避免地 造成信息的大量重叠, 这种信息的重叠有时甚至 会抹杀事物的真正特征与内在规律 [ 4] 。因此, 需 要分析这些影响指标各自的重要程度, 提取最重 要的影响因素。
i 分别为
第 i个指标的样本均值和标准差。
( 2) 计算 相关系 数矩阵 R = ( rij )p p, 其 中,
rij =
1! n
( xki - X i ) (xkj - X j ) /(
i j )。其中, rij为
第 i个指标 X i 和第 j 个指标 X j 的相关系数, xki,
xkj分别为指标 X i、X j 的第 k 个样本值, n 为样本个
1996 13 150 12 815 16 258 5 115 555 1 653 6 903 4 594 194 362 12 502 122 994 1997 14 805 12 876 17 046 5 688 627 1 727 7 740 5 338 189 184 11 669 123 656 1998 16 054 12 936 17 947 6 168 726 1 730 8 279 6 044 187 028 10 811 126 018 1999 17 330 12 994 19 560 6 678 882 1 718 8 880 6 733 193 931 10 561 127 728 2000 19 466 13 150 23 261 7 327 1 282 1 756 9 917 7 792 217 526 11 339 142 433 2001 21 565 13 202 26 634 8 089 1 451 1 832 10 884 8 850 219 386 12 004 143 633 2002 24 352 13 251 31 385 9 027 1 849 1 875 12 317 10 159 237 996 12 654 153 590 2003 28 842 13 299 41 244 10 110 2 875 1 961 15 093 11 788 260 535 13 520 165 906 2004 34 725 13 362 56 451 11 605 4 161 2 265 18 580 13 880 283 149 11 414 179 152 2005 40 908 13 437 71 581 13 305 5 217 2 445 21 974 16 489 310 389 11 891 190 433 2006 47 754 13 547 89 113 15 309 6 506 2 564 25 789 19 401 340 393 12 190 207 460 数据来源: 上海市、江苏省 及浙江省 2007年统计年鉴并整理而得。
方法, 所提取的几个综合变量可以反映原来多个
变量的大部分信息。为了使这些综合变量所含的
信息互不重叠, 应要求它们之间互不相关。例如 在评价企业的经营业绩时, 要考虑许多指标, 如利
润、产值、产品数量、产品质量、固定资产和流动资
产等, 若要全部列出, 也许可以有几十个变量。因 此, 用少量的几个综合变量代替原来的许多变量
港和青岛港为例, 笔者收集了 1996~ 2006年 [ 8] 上
述指标值的统计数据。其中, 长三角地区 1996 ~ 2006年相关指标一览表如表 1所示。
第 30卷 第 6期
陈涛焘, 等: 港口集装箱吞吐量影响因素研究
993
( 1)标准化数据。根据以上公式, 得 到标准 化后各指标数据如表 2所示。
求出主成分的因子载荷矩阵。其中涉及的数值视
解释精度而定, 本研究取 95% 。 ( 6)因子载荷矩阵乘以主成分的贡献率, 求
得各指标的重要度影响系数。
2. 2 实证分析 根据上述分析, 可能影响港口吞吐量的相关
量化指标主要包括: GDP、对外贸易额、人口、第一 产业产值、第二产业产值、第三产业产值、货运量、 铁路货运量和公路货运量 [ 7 ] 等。以上海港、广州
港口集装箱吞吐量影响因素研究
陈涛焘, 高 琴
( 武汉理工大学 交通学院, 湖北 武汉 430063)
摘 要: 针对港口集装箱吞吐量预测中重要指标难以选取的问题, 从可能影响港口集装箱吞吐量的因素出发,
采用主成分分析法, 提取最关键影响因素。分别选取我国 三大区域中 的上海港、青岛港 和广州港进 行实证分
2000 - 0. 52 - 0. 08 - 0. 57 - 0. 49 - 0. 53 - 0. 63 - 0. 54 - 0. 48 - 0. 42 - 0. 62 - 0. 36 2001 - 0. 33 0. 13 - 0. 43 - 0. 26 - 0. 45 - 0. 39 - 0. 38 - 0. 26 - 0. 38 0. 16 - 0. 32
(X 7 )、第三产业 值 (X 8 )、铁路货运 量 (X 9 )、公路
货运量 (X 10 )和货运量 (X 11 )。其计算步骤如下:
( 1)为了消除系统统计误差及量纲差异的影
响
,
对
原始数据进
行标准化处理:
*
x
ij
=
( xij - X
)
/
i,
其中,
x ij 为原 始 值,
*
x
ij为
标准
化
值,
X
和
数, p 为指标个数。
( 3)计算矩阵 R 的特征值和特征向量。求出
特征值 1, 2, ∀, p, 并按从大到小顺序排列, 同
时求得对应的特征向量 1, 2, ∀, p。
( 4)计算贡献率和累计贡献率。贡献率 e =
p
m
p
! ! ! i / i, 累计贡献率 Em =
j
i , 其中,
p 为指标个数, m 为累计指标个数。 ( 5)取累计贡献率大于 一定数值的主 成分,
图 1~ 图 3给出了部分影响因素与港口集装 箱吞吐量的相关关系图。从单因素角度分析, 其
图 1 上海港集装箱吞吐量与影响因素关系图
收稿日期: 2008 - 07- 09. 作者简介: 陈涛焘 ( 1982- ) , 男, 安徽合肥人, 武汉理工大学交通学院硕士研究生.
99 2
武汉理工大学学报 信息与管 理工程版
第 30卷 第 6期 2008年 12月
武汉理工大学学报 信息与管理工程版
JOURNAL OF WUT ( INFORM AT ION & M ANAG EM ENT ENG INEER ING )
文章编号: 1007- 144X ( 2008) 06- 0991- 04
V o .l 30 N o. 6 D ec. 2008
( 2)计算特征值及特征贡献率。标准化后样
本的协方差矩阵, 计算上述矩阵的特征值, 从中得 到各主成分的特征值以及按从大到小顺序排列的 方差贡献率如表 3所示。
表 1 长三角地区 1996~ 2006年相关指标一览表 年份 /年 X 1 /亿元 X 2 /万人 X 3 /亿元 X4 /亿元 X 5 /亿美元 X6 /亿元 X7 /亿元 X8 /亿元 X 9 /万吨 X10 /万吨 X 11 /万吨
析。这些影响指标的提取, 将为三大区域构建港口集装箱吞吐量预测模型提供重要参 考。
关键词: 港口集装箱吞吐量; 主成 分分析; 影响因素
中图法分类号: U 691. 71
文献标志码: A
港口集装箱吞吐量是港口的主要生产指标, 对港口的建设和管理具有重大影响。港口集装箱 吞吐量预测是港口项目建设可行性研究的重要内 容, 直接影响着项目是否可建及其建设规模。科 学预测的前提就是要充分把握影响港口集装箱吞 吐量的最主要因素, 尤其是在构建预测港口集装 箱吞吐量预测模型时, 所采用的影响指标对模型 的可靠性和结果精度至关重要。而目前国内多是 凭借主观判断和经验选取定性的影响因素, 有些 指标在定性分析时影响显著, 但作为自变量在数 学模型中却对港口集装箱吞吐量的影响并不起主 要作用。这样往往会漏掉影响显著的因素而加入 冗余变量, 不仅会减弱模型的解释能力, 而且会降 低模型的精度 [ 1] 。
源自文库
2002 - 0. 09 0. 34 - 0. 24 0. 02 - 0. 26 - 0. 26 - 0. 16 0. 01 - 0. 03 0. 92 2003 0. 30 0. 54 0. 16 0. 35 0. 24 0. 01 0. 28 0. 35 0. 40 1. 94
是有实际意义的。由这几个综合变量出发还可能
得到一个总的指标, 按该总指标来排序、分类, 问 题就得以简化。
笔者选取可能 影响港口集装 箱吞吐量 的指
标 [ 6] 有: 地区 GD P ( X 1 )、地区总人口数 (X 2 )、工
业总产值 (X 3 )、社会消费品零售总额 (X 4 )、外贸
进出口额 (X 5 )、第一 产业值 (X 6 )、第二 产业 值
X7 - 1. 02 - 0. 88
X8 - 1. 14 - 0. 99
X9 - 0. 85 - 0. 95
X 10 0. 75 - 0. 23
X 11 - 1. 03 - 1. 00
1998 - 0. 81 - 0. 98 - 0. 78 - 0. 84 - 0. 80 - 0. 71 - 0. 80 - 0. 84 - 0. 99 - 1. 24 - 0. 92 1999 - 0. 70 - 0. 74 - 0. 72 - 0. 69 - 0. 73 - 0. 75 - 0. 70 - 0. 70 - 0. 86 - 1. 54 - 0. 86
1. 1 数据来源 因素分析法是依据分析指标与其影响因素的
关系, 从数量上确定各因素对分析指标影响方向 和影响程度的一种方法。因素分析法既可以全面 分析各因素对某一经济指标的影响, 又可以单独 分析某个因素对经济指标的影响。
一般认为影响港口集装箱运输的主要因素包 括: 港口的地理位置、腹地经济、政策环境、港口通 过能力和集疏运系统等。其具体内容包括: 地区 GD P、工业 总产 值、地区 总人 口、货运 量、社 会消 费 品总额和外贸进出口额等。
笔者分别在国内的三大经济区域 ( 长三角经
济圈、环渤海经济圈、珠三角经济圈 ) 选取具有代 表性的上海港、青岛港和广州港作为 研究对象。 并收集了 1996~ 2006年的上述港口集装箱吞吐 量数据, 以及上海、江苏、浙江、山东和广东五省市 1996~ 2006年的 GDP、总人口数、工业总产值、社 会商品零售总额、外贸进出口额、第一产业值、第 二产业值、第三产业值、铁路货运量、公路货运量 和总货运量等数据。由于上海港的直接经济腹地 为长三角地区, 青岛港和广州港的直接经济腹地 分别为山东省和广东省, 其货物吞吐量的 90% 以 上来自本省, 因此, 影响上海港集装箱吞吐量因素 的数据为上海市、江苏省和浙江省的总和, 青岛港 和广州港则以本省数据为基础。 1. 2 单因素分析关系图
2 重要影响因素提取
2. 1 计算方法 主成 分 分 析 ( principal com ponen ts analysis,
PCA ) 也称 为主 分量 分析 [ 5 ] , 由 HOTELL ING 于 1933年首先提出。它是一种通 过降维把多个变 量 ( 指标 )化为少数几个综合变量 (综合指标 ) 的
表 2 长三角地区 1996~ 2006年相关指标数据的标准 化
年份 /年 1 996 1 997
X1 - 1. 07 - 0. 92
X2 - 1. 48 - 1. 23
X3 - 0. 85 - 0. 82
X4 - 1. 16 - 0. 99
X5 - 0. 89 - 0. 85
X6 - 0. 95 - 0. 72
2008年 12月
相关系数 R 都在 0. 90以上, 说明港口集装箱吞吐 量和这些单个影响因素均存在较好的相关性 [ 2] 。 国内已有采用某一单因素 来构建预测模 型的研 究, 如采用 GDP 作为惟一的影响因素, 利用灰色 理论建立集装箱吞吐量预测模型 [ 3] 。但是, 由于 港口集装箱吞吐量受多因素的影响, 如果仅仅从 单因素分析, 忽略其他影响指标, 就很难剖析影响 港口集装箱吞吐量的机理, 从而影响预测的准确 性。而在考虑多影响因素 的多元回归统 计分析 中, 往往容易产生两方面问题: 一方面为了避免遗 漏重要信息而考虑尽可能多的指标; 另一方面随 着考虑指标的增多增加了问题的复杂性。同时, 由于各指标均是对同一事物的反映, 不可避免地 造成信息的大量重叠, 这种信息的重叠有时甚至 会抹杀事物的真正特征与内在规律 [ 4] 。因此, 需 要分析这些影响指标各自的重要程度, 提取最重 要的影响因素。
i 分别为
第 i个指标的样本均值和标准差。
( 2) 计算 相关系 数矩阵 R = ( rij )p p, 其 中,
rij =
1! n
( xki - X i ) (xkj - X j ) /(
i j )。其中, rij为
第 i个指标 X i 和第 j 个指标 X j 的相关系数, xki,
xkj分别为指标 X i、X j 的第 k 个样本值, n 为样本个
1996 13 150 12 815 16 258 5 115 555 1 653 6 903 4 594 194 362 12 502 122 994 1997 14 805 12 876 17 046 5 688 627 1 727 7 740 5 338 189 184 11 669 123 656 1998 16 054 12 936 17 947 6 168 726 1 730 8 279 6 044 187 028 10 811 126 018 1999 17 330 12 994 19 560 6 678 882 1 718 8 880 6 733 193 931 10 561 127 728 2000 19 466 13 150 23 261 7 327 1 282 1 756 9 917 7 792 217 526 11 339 142 433 2001 21 565 13 202 26 634 8 089 1 451 1 832 10 884 8 850 219 386 12 004 143 633 2002 24 352 13 251 31 385 9 027 1 849 1 875 12 317 10 159 237 996 12 654 153 590 2003 28 842 13 299 41 244 10 110 2 875 1 961 15 093 11 788 260 535 13 520 165 906 2004 34 725 13 362 56 451 11 605 4 161 2 265 18 580 13 880 283 149 11 414 179 152 2005 40 908 13 437 71 581 13 305 5 217 2 445 21 974 16 489 310 389 11 891 190 433 2006 47 754 13 547 89 113 15 309 6 506 2 564 25 789 19 401 340 393 12 190 207 460 数据来源: 上海市、江苏省 及浙江省 2007年统计年鉴并整理而得。
方法, 所提取的几个综合变量可以反映原来多个
变量的大部分信息。为了使这些综合变量所含的
信息互不重叠, 应要求它们之间互不相关。例如 在评价企业的经营业绩时, 要考虑许多指标, 如利
润、产值、产品数量、产品质量、固定资产和流动资
产等, 若要全部列出, 也许可以有几十个变量。因 此, 用少量的几个综合变量代替原来的许多变量
港和青岛港为例, 笔者收集了 1996~ 2006年 [ 8] 上
述指标值的统计数据。其中, 长三角地区 1996 ~ 2006年相关指标一览表如表 1所示。
第 30卷 第 6期
陈涛焘, 等: 港口集装箱吞吐量影响因素研究
993
( 1)标准化数据。根据以上公式, 得 到标准 化后各指标数据如表 2所示。
求出主成分的因子载荷矩阵。其中涉及的数值视
解释精度而定, 本研究取 95% 。 ( 6)因子载荷矩阵乘以主成分的贡献率, 求
得各指标的重要度影响系数。
2. 2 实证分析 根据上述分析, 可能影响港口吞吐量的相关
量化指标主要包括: GDP、对外贸易额、人口、第一 产业产值、第二产业产值、第三产业产值、货运量、 铁路货运量和公路货运量 [ 7 ] 等。以上海港、广州
港口集装箱吞吐量影响因素研究
陈涛焘, 高 琴
( 武汉理工大学 交通学院, 湖北 武汉 430063)
摘 要: 针对港口集装箱吞吐量预测中重要指标难以选取的问题, 从可能影响港口集装箱吞吐量的因素出发,
采用主成分分析法, 提取最关键影响因素。分别选取我国 三大区域中 的上海港、青岛港 和广州港进 行实证分
2000 - 0. 52 - 0. 08 - 0. 57 - 0. 49 - 0. 53 - 0. 63 - 0. 54 - 0. 48 - 0. 42 - 0. 62 - 0. 36 2001 - 0. 33 0. 13 - 0. 43 - 0. 26 - 0. 45 - 0. 39 - 0. 38 - 0. 26 - 0. 38 0. 16 - 0. 32
(X 7 )、第三产业 值 (X 8 )、铁路货运 量 (X 9 )、公路
货运量 (X 10 )和货运量 (X 11 )。其计算步骤如下:
( 1)为了消除系统统计误差及量纲差异的影
响
,
对
原始数据进
行标准化处理:
*
x
ij
=
( xij - X
)
/
i,
其中,
x ij 为原 始 值,
*
x
ij为
标准
化
值,
X
和
数, p 为指标个数。
( 3)计算矩阵 R 的特征值和特征向量。求出
特征值 1, 2, ∀, p, 并按从大到小顺序排列, 同
时求得对应的特征向量 1, 2, ∀, p。
( 4)计算贡献率和累计贡献率。贡献率 e =
p
m
p
! ! ! i / i, 累计贡献率 Em =
j
i , 其中,
p 为指标个数, m 为累计指标个数。 ( 5)取累计贡献率大于 一定数值的主 成分,
图 1~ 图 3给出了部分影响因素与港口集装 箱吞吐量的相关关系图。从单因素角度分析, 其
图 1 上海港集装箱吞吐量与影响因素关系图
收稿日期: 2008 - 07- 09. 作者简介: 陈涛焘 ( 1982- ) , 男, 安徽合肥人, 武汉理工大学交通学院硕士研究生.
99 2
武汉理工大学学报 信息与管 理工程版
第 30卷 第 6期 2008年 12月
武汉理工大学学报 信息与管理工程版
JOURNAL OF WUT ( INFORM AT ION & M ANAG EM ENT ENG INEER ING )
文章编号: 1007- 144X ( 2008) 06- 0991- 04
V o .l 30 N o. 6 D ec. 2008
( 2)计算特征值及特征贡献率。标准化后样
本的协方差矩阵, 计算上述矩阵的特征值, 从中得 到各主成分的特征值以及按从大到小顺序排列的 方差贡献率如表 3所示。
表 1 长三角地区 1996~ 2006年相关指标一览表 年份 /年 X 1 /亿元 X 2 /万人 X 3 /亿元 X4 /亿元 X 5 /亿美元 X6 /亿元 X7 /亿元 X8 /亿元 X 9 /万吨 X10 /万吨 X 11 /万吨
析。这些影响指标的提取, 将为三大区域构建港口集装箱吞吐量预测模型提供重要参 考。
关键词: 港口集装箱吞吐量; 主成 分分析; 影响因素
中图法分类号: U 691. 71
文献标志码: A
港口集装箱吞吐量是港口的主要生产指标, 对港口的建设和管理具有重大影响。港口集装箱 吞吐量预测是港口项目建设可行性研究的重要内 容, 直接影响着项目是否可建及其建设规模。科 学预测的前提就是要充分把握影响港口集装箱吞 吐量的最主要因素, 尤其是在构建预测港口集装 箱吞吐量预测模型时, 所采用的影响指标对模型 的可靠性和结果精度至关重要。而目前国内多是 凭借主观判断和经验选取定性的影响因素, 有些 指标在定性分析时影响显著, 但作为自变量在数 学模型中却对港口集装箱吞吐量的影响并不起主 要作用。这样往往会漏掉影响显著的因素而加入 冗余变量, 不仅会减弱模型的解释能力, 而且会降 低模型的精度 [ 1] 。
源自文库
2002 - 0. 09 0. 34 - 0. 24 0. 02 - 0. 26 - 0. 26 - 0. 16 0. 01 - 0. 03 0. 92 2003 0. 30 0. 54 0. 16 0. 35 0. 24 0. 01 0. 28 0. 35 0. 40 1. 94
是有实际意义的。由这几个综合变量出发还可能
得到一个总的指标, 按该总指标来排序、分类, 问 题就得以简化。
笔者选取可能 影响港口集装 箱吞吐量 的指
标 [ 6] 有: 地区 GD P ( X 1 )、地区总人口数 (X 2 )、工
业总产值 (X 3 )、社会消费品零售总额 (X 4 )、外贸
进出口额 (X 5 )、第一 产业值 (X 6 )、第二 产业 值
X7 - 1. 02 - 0. 88
X8 - 1. 14 - 0. 99
X9 - 0. 85 - 0. 95
X 10 0. 75 - 0. 23
X 11 - 1. 03 - 1. 00
1998 - 0. 81 - 0. 98 - 0. 78 - 0. 84 - 0. 80 - 0. 71 - 0. 80 - 0. 84 - 0. 99 - 1. 24 - 0. 92 1999 - 0. 70 - 0. 74 - 0. 72 - 0. 69 - 0. 73 - 0. 75 - 0. 70 - 0. 70 - 0. 86 - 1. 54 - 0. 86