公交客运量的回归预测方法
合集下载
相关主题
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
43154 × 40◊ = 17141 (万人次 日) 其次, 考虑出租车及小巴的客运量, 由于出租车及小巴历年的车辆数没有确切的数据, 所以只能根 据现有的数据表 2 进行推算。由 1994、1995 年全市出租车辆数平均为公交内部出租车辆的 718 倍, 从而 由 1989~ 1995 上公交内部出租车辆数计算得全市出租车辆数见表 3。 据统计出租车日载客量平均 30 人次从而计算得到历年出租车年均日客运量见表 3。
211 对客运量进行调整 首先给历年客运量除以 365, 将其换成年日平均客运量, 从历年客运量趋势看, 自 1989 年起呈下降
趋势, 这是一种反常现象, 其原因很多, 但主要原因为 1989 年以来本市增加了出租及小巴车辆; 票价进 行了几次调整; 并在 1996 年取消了月票; 近年来下岗职工增多等原因。由于票价的影响已在回归方程中 考虑, 而下岗职工数的影响无法统计, 所以只考虑出租车、小巴及月票取消对客运量的影响, 并将它们影 响的客运量加原原客运量上去。首先考虑 1996 年取消月票的客运量损失值, 因为 1995 年的售月票数为 105194 万张, 折合客运量为 105194×150 365= 43. 54 (万人次 日) 认为因取消月票大多数 (60◊ ) 人仍乘公交车, 所以损失值为
y = b0 + b1x 1 + b2x 2 + b3x 3 + b4x 4 + Ε
(2)
式中: y 为客运量 (万人次 日) ; x 1 为工农业生产总值 (亿元) ; x 2 为公交票价 (分 人·公里) ; x 3 为市区
人口数 (万人) ; x 4 为市区自行车保有量 (万辆) ; bi 为待定参数; Ε为剩余误差 (是随机变量)。
3179 316 3156 3148 3142 3132 3119 3108 3106 3111
165 172 184 190 184 194 174 174 18817 19517
352 349 383 448 115 1277
1 4 西安公路交通大学学报 1997 年
x 11 01944
x 12 01975
注: x 1—市区人口; x 2—公交线路长度; x 3—城市道路长度; x 4—城市道路面积; x 5—全市人口; x 6—固定资产完成额; x 7—市区工业 总产值; x 8—人均国民民入; x 9—市区国民收入; x 10—国民生产总值; x 11—公共营运车数; x 12—自行车保有量。
Abstract: A cco rd ing to the da ta of p ub lic t ran sit p a ssenger vo lum e of X i’an, u sing the m u lt i2 va ria te reg ression m ethod, th is p ap er p red ict s the p ub lic t ran sit p a ssenger vo lum e of X i’an in 2000. T h is resu lt supp ly s the ba sis fo r the netw o rk d raw up a p lan of the p ub lic t ran sit of X i’an. Key words: p ub lic t ran sit p a ssenger vo lum e, p red ict ing, reg ression ana ly sis
3017
33100
小巴车客运量 (万人次 日)
415
5121
419
5152
10150
1513
1916
24
1990 年全市拥有小巴 800 辆, 据调查, 小巴每趟平均收入 100 元, 即每趟客运量为 100 人次, 平均 每天 3 趟, 所以小巴平均每天客运量为 24 万人次 日, 按以上出租车的增长比例从 1996 年 1996 年小巴 客运量反推, 计算得到历年小巴客运量见表 3, 把这两种客运量加到原始客运量上去得到调整的客运量 见表 4。
来的数据可以预测。根据这个原则, 由 (表 2) 可看到 1990、1992、1993、1996 年的票价调整对客运量影响
极大, 所以选择票价作为一个自变量; 由“西安市公交客运量与各种因素的相关分析”一文可知下列各种
指标与公交客运量的相关系数如表 1 所示。
本文 1997 年 3 月 20 日收到
表 3 全市出租车辆数及其客运量 (测算) 表
项 目
1989
1990
1991
年 份
1992
1993
1994
1995
1996
全市出租车辆 (辆)
2737
2782
2987
3494
6716
8761
9914
11000
全市出租车客运量 (万人次 日)
8117
8135
8196
10148
20114
26128
第 2B 期 马荣国等: 公交客运量的回归预测方法 1 3
表 1 各项指标与公交客运量的相关系数
指标 相关系数
x1 01962
x2 01306
x3 01859
x4 01938
x5 01950
x6 01916
x7 01830
x8 01894
x9 01891
x 10 01876
87190 98138 108170 118170 119173 132164 125192 133158 147167 153115 160191
212 票价的计算 1996 年以前每三站 5 分 人, 而平均全程距离为 10km , 全程平均 15 站, 所以每三站平均距离为
第 2B 期 马荣国等: 公交客运量的回归预测方法 1 5
2km , 因此票价为 5 2= 2. 5 分 人 km。 1990、1991 年调为 4 分 人 km。 1992 年调为起价 2 角, 1 角进位, 相当于每三站 10 分 人, 每人次附加 10 分。 因为全程平均距离为
工农业生产总值 票价情况
(亿元)
市区人口 (万人)
平均每户人口 自行车保有率 公交内部出租车数
(人 户)
(车 100 户)
(辆)
1985 1986 1987 1988 1989 1990 1991 1992 1994 1995
1996
4455214 44105132 42945133
45912 45160 41234119 40253152 3844015 34198161 35560168
第 17 卷 第 2B 期 1997 年 6 月
西安公路交通大学学报 Jou rna l of X i’an H ighw ay U n ive rsity
公交客运量的回归预测方法
V o l117 N o 12B Jun1 1997
马荣国① 陈宽民 候奠社
[ ①西安公路交通大学交通运输规划与管理研究所, 西安 710064; 副教授 ]
1 模型建立
多元线性回归的一般模型为
y = b0 + b1x 1 + b2x 2 + … + bm x m + Ε
(1)
式 中: y 为客运量 (万人次 日) ; x i 为与客运量相关的自变量 ( i= 1, 2, …, m ) ; Ε为剩余误差 (是随机变 量)。
111 选择自变量 x i 选择自变量时, 首先要考虑选择的变量与客运量相关, 其次要考虑自变量过去的数据便于收集, 将
摘 要: 根据西安市公交运量的数据, 利用多元回归方法, 对西安市 2000 年公交客运量进行预 测, 为西安公交网络规划提供了重要依据。 关键词: 公交客运量, 预测, 回归分析 分类号: U 491114
Regress ion M ethod for Pred icting Pa ssenger Volum e of Publ ic Tran s it
从表 1 可以看到上述 12 个指标除 x 2 外与客运量的相关性都比较强 (相关系数≥018) , 所以可以选 择上述除 x 2 外的 11 个指标作自变量。 综上所述我们可以初步选择: 交公票价, 市区人口, 城市道路长 度, 城市道路面积, 全市人口, 固定资产完成额, 市区工业总产值, 人均国民收入, 市区国民收入, 国民生 产总值, 公交营运车数, 自行车保有量等 12 个指标作为自变量。 112 对自变量 x i 进行筛选
表 4 整理数据表
项 目
年 份
客运量 (万人次 日)
工农业生产总值 (亿元)
公交票价 (分 人 km )
市区人口 (万人)
市区自行车保有量 (万辆)
1985 1986 1987 1988 1989 1990 1991 1992 1993 1994 1995 1996
122106 120184 117166 125178 128118 126153 124114 121132 127191 135127 147173 150191
M a R ong g uo① Ghen K uanm in H ou D ianshe
[ ①T raffic T ran spo rta tion’s P lann ing and M anag ing In stitu te, X i’an H ighw ay U n iversity, X i’an 710064 ]
123196 139127 161129 180159 191114 203132 222193 244156 332184 390107 421131
2150 2150 2150 2150 2150 4100 4100 7100 9100 9100 9100 10100
201190 205192 210125 216199 222154 226198 230185 236145 240185 248135 255171
虽然选择自变量时, 只要和客运量相关性较强的指标都应考虑, 但由于当计算机计算时, 如果正规 方程的阶数 (即自变量的个数)m 过大时解的精度必然下降, 另外由于变量过多可能使变量之间不完全 独立而引起计算上的困难 (病态或退化) , 所以在筛选时, 要尽可能使自变量少一些, 并使自变量相互独 立。 根据这个原则在上述 12 个指标中如有相互相关的指标时则只选其中之一个作为自变量。 比如, 市 区人口与全市人口两指标中只选市区人口; 固定资产完成额, 市区工业总产值, 人均国民收入, 市区国民 收入, 国民生产总值等指标中由于与它们相关的工wenku.baidu.com业生产总值数据较容易收集, 所以只选工农业生产 总值。 另外, 对于城市道路长度及城市道路面积, 西安市的道路网络已基本构成, 其增长率不大, 因此把 这两个指标从自变量中剔除。又由于我们预测客运量的目的是进行西安市的公交网络规划, 其中包括公 交营运车数的规划, 所以公交营运车数也不能作为自变量。至此我们确定四个指标: 工农业生产总值、公 交票价、市区人口、自行车保有数等作为自变量。 从而得到回归模型
公交客运量对公交网络规划是十分重要的, 公交客运量的数据为公交系统的规划与技术改造提供, 依据是合理安排任务计划的基础, 也是进行科学决策的重要依据。 为了改进和发展公共交通, 完善客运 结构, 首要的任务就是对整个城市的公交客运量进行预测。目前, 公交客运量的预测方法很多, 但各有其 优缺点。 这里我们选用了多元回归法对西安市公交客运量进行预测。
2 数据收集、分析、整理
根据回归方程 (2) , 我们必须收集近年来历年的客运量、工农业生产总值、公交票价、市区人口数、市 区自行车保有量。 但由于时间关系, 我们只收集了 1985~ 1996 年与上述 5 个指标有关的数据, 见表 2。
表 2 原始数据调查表
项 目
年份
客运量 (万人次 年)
27923157
123196 139127 161129 180159 191114
222193 244156 390107 421131
每三站
五分
每公里
四分 起价三角 一角进位
五角 一票制
201190 205192 210125 206199 222154 226198 230185 236145 248135 255171
211 对客运量进行调整 首先给历年客运量除以 365, 将其换成年日平均客运量, 从历年客运量趋势看, 自 1989 年起呈下降
趋势, 这是一种反常现象, 其原因很多, 但主要原因为 1989 年以来本市增加了出租及小巴车辆; 票价进 行了几次调整; 并在 1996 年取消了月票; 近年来下岗职工增多等原因。由于票价的影响已在回归方程中 考虑, 而下岗职工数的影响无法统计, 所以只考虑出租车、小巴及月票取消对客运量的影响, 并将它们影 响的客运量加原原客运量上去。首先考虑 1996 年取消月票的客运量损失值, 因为 1995 年的售月票数为 105194 万张, 折合客运量为 105194×150 365= 43. 54 (万人次 日) 认为因取消月票大多数 (60◊ ) 人仍乘公交车, 所以损失值为
y = b0 + b1x 1 + b2x 2 + b3x 3 + b4x 4 + Ε
(2)
式中: y 为客运量 (万人次 日) ; x 1 为工农业生产总值 (亿元) ; x 2 为公交票价 (分 人·公里) ; x 3 为市区
人口数 (万人) ; x 4 为市区自行车保有量 (万辆) ; bi 为待定参数; Ε为剩余误差 (是随机变量)。
3179 316 3156 3148 3142 3132 3119 3108 3106 3111
165 172 184 190 184 194 174 174 18817 19517
352 349 383 448 115 1277
1 4 西安公路交通大学学报 1997 年
x 11 01944
x 12 01975
注: x 1—市区人口; x 2—公交线路长度; x 3—城市道路长度; x 4—城市道路面积; x 5—全市人口; x 6—固定资产完成额; x 7—市区工业 总产值; x 8—人均国民民入; x 9—市区国民收入; x 10—国民生产总值; x 11—公共营运车数; x 12—自行车保有量。
Abstract: A cco rd ing to the da ta of p ub lic t ran sit p a ssenger vo lum e of X i’an, u sing the m u lt i2 va ria te reg ression m ethod, th is p ap er p red ict s the p ub lic t ran sit p a ssenger vo lum e of X i’an in 2000. T h is resu lt supp ly s the ba sis fo r the netw o rk d raw up a p lan of the p ub lic t ran sit of X i’an. Key words: p ub lic t ran sit p a ssenger vo lum e, p red ict ing, reg ression ana ly sis
3017
33100
小巴车客运量 (万人次 日)
415
5121
419
5152
10150
1513
1916
24
1990 年全市拥有小巴 800 辆, 据调查, 小巴每趟平均收入 100 元, 即每趟客运量为 100 人次, 平均 每天 3 趟, 所以小巴平均每天客运量为 24 万人次 日, 按以上出租车的增长比例从 1996 年 1996 年小巴 客运量反推, 计算得到历年小巴客运量见表 3, 把这两种客运量加到原始客运量上去得到调整的客运量 见表 4。
来的数据可以预测。根据这个原则, 由 (表 2) 可看到 1990、1992、1993、1996 年的票价调整对客运量影响
极大, 所以选择票价作为一个自变量; 由“西安市公交客运量与各种因素的相关分析”一文可知下列各种
指标与公交客运量的相关系数如表 1 所示。
本文 1997 年 3 月 20 日收到
表 3 全市出租车辆数及其客运量 (测算) 表
项 目
1989
1990
1991
年 份
1992
1993
1994
1995
1996
全市出租车辆 (辆)
2737
2782
2987
3494
6716
8761
9914
11000
全市出租车客运量 (万人次 日)
8117
8135
8196
10148
20114
26128
第 2B 期 马荣国等: 公交客运量的回归预测方法 1 3
表 1 各项指标与公交客运量的相关系数
指标 相关系数
x1 01962
x2 01306
x3 01859
x4 01938
x5 01950
x6 01916
x7 01830
x8 01894
x9 01891
x 10 01876
87190 98138 108170 118170 119173 132164 125192 133158 147167 153115 160191
212 票价的计算 1996 年以前每三站 5 分 人, 而平均全程距离为 10km , 全程平均 15 站, 所以每三站平均距离为
第 2B 期 马荣国等: 公交客运量的回归预测方法 1 5
2km , 因此票价为 5 2= 2. 5 分 人 km。 1990、1991 年调为 4 分 人 km。 1992 年调为起价 2 角, 1 角进位, 相当于每三站 10 分 人, 每人次附加 10 分。 因为全程平均距离为
工农业生产总值 票价情况
(亿元)
市区人口 (万人)
平均每户人口 自行车保有率 公交内部出租车数
(人 户)
(车 100 户)
(辆)
1985 1986 1987 1988 1989 1990 1991 1992 1994 1995
1996
4455214 44105132 42945133
45912 45160 41234119 40253152 3844015 34198161 35560168
第 17 卷 第 2B 期 1997 年 6 月
西安公路交通大学学报 Jou rna l of X i’an H ighw ay U n ive rsity
公交客运量的回归预测方法
V o l117 N o 12B Jun1 1997
马荣国① 陈宽民 候奠社
[ ①西安公路交通大学交通运输规划与管理研究所, 西安 710064; 副教授 ]
1 模型建立
多元线性回归的一般模型为
y = b0 + b1x 1 + b2x 2 + … + bm x m + Ε
(1)
式 中: y 为客运量 (万人次 日) ; x i 为与客运量相关的自变量 ( i= 1, 2, …, m ) ; Ε为剩余误差 (是随机变 量)。
111 选择自变量 x i 选择自变量时, 首先要考虑选择的变量与客运量相关, 其次要考虑自变量过去的数据便于收集, 将
摘 要: 根据西安市公交运量的数据, 利用多元回归方法, 对西安市 2000 年公交客运量进行预 测, 为西安公交网络规划提供了重要依据。 关键词: 公交客运量, 预测, 回归分析 分类号: U 491114
Regress ion M ethod for Pred icting Pa ssenger Volum e of Publ ic Tran s it
从表 1 可以看到上述 12 个指标除 x 2 外与客运量的相关性都比较强 (相关系数≥018) , 所以可以选 择上述除 x 2 外的 11 个指标作自变量。 综上所述我们可以初步选择: 交公票价, 市区人口, 城市道路长 度, 城市道路面积, 全市人口, 固定资产完成额, 市区工业总产值, 人均国民收入, 市区国民收入, 国民生 产总值, 公交营运车数, 自行车保有量等 12 个指标作为自变量。 112 对自变量 x i 进行筛选
表 4 整理数据表
项 目
年 份
客运量 (万人次 日)
工农业生产总值 (亿元)
公交票价 (分 人 km )
市区人口 (万人)
市区自行车保有量 (万辆)
1985 1986 1987 1988 1989 1990 1991 1992 1993 1994 1995 1996
122106 120184 117166 125178 128118 126153 124114 121132 127191 135127 147173 150191
M a R ong g uo① Ghen K uanm in H ou D ianshe
[ ①T raffic T ran spo rta tion’s P lann ing and M anag ing In stitu te, X i’an H ighw ay U n iversity, X i’an 710064 ]
123196 139127 161129 180159 191114 203132 222193 244156 332184 390107 421131
2150 2150 2150 2150 2150 4100 4100 7100 9100 9100 9100 10100
201190 205192 210125 216199 222154 226198 230185 236145 240185 248135 255171
虽然选择自变量时, 只要和客运量相关性较强的指标都应考虑, 但由于当计算机计算时, 如果正规 方程的阶数 (即自变量的个数)m 过大时解的精度必然下降, 另外由于变量过多可能使变量之间不完全 独立而引起计算上的困难 (病态或退化) , 所以在筛选时, 要尽可能使自变量少一些, 并使自变量相互独 立。 根据这个原则在上述 12 个指标中如有相互相关的指标时则只选其中之一个作为自变量。 比如, 市 区人口与全市人口两指标中只选市区人口; 固定资产完成额, 市区工业总产值, 人均国民收入, 市区国民 收入, 国民生产总值等指标中由于与它们相关的工wenku.baidu.com业生产总值数据较容易收集, 所以只选工农业生产 总值。 另外, 对于城市道路长度及城市道路面积, 西安市的道路网络已基本构成, 其增长率不大, 因此把 这两个指标从自变量中剔除。又由于我们预测客运量的目的是进行西安市的公交网络规划, 其中包括公 交营运车数的规划, 所以公交营运车数也不能作为自变量。至此我们确定四个指标: 工农业生产总值、公 交票价、市区人口、自行车保有数等作为自变量。 从而得到回归模型
公交客运量对公交网络规划是十分重要的, 公交客运量的数据为公交系统的规划与技术改造提供, 依据是合理安排任务计划的基础, 也是进行科学决策的重要依据。 为了改进和发展公共交通, 完善客运 结构, 首要的任务就是对整个城市的公交客运量进行预测。目前, 公交客运量的预测方法很多, 但各有其 优缺点。 这里我们选用了多元回归法对西安市公交客运量进行预测。
2 数据收集、分析、整理
根据回归方程 (2) , 我们必须收集近年来历年的客运量、工农业生产总值、公交票价、市区人口数、市 区自行车保有量。 但由于时间关系, 我们只收集了 1985~ 1996 年与上述 5 个指标有关的数据, 见表 2。
表 2 原始数据调查表
项 目
年份
客运量 (万人次 年)
27923157
123196 139127 161129 180159 191114
222193 244156 390107 421131
每三站
五分
每公里
四分 起价三角 一角进位
五角 一票制
201190 205192 210125 206199 222154 226198 230185 236145 248135 255171