多元线性回归 私家车
合集下载
相关主题
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
主成分 10 9 8 7 6 5 4 3 2 1 表2.特征值及方差贡献率 特征值 方差贡献率 累积贡献率 9.69594 0.197832 0.0542041 0.0243657 0.0129806 0.00835554 0.00339498 0.00241619 0.000506459 6.5151e-006 0.970 0.020 0.005 0.002 0.001 0.001 0.970 0.990 0.995 0.997 0.998 0.999
四、符号说明
符号 意义 人均国内生产总值 全社会消费品零售总额 全社会固定资产投资总 额 备注 单位:元 单位:亿元 单位:亿元
运营公交车辆数 公交营运总数 城市交通干线噪音均值 公交车营运总里程 道路总长(公里) 居民人均可支配收入 居民储蓄款余额 汽油(93号)年均价 存款准备金率 一年期存款基准利率 n1 n2 m1 m2
二、基本假设
1.假设附录中所提供的历史数据真实有效; 2.假设社会是稳定的,发展是平稳的,不考虑因突发事件而导致保有量 的突变; 3.假设汽车生产厂家不会出现停产或者供应不足的现象;
三、问题分析
问题一的分析: 对于问题一,要求我们分析影响该地区私人汽车保有量的因素,并 预测到2010年该地区私人汽车保有量。从所给数据表中我们知道影响汽 车保有量的因素有11个。考虑到用主成分分析法,从所有因素出发,不 区分经济因素和环境因素,采用降维的思想,通过对所有因素的相关性 分析,剔除相关性较差的影响指标,从而分析出对汽车保有量影响较大 的因素,采用这些指标,不仅可以最大程度地反映原始信息,同时使得 变量减少,更利于我们的模型建立和模型求解,更具实用性。 问题二的分析: 对于该问题,政府采取的一系列货币政策,如加息、提高人民币存 款准备金率等,其直接的影响因子为居民的人均可支配收入以及居民存 储款余额,从而影响私人汽车保有量。我们可以通过查阅相关资料,得 到我国历年的息率调整以及存款准备金率的调整值。由经济学的相关常 识可以知道,人均国内生产总值对人均可支配收入有直接影响。我们可 以建立居民人均可支配收入与人均国内生产总值以及存款准备金率之间 的关系,然后通过分析,建立居民储蓄款余额与人均国内生产总值以及 利率调整之间的函数关系式。 问题三的分析: 问题三要求对公交车和私人汽车保有量进行调控,首先我们希望选 定调控标准,即表示方法。由于题目中并没有给出具体的数据来显示该 地区的公交车量数,因此我们没有办法给出具体到辆的调控方案,因此 我们决定采用比例的形式给出调控方案。使得该地区私家车保有量与公 交车辆数保持在一定的比例,只要给出总的汽车辆数,即可知道两类车 具体的数量。
年份 1996 1997 1998 1999 2000 2001 2002 2003 2004 2005
2006 2007
0.8913 1
0.8773 1
0.947 1
0.8922 1
0.9038 1
0.9346 1
0.9023 1
0.9855 1
0.9874 1
0.9774 1
通过matlab软件编程求解,得到:特征值、特征向量以及方差贡献率。
私家车保有量增长及调控数学模型
摘要
我国经济的快速发展为私人汽车提供了巨大的发展空间。据中国汽 车工业协会估算,截止到2006年底,中国私人汽车保有量约为2650万 辆,占全国汽车保有量的60%左右。在2006年,我国汽车销量为710多 万辆,私人购买比例超过77%,中国已经成为仅次于美国的全球第二大 新车市场。本文对针对某地区私家车保有量增长及调控问题进行了探讨 和研究。分别建立了主成份分析模型分析影响汽车保有量的因素并对汽 车保有量进行预测。利用经济学相关知识分别建立了私人汽车保有量与 人均国内生产总值、存款准备金率及一年存款利率之间的函数关系,对 应建立了多元线性回归模型,通过建立一个线性优化模型,来到到对未 来一段时间该地区公交车及私人小汽车保有量的一个合理调控方案。 关键词:主成分分析 多元线性回归模型 线性优化模型
一、问题重述
据世界银行的研究,汽车保有量 (尤其是私人汽车)与人均国民收 入成正比。2003年,我国国内人均GDP首次突破1000美元,这预示着中 国汽车开始进入家庭消费阶段。而事实表明,随着中国人均GDP的稳健 增长,近年来,我国的家用汽车销量以两位数的增速急剧扩大。汽车特 别是用于消费的私人汽车保有量的多少,与经济发展程度、居民收入以 及道路建设等有着密切的联系。随着私人汽车消费时代的到来,汽车保 有量上升的一个重要因素就是国内汽车消费的快速增长。消费者购买力 的增强和个体私营经济的快速发展,也带动了私人汽车的大发展。私人 汽车保有量与一个国家或地区的社会经济发展的有关数据有着密切关 系。附表提供了我国某一经济发达地区的一些相关统计数据。 然而,当我们快速迈进以私人汽车为主体的汽车社会的时候,也面 临着新的考验,除了能源紧缺、燃油价格上涨、土地资源有限等诸多不 利因素对汽车发展带来巨大的压力外,环境污染也对汽车工业的发展提 出了严格的要求。我国于上世纪1999年对生产的小汽车废气CO、HC、 NOX和PM允许排放量制订了国家标准(相当于欧洲标准)。规定生产的汽 车从2000年1月1日起实施国Ⅰ排放标准,从2005年1月1日起实施国Ⅱ排 放标准,从2007年7月1日起实施国Ⅲ排放标准,从2010年1月1日起实施 国Ⅳ和国Ⅴ排放标准(实现基本与欧洲标准同步)。 据有关资料介绍, 在城市交通中,小汽车与公共汽车相比,单位小汽车排放的污染物比公 共汽车高9倍。如果对这种快速增长不从战略的高度加以科学引导和调 整,汽车的迅猛增长将不再单纯体现经济建设成就,巨大的负面效应也 将成为社会发展的阻碍因素。因此,基于上述的现象我们研究下述问 题: 1、 根据附表中的相关数据建立数学模型,分析影响该地区私人汽 车保有量的因素,并预测到2010年该地区私人汽车保有量有多少? 2、 自2007年以来,CPI指数累创新高,为了稳定宏观经济,控制投 资与物价的过快上涨,防止过大的资产价格泡沫和过度的投机, 政府决 定自去年开始及今后一段时期内采取从紧的货币政策,如,加息、提高 人民币存款准备金等等. 据统计, 2007年政府5次升息,9次上调存款准 备金率,分析这些措施对该地区私人汽车保有量有什么样的影响? 3、 假设私人汽车的年运行公里数是公交车年运行公里数的五分之 一。按照汽车废气国III排放标准(欧III)(要求CO排放量每公里不超 过2.3克,HC+NOX排放量每公里不超过0.56克,PM排放量每公里不超过 0.05克), 如何根据该地区的汽车废气的排放情况,来调控公交车和私 人汽车保有量?
欧II标准标准的私家车的数量 欧III标准的私家车的数量 欧II标准标准的公家车的数量 欧III标准的公家车的数量
时间年号 单位私家车年运行总数 单位公家车年运行总数 分别为国标II私家车的三种污染物排放标
五、模型的建立及求解
问题一的模型建立及求解:
主成分分析预测模型: 主成分分析是利用降维的思想, 通过构造原始指标的适当的线性组 合, 以产生一系列互不相关的综合性指标, 从中选出少数几个综合指 标, 并使它们含有尽可能多的原始指标所反映的信息, 进而用这较少的 几项综合性指标来刻画个体。由于该方法具有消除指标之间的相关性而 降维, 以及指标权重确定的客观性(以各主成分方差贡献率作为指标的 权重wenku.baidu.com) 的特点, 因而独具特色,并且特别适用于本问题的研究。 题中所给的历史数据并没有明确的指出影响该地区的私人汽车保有 量的因素,因此,基于主成分分析法是建立在各个变量相关的基础上, 本文通过对题目中所给的十一个变量的相关性分析,我们可以看到:除 去城市交通干线噪音均值这一因素与其它相关性为负外,其余的都有很 强的相关性。所以在这一模型中忽略这一因素对私家车保有量的影响。 即假定影响私家车保有量的只有十个因素。 模型的求解: 求解预处理: 首先对影响因素标准化,我们选择2007年的各项因素指标单位为 1,其它年份的因素指标参照2007年均分别进行标准化,得到无量纲的 各因素的标准比值如表所示。
t s1 s2 a0 b0 c0 a1 b1 c1 a2 b2 c2 a3 b3 c3 准 分别为国标III私家车的三种污染物排放 标准 分别为国标II公家车的三种污染物排放标 准 分别为国标III公家车的三种污染物排放 标准
单位:辆 单位:亿人 次 单位:亿人 次 单位:万公 里 单位:公里 单位:元 单位:亿元 单位:元/升
主成分上的载荷与私有汽车保有量关系图
从图中的趋势大致可以看出,y与大致呈二次关系,y与大致呈线性关 系。于是,我们可以利用主成分分析建立多元线性回归模型: 式右端的称为回归变量(自变量),称为回归系数。 我们利用matlab数学软件包编程求解,得到回归模型为:
方差贡献率是衡量各因子相对重要程度的指标,方差贡献率的大 小,表示各个主成分的相对重要程度。在统计学中,一般认为主成分的 累积贡献率达到85%即可保留有效信息。由表可知,第一,第二,第三 主成分的累计贡献率已高达99.5%,说明前三个主成分提供了原始数据 的足够信息,通过检验,提取前三个主成分。故只需求出第一、第二、 第三主成分即可。 模型求解: 计算出三个特征值的特征向量,再求出各个变量,在主成分上的载 荷。 根据表的数据,各个变量,在主成分上的载荷如下表所示:
2.0163 2.2465 2.5857 2.9402 3.1621
0.2587 0.2559 0.1349 0.0018 -0.0102
-0.0679 -0.0103 -0.1072 -0.0343 -0.0204
在matlab软件中分别作出各个变量,在主成分上的载荷与私有汽车 保有量y的关系图:
0.9362 1.0497 1.1218 1.2227 1.3552 1.5569 1.7038 表3.各变量在主成分上的载荷 0.0036 0.0152 0.1030 0.0874 0.1132 0.1400 0.2329 -0.1495 -0.1812 -0.1409 -0.1962 -0.2120 -0.2037 -0.2225
表1.标准化结果 人均国 内生产 总值 (元) 0.3409 0.3865 0.4202 0.4253 0.5179 0.5472 0.5811 0.6803 0.7483 0.8144 全社会 消费品 零售总 额(亿 元) 0.1561 0.1706 0.222 0.2454 0.2825 0.4368 0.4944 0.5749 0.6565 0.7547 全社会 固定资 产投资 总额 (亿元 0.2435 0.2903 0.3529 0.4235 0.4582 0.5103 0.586 0.7205 0.8123 0.8744 运营公 交车辆 数(辆 0.3246 0.3374 0.3421 0.3526 0.3566 0.4268 0.4268 0.5966 0.6566 0.7439 公交营 运总数 (亿人 次) 0.3392 0.3731 0.3081 0.4172 0.4425 0.4769 0.5145 0.5188 0.5435 0.8091 公交车 营运总 里程 (万公 里) 0.2267 0.2435 0.254 0.2695 0.2799 0.3478 0.3527 0.5139 0.6114 0.7384 道路总 长(公 里) 0.2544 0.2724 0.3086 0.3504 0.4135 0.4698 0.5903 0.7249 0.7988 0.863 居民人 均可支 配收入 (元) 0.5427 0.6187 0.6615 0.6736 0.7194 0.7832 0.8296 0.8627 0.8847 0.9478 居民储 蓄款余 额(亿 元) 0.154 0.1866 0.2273 0.2484 0.2855 0.3621 0.4631 0.5799 0.6922 0.8515 汽油 (93号) 年均价 (元/ 升) 0.3847 0.4475 0.4553 0.4671 0.5358 0.5672 0.5535 0.6045 0.6987 0.7812
四、符号说明
符号 意义 人均国内生产总值 全社会消费品零售总额 全社会固定资产投资总 额 备注 单位:元 单位:亿元 单位:亿元
运营公交车辆数 公交营运总数 城市交通干线噪音均值 公交车营运总里程 道路总长(公里) 居民人均可支配收入 居民储蓄款余额 汽油(93号)年均价 存款准备金率 一年期存款基准利率 n1 n2 m1 m2
二、基本假设
1.假设附录中所提供的历史数据真实有效; 2.假设社会是稳定的,发展是平稳的,不考虑因突发事件而导致保有量 的突变; 3.假设汽车生产厂家不会出现停产或者供应不足的现象;
三、问题分析
问题一的分析: 对于问题一,要求我们分析影响该地区私人汽车保有量的因素,并 预测到2010年该地区私人汽车保有量。从所给数据表中我们知道影响汽 车保有量的因素有11个。考虑到用主成分分析法,从所有因素出发,不 区分经济因素和环境因素,采用降维的思想,通过对所有因素的相关性 分析,剔除相关性较差的影响指标,从而分析出对汽车保有量影响较大 的因素,采用这些指标,不仅可以最大程度地反映原始信息,同时使得 变量减少,更利于我们的模型建立和模型求解,更具实用性。 问题二的分析: 对于该问题,政府采取的一系列货币政策,如加息、提高人民币存 款准备金率等,其直接的影响因子为居民的人均可支配收入以及居民存 储款余额,从而影响私人汽车保有量。我们可以通过查阅相关资料,得 到我国历年的息率调整以及存款准备金率的调整值。由经济学的相关常 识可以知道,人均国内生产总值对人均可支配收入有直接影响。我们可 以建立居民人均可支配收入与人均国内生产总值以及存款准备金率之间 的关系,然后通过分析,建立居民储蓄款余额与人均国内生产总值以及 利率调整之间的函数关系式。 问题三的分析: 问题三要求对公交车和私人汽车保有量进行调控,首先我们希望选 定调控标准,即表示方法。由于题目中并没有给出具体的数据来显示该 地区的公交车量数,因此我们没有办法给出具体到辆的调控方案,因此 我们决定采用比例的形式给出调控方案。使得该地区私家车保有量与公 交车辆数保持在一定的比例,只要给出总的汽车辆数,即可知道两类车 具体的数量。
年份 1996 1997 1998 1999 2000 2001 2002 2003 2004 2005
2006 2007
0.8913 1
0.8773 1
0.947 1
0.8922 1
0.9038 1
0.9346 1
0.9023 1
0.9855 1
0.9874 1
0.9774 1
通过matlab软件编程求解,得到:特征值、特征向量以及方差贡献率。
私家车保有量增长及调控数学模型
摘要
我国经济的快速发展为私人汽车提供了巨大的发展空间。据中国汽 车工业协会估算,截止到2006年底,中国私人汽车保有量约为2650万 辆,占全国汽车保有量的60%左右。在2006年,我国汽车销量为710多 万辆,私人购买比例超过77%,中国已经成为仅次于美国的全球第二大 新车市场。本文对针对某地区私家车保有量增长及调控问题进行了探讨 和研究。分别建立了主成份分析模型分析影响汽车保有量的因素并对汽 车保有量进行预测。利用经济学相关知识分别建立了私人汽车保有量与 人均国内生产总值、存款准备金率及一年存款利率之间的函数关系,对 应建立了多元线性回归模型,通过建立一个线性优化模型,来到到对未 来一段时间该地区公交车及私人小汽车保有量的一个合理调控方案。 关键词:主成分分析 多元线性回归模型 线性优化模型
一、问题重述
据世界银行的研究,汽车保有量 (尤其是私人汽车)与人均国民收 入成正比。2003年,我国国内人均GDP首次突破1000美元,这预示着中 国汽车开始进入家庭消费阶段。而事实表明,随着中国人均GDP的稳健 增长,近年来,我国的家用汽车销量以两位数的增速急剧扩大。汽车特 别是用于消费的私人汽车保有量的多少,与经济发展程度、居民收入以 及道路建设等有着密切的联系。随着私人汽车消费时代的到来,汽车保 有量上升的一个重要因素就是国内汽车消费的快速增长。消费者购买力 的增强和个体私营经济的快速发展,也带动了私人汽车的大发展。私人 汽车保有量与一个国家或地区的社会经济发展的有关数据有着密切关 系。附表提供了我国某一经济发达地区的一些相关统计数据。 然而,当我们快速迈进以私人汽车为主体的汽车社会的时候,也面 临着新的考验,除了能源紧缺、燃油价格上涨、土地资源有限等诸多不 利因素对汽车发展带来巨大的压力外,环境污染也对汽车工业的发展提 出了严格的要求。我国于上世纪1999年对生产的小汽车废气CO、HC、 NOX和PM允许排放量制订了国家标准(相当于欧洲标准)。规定生产的汽 车从2000年1月1日起实施国Ⅰ排放标准,从2005年1月1日起实施国Ⅱ排 放标准,从2007年7月1日起实施国Ⅲ排放标准,从2010年1月1日起实施 国Ⅳ和国Ⅴ排放标准(实现基本与欧洲标准同步)。 据有关资料介绍, 在城市交通中,小汽车与公共汽车相比,单位小汽车排放的污染物比公 共汽车高9倍。如果对这种快速增长不从战略的高度加以科学引导和调 整,汽车的迅猛增长将不再单纯体现经济建设成就,巨大的负面效应也 将成为社会发展的阻碍因素。因此,基于上述的现象我们研究下述问 题: 1、 根据附表中的相关数据建立数学模型,分析影响该地区私人汽 车保有量的因素,并预测到2010年该地区私人汽车保有量有多少? 2、 自2007年以来,CPI指数累创新高,为了稳定宏观经济,控制投 资与物价的过快上涨,防止过大的资产价格泡沫和过度的投机, 政府决 定自去年开始及今后一段时期内采取从紧的货币政策,如,加息、提高 人民币存款准备金等等. 据统计, 2007年政府5次升息,9次上调存款准 备金率,分析这些措施对该地区私人汽车保有量有什么样的影响? 3、 假设私人汽车的年运行公里数是公交车年运行公里数的五分之 一。按照汽车废气国III排放标准(欧III)(要求CO排放量每公里不超 过2.3克,HC+NOX排放量每公里不超过0.56克,PM排放量每公里不超过 0.05克), 如何根据该地区的汽车废气的排放情况,来调控公交车和私 人汽车保有量?
欧II标准标准的私家车的数量 欧III标准的私家车的数量 欧II标准标准的公家车的数量 欧III标准的公家车的数量
时间年号 单位私家车年运行总数 单位公家车年运行总数 分别为国标II私家车的三种污染物排放标
五、模型的建立及求解
问题一的模型建立及求解:
主成分分析预测模型: 主成分分析是利用降维的思想, 通过构造原始指标的适当的线性组 合, 以产生一系列互不相关的综合性指标, 从中选出少数几个综合指 标, 并使它们含有尽可能多的原始指标所反映的信息, 进而用这较少的 几项综合性指标来刻画个体。由于该方法具有消除指标之间的相关性而 降维, 以及指标权重确定的客观性(以各主成分方差贡献率作为指标的 权重wenku.baidu.com) 的特点, 因而独具特色,并且特别适用于本问题的研究。 题中所给的历史数据并没有明确的指出影响该地区的私人汽车保有 量的因素,因此,基于主成分分析法是建立在各个变量相关的基础上, 本文通过对题目中所给的十一个变量的相关性分析,我们可以看到:除 去城市交通干线噪音均值这一因素与其它相关性为负外,其余的都有很 强的相关性。所以在这一模型中忽略这一因素对私家车保有量的影响。 即假定影响私家车保有量的只有十个因素。 模型的求解: 求解预处理: 首先对影响因素标准化,我们选择2007年的各项因素指标单位为 1,其它年份的因素指标参照2007年均分别进行标准化,得到无量纲的 各因素的标准比值如表所示。
t s1 s2 a0 b0 c0 a1 b1 c1 a2 b2 c2 a3 b3 c3 准 分别为国标III私家车的三种污染物排放 标准 分别为国标II公家车的三种污染物排放标 准 分别为国标III公家车的三种污染物排放 标准
单位:辆 单位:亿人 次 单位:亿人 次 单位:万公 里 单位:公里 单位:元 单位:亿元 单位:元/升
主成分上的载荷与私有汽车保有量关系图
从图中的趋势大致可以看出,y与大致呈二次关系,y与大致呈线性关 系。于是,我们可以利用主成分分析建立多元线性回归模型: 式右端的称为回归变量(自变量),称为回归系数。 我们利用matlab数学软件包编程求解,得到回归模型为:
方差贡献率是衡量各因子相对重要程度的指标,方差贡献率的大 小,表示各个主成分的相对重要程度。在统计学中,一般认为主成分的 累积贡献率达到85%即可保留有效信息。由表可知,第一,第二,第三 主成分的累计贡献率已高达99.5%,说明前三个主成分提供了原始数据 的足够信息,通过检验,提取前三个主成分。故只需求出第一、第二、 第三主成分即可。 模型求解: 计算出三个特征值的特征向量,再求出各个变量,在主成分上的载 荷。 根据表的数据,各个变量,在主成分上的载荷如下表所示:
2.0163 2.2465 2.5857 2.9402 3.1621
0.2587 0.2559 0.1349 0.0018 -0.0102
-0.0679 -0.0103 -0.1072 -0.0343 -0.0204
在matlab软件中分别作出各个变量,在主成分上的载荷与私有汽车 保有量y的关系图:
0.9362 1.0497 1.1218 1.2227 1.3552 1.5569 1.7038 表3.各变量在主成分上的载荷 0.0036 0.0152 0.1030 0.0874 0.1132 0.1400 0.2329 -0.1495 -0.1812 -0.1409 -0.1962 -0.2120 -0.2037 -0.2225
表1.标准化结果 人均国 内生产 总值 (元) 0.3409 0.3865 0.4202 0.4253 0.5179 0.5472 0.5811 0.6803 0.7483 0.8144 全社会 消费品 零售总 额(亿 元) 0.1561 0.1706 0.222 0.2454 0.2825 0.4368 0.4944 0.5749 0.6565 0.7547 全社会 固定资 产投资 总额 (亿元 0.2435 0.2903 0.3529 0.4235 0.4582 0.5103 0.586 0.7205 0.8123 0.8744 运营公 交车辆 数(辆 0.3246 0.3374 0.3421 0.3526 0.3566 0.4268 0.4268 0.5966 0.6566 0.7439 公交营 运总数 (亿人 次) 0.3392 0.3731 0.3081 0.4172 0.4425 0.4769 0.5145 0.5188 0.5435 0.8091 公交车 营运总 里程 (万公 里) 0.2267 0.2435 0.254 0.2695 0.2799 0.3478 0.3527 0.5139 0.6114 0.7384 道路总 长(公 里) 0.2544 0.2724 0.3086 0.3504 0.4135 0.4698 0.5903 0.7249 0.7988 0.863 居民人 均可支 配收入 (元) 0.5427 0.6187 0.6615 0.6736 0.7194 0.7832 0.8296 0.8627 0.8847 0.9478 居民储 蓄款余 额(亿 元) 0.154 0.1866 0.2273 0.2484 0.2855 0.3621 0.4631 0.5799 0.6922 0.8515 汽油 (93号) 年均价 (元/ 升) 0.3847 0.4475 0.4553 0.4671 0.5358 0.5672 0.5535 0.6045 0.6987 0.7812