多元线性回归 私家车
多元线性回归分析范例
多元线性回归分析范例多元线性回归是一种用于预测因变量和多个自变量之间关系的统计分析方法。
它假设因变量与自变量之间存在线性关系,并通过拟合一个多元线性模型来估计因变量的值。
在本文中,我们将使用一个实际的数据集来进行多元线性回归分析的范例。
数据集介绍:我们选取的数据集是一份汽车销售数据,包括了汽车的价格(因变量)和多个与汽车相关的特征(自变量),如车龄、行驶里程、汽车品牌等。
我们的目标是通过这些特征来预测汽车的价格。
数据集包括了100个样本。
数据集的构成如下:车龄(年),行驶里程(万公里),品牌,价格(万元)----------------------------------------5,10,A,153,5,B,207,12,C,10...,...,...,...建立多元线性回归模型:我们首先需要将数据集划分为自变量矩阵X和因变量向量y。
其中,自变量矩阵X包括了车龄、行驶里程和品牌等特征,因变量向量y包括了价格。
在Python中,我们可以使用NumPy和Pandas库来处理和分析数据。
我们可以使用Pandas的DataFrame来存储数据集,并使用NumPy的polyfit函数来拟合多元线性模型。
首先,我们导入所需的库并读取数据集:```pythonimport pandas as pdimport numpy as np#读取数据集data = pd.read_csv('car_sales.csv')```然后,我们将数据集划分为自变量矩阵X和因变量向量y:```python#划分自变量矩阵X和因变量向量yX = data[['车龄', '行驶里程', '品牌']]y = data['价格']```接下来,我们使用polyfit函数来拟合多元线性模型。
我们将自变量矩阵X和因变量向量y作为输入,并指定多项式的次数(线性模型的次数为1):```python#拟合多元线性模型coefficients = np.polyfit(X, y, deg=1)```最后,我们可以使用拟合得到的模型参数来预测新的样本。
多元线性回归模型(6)
样本,可表示为
Y1 1 2 X 21 3 X31 ... k X k1 u1 Y2 1 2 X 22 3 X32 ... k X k2 u2
Yn 1 2 X 2n 3 X3n ... k X kn un
11
用矩阵表示
Y1 1
即 X可X逆
假定6:正态性假定 ui ~ N(0,σ2)
15
第二节 多元线性回归模型的估计
本节基本内容:
● 普通最小二乘法(OLS) ● OLS估计式的性质 ● OLS估计的分布性质
● 随机扰动项方差 的估2 计
● 回归系数的区间估计
16
一、普通最小二乘法(OLS)
最小二乘原则
剩余平方和最小: min ei2 (Yi -Yˆi)2
1 X 22
X kiei
X
k1
Xk2
1 e1
0
X
2n
e2
=
XБайду номын сангаас
e
=
0
X
kn
en
0
X
e
因为样本回归函数为 Y = Xβˆ + e
两边乘 X有 :
X Y = X Xβˆ + X e
因为 Xe,= 0则正规方程为:
X Xβˆ = X Y
19
OLS估计式
由正规方程 多元回归中 二元回归中
或取固定值的矩阵
2.无偏特性:
E(βˆk ) βk
21
3. 最小方差特性
在 βk所有的线性无偏估计中,OLS估计 β具ˆk 有
最小方差
结论:在古典假定下,多元线性回归的 OLS估计 式是最佳线性无偏估计式(BLUE)
多元线性回归
多元线性回归简介多元线性回归是一种统计分析方法,用于预测一个因变量与多个自变量之间的关系。
该方法适用于具有多个自变量和一个因变量之间的线性关系的数据集。
多元线性回归建立了一个多元线性模型,通过对多个自变量进行加权求和来预测因变量的值。
它基于最小二乘法,通过最小化预测值与实际观测值之间的差异来找到最佳拟合线。
在多元线性回归中,自变量可以是连续变量、二进制变量或分类变量。
因变量通常是连续的,可以预测数值型变量的值,也可以用于分类问题中。
数学原理多元线性回归的数学原理基于线性代数和统计学。
假设有n个自变量和一个因变量,可以将多元线性回归模型表示为:多元线性回归公式其中,y表示因变量的值,β0表示截距,β1, β2, …, βn表示自变量的系数,x1, x2, …, xn表示自变量的取值。
通过使用最小二乘法,可以最小化残差的平方和来计算最佳拟合线的系数。
残差是预测值与实际观测值之间的差异。
模型评估在构建多元线性回归模型后,需要对模型进行评估,以确定模型的效果和拟合优度。
常用的模型评估指标包括均方误差(Mean Squared Error, MSE)、决定系数(Coefficient of Determination, R2)和F统计量等。
•均方误差(MSE)是指预测值与实际观测值之间差异的平方和的均值。
MSE越接近于0,说明模型的预测效果越好。
•决定系数(R2)是指模型解释因变量变异性的比例。
R2的取值范围是0到1,越接近1表示模型对数据的解释能力越好。
•F统计量是用于比较两个模型之间的差异是否显著。
F统计量越大,说明模型的解释能力越好。
实例应用下面通过一个实例来说明多元线性回归的应用。
假设我们想要预测一个学生的学术成绩(因变量)与以下自变量之间的关系:学习时间、睡眠时间和饮食状况。
我们收集了100个学生的数据。
首先,我们需要对数据进行预处理,包括处理缺失值、异常值和标准化数据等。
然后,我们使用多元线性回归模型进行建模。
基于多元线性回归方法的城市汽车保有量预测研究以天津市为例
(2)异方差检验 对模型进行怀特检验,应用STATA软件 计算得到nR2=3.867919,在显著性水平0.05下 得到x20m(7)=14.25,因为nR2=3.867919<
x‰(7)=14.25,所以原假设成立,该模型
不存在异方差。 (3)自相关检验 应用D.w.法进行自相关检验,依据修正 后的多重共线性的结果可得DW=1.846879,
圈圜墨亘
DOI:10.3969/j.issn.1009-847X.2013.09.009 众的购买力有密切关系,因此本 文将城镇居民家庭人均可支配收
譬/B息
么丽欣 张海波 白 辰
入、燃料动力购进价格指数、城 区建成面积、公路里程以及政策 因素等几个与民众购买力关系密 切的指标作为模型的解释变量。 城镇居民人均可支配收入: 居民收入的高低对于民用车辆的 购买有着直接的影响,目前我国
从回归结果来看,解释变量x,的参数t检 验不显著。因此我们需要对上述模型进行计 量经济学检验并进行修正,从而使得模型能 够得到改进。因此剔除x,重新进行计算,得 到修正后的回归方程:
是因为天津市高峰时段的拥堵路段主要集中 在商业区和火车站等市区地段,新修建的公 路虽然能在一定程度上缓解道路拥堵,但是 并不能从根本上解决城市交通的堵塞问题, 因此新建公路并不能有效地激励普通市民购
[4】古继宝,亓芳芳,吴剑琳.基于Gompertz模型的中 国民用汽车保有量预测.技术经济,2010(1):57—62. [5】天津市社科院.天津市经济社会形势分析与预 测:2012年经济社会蓝皮书,天津社会科学院出版社,
2】3
2008年前杂志
逛街血拼、淘宝下单 不如买《汽车工业研多黔杂志回家。
42汽车工业研究・月刊2013年第9期
基于多元线性回归的民用汽车保有量研究
基于多元线性回归的民用汽车保有量研究作者:董兴军来源:《报刊荟萃(下)》2018年第04期摘要:自我国加入世界贸易组织后,中国汽车市场大举对外开放,目前我国民用汽车保有量已突破1亿辆。
随着经济的发展,居民对汽车的购买量将不断增加。
正是基于中国汽车这样的发展前景,吸引了诸多学者对汽车保有量进行相关研究。
鉴于以上,本文搜集了沈阳市相关数据,通过对沈阳市总人口数、燃料价格指数、经济发展水平等因素进行多元线性回归分析,以此研究影响沈阳市民用汽车保有量的关键因素,最后本文通过研究得出了结论并根据结论和沈阳市民用汽车行业存在的问题提出了相关建议。
关键词:沈阳市;民用汽车;回归分析一、研究背景及意义在我国城市化进程不断推进的今日,城市居民汽车保有量迅速增长,各种各样的交通问题愈演愈烈。
以沈阳市为例,每天都产生大量交通问题例如交通拥挤、汽车尾气、车祸频发等。
对城市汽车保有量进行研究是城市交通规划过程中的一项非常基础性的工作,因而需要从我国的城市交通的实际出发,来探索出我国的城市汽车保有量的增长影响因素,来准确地合理地对城市汽车保有量进行预测,从而对沈阳市更好的制定上行业发展规划以及解决交通环境问题提供了一定依据。
同时也有利于促沈阳市民用汽车行业的发展将乃至促进沈阳市整体经济更好的发展。
二、变量选取在研究沈阳市居民汽车保有量的问题时,居民汽车保有量为Y,同时将以下因素纳入自变量:总人口数。
一般来说总人口数的增加会使对汽车的需求不断增加,设定为x1。
燃料价格水平。
燃料价格是影响民用汽车保有量的可能因素之一,设定为x2。
经济发展水平。
经济发展水平是影响汽车保有量最重要的因素。
设定为x3。
交通运输情况。
汽车市场的发展无疑受到交通运输量客观存在的影响。
设定为x4。
部分信息见表2.1。
数据来源于《沈阳市统计年鉴》。
三、实证分析根据表2.1的数据,利用Eviews6.0对模型进行计量分析,得出散点图3.1,发现存在线性关系,用OLS法进行回归。
多元线性回归案例
多元线性回归案例假设我们有一个汽车制造公司的数据集,其中包含了多个自变量(如汽车的马力、车重、座位数等)和因变量(汽车的燃油效率)。
我们的目标是建立一个多元线性回归模型,以预测汽车的燃油效率。
首先,我们需要对数据进行探索性分析,了解各个自变量与因变量之间的关系。
我们可以使用散点图、相关系数等方法来探索这些关系。
在这个案例中,我们将会使用Python的pandas和matplotlib库进行数据的处理和可视化。
首先,我们需要导入所需的库和数据集。
```import pandas as pdimport matplotlib.pyplot as plt#读取数据集df = pd.read_csv('car_data.csv')```接下来,我们可以使用`head(`函数查看数据集的前几行。
```print(df.head()```数据集应该包含有关汽车的各个自变量和因变量,其中每一行代表一个汽车的数据。
我们可以使用散点图矩阵来展示自变量之间以及自变量与因变量之间的关系。
```pd.plotting.scatter_matrix(df)plt.show```散点图矩阵可以帮助我们观察数据之间的线性关系。
根据图中的趋势,我们可以初步判断哪些自变量与因变量之间可能存在显著的关系。
接下来,我们可以计算自变量之间和自变量与因变量之间的相关系数。
```correlation_matrix = df.corrprint(correlation_matrix)```相关系数可以衡量两个变量之间的线性相关程度,其取值范围为-1到1,0表示两个变量之间没有线性相关关系。
根据相关系数的取值,我们可以确定哪些自变量可能对燃油效率有重要影响。
在构建多元线性回归模型之前,我们需要对数据集进行预处理。
这包括处理缺失值、异常值和分类变量的转换等步骤。
然后,我们可以使用`train_test_split(`函数将数据集划分为训练集和测试集。
基于多元线性回归的私家车保有量预测
基 于 多元 线 性 回归 的私 家 车保 有 量 预测
朱 祥 和
( 中 华. 科技大学武昌分校基础科学部, 湖北 武汉 406) 304
[ 摘 要]根据某地 区的相关数据 , 运用时间序列分析 , 多元线性 回归法 , 对影响该地区私家车保有量的几个因素进
行 数 学 建 模 . 对 模 型 进 行 适 当 修 正 后 , 出其 中 的相 关 性 和 函 数关 系 , 而 对 该 地 区的 私 家 车 保 有 量 进 行 预 测 . 在 找 从 [ 键 词 ]私 家 车 ;汽 车 保 有 量 ; 间序 列 分 析 ;曲 线 拟 合 ; 元 线 性 回归 关 时 多 [ 图分 类 号 ]O2 2 4 中 1. [ 献标识码] A 文 :
第2 6卷 第 3期
V01 6 .2 No 3 .
湖 北 工
业 大
学 学
报
21 0 1年 O 6月
J n 2 1 u.01
J u n l fHu e ie st fT c n lg o r a b iUn v r i o e h oo y o y
[ 文章编号]10 -4 8 (0 1 0—0 80 0 3 6 4 2 1 )30 3—2
有好 的预期 , 因而扩 大 自己 的消 费 , 因此社 会 总体经 济 的发 展 状 况 也 会 对 私 家 车 保 有 量 产 生 重 要 的影
1 相 关 因素 与汽 车保 有 量 的 函数 关 系
影 响 消费者 购 买 者 私家 车 主要 有 三 大 因 素[ : 1 ] 其 一是 公共 交通 建设 的程 度 , 共 交 通 可 以看 做 是 公
响. 地 区相关数 据如 表 1所示 . 了消除 量纲 对数 某 为 据 的影 响 , 用 s s 对 数据 进行 标准 化. 利 ps
基于多元线性回归的汽车油耗预测模型
090海峡科技与产业2019年第3期1引言1.1研究目的及意义预测是一门实用学科,所研究的内容是如何对未来事物的发展做出科学的估计。
国民经济的高速发展,也带动了国内汽车工业的快速发展,使得汽车的燃油消耗量快速增长,而汽车的燃油消耗量又与很多因素有关,确定这些因素与汽车燃油消耗量的关联程度是一项值得深入的工作。
多元线性回归分析作为一种较为科学的方法,在各行各业都有广泛的应用,可以在获得影响因素的前提下,将定性问题定量化,确定各因素对主体问题的影响程度。
1.2研究背景早在20世纪20年代,国外就开始了对汽车燃油消耗方面的研究,此时的研究主要是针对燃烧过程,以提高燃烧效率为目的。
20世纪70年代石油危机爆发后,人们才越来越关注车辆的燃油消耗。
近年来,国民经济的高速发展也带动了国内汽车工业的快速发展,国内汽车保有量也越来越大,这就导致原油需求量的大幅提高。
我国的车用燃油消耗量以年均超过10%的速度快速增长。
仅汽车交通一项,所消耗的汽油和柴油便已占到国内汽、柴油生产总量的87%和40.7%;所消耗的石油总量也占到国内总石油消耗量的30%。
而且,我国汽车产业发展势头迅猛:从2003年到2013年,我国汽车保有量增长迅速,从2400万辆增长到1.37亿辆。
汽车燃油消费的过快增长将给我国经济和社会可持续发展带来巨大压力。
所以,节约油耗已经刻不容缓,我们必须采取有效措施减少不必要的燃油浪费,延长石油资源的可使用时间。
2理论与方法介绍多元线性回归分析预测法是通过对两个或两个以上的自变量与一个因变量的相关分析,建立预测模型并进行预测的方法。
它是研究一个随机变量Y 与两个或两个以上的一般变量X 1,X 2,…,X p 之间相依关系的统计分析方法。
设计思路为:设影响因变量Y 的自变量共有P 个,即X 1,X 2,…,X p ,这些自变量之间无确定的线性关系。
有N 组数据(X r 1,X r 2…,X p ,Y r ),r =1,2,…,N 。
多元线性回归分析
研究国内生产总值对民用汽车总量的影响 提出问题:改革开放以来,随着中国经济的快
速发展,人民生活水平不断提高,国内生产总值 也在不断增长。,研究国内生产总值与民用汽车 总量的数量关系,对于国内生产总值增长的规律 性,预测民用汽车总量的增长趋势有重要意义。 理论分析:影响民用汽车总量的因素有多种, 但从理论和经验分析,最主要的影响因素应是国 内生产总值。从理论上说国内生产总值越高,民 用汽车总量越多。
变量选择:自变量选择表现经济增长水平 的“国内生产总值(GDP)”(亿元) 因变量选择能代表全体人民消费水平的 “民用汽车总量”(亿元);
研究范围:1990年至2006年中国“国内生 产总值(GDP)”与“民用汽
基于多元线性回归法估算车辆外部环境温度
基于多元线性回归法估算车辆外部环境温度多元线性回归法被广泛应用于各种工业领域和科学研究中。
在这篇文章中,我们将探讨如何使用多元线性回归法来估算车辆外部环境温度。
车辆是在运行过程中常常受到外部环境温度的影响。
现在,我们有越来越多的传感器和数据,可以用来帮助我们更好地估算车辆外部环境温度,并且可以把温度数据与其他传感器数据联合起来使用。
多元线性回归法是一种基于假设函数和最小二乘法的数据分析方法,它可以用来估算车辆外部环境温度。
这个方法假定输入变量和输出变量之间存在线性关系,可以通过多元线性回归方程来描述。
为了估算车辆外部环境温度,我们需要以下数据:车辆的传感器数据、环境参数和历史温度数据。
车辆传感器数据可以包括:车速、转速、油耗、氧气传感器数据、排气温度传感器数据等。
环境参数可以包括:时间、季节、天气、海拔、周围环境温度等。
历史温度数据可以包括:以前的温度测量数据,可以用来建立模型。
我们需要对这些数据进行预处理,包括处理缺失值、异常值和噪声等。
然后,我们需要将数据分成训练集和测试集,以便进行训练和测试。
训练集是用来训练模型的数据集,而测试集是用来测试模型的数据集。
我们可以将70%的数据用来训练模型,并用30%的数据来测试模型。
但是,在确定训练集和测试集的百分比时,这要根据数据量和数据的特点进行调整。
然后,我们需要选择一个合适的假设函数来拟合我们的数据。
在这里,我们选择多元线性回归方程。
多元线性回归方程的一般形式为:Y = b0 + b1X1 + b2X2 + … + bnxn其中Y是我们要估算的车辆外部环境温度,X1,X2……Xn是车辆传感器数据和环境参数,b0,b1,b2……bn是方程中的权值。
最后,我们使用最小二乘法来求解方程中的权值。
最小二乘法是一种优化算法,可以通过最小化方差来拟合数据点与假设函数之间的误差。
通过这种方法,我们可以得到一个多元线性回归方程,然后使用测试集来评估我们的模型。
评估的指标可以包括误差率和均方误差(MSE)等。
基于多元线性回归分析的乘用车质心高度预估
基于多元线性回归分析的乘用车质心高度预估郑羿方;卢萍【摘要】整车质心高度是汽车动力学的重要参数之一,对整车侧向稳定性及车辆纵倾均有较大影响,是汽车动力学开发及仿真必不可少的参数.在概念设计阶段初期,由于车辆造型及详细布置方案均未确定,无法通过数模计算,获取较为准确的整车质心高度值.文章利用公开的已上市乘用车基本参数,通过回归分析,逐步提取概念设计阶段已知的整车参数中对整车质心高度影响较大的参数,建立整车基本参数与质心高度间的多元线性回归关系,并通过已量产整车项目及其对标车,验证所建立的多元线性回归关系的预估准确性.上述多元线性回归关系可在项目早期为汽车动力学开发仿真提供较为准确的整车质心高度值,也可用于评价下线样车质心高度与对标车的趋合程度.【期刊名称】《汽车实用技术》【年(卷),期】2019(000)007【总页数】5页(P84-88)【关键词】整车质心高度;多元回归分析;概念设计【作者】郑羿方;卢萍【作者单位】广州汽车集团股份有限公司汽车工程研究院,广东广州 511434;广州汽车集团股份有限公司汽车工程研究院,广东广州 511434【正文语种】中文【中图分类】U467本文介绍利用整车项目概念设计阶段已知的参数,运用多元线性回归分析,预估整车质心高度的方法。
整车质心高度作为汽车动力学开发及仿真必不可少的参数,对车辆的侧向稳定性及纵倾影响较大。
准确的预估整车质心高度,对底盘的硬点设计,悬架弹性件匹配以及底盘调校骡子车的重量配载都至关重要。
汽车动力学性能开发始于概念设计阶段,在概念设计阶段初期,只有立项时确定的整车基本尺寸参数及部分关键总成参数,车辆内外造型及详细布置方案均未确定,因此无法通过数模计算,获取较为准确的整车质心高度值。
一般是通过测量尺寸及配置相近的对标车质心高度作为整车质心高度目标的初值,但实际的样车质心高度往往与对标车有一定偏离,有时偏离较大,造成样车下线后部分底盘动力学性能无法达成目标,而重新匹配底盘参数又将带来其他性能的牺牲以及项目周期的延后。
第三章多元线性回归模型
第三章多元线性回归模型简单线性回归模型要紧讨论一个被说明变量和一个说明变量之间的线性关系,可是,由于实际经济问题的复杂性,一个经济变量可能会同多个变量相联系。
例如,消费者对某种商品的需求量不仅受该种商品价钱的阻碍,而且还可能受消费者的收入水平、其他代用商品的价钱等因素的阻碍;又如,阻碍一个国家货币需求量的不仅有经济总量GDP ,而且还有利率、物价水平、外汇储蓄等多种因素。
因此,有必要将只有一个说明变量的一元回归模型推行到有多个说明变量的情形。
本章将把上一章讨论的结论推行到包括多个说明变量的多元回归模型。
第一节 多元线性回归模型及古典假定一、多元线性回归模型社会经济现象是复杂的,通常一种社会经济现象老是和许多种现象相联系。
一种社会经济现象与多种现象相联系的最简单形式,是一个被说明变量与多个说明变量的线性关系。
例如,在生产理论中,闻名的Cobb-Douglas 生产函数描述了产出量与投入要素之间的关系,其形式为Y AK L u αβ= ()其中Y 表示产出量,K 、L 别离表示资本和劳动投入,α、β为参数,u 为随机误差项。
只是那个地址的被说明变量Y 与说明变量K 、L 之间的关系是非线性的,但通过对数变换后可转化为如下形式ln ln ln ln ln Y A K L u αβ=+++ ()若是将lnY 视为被说明变量,将lnK 和lnL 视为说明变量,ln u 是随机误差项,该式关于参数lnA 、α、β是线性的。
又如,为了对西部大开发中的电力供给作好安排,研究西部地域各省区电力消费的转变与各地域国内生产总值(GDP )及电力价钱水平变更等因素的关系,这时的说明变量已不止一个,可成立如下计量经济模型:12233i i Y X X u βββ=+++ ()其中:i Y 为西部地域各省区电力消费量;2X 为西部地域各省区国内生产总值(GDP );3X 为各地域电力价钱变更,i u 为随机误差项。
在计量经济学中,若是整体回归函数描述了一个被说明变量与多个说明变量之间的线性关系,由此而设定的整体回归函数确实是多元线性回归模型。
私家车增长logistic回归分析模型
第12卷 第3期2010年9月长安大学学报(社会科学版)Journa l o f Chang an U niversity(So cial Science Ed iti on)V o l 12 N o 3Sept .2010收稿日期:2010 06 04作者简介:任科社(1958 ),男,陕西耀县人,副教授。
私家车增长l ogistic 回归分析模型任科社(长安大学经济与管理学院,陕西西安 710064)摘 要:为汽车销售行业制定营销策略提供借鉴,也为私家车消费者理性决策提供参考,通过分析购置私家车的主要影响因素家庭因素、停车条件、交通环境、养车费用与购车决策之间的相关关系,运用SPSS 软件进行模拟运算,建立了私家车购置log ist i c 回归分析模型,应用该模型对私家车增加进行了预测,并对私家车购置决策提供了可参考的方法。
关键词:私家车;汽车销售;log istic 回归分析模型;养车费用中图分类号:F570.79 文献标志码:A 文章编号:1671 6248(2010)03 0034 04随着人们生活水平的提高,小轿车逐渐进入普通百姓家庭。
小轿车在给人们带来出行便利的同时也给许多大城市带来一系列问题,如交通拥堵、停车难、污染严重等。
因此,正确引导私家车消费涉及诸多方面的问题,如政策、管理、停车、收入、费用等。
目前,从宏观上或就某个方面研究私家车增长规律的较多[1 5],而在综合考虑用车需求、家庭收入、停车条件、交通环境、养车费用等因素的条件下,研究城市家庭私家车的增长规律,特别是通过建立相应模型进行研究则更少。
本文尝试通过logistic 分析模型对其进行分析和模拟,为交通管理部门、汽车销售部门及家庭购车提供决策参考。
一、私家车消费的主要影响因素私家车消费的主要影响因素可归纳为3个方面:(1)家庭因素,主要包括家庭对小汽车的需求和家庭的经济承受能力等;(2)社会因素,主要包括城市居住区分布、就业的布局形态、城市道路基础设施供应水平、静态交通设施建设状况以及公共交通的服务水平;(3)交通政策和税费政策因素,主要包括政府对城市发展汽车的战略方针以及购买和使用小汽车的各项具体政策。
基于ARIMA和线性回归的私家车拥有度预测理论
基于ARIMA和线性回归的私家车拥有度预测理论快速发展的汽车行业促使了汽车消费力的急速上涨,私家车保有程度也随之迅猛上升,不仅仅只有政府注意这一趋势,汽车生产与流通企业也正在做出积极应对的决策,因此对私家车的消费需求的发展方向进行预测显得非常重要。
本文首先从各个方面对私人汽车保有量的影响因素进行分析,之后根据分析结果介绍合适的理论模型与方法。
标签:私人汽车保有量;ARIMA;多元线性回归;预测1 引言中国人民的生活水平随着改革开放之后的经济发展而变得越来越滋润,薪资待遇更是稳定上涨,随之水涨船高的令全国私人汽车拥有量大幅增长。
生活质量越来越高,汽车也渐渐成为了生活中的不可替代品。
自2002年起私家车占比逐步上升,并且已经成为了乘用车消费市场的主导力量,汽车行业不得不更加关注私家车的消费市场。
汽车工业是国民经济的重要组成部分,但也在复杂的产业背景下,从生产到消费,都将消耗大量的能源。
因此汽车行业的规模与汽车保有量的变化趋势,是政府和许多研究者集中关注的研究课题。
保有量预测研究机构,无论是国内还是国外都做了很多工作。
国外已经做了很多理论和实证方面的研究,他们研究汽车的扩散主要就是针对汽车的保有量进行的。
就目前而言对私家车保有量预测的最主要方法有两类:需求模型以及均衡模型。
而集合模型和非集合模型又是需求模型的两种分类。
Dargey Gately的Gomperta模型与Ingram对数线性方程是集合模型中非常具有代表意义的两个模型,其对于决策的长远规划更具有说服力。
非集合模型以家庭或个人作为决策单元建模。
这些模型大部分都基于效用最大化行为假设,对于短期动态预测更具优势。
2 影响私家车市场的因素分析私人汽车保有量的发生变化的因素有很多,笔者选出最具代表性的经济和环境因素,从这两方面的因素出发,分析确定最为相对而言更加合理有效的影响因素。
2.1 经济因素汽车销量与经济发展是成正比关系的,故此汽车产业的发展史相对而言可以认为是经济的发展史。
关于私家车保有量的影响因素分析
关于私家车保有量的影响因素分析摘要:基于各线城市日益严重的交通拥堵情况,本研究提出了私家车保有量的影响因素,并于国家数据获取了相关因素自1998年至2013年的真实数据进行分析。
本研究的核心是建立多元线性回归分析模型,来分析私家车保有量的影响因素进行,分析各因素与保有量的影响关系,从而需求清晰地描述出私家车保有量的影响关系。
关键词:私家车保有量多元回归因素分析一、问题提出随着社会经济的发展,私家车保有量近年来一直保持增长。
私家车不仅方便了大众出行,也带动了整个供应链相关行业的发展和GDP的增长,但是却带来了拥堵问题、污染问题及安全问题已经对我们的生活造成困扰。
二、建立模型2.1选择模型多元线性回归模型是指有多个解释变量的线性回归模型,用于揭示被解释变量与其它多个解释变量之间的线性关系。
由于非线性模型的假设检验都涉及非常复杂的数学计算,所以本文考虑做一个线性模型,这样各种检验的方法较多,对模型准确程度的分析也更可靠。
本研究选取五个影响私家车保有量的影响因素,运用多元线性回归非常适合。
2.2变量选取影响私人汽车拥有量的因素有很多,本研究从当今比较热的政策方针及大家谈论比较多的角度等综合考虑,确定了影响私家车保有量的五个因素:居民消费水平、国内消费税、汽车产量、公路里程、汽油产量,并从国家数据官方网站获取了相关因素自1998年至2013年的真实数据。
2.3模型建立从多元回归分析角度,我们建立如下模型:Y=β0+β1X1+β2X2+β3X3+β4X4+β5X5+u其中:Y私家车数量(万辆)X1居民消费水平(元)X2国内消费税(亿元)X3汽车产量(万吨)X4公路里程(万公里)X5汽油产量(万吨)数据如下:表2-1 各因素数据表2.4模型分析2.4.1表2-2所示是模型汇总,R称为多元相关系数,R2代表着模型的拟合优度。
R2=∑(ŷ−y̅)2∑(y−y̅)2我们可以看到该模型是拟合优度良好。
也称为失拟性检验。
中国私人汽车拥有量影响因素分析——基于偏最小二乘回归方法
问题研究中国私人汽车拥有量影响因素分析——基于偏最小二乘回归方法粟业平 赵 凌摘 要:随着我国经济实力的不断增强,人们向往更高质量的生活。
私人汽车已经成为大多数人出行必不可少的交通工具。
由于影响私人汽车拥有量的因素之间往往存在严重的相关关系,而偏最小二乘回归方法在解决小样本条件下存在严重多重共线性问题上比传统的多元线性回归具有明显的优势。
因此,本文首先选取了影响私人汽车拥有量的7个代表性因素,并且收集了1999年至2014年的相关数据,其次运用偏最小二乘回归方法进行分析,最后得出城镇居民家庭人均可支配收入、个人所得税以及钢铁产量是影响私人汽车拥有量的三个主要因素。
关键词:私人汽车拥有量 多重共线性 偏最小二乘回归DOI: 10.16722/j.issn.1674-537X.2017.01.025一、背景改革开放以后,随着人们收入的提高,物质生活开始丰富,人们已经不仅仅追求温饱,而是向往更高质量的生活。
私人汽车已经成为大多数人出行必不可少的交通工具。
全国私人汽车拥有量由1985年的28.49万辆增加到2014年的12339.36万辆。
汽车的普及方便了人们的出行,给人们生活带来了便利,私人汽车拥有量有着突飞猛进的增长。
如今已有大量的学者对影响私人汽车拥有量的因素进行了研究。
胡清尘建立计量经济学模型,探寻上海市私人汽车拥有量和社会经济的相关指标之间的函数关系,运用逐步回归法得出人均可支配收入、一年期贷款利率以及国家对私家车的购买和使用是否有限行和限牌等相关政策会对私人汽车拥有量产生影响[1]。
何文基于时空视角分析影响私人汽车拥有量的因素,利用逐步回归方法消除自变量之间的多重共线性,从时序角度得出私人汽车拥有量受城镇居民可支配收入、人口数量和社会消费品零售总额的影响;从空间角度得出私人汽车拥有量受到年末常住人口、城镇居民人民币储蓄存款余额、航空客运量、地铁控制变量以及区域变量的影响[2]。
刘佳在影响我国私人汽车拥有量的因素计量分析中,指出国民总收入、公路里程、钢铁产量是影响私人汽车拥有量的三个显著因素[3]。
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
2.0163 2.2465 2.5857 2.9402 3.1621
0.2587 0.2559 0.1349 0.0018 -0.0102
-0.0679 -0.0103 -0.1072 -0.0343 -0.0204
在matlab软件中分别作出各个变量,在主成分上的载荷与私有汽车 保有量y的关系图:
表1.标准化结果 人均国 内生产 总值 (元) 0.3409 0.3865 0.4202 0.4253 0.5179 0.5472 0.5811 0.6803 0.7483 0.8144 全社会 消费品 零售总 额(亿 元) 0.1561 0.1706 0.222 0.2454 0.2825 0.4368 0.4944 0.5749 0.6565 0.7547 全社会 固定资 产投资 总额 (亿元 0.2435 0.2903 0.3529 0.4235 0.4582 0.5103 0.586 0.7205 0.8123 0.8744 运营公 交车辆 数(辆 0.3246 0.3374 0.3421 0.3526 0.3566 0.4268 0.4268 0.5966 0.6566 0.7439 公交营 运总数 (亿人 次) 0.3392 0.3731 0.3081 0.4172 0.4425 0.4769 0.5145 0.5188 0.5435 0.8091 公交车 营运总 里程 (万公 里) 0.2267 0.2435 0.254 0.2695 0.2799 0.3478 0.3527 0.5139 0.6114 0.7384 道路总 长(公 里) 0.2544 0.2724 0.3086 0.3504 0.4135 0.4698 0.5903 0.7249 0.7988 0.863 居民人 均可支 配收入 (元) 0.5427 0.6187 0.6615 0.6736 0.7194 0.7832 0.8296 0.8627 0.8847 0.9478 居民储 蓄款余 额(亿 元) 0.154 0.1866 0.2273 0.2484 0.2855 0.3621 0.4631 0.5799 0.6922 0.8515 汽油 (93号) 年均价 (元/ 升) 0.3847 0.4475 0.4553 0.4671 0.5358 0.5672 0.5535 0.6045 0.6987 0.7812
t s1 s2 a0 b0 c0 a1 b1 c1 a2 b2 c2 a3 b3 c3 准 分别为国标III私家车的三种污染物排放 标准 分别为国标II公家车的三种污染物排放标 准 分别为国标III公家车的三种污染物排放 标准
单位:辆 单位:亿人 次 单位:亿人 次 单位:万公 里 单位:公里 单位:元 单位:亿元 单位:元/升
主成分 10 9 8 7 6 5 4 3 2 1 表2.特征值及方差贡献率 特征值 方差贡献率 累积贡献率 9.69594 0.197832 0.0542041 0.0243657 0.0129806 0.00835554 0.00339498 0.00241619 0.000506459 6.5151e-006 0.970 0.020 0.005 0.002 0.001 0.001 0.970 0.990 0.995 0.997 0.998 0.999
四、符号说明
符号 意义 人均国内生产总值 全社会消费品零售总额 全社会固定资产投资总 额 备注 单位:元 单位:亿元 单位:亿元
运营公交车辆数 公交营运总数 城市交通干线噪音均值 公交车营运总里程 道路总长(公里) 居民人均可支配收入 居民储蓄款余额 汽油(93号)年均价 存款准备金率 一年期存款基准利率 n1 n2 m1 m2
二、基本假设
1.假设附录中所提供的历史数据真实有效; 2.假设社会是稳定的,发展是平稳的,不考虑因突发事件而导致保有量 的突变; 3.假设汽车生产厂家不会出现停产或者供应不足的现象;
三、问题分析
问题一的分析: 对于问题一,要求我们分析影响该地区私人汽车保有量的因素,并 预测到2010年该地区私人汽车保有量。从所给数据表中我们知道影响汽 车保有量的因素有11个。考虑到用主成分分析法,从所有因素出发,不 区分经济因素和环境因素,采用降维的思想,通过对所有因素的相关性 分析,剔除相关性较差的影响指标,从而分析出对汽车保有量影响较大 的因素,采用这些指标,不仅可以最大程度地反映原始信息,同时使得 变量减少,更利于我们的模型建立和模型求解,更具实用性。 问题二的分析: 对于该问题,政府采取的一系列货币政策,如加息、提高人民币存 款准备金率等,其直接的影响因子为居民的人均可支配收入以及居民存 储款余额,从而影响私人汽车保有量。我们可以通过查阅相关资料,得 到我国历年的息率调整以及存款准备金率的调整值。由经济学的相关常 识可以知道,人均国内生产总值对人均可支配收入有直接影响。我们可 以建立居民人均可支配收入与人均国内生产总值以及存款准备金率之间 的关系,然后通过分析,建立居民储蓄款余额与人均国内生产总值以及 利率调整之间的函数关系式。 问题三的分析: 问题三要求对公交车和私人汽车保有量进行调控,首先我们希望选 定调控标准,即表示方法。由于题目中并没有给出具体的数据来显示该 地区的公交车量数,因此我们没有办法给出具体到辆的调控方案,因此 我们决定采用比例的形式给出调控方案。使得该地区私家车保有量与公 交车辆数保持在一定的比例,只要给出总的汽车辆数,即可知道两类车 具体的数量。
年份 1996 1997 1998 1999 2000 2001 2002 2003 2004 2005
2006 2007
0.8913 1
0.8773 1
0.947 1
0.8922 1
0.9038 1
0.9346 1
0.9023 1
0.9855 1
0.987ቤተ መጻሕፍቲ ባይዱ 1
0.9774 1
通过matlab软件编程求解,得到:特征值、特征向量以及方差贡献率。
0.9362 1.0497 1.1218 1.2227 1.3552 1.5569 1.7038 表3.各变量在主成分上的载荷 0.0036 0.0152 0.1030 0.0874 0.1132 0.1400 0.2329 -0.1495 -0.1812 -0.1409 -0.1962 -0.2120 -0.2037 -0.2225
欧II标准标准的私家车的数量 欧III标准的私家车的数量 欧II标准标准的公家车的数量 欧III标准的公家车的数量
时间年号 单位私家车年运行总数 单位公家车年运行总数 分别为国标II私家车的三种污染物排放标
五、模型的建立及求解
问题一的模型建立及求解:
主成分分析预测模型: 主成分分析是利用降维的思想, 通过构造原始指标的适当的线性组 合, 以产生一系列互不相关的综合性指标, 从中选出少数几个综合指 标, 并使它们含有尽可能多的原始指标所反映的信息, 进而用这较少的 几项综合性指标来刻画个体。由于该方法具有消除指标之间的相关性而 降维, 以及指标权重确定的客观性(以各主成分方差贡献率作为指标的 权重值) 的特点, 因而独具特色,并且特别适用于本问题的研究。 题中所给的历史数据并没有明确的指出影响该地区的私人汽车保有 量的因素,因此,基于主成分分析法是建立在各个变量相关的基础上, 本文通过对题目中所给的十一个变量的相关性分析,我们可以看到:除 去城市交通干线噪音均值这一因素与其它相关性为负外,其余的都有很 强的相关性。所以在这一模型中忽略这一因素对私家车保有量的影响。 即假定影响私家车保有量的只有十个因素。 模型的求解: 求解预处理: 首先对影响因素标准化,我们选择2007年的各项因素指标单位为 1,其它年份的因素指标参照2007年均分别进行标准化,得到无量纲的 各因素的标准比值如表所示。
私家车保有量增长及调控数学模型
摘要
我国经济的快速发展为私人汽车提供了巨大的发展空间。据中国汽 车工业协会估算,截止到2006年底,中国私人汽车保有量约为2650万 辆,占全国汽车保有量的60%左右。在2006年,我国汽车销量为710多 万辆,私人购买比例超过77%,中国已经成为仅次于美国的全球第二大 新车市场。本文对针对某地区私家车保有量增长及调控问题进行了探讨 和研究。分别建立了主成份分析模型分析影响汽车保有量的因素并对汽 车保有量进行预测。利用经济学相关知识分别建立了私人汽车保有量与 人均国内生产总值、存款准备金率及一年存款利率之间的函数关系,对 应建立了多元线性回归模型,通过建立一个线性优化模型,来到到对未 来一段时间该地区公交车及私人小汽车保有量的一个合理调控方案。 关键词:主成分分析 多元线性回归模型 线性优化模型
主成分上的载荷与私有汽车保有量关系图
从图中的趋势大致可以看出,y与大致呈二次关系,y与大致呈线性关 系。于是,我们可以利用主成分分析建立多元线性回归模型: 式右端的称为回归变量(自变量),称为回归系数。 我们利用matlab数学软件包编程求解,得到回归模型为:
一、问题重述
据世界银行的研究,汽车保有量 (尤其是私人汽车)与人均国民收 入成正比。2003年,我国国内人均GDP首次突破1000美元,这预示着中 国汽车开始进入家庭消费阶段。而事实表明,随着中国人均GDP的稳健 增长,近年来,我国的家用汽车销量以两位数的增速急剧扩大。汽车特 别是用于消费的私人汽车保有量的多少,与经济发展程度、居民收入以 及道路建设等有着密切的联系。随着私人汽车消费时代的到来,汽车保 有量上升的一个重要因素就是国内汽车消费的快速增长。消费者购买力 的增强和个体私营经济的快速发展,也带动了私人汽车的大发展。私人 汽车保有量与一个国家或地区的社会经济发展的有关数据有着密切关 系。附表提供了我国某一经济发达地区的一些相关统计数据。 然而,当我们快速迈进以私人汽车为主体的汽车社会的时候,也面 临着新的考验,除了能源紧缺、燃油价格上涨、土地资源有限等诸多不 利因素对汽车发展带来巨大的压力外,环境污染也对汽车工业的发展提 出了严格的要求。我国于上世纪1999年对生产的小汽车废气CO、HC、 NOX和PM允许排放量制订了国家标准(相当于欧洲标准)。规定生产的汽 车从2000年1月1日起实施国Ⅰ排放标准,从2005年1月1日起实施国Ⅱ排 放标准,从2007年7月1日起实施国Ⅲ排放标准,从2010年1月1日起实施 国Ⅳ和国Ⅴ排放标准(实现基本与欧洲标准同步)。 据有关资料介绍, 在城市交通中,小汽车与公共汽车相比,单位小汽车排放的污染物比公 共汽车高9倍。如果对这种快速增长不从战略的高度加以科学引导和调 整,汽车的迅猛增长将不再单纯体现经济建设成就,巨大的负面效应也 将成为社会发展的阻碍因素。因此,基于上述的现象我们研究下述问 题: 1、 根据附表中的相关数据建立数学模型,分析影响该地区私人汽 车保有量的因素,并预测到2010年该地区私人汽车保有量有多少? 2、 自2007年以来,CPI指数累创新高,为了稳定宏观经济,控制投 资与物价的过快上涨,防止过大的资产价格泡沫和过度的投机, 政府决 定自去年开始及今后一段时期内采取从紧的货币政策,如,加息、提高 人民币存款准备金等等. 据统计, 2007年政府5次升息,9次上调存款准 备金率,分析这些措施对该地区私人汽车保有量有什么样的影响? 3、 假设私人汽车的年运行公里数是公交车年运行公里数的五分之 一。按照汽车废气国III排放标准(欧III)(要求CO排放量每公里不超 过2.3克,HC+NOX排放量每公里不超过0.56克,PM排放量每公里不超过 0.05克), 如何根据该地区的汽车废气的排放情况,来调控公交车和私 人汽车保有量?