关于司机年龄与发生车祸次数关系的分析
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
关于司机年龄与发生车祸次数关系的分析 一、 引 言
客观现象总是普遍联系与相互依存的。随着社会的进步,经济的发展,交通事故也是频频增多,而且有意思的是:发生车祸的驾驶员中年轻人尤其是21岁以下者所占比例有上升的趋势,那么车祸次数与年龄是否必然相关呢?本文旨在应用相关与回归的分析方法来对这一问题进行研究,在计算各种指标时构造了回归模型等来进行判定与分析。 全文主要内容安排如下:首先提出研究方法与模型检验方法,接着在第三部分是对数据的描述和简单的分析,最后对模型进行检验,得出结论。
二、 理 论 研 究
各种客观变量之间的相互关系可分为两类:一类是确定性的函数关系,另一类是不确定性的统计关系。研究现象之间的统计关系时,依研究者的理论知识和实践经验,可对客观现象之间是否存在相互关系以及有何种相关关系做出判断,在定性分析基础上,可以利用求相关系数的方式来判断两个或两个以上变量之间相关关系的方向、形态以及相关关系的密切程度。一般求两个变量相关系数r 的方法是;
XY
X Y n XY X Y S r S S -==
XY S 是变量x, y 的样本协方差,X S 、Y S 分别为变量x, y
的样本标准差。用相关系数大小来判断相关系数的密切程度: 4.0 Y=a+bX+u (x 为自变量,y 为因变量,u 随机扰动项) 根据最小二乘法知:()22X X n Y X XY n b ∑-∑∑∑-∑= a=Y –bX 为了判断两变量之间是否真正存在显著的线性相关关系,可以求可决系数进行拟合程度评价,也可通过相关系数的显著性检验或回归系数的假设检验来对所建立的回归方程式的有效性进行分析判断。 三、实 证 研 究 与 分 析 本文数据来源于美国交通部,共采集了每千个驾驶执照发生死亡事故的车祸次数和有驾驶执照的司机中21岁以下者所占比例的数据,样本由42个城市组成,在一年间采集的数据如下: 从上表可知每千个驾驶执照中,平均发生车祸次数为1.92次,即一年内每1000个驾驶员中就约有两次死亡事故发生。 是什么原因导致如此之高的车祸发生率呢?与驾驶员中年轻人变多是否有关呢?下面就采集的数据从以下两个方面进 行了探讨。 (1)相关分析:根据数据作出散点图如下: 从相关图中,我们可以看到,21岁以下者所占比例与车祸次数之间的关系较为密切,且有线性正相关的趋势,进一步计算二者的相关系数,我们可作变量假设:x 为21岁以下者所占比例,y 为每个驾驶执照中发生车祸的次数,则相关系 数为: ()() 835 .0 2 2 2 2 = ∑ - ∑ ∑ - ∑ ∑ ∑ - ∑ = = y y n x x n y x xy n S S S r y x XY 相关系数r 为0.835 > 0.7,说明车祸发生次数与21岁以下年 轻人所占比例有高度的线性相关关系 (2)回归分析 知道了车祸次数与年轻人比例的高度线性相关关系后,我们现在关心的是二者间的这种关系能否用一比较好的函数进行描述呢?因此,对其进行回归分析也就尤显必要,在分析时,我们假设 ①在简单的线性回归模型里,解释变量无测量误差; ②模型满足古典假定。 对其运用OLS对其进行回归得:(表一) Dependent Variable: Y Method: Least Squares Date: 06/09/04 Time: 12:31 Sample: 1 42 C -1.591633 0.372128 -4.277110 0.0001 R-squared 0.703612 Mean dependent 1.924405 var 0.696202 S.D. dependent var 1.070568 Adjusted R-squared S.E. of regression 0.590074 Akaike info criterion 1.829312 Sum squared resid 13.92751 Schwarz criterion 1.912058 Log likelihood -36.41554 F-statistic 94.95816 Durbin-Watson stat 1.724953 Prob(F-statistic) 0.000000 根据上述变量假设,可作一元线性直线图如下 可知回归方程为:Y=0.2867X—1.5916+u,系数b=0.2867表示在其他条件不变时,21岁以下者所占比例每增加一个百分点,一年内每一个驾驶执照发生车祸次数会增加0.2867次,这显然是相当严重的了。 四、模型的检验 上述构建的模型是否能代表普遍现象呢?还须对回归模型进行一级检验。 (1)拟合优度评价: 从意义上讲,可决系数与相关系数有很明显的差异,但从数值上,我们知道可决系数即为相关系数的平方 r=0.697225 故可决系数为:2