交通事故影响因素分析
合集下载
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
上式 滋i=exp(xi'茁)中,即可得泊松回归模型。其中 xi=(xi1,…, xip)' 是 p伊1 向量,表示第 i 起交通事故中 p个影响因子(时间、 天气等)的取值。茁为 p伊1 维参数向量。
负二项回归模型的似然函数为:
收稿日期:2014-05-15Байду номын сангаас
通讯作者:赵丽华
作者简介:李蕊(1989-),女,河北衡水人,硕士研究生。研究方向:实验设计与数据分析。
Poisson 回归模型的似然函数为:
上式对 茁j 参数求偏导,并令其等于零可得到如下似然方程 组:
^
采用 GAUSS 迭代法对上述方程组求解得到参数估计值茁j , j=1,2,…,p。 2.2 负二项(Negative binomial,NB)回归模型
负二项分布[6]是当 Poisson 分布中强度参数 姿i 服从均值 E (姿i)=滋i,方差 Var(姿i)=k滋i2 的 祝 分布。假设有 n 起交通事故,随机 变量 Yi 为第 i 起事故死亡人数,Y i 服从负二项分布,概率函 数[7]:
见负二项回归模型的 AIC、BIC 值均小于泊松回归模型,说明此 数据采用负二项回归模型拟合效果优于泊松回归模型。
Journal of Mathematical Medicine 文章编号:1004-4337(2014)06-0634-03
中图分类号:R311;O212
Vol.27 文献标识码:A
No.6
2014
·方法评介·
交通事故影响因素分析 吟
李 蕊 赵丽华
(太原理工大学数学学院 太原 030024)
摘 要院 目的:探讨时间、天气、车型、年龄等因素对交通事故造成死亡情况的影响,从而为预防和控制交通事故造成人员死亡提供 科学依据。方法:以某市 2013 年 4 月 ~9 月交通事故案件填写的“道路交通事故伤害信息采集表”生成 SPSS 数据,分别用泊松回归模型和 负二项回归模型对该数据进行拟合。根据回归系数得出交通事故中死亡人数与各影响因素的关系,从而给出有效控制交通事故伤害的建 议。结果:某市 2013 年 4 月 ~9 月交通事故数据中单位事故死亡人数的方差大于均值,负二项回归模型数据拟合的 AIC、BIC 值均小于泊 松回归模型,两模型中时间因素回归参数估计的 P 值均小于 0.05。结论:对于过度离散数据,负二项回归拟合效果优于泊松回归。交通事 故发生时间这一影响因素对交通事故中单位事故死亡人数的影响具有统计学意义,发生在晚上的事故较白天更易引发死亡。
2 模型简介
2.1 Poisson 回归模型 假设有 n 起交通事故,随机变量为第起事故的死亡人数,
服从参数为的泊松分布,概率函数:
泊松分布的均值等于方差,即 Var(Y i)=E(Yi)=姿i 上式中 姿i=exp(xi'茁),即可得泊松回归模型[5]。其中 xi=(xi1,
负二项分布的均值 E(Ki)=滋i,方差 Var(Y i)=滋i(1+k滋i),其中 k 表示离散参数,当 k 趋于 0 时,其极限分布为泊松分布。负二项 分布方差大于均值,具有过度离散的特点。
不同模型的拟合优度常用 AIC[8]和 BIC[9]准则进行比较。 AIC 统计量的表达式为:AIC=-2l+2M
其中 l 表示对数似然值,M 为自由参数个数。AIC 的值越 小表明模型拟合越好。
BIC 统计量的表达式为:BIC=-2l+Mlog(N) 其中 l 表示对数似然值,M 为自由参数个数,N 为样本量。 BIC 的值越小拟合越好。 4 实例分析 某市 2013 年 4 月~9 月发生的交通事故资料中,本文选取 事故发生时间(0=“晚上”(6:00-23:00),1=“白天”(6:00 前和 23: 00 后)),天气情况(晴/阴/雨),事故涉及责任方(0=“单方”,1= “双方及以上”),甲方车型(0=“非机动车”,1=“机动车”)、驾驶 者年龄(0=“<=40 岁”,1=“>40 岁”)、驾驶资历(0=“<5 年”,1=“> 5 年”)为均值 姿k 的协变量,单位事故中死亡人数 Y i 为响应变 量。生成新的 SPSS 数据,单位事故死亡人数 Y i 的频率分布条 形图,如图 1。
1 资料来源
道路交通事故资料来源于某市 2013 年 4 月~9 月交通事 故案件填写的“道路交通事故伤害信息采集表”,资料包括事故 发生日期和时间、事故涉及责任方、各事故责任方的基本资料 (性别、年龄、驾驶资历等)、天气情况、肇事地点、受伤人数、死 亡人数、车损情况等。
…,xip)' 是 p伊1 向量,表示第 i 起交通事故中 p 个影响因子(时 间、天气等)的取值。茁为 p伊1 维参数向量。
吟基金项目:山西省青年科技研究基金项目(2012021015-6)
· 634 ·
数理医药学杂志
2014 年第 27 卷第 6 期
上式对参数 茁j,资 求偏导,并令其等于零可得到如下似然方 程组:
滋i=exp(xi'茁).
^
采用 GAUSS 迭代法对上述方程组求解得到参数估计值茁j , j=1,2,…,p。 3 拟合优度检验
关键词院 泊松; 负二项; 回归; 交通事故 doi院10.3969/j.issn援1004-4337.2014.06.002
随着中国经济的快速发展,道路交通事故已成为当今社会 的一个重大公共卫生问题, 给人民生命、财产造成巨大损失[1]。 2005 年全国共发生交通事故 450254 起, 导致 98738 人死亡, 469911 人受伤,直接财产损失达 18.8 亿元[2]。因此,交通事故问题 引起了全国人民的迫切关注,各位学者也纷纷为尽量减少交通 事故造成的损失做出努力。2006 年,王迎春,余金明采用回归分 析的方法对上海市重大交通事故变化趋势作了多因素分析[3]; 2007 年,殷凯等研究了饮酒与交通事故的相关性[1];2009 年,姚 文等人对上海市虹口区 2006 年的道路交通事故发生情况作了 分析[1]。本文将研究事故发生时间、天气、驾驶者年龄等因素对单 位事故死亡人数的影响情况,为有效地预防和控制交通事故造 成人员死亡提供科学依据。
负二项回归模型的似然函数为:
收稿日期:2014-05-15Байду номын сангаас
通讯作者:赵丽华
作者简介:李蕊(1989-),女,河北衡水人,硕士研究生。研究方向:实验设计与数据分析。
Poisson 回归模型的似然函数为:
上式对 茁j 参数求偏导,并令其等于零可得到如下似然方程 组:
^
采用 GAUSS 迭代法对上述方程组求解得到参数估计值茁j , j=1,2,…,p。 2.2 负二项(Negative binomial,NB)回归模型
负二项分布[6]是当 Poisson 分布中强度参数 姿i 服从均值 E (姿i)=滋i,方差 Var(姿i)=k滋i2 的 祝 分布。假设有 n 起交通事故,随机 变量 Yi 为第 i 起事故死亡人数,Y i 服从负二项分布,概率函 数[7]:
见负二项回归模型的 AIC、BIC 值均小于泊松回归模型,说明此 数据采用负二项回归模型拟合效果优于泊松回归模型。
Journal of Mathematical Medicine 文章编号:1004-4337(2014)06-0634-03
中图分类号:R311;O212
Vol.27 文献标识码:A
No.6
2014
·方法评介·
交通事故影响因素分析 吟
李 蕊 赵丽华
(太原理工大学数学学院 太原 030024)
摘 要院 目的:探讨时间、天气、车型、年龄等因素对交通事故造成死亡情况的影响,从而为预防和控制交通事故造成人员死亡提供 科学依据。方法:以某市 2013 年 4 月 ~9 月交通事故案件填写的“道路交通事故伤害信息采集表”生成 SPSS 数据,分别用泊松回归模型和 负二项回归模型对该数据进行拟合。根据回归系数得出交通事故中死亡人数与各影响因素的关系,从而给出有效控制交通事故伤害的建 议。结果:某市 2013 年 4 月 ~9 月交通事故数据中单位事故死亡人数的方差大于均值,负二项回归模型数据拟合的 AIC、BIC 值均小于泊 松回归模型,两模型中时间因素回归参数估计的 P 值均小于 0.05。结论:对于过度离散数据,负二项回归拟合效果优于泊松回归。交通事 故发生时间这一影响因素对交通事故中单位事故死亡人数的影响具有统计学意义,发生在晚上的事故较白天更易引发死亡。
2 模型简介
2.1 Poisson 回归模型 假设有 n 起交通事故,随机变量为第起事故的死亡人数,
服从参数为的泊松分布,概率函数:
泊松分布的均值等于方差,即 Var(Y i)=E(Yi)=姿i 上式中 姿i=exp(xi'茁),即可得泊松回归模型[5]。其中 xi=(xi1,
负二项分布的均值 E(Ki)=滋i,方差 Var(Y i)=滋i(1+k滋i),其中 k 表示离散参数,当 k 趋于 0 时,其极限分布为泊松分布。负二项 分布方差大于均值,具有过度离散的特点。
不同模型的拟合优度常用 AIC[8]和 BIC[9]准则进行比较。 AIC 统计量的表达式为:AIC=-2l+2M
其中 l 表示对数似然值,M 为自由参数个数。AIC 的值越 小表明模型拟合越好。
BIC 统计量的表达式为:BIC=-2l+Mlog(N) 其中 l 表示对数似然值,M 为自由参数个数,N 为样本量。 BIC 的值越小拟合越好。 4 实例分析 某市 2013 年 4 月~9 月发生的交通事故资料中,本文选取 事故发生时间(0=“晚上”(6:00-23:00),1=“白天”(6:00 前和 23: 00 后)),天气情况(晴/阴/雨),事故涉及责任方(0=“单方”,1= “双方及以上”),甲方车型(0=“非机动车”,1=“机动车”)、驾驶 者年龄(0=“<=40 岁”,1=“>40 岁”)、驾驶资历(0=“<5 年”,1=“> 5 年”)为均值 姿k 的协变量,单位事故中死亡人数 Y i 为响应变 量。生成新的 SPSS 数据,单位事故死亡人数 Y i 的频率分布条 形图,如图 1。
1 资料来源
道路交通事故资料来源于某市 2013 年 4 月~9 月交通事 故案件填写的“道路交通事故伤害信息采集表”,资料包括事故 发生日期和时间、事故涉及责任方、各事故责任方的基本资料 (性别、年龄、驾驶资历等)、天气情况、肇事地点、受伤人数、死 亡人数、车损情况等。
…,xip)' 是 p伊1 向量,表示第 i 起交通事故中 p 个影响因子(时 间、天气等)的取值。茁为 p伊1 维参数向量。
吟基金项目:山西省青年科技研究基金项目(2012021015-6)
· 634 ·
数理医药学杂志
2014 年第 27 卷第 6 期
上式对参数 茁j,资 求偏导,并令其等于零可得到如下似然方 程组:
滋i=exp(xi'茁).
^
采用 GAUSS 迭代法对上述方程组求解得到参数估计值茁j , j=1,2,…,p。 3 拟合优度检验
关键词院 泊松; 负二项; 回归; 交通事故 doi院10.3969/j.issn援1004-4337.2014.06.002
随着中国经济的快速发展,道路交通事故已成为当今社会 的一个重大公共卫生问题, 给人民生命、财产造成巨大损失[1]。 2005 年全国共发生交通事故 450254 起, 导致 98738 人死亡, 469911 人受伤,直接财产损失达 18.8 亿元[2]。因此,交通事故问题 引起了全国人民的迫切关注,各位学者也纷纷为尽量减少交通 事故造成的损失做出努力。2006 年,王迎春,余金明采用回归分 析的方法对上海市重大交通事故变化趋势作了多因素分析[3]; 2007 年,殷凯等研究了饮酒与交通事故的相关性[1];2009 年,姚 文等人对上海市虹口区 2006 年的道路交通事故发生情况作了 分析[1]。本文将研究事故发生时间、天气、驾驶者年龄等因素对单 位事故死亡人数的影响情况,为有效地预防和控制交通事故造 成人员死亡提供科学依据。