论文部分内容阅读
在加纳,摩托车注册数量差不多占机动车注册数量的四分之一。在加纳北部农村地区,骑摩托车已成为一种常见又便宜的出行方式。近年来,作为拥堵道路下经济可行的交通模式,摩托车在加纳的城市中也越来越流行。摩托车碰撞事故通常发生在共用道路上,而与其相关的伤害与死亡是道路交通安全的重要问题,在近些年显得尤为突出。目前,摩托车碰撞事故在加纳的行人死亡原因中排名第二位。因此,有必要对导致摩托车碰撞事故的因素进行研究。摩托车碰撞事故分析在全球范围内是一个重要的研究领域。而在加纳,还没有关于摩托车碰撞事故严重性及其影响因素的研究。目前,关于预测摩托车碰撞事故严重性的经典统计模型,相关文献较多。传统的统计模型有基本的假设和预定义关系,但如果它们不满足条件,将产生不准确的结果。鉴于统计模型的缺点,本文采用基于机器学习的算法来预测摩托车碰撞事故严重性。机器学习技术采用非参数模型,其没有预测变量和响应变量之间的关系推定。本文对不同的机器学习算法进行比较和评价。本文研究的事故数据来自加纳建筑与道路研究院(BRRI)的国家道路交通碰撞数据库中2011至2015年间的摩托车碰撞数据。该数据被划分为4种损伤严重性类型:致命,住院就医,受伤和车辆受损。选择机器学习的分类算法是因为目标变量(摩托车碰撞事故严重性)有4种可能的结果(致命,住院就医,受伤和车辆受损)。考虑准确度因素,选择5种分类算法:多层感知机(MLP),规则归纳(PART),分类与回归树(CART),J48决策树分类器,以及基于实例的学习(IBk),在WEKA(Waikato Environment for Knowledge Analysis)机器学习软件中建立摩托车碰撞事故损伤严重性模型。这些机器学习算法通过十层交叉验证技术进行验证。此外,分别研究了4种集成学习策略(AdaBoosting算法,Bagging算法,随机森林算法和多数投票算法),以改善普通单个分类器的分类准确度。同时,进行了属性的相对重要性分析以确定这些属性对损伤严重性结果的影响。研究结果表明:MLP分类算法对预测摩托车碰撞事故严重性的准确度为80.84%,对4种损伤严重性类型的分类精度分别为0.867、0.802、0.791和0.736;PART算法对预测摩托车碰撞事故严重性的准确度为82.1%,对4种损伤严重性类型的分类精度分别为0.905、0.794、0.818和0.846;CART算法对预测摩托车碰撞事故严重性的准确度为82.34%,对4种损伤严重性类型的分类精度分别为0.901、0.8、0.816和0.858;J48算法对预测摩托车碰撞事故严重性的准确度为81.55%,对4种损伤严重性类型的分类精度分别为0.905、0.787、0.81和0.888;IBk算法对预测摩托车碰撞事故严重性的准确度为82.41%,对4种损伤严重性类型的分类精度分别为0.902、0.799、0.819和0.856。在5种分类算法中,IBk算法因具有全局优化和外推能力,与试验数据有最好的吻合度。此外,针对集成学习策略,研究结果表明:AdaBoosting算法改善了MLP、PART、J48和IBk算法的性能度量;Bagging算法改善了MLP、PART、J48和IBk算法的性能度量;而AdaBoosting和Bagging算法均未改善CART算法的性能度量;随机森林算法和多数投票算法的性能优于单个分类器。在4种集成学习策略中,随机森林算法在改善单个分类器性能方面优于其他技术。高峰时间、碰撞位置类型、醉酒驾驶、年龄、性别、碰撞时间和生活区类型是加纳摩托车碰撞事故损伤严重性的重要决定因素。