基于文本数据的高速公路事故持续时间预测研究

来源 :重庆交通大学 | 被引量 : 0次 | 上传用户:mydearsun
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
近年来,随着我国高速公路总里程的快速增长,国内高速公路交通安全形势的日益严峻。一方面,交通事故不仅会造成严重的财产损失、给涉事人员带来身体和精神上的创伤;另一方面,也会引发道路交通拥堵,降低整个高速公路路网的通行效率。为减少交通事故造成的拥堵和风险,就要求高速公路交通管理部门对交通事故第一时间做出反应,加快应急救援速度,采取合理、高效的应急救援策略,而准确的事故持续时间预测则是开展这些工作的基础。
  传统高速公路交通事故持续时间预测模型依赖于特定的事故特征,受事故数据来源、数量及质量的影响程度较大,并且大量的事故信息以非结构化形式被记录在自由流文本中,未能被完全量化表示;因此,传统的预测模型无论是对数据本身挖掘程度上还是对数据特征提取上都难以满足实际应用需要。考虑到文本数据中包含的丰富事故信息内容,基于自然语言处理等技术,利用事故文本语料中人类语言传递的多维信息,开展对高速公路道路交通事故持续时间预测研究。
  (1)首先,构建具有完整时间标签的事故文本数据集,其主要由两部分组成,一是由四川省高速公路事故台账数据,二是利用网络爬虫技术获取“四川高速”微博号中发布的事故微博数据,共计4808条。其次,考虑到事故检测阶段和事故响应阶段的延迟性,根据相关研究和事故处理工作流程,限定本文事故持续时间研究范围包含事故清除阶段和交通恢复阶段两部分。最后,为更大程度满足出行者出行需求,降低离群值的影响,对收集到的事故文本数据进行预处理,从而得到符合研究要求的数据共4334条,并验证了两类来源数据在词向量和标签特征、概率分布等方面均保持相同,可作为后文模型训练集使用;
  (2)在对事故文本数据特性分析的基础上,构建事故持续时间预测专属分词词表和停用词词表,并基于Word2Vec模型和TF-IDF模型,建立TI-W2Vec文本向量模型,更好的突出词语间的差异性。其次,考虑到事故持续时间具有连续时序性,故借鉴Fisher聚类算法思想,建立有序文本聚类模型(TW-Fisher),使得同类文本特征之间的差异最小,不同类别文本特征间的差异最大,将有序回归问题转化为有序分类问题,并进行不同分类模型的性能对比分析。结果表明,TW-TextRNN模型准确率最高,且TW-TextRNN模型准确率较TextRNN模型提升了10%;
  (3)考虑到网络信息中存在大量未标注的事故文本数据,而通过人工对新样本进行标注则是一项费用高、耗时长的艰巨任务,为了丰富训练集样本量,提高模型的泛化能力,在TW-TextRNN模型基础上,建立基于TW-BiLSTM的网络信息事故持续时间迁移预测模型,通过保持词向量层权重不变,让双向长短期记忆层在少量目标领域有标注数据集上进行微调处理,从而实现迁移学习的目的。结果表明,使用迁移学习策略的TW-BiLSTM模型比未使用迁移学习策略的TW-BiLSTM模型准确率提高了6%。
其他文献
水上交通运输作为综合交通运输枢纽中的重要一环,其安全发展对于建立综合交通运输立体走廊具有重要意义。同时,重庆作为长江经济带的重要连接点和交通强国建设的示范点,在服务长江经济带和交通强国战略的发展中扮演着重要角色。但近年来,重庆水上交通安全事故仍有发生,造成人员伤亡和财产损失,因此制约着水上交通经济的发展。当前,随着事中事后监管模式的加强,水上交通安全治理能力和治理体系的完善,需要依靠政府、市场和社
进入21世纪后,我国的城市轨道交通建设进入快速发展阶段,其自身快速、准时、方便等特点越来越受到人们的欢迎,许多大中型城市将其作为缓解交通拥堵的重要交通工具。但是由于车站功能结构复杂、环境封闭、高峰期客流较大且集中等原因,一旦在车站内发生突发事件,轨道车站疏散能力不一定能满足实际需要,将会给乘客疏散带来巨大困难。而且随着城市的发展,浅层地下空间日趋紧张,轨道站的布设多采用深埋的布设方式,相较于浅埋车
我国高速公路正依托各类高新技术朝着信息化、智慧化的方向不断发展,但相应的交通安全控制大多仍然沿用传统的管理方法,主要表现为“重执法,轻管控”、交通安全改善十分被动等,这显然无法适应或满足现阶段以及未来高速公路交通安全管理的需求和可持续发展。为帮助高速公路交通管理人员制定合理的交通主动安全管理策略、开发高效的事故防控技术,论文以高速公路道路实时交通流运行角度为切入点,通过挖掘事故前兆特征、构建事故风
学位
在全国小汽车保有量大幅增加,交通拥堵现象日益严重和环境质量日趋恶化,通勤人群出行时间、距离变长变远,乘客出行需求更趋个性化、多元化的时代交通背景下,定制公交作为可以缓解以上问题的方法之一,对它的研究显得尤为重要。线路规划是定制公交服务的核心环节,科学合理的线路规划可有效提高乘客的服务质量,同时也是定制公交进入市场和实现可持续发展需考虑的问题。  本文首先分析了我国当下的交通大环境,阐述了研究的背景
学位
随着中国城市化速度不断加快及城市规模不断扩大,居民的出行需求也在不断增长。虽然城市轨道交通得到了快速发展,运营技术日益成熟,但快速增长的出行需求还是给轨道交通系统带来了巨大的压力:轨道交通客流时空分布不均衡,高峰时段乘客出行需求量大等造成短时间内供需矛盾突出,导致车站客流过于饱和,影响轨道交通的安全运营。因此,有必要从车站层和线网层对轨道交通车站的过饱和客流进行控制,系统性地提高轨道的交通运输性能
城市轨道交通作为公共交通系统的主骨架,承载着绝大多数居民的日常出行,它的迅猛发展为解决交通拥挤问题做出了巨大贡献,但同时也对其运营管理提出了更高要求。随着轨道交通建设步伐的加快以及轨道线网日益完善,站点客流量预测成为轨道交通合理规划建设和高效运营管理的前提。因此本文通过采集轨道站点周边的POI和建成环境信息,结合轨道交通AFC数据,建立基于多源数据的轨道站点客流量预测模型。主要研究内容如下:  首
近年来我国隧道建设技术快速发展,高质量沉管隧道不断涌现,其长度和建设规模也不断增大。这些长大隧道在提高出行效率和经济效益的同时,也带来了一定的安全运营挑战,尤其是隧道火灾事故危害公众生命和财产安全。人员疏散可用时间是评价安全的重要因素,且围绕沉管隧道火灾人员安全疏散时间的研究较少,故针对沉管隧道火灾人员安全疏散可用时间问题开展系统的研究尤为重要。本学位论文以沉管隧道不同火灾场景下:温度、能见度、C
学位
重大活动期间,活动区域周边将会在较短时间内会聚集大量的车流、人流,对活动周边区域路网提出严峻的挑战。如何保障重大活动顺利进行,同时保证重大活动期间交通畅通、减少活动对交通产生的影响,是一个函待解决的难题。尤其是近年来,一些具有国际、国内重大影响力的活动在我国频繁举办,使这一问题的研究变的更加迫切。伴随着信息传输技术的发展,为交通出行引导提供了技术支持,出行引导能够很大程度提高重大活动期间个体出行效
学位
随着我国新型城镇化、城市群等国家级战略的落地推进,我国常住人口城镇化率持续增长,至2020年末已突破60%。城市物流既是物流供应链的“最后一公里”,也是支撑城市经济发展的基础性产业,还是保障城市居民日常生活的重要工程,推动城市物流健康高质量发展是提高城市竞争力和经济质量的重要途径。目前,我国城市物流仍然是人力密集型产业,不断增长的劳动力成本极大地压缩了城市物流配送企业的成长空间,不断取得突破并趋于
随着高速路网的不断织密以及汽车保有量的逐年攀升,城镇间的高连通性使得高速公路出行目的愈加丰富,车辆出行的异质性凸显。同时随着高速公路交通量快速增长,道路服务能力与出行需求出现不均衡,交通拥堵、交通安全等问题日益加剧。掌握车辆在高速公路的个体出行偏好及出行目的,准确预测OD分布量,对进行有针对性的、精细化的车辆管理,及时部署交通管控资源,提高道路服务水平具有重要的实际应用价值及意义。  由于个体车辆
学位