论文部分内容阅读
我国机动车保有量逐年增长,给交通系统带来的压力越来越大,道路交通违法行为经常性的发生不可避免,违法行为常常会导致交通事故,因此针对交通事故发生的原因进行分析成为了交通系统研究的重点之一。交通违法行为是交通事故发生的基础,通过分析交通违法行为,发现构成违法行为信息的各因素之间的关系,才能更好的预防交通违法行为的发生。同时,随着信息时代数据的大规模增长,知识发现已经成为了热门,数据挖掘是其中的一个重要步骤,我国交通管理部门的数据库中累积着大量的数据,如何让这些数据发挥出作用,数据挖掘技术必不可少。本文通过对研究交通违法信息数据的需求分析,说明对违法数据进行挖掘分析的必要性。关联规则是数据挖掘的一个重要组成部分,因此可以将关联规则挖掘算法应用于道路交通违法数据分析。Apriori算法是经典的关联规则挖掘算法,分析其基本思想及实现步骤,发现Apriori算法在寻找频繁项集时产生大量候选项集,并且重复多次扫描数据库,造成算法执行效率不理想。因此,针对其性能上的缺陷,通过删除无意义的数据项压缩数据集大小和对频繁项集进行剪枝有效减少候选集的数量,提出了改进算法——R_Apriori算法,并用实验验证改进算法相比于Apriori算法在性能上的的优越性。违法记录表中的信息比较繁多,但并不都是感兴趣的信息,通过功能强大的数据挖掘工具,完成数据预处理过程,对处理后的数据进行分析。将R_Apriori应用在交通违法数据上,根据不同的属性、属性组合与违法行为之间的关联关系,分析交通违法数据,得到对实践有指导意义的规则,从而更好地为交通管理服务。