论文部分内容阅读
随着水上经济活动的日益频繁和船舶通航环境的复杂多变,使得水上交通态势日趋复杂,水上交通事故频发,船舶交通流量和时空多维AIS数据呈现爆炸式增长,进而对水上交通安全和海事智能化监管提出了更高的要求。针对大数据背景下水上交通数据的复杂性、繁忙水域的独特性和船舶运动轨迹的不确定性,船舶轨迹数据挖掘面临巨大的挑战,且水上交通高速发展形势对船舶运动态势感知和船舶异常行为识别研究提出了更切实的需求。轨迹数据驱动的船舶正常行为模式构建和异常行为识别是提升繁忙水域船舶运动态势感知的有效方式,也是实现海事智能化监管的主要手段,且对于保障水上交通安全和促进海上交通智能化发展具有重要的研究意义及实用价值。
基于海量AIS数据的船舶轨迹压缩、距离度量、聚类分析和分类研究是提取船舶正常行为模式和识别船舶异常行为的关键技术因素。为了提取船舶正常行为模式和智能识别船舶异常行为,本文以时空多维AIS数据为研究对象,采用数据挖掘、人工智能和模式识别的方法,对繁忙水域船舶轨迹进行深入研究。主要工作及创新性成果包括:
(1)针对轨迹压缩方法中阈值需人为设置,且所有轨迹仅有唯一阈值的缺点,本文提出了一种自动高效的轨迹压缩方法。该方法利用船舶轨迹特征、航速和航道特征为每条船舶轨迹设置不同的压缩阈值,自动提取关键特征,消除人为设置阈值的影响。以成山角水域AIS数据为样本集,分析船舶轨迹压缩的聚类效果,验证了压缩算法的有效性和高效性,实验结果表明该算法不仅提高了聚类性能,而且压缩后的轨迹点存储量降低了14倍,轨迹距离度量时间节省了10.5倍。该方法具有高效性,能够减小数据存储量,且能自动快速处理海量AIS数据。
(2)针对轨迹相似性度量研究方法中特征对应关系被过度压缩和拉伸的问题,本文提出了一种自适应的轨迹相似性度量算法。该方法基于船舶轨迹特征和长度设置自适应惩罚函数,自动纠正轨迹特征对应关系,增加了相似轨迹之间的相似性,放大了不相似轨迹之间的差异。在UCR标准时间序列数据库中22个典型的数据集上验证了相似性度量模型的有效性,证明了基于提出算法的分类准确率优于其他四种经典的算法;并以成山角水域AIS数据为样本集,实例分析了算法的有效性和实用性,验证了基于提出算法的聚类性能优于原始算法。该方法具有鲁棒性,能够自适应纠正轨迹特征之间的对应关系,度量轨迹之间的距离。
(3)针对轨迹聚类方法中簇中心数目未知,且聚类效果难以度量的问题,本文提出了一种映射聚类的方法。该方法基于映射算法实现轨迹从线到点的转化,利用轨迹特征和密度分布确定簇的中心数目,运用改进的谱聚类算法高效地聚类船舶轨迹,挖掘航行模式信息。以成山角水域AIS数据为样本,实例分析验证了提出方法的有效性和挖掘航行模式的准确性,基于映射聚类算法的聚类结果优于基于谱聚类的结果,该方法实现了轨迹自动聚类,可准确挖掘轨迹内在模式信息和船舶习惯航路。
(4)针对目前船舶异常行为识别中仅能单独识别单个特征异常或轨迹异常的问题,本文提出了一种融合船舶分类研究、船舶动态特征、轨迹聚类结果和轨迹分类结果的船舶异常行为识别方法,设计了一种能智能识别船舶异常行为的应用软件。该方法基于不同类型的船舶动态特征确定船舶最大最小航速动态平面,基于历史数据网格化分析研究水域航行密度平面,利用轨迹聚类结果构建航行模式字典,运用自适应相似性度量算法和最近邻分类器构建船舶轨迹异常识别标准,综合识别船舶多种异常行为。以成山角水域不同月份的AIS数据为样本集,实验结果表明该方法不仅能智能识别出船舶多种异常行为,且能自动提前预警,降低航行风险,保障航行安全。
基于海量AIS数据的船舶轨迹压缩、距离度量、聚类分析和分类研究是提取船舶正常行为模式和识别船舶异常行为的关键技术因素。为了提取船舶正常行为模式和智能识别船舶异常行为,本文以时空多维AIS数据为研究对象,采用数据挖掘、人工智能和模式识别的方法,对繁忙水域船舶轨迹进行深入研究。主要工作及创新性成果包括:
(1)针对轨迹压缩方法中阈值需人为设置,且所有轨迹仅有唯一阈值的缺点,本文提出了一种自动高效的轨迹压缩方法。该方法利用船舶轨迹特征、航速和航道特征为每条船舶轨迹设置不同的压缩阈值,自动提取关键特征,消除人为设置阈值的影响。以成山角水域AIS数据为样本集,分析船舶轨迹压缩的聚类效果,验证了压缩算法的有效性和高效性,实验结果表明该算法不仅提高了聚类性能,而且压缩后的轨迹点存储量降低了14倍,轨迹距离度量时间节省了10.5倍。该方法具有高效性,能够减小数据存储量,且能自动快速处理海量AIS数据。
(2)针对轨迹相似性度量研究方法中特征对应关系被过度压缩和拉伸的问题,本文提出了一种自适应的轨迹相似性度量算法。该方法基于船舶轨迹特征和长度设置自适应惩罚函数,自动纠正轨迹特征对应关系,增加了相似轨迹之间的相似性,放大了不相似轨迹之间的差异。在UCR标准时间序列数据库中22个典型的数据集上验证了相似性度量模型的有效性,证明了基于提出算法的分类准确率优于其他四种经典的算法;并以成山角水域AIS数据为样本集,实例分析了算法的有效性和实用性,验证了基于提出算法的聚类性能优于原始算法。该方法具有鲁棒性,能够自适应纠正轨迹特征之间的对应关系,度量轨迹之间的距离。
(3)针对轨迹聚类方法中簇中心数目未知,且聚类效果难以度量的问题,本文提出了一种映射聚类的方法。该方法基于映射算法实现轨迹从线到点的转化,利用轨迹特征和密度分布确定簇的中心数目,运用改进的谱聚类算法高效地聚类船舶轨迹,挖掘航行模式信息。以成山角水域AIS数据为样本,实例分析验证了提出方法的有效性和挖掘航行模式的准确性,基于映射聚类算法的聚类结果优于基于谱聚类的结果,该方法实现了轨迹自动聚类,可准确挖掘轨迹内在模式信息和船舶习惯航路。
(4)针对目前船舶异常行为识别中仅能单独识别单个特征异常或轨迹异常的问题,本文提出了一种融合船舶分类研究、船舶动态特征、轨迹聚类结果和轨迹分类结果的船舶异常行为识别方法,设计了一种能智能识别船舶异常行为的应用软件。该方法基于不同类型的船舶动态特征确定船舶最大最小航速动态平面,基于历史数据网格化分析研究水域航行密度平面,利用轨迹聚类结果构建航行模式字典,运用自适应相似性度量算法和最近邻分类器构建船舶轨迹异常识别标准,综合识别船舶多种异常行为。以成山角水域不同月份的AIS数据为样本集,实验结果表明该方法不仅能智能识别出船舶多种异常行为,且能自动提前预警,降低航行风险,保障航行安全。