【摘 要】
:
船舶自动识别系统(Automatic Identification System,简称AIS),是新一代的海上通信导航系统,能够实现船舶、船岸间的船舶表示、位置、航向、航速等航行信息的自动交换。随着船舶自
论文部分内容阅读
船舶自动识别系统(Automatic Identification System,简称AIS),是新一代的海上通信导航系统,能够实现船舶、船岸间的船舶表示、位置、航向、航速等航行信息的自动交换。随着船舶自动识别系统(AIS)的广泛安装和使用,对海上移动对象的轨迹数据的研究也慢慢成为了数据挖掘领域研究的热点之一。本文主要研究海量船舶时空轨迹数据缺失属性处理方法和船舶轨迹聚类算法。针对不完备数据集中的缺失属性填补问题,轨迹聚类中轨迹划分方法、轨迹间的相似度计算、轨迹的聚类方法等问题提出了针对AIS数据的方法和改进措施,主要进行了如下工作。 提出基于信息熵简化的决策树算法对缺失属性值进行填补。通过对原始ID3决策树计算信息熵过程的研究,使用泰勒公式化简计算属性信息熵的过程,重新构造决策树算法,在保证正确性的前提下进行了对比试验。实验表明,决策树算法可以有效的进行AIS数据缺失属性值的填补,改进后的决策树算法能够训练出同样大小、同样特征的决策树,并可以减少决策树构造运算时间,提高准确率。 提出基于拐点检测的子轨迹划分方法和基于改进的豪斯多夫距离的轨迹聚类方法对AIS数据进行轨迹聚类研究。主要研究以下几方面:首先,通过坐标变化,转换轨迹数据坐标为投影坐标用于计算相似度,接着使用基于拐点检测的轨迹压缩划分算法对轨迹进行压缩和划分;然后在豪斯多夫距离的基础上加入船舶角度-旋回距离,作为新的相似度计算方法,最后使用前面划分的子轨迹段和改进的相似度计算方法进行轨迹聚类,对已经划分好的子轨迹进行聚类,并从每一类中通过扫描线方法找出特征轨迹。实验表明,该聚类算法可以对AIS数据在不丢失重要信息前提下进行有效的压缩,并快速的划分子轨迹,能从海量AIS数据中找出特征轨迹,有较好的应用价值。
其他文献
Sybil账号是由恶意攻击者创建的,用来不公平的获取大量互联网资源与能力的虚假账号。长久以来,人们注意到sybil账号出现在各种互联网社区中,例如文件共享系统。但由于缺乏进
网页作为人类知识的一个重要载体,像照片一样记录了人类的历史,是人类的一份珍贵史料。同时,网页如同书籍、报纸一样,其生存周期是有限的。因此,就有许多有机构致力于有效的
非功能需求建模在软件工程领域越来越受到重视,存在着多种分析和建模方法,其中NFR Framework是一种发展迅速和应用广泛的框架。该框架的思想是用软目标来表示非功能需求,将顶层
手指静脉识别技术是近十年来新兴的生物特征识别技术。她具有防伪性好、识别率高等优点,因而具有广阔的市场前景。六年来作者所在的研究小组自主研发了手指静脉的采集设备,并
随着近年来智能移动设备的快速普及和移动互联网的高速发展,电子文档被越来越多的使用和传播。而在电子文档中,需要使用一种良好的数据格式来用于保存和传输数据。XML由于良
近十年以来,互联网的发展速度超乎人们的想象,网络中的内容不断呈爆炸趋势增长。如今人们使用互联网时更在意网络中的内容,但是网络的通信模型却是基于位置的,仍然沿用上个世
内容中心网络(Content-centric networking,CCN)是由美国帕罗阿图研究中心提出并致力于发展的下一代基于内容的互联网的基础协议及底层架构。随着近十几年来互联网上用户和内
众所周知,地理问题分析与求解是一个非常复杂的过程。而将分析出的地理模型实现成可运行的程序更是一项庞大的工程,需要消耗很多的人力和财力。当前现状是,大量实用地理模型己被
失语症形成的原因有多种多样,脑卒中等神经疾病是导致言语缺失最常见的原因。由脑卒中引起失语症可以通过言语康复训练进行恢复,从而提高他们的交流能力,让他们更好的融入生活。
音乐情感分类在音乐检索和音乐推荐等方面具有广泛的应用。国内主流的搜索引擎百度(Baidu)和门户网站网易(163)都相继推出了音乐情感检索系统,但检索的准确率都不高。以往的