【摘 要】
:
不断普及的位置传感器、飞速发展的移动互联网以及日益完善的基于4G的通信设施,使得各行各业正在以越来越快的速度产生移动对象轨迹数据。大规模轨迹数据除了对数据存储与管理能力提出了更高的要求,更重要一个挑战是应用轨迹数据挖掘分析方法,快速从中提取出有效的信息和规律。作为移动对象时空轨迹数据挖掘中最常用的一种无监督分类方法,聚类分析可以用来进行轨迹信息的分析与处理。轨迹聚类分析指的是根据轨迹之间定义的某种
论文部分内容阅读
不断普及的位置传感器、飞速发展的移动互联网以及日益完善的基于4G的通信设施,使得各行各业正在以越来越快的速度产生移动对象轨迹数据。大规模轨迹数据除了对数据存储与管理能力提出了更高的要求,更重要一个挑战是应用轨迹数据挖掘分析方法,快速从中提取出有效的信息和规律。作为移动对象时空轨迹数据挖掘中最常用的一种无监督分类方法,聚类分析可以用来进行轨迹信息的分析与处理。轨迹聚类分析指的是根据轨迹之间定义的某种相似度度量准则计算轨迹之间的相似程度,从而将具有相似的结构的轨迹划分到同一个簇中。经典轨迹(Classic Trajectory)是从轨迹聚类簇中提取的一条有代表性的轨迹,它描述了一个聚类簇中的轨迹的总体运动模式,某种程度上能够被认为是轨迹聚类簇的一个模型。经典轨迹生成是指从轨迹聚类簇中选择一条已有轨迹或者生成一条新的合成轨迹作为代表聚类簇的经典轨迹。从轨迹聚类簇中生成经典轨迹并进行相关分析,能够提取出轨迹聚类相关的大量有用信息,作为对轨迹进行预测等进一步分析的基础。综上,本文希望基于轨迹密度峰值聚类算法,设计一个同时适用于受限空间和非受限空间中的轨迹数据的经典轨迹生成框架。该框架主要包括以下内容:1)轨迹相似度距离计算。根据现有轨迹相似度距离度量的特点,并考虑轨迹噪声点对于相似度距离计算效果的影响,基于SSPD距离提出改进的轨迹相似度距离度量指标—SSPDP距离,计算轨迹相似度距离矩阵。2)轨迹聚类。考虑到原始轨迹数据集中轨迹形状多样、运动模式复杂且一般存在大量噪声点,选择密度峰值聚类作为轨迹聚类算法。原始密度峰值聚类算法存在某些缺陷,比如局部密度计算方法无法适用于不同规模数据集、对数据集中稀疏簇的识别上效果不佳进行相关改进,本文引入基于K最近思想的密度峰值聚类算法—KNN-DPC,并针对KNN-DPC算法对数据集中稀疏簇识别困难的问题进行优化,提出基于密度惩罚的改进算法—DPKNN-DPC。3)经典轨迹生成。完成轨迹聚类后,接下来的问题是如何从聚类簇中提取经典轨迹,本文总结了三种经典轨迹生成方法:(1)最优代表性合并法;(2)等间距合并法;(3)扫描线法。其中最优代表性合并法不生成新的轨迹,而是从轨迹簇中已有轨迹中选取一条到其他轨迹整体相似度距离之和最小的轨迹作为经典轨迹,另外两种方法合成一条新的轨迹作为经典轨迹。最后,通过对受限空间以及非受限空间中的轨迹数据集进行实验,使用BC指数和WC指数评价聚类质量并辅助聚类中心选取,与不同的经典轨迹生成框架对比,验证该经典轨迹生成算法的准确性以及可行性。
其他文献
自由生活海洋线虫代表了分布最为广泛的、数量最为丰富的、多样性最高的后生动物类群。且自由生活海洋线虫是小型底栖动物的主要类群,在沉积环境食物链网中起着重要作用。随
柑橘黄龙病(Huanglongbing,HLB)是柑橘种植中为害最严重的病害之一,该病原属于革兰氏阴性细菌,主要通过柑橘木虱进行广泛传播。该病害的发生和扩散对柑橘产业造成了极大的经济损失。脱落酸(Abscisic Acid,ABA)是植物中普遍存在的植物激素,具有控制植株器官脱落,抑制植物生长的作用,并在受到不利环境胁迫下自身会产生防御和抵抗。鉴于脱落酸在柑橘生长发育过程中产生的重要生理作用及黄龙
本文考虑了模式转换下保险公司的最优投资和再保险策略问题。利用具有漂移的布朗运动近似保险公司的盈余过程。金融市场由一个无风险资产和一个风险资产组成,其中风险资产的
街道是城市的框架,是连接城市各个功能区的纽带,是展现城市面貌的重要窗口,更是与城市居民日常生活密不可分的重要场所之一,因此其重要性不言而喻[1]。但目前许多街道均存在着过于重视交通性功能,导致街道社会性功能不强的现象,街道公共空间景观仅以视觉效果作为设计重点,夹带少量休憩功能,因此缺乏吸引力及互动性,景观大多只是冰冷的摆设,人们仅仅停留在表面的欣赏,无法与其产生深层次的交流互动,街道体验感不强。随
牙科畏惧症是与牙科诊疗相关的一种心理和生理的临床医学反应,具体表现为对牙科治疗的焦虑、恐慌和抵触。儿童耐受力不强,属于牙科疾病的高发人群;但是,由于缺乏足够的卫生安全知识,以及牙科诊疗的复杂性,很多患儿在临床服务过程中都会表现出不同程度的牙科畏惧症。这不但降低了诊治质量,影响工作效率,还会延误儿童口腔疾病的根治。因此,如何帮助他们缓解牙科畏惧症,使之能够顺利接受口腔诊疗服务,是摆在口腔医疗服务工作
习作与阅读是小学语文教学的两个重要组成部分,占小学分值的60%以上。读写结合这一方法可以引导、帮助学生把阅读中所学到的习作方法及摄取的知识点运用到习作中,使习作内容更加充实生动,也可以把对于习作的思考运用到阅读理解中,并且通过习作后的阅读自查缺点,完善自身习作能力。它是语文课程全面性、综合性的体现,也符合语文课程实践性的特征。本论文除前言和结语外由三部分组成,第一部分对读写结合的教学模式及作用进行
文学经典《红楼梦》中蕴含了丰富的中医文化,涉及到的中医文化负载词也不胜枚举。本文参照李照国教授对中医术语的分类方法,将其分为基本概念,病症名称,方剂名称三类,从翻译
一百年风雨兼程,一世纪沧桑巨变。在中国共产党成立100周年这个特殊的历史节点,平顶山日报社发扬党媒传统,发挥资源优势,及早谋划、全媒行动、融合传播,开展了声势浩大的庆祝
物流行业已成为第三利润源泉,其重要性自然不言而喻。物流企业也更加关心如何使自己的服务更加多样化、更多的发挥自己在物流运作中的价值,促进自身的发展。对物流系统的协同发展模式需要更进一步的研究。针对现实存在的问题以及已有研究的不足,本文从模块化的角度出发,以我国宏观物流系统为研究对象,从系统科学的角度,建立模块化物流系统演化研究的理论体系;另一方面,以自组织理论为理论基础,对模块化物流系统进行序参量的
蓬莱19-3油田断层十分发育,浅层构造破碎,油气分布产状及压力系统较复杂,属于由多断块组成的、纵横向上存在多套油水系统的构造层状油藏。由于复杂的地质环境,比如高温高压、原油粘度高、地层出砂严重、流体里面高含气,电潜泵井不可避免地出现了非故障停产,如何处理甚至避免电潜泵井的非故障停产造成的产量损失已成为海上平台上产工作的一个重点。本文根据现场工作的实际情况,总结了一些生产中遇到的常见故障,包括出砂,