面向复杂应用的新型空间查询与模式挖掘技术研究

来源 :东北大学 | 被引量 : 1次 | 上传用户:lijie6857272
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着地理信息系统、互联网、移动智能终端等技术的发展,空间数据得到了极大的丰富,具有海量性、动态性和异构性等特点,为空间数据库技术的发展提供了新的机遇。通过对这些多样的、丰富的数据进行查询与挖掘可以有效提升智能交通、智慧城市、基于位置的服务、地理信息服务等重要应用的水平。空间数据所表现的新特点为空间的复杂应用提供了基础条件,同时对空间数据库的查询与挖掘提出了新的挑战,主要体现在:1)查询需求不局限于单个对象,而更关注于查询分组对象关系或区域特征;2)空间查询需综合考虑对象多种类别的信息,包括位置、文本描述、对象关系及人员活动等信息;3)空间查询及挖掘表现出了智能化趋势,从多类型、海量的空间数据中高效、智能地获取知识能够进一步推动基于位置的服务发展。上述新的挑战对空间查询与挖掘算法、索引技术、评价方法等关键技术均提出了新的要求。本文针对当前空间数据库中相关应用需求进行了归纳和总结,对空间数据查询与挖掘的研究现状进行了分析和综述。针对空间的复杂应用,对多种新型的空间查询与挖掘技术进行了深入研究,包括基于线索的区域位置定位、空间主题相关的区域发现、区域对象流动模式挖掘及区域流动模式查询处理等问题。在查询算法、索引、挖掘方法及结果应用等方面提出了相应的方法,这些技术可以有效地提高空间数据库系统的数据管理能力和处理效率,从而支持复杂的新型空间查询应用。本文的主要工作包括以下几个方面:(1)在空间位置查询方面,提出一种新的空间数据查询—基于线索的区域位置定位查询。由于环境信息的多样性、用户对空间认知的模糊性决定了线索是多样的、模糊的,将多样模糊的线索与海量空间特征数据有效匹配实现位置查询是一个重要的研究问题。为了有效地实现基于线索的查询,本文设计了三类算法,包括分支限界算法,逐个特征对象连接算法和基于预计算的算法。其中基于预计算的算法采用实例化预连接结果,设计了网格结构进行索引,线索查询在预计算的结果上进行,较大程度地提高了查询效率。(2)在面向区域的查询方面,提出了主题相关的区域查询,查询返回与给定主题最相关的空间区域,解决城市主题的划分、设施的优化选址等决策分析问题。为了有效地处理主题相关的区域查询设计了三类算法,一类为基本查询算法;为根据结果分布的特点,定义了候选扩展区域,设计了过滤-提炼两阶段的第二类算法;基于聚类扩展区域、细粒度划分,进行候选区域收缩等方式设计了第三类算法,进一步提高了查询效率。所提出的算法解决了给定查询窗口下对数据空间任意位置按主题相关程度进行排序的问题。(3)在面向区域的模式挖掘方面,研究了空间区域中移动对象流动模式的挖掘方法,将区域的流动规律以时间序列形式进行定量表示,用于改进城市规划、智能交通系统等方面。为了构建高预测精度的模式,本文提出了一种基于层次聚类的流动模式构建模型,模型中通过数据的离散化、序列化、模式训练等步骤实现了模式的构建;提出了偏斜度层次聚类树及异常序列去除方法,可以有效地去除局部异常序列及自动选取聚簇,提高了模式的预测精度。(4)在空间区域的模式查询处理方面,提出一种新的模式收敛封装概念,用于查询匹配大量的移动对象流中的模式,且模式可以具有不同长度与匹配阈值。为了索引不同长度和阈值的模式,本文将模式等分为相同长度不同阈值的子模式,实现了多树和单树两种索引结构用以索引子模式。在模式匹配中,单树具有更好的剪枝能力,多树需要较少的内存。针对以上问题,本文利用真实数据集对所提出的问题及算法进行了充分的实验,在有效性与效率方面进行评估验证,验证了所提出问题的意义及所提出的算法的高效性。总之,本文所研究的基于线索的区域位置定位、主题相关区域查询、区域流动模式查询与挖掘等问题扩展了空间数据库研究,解决了多种复杂的新型空间应用需求问题。
其他文献
ue*M#’#dkB4##8#”专利申请号:00109“7公开号:1278062申请日:00.06.23公开日:00.12.27申请人地址:(100084川C京市海淀区清华园申请人:清华大学发明人:隋森芳文摘:本发明属于生物技
作为一名班主任,要解决学生思想上的很多问题,免不了要经常与学生谈话。但是,选择什么样的谈话方式,则是一个值得探讨的问题。结合近几年班主任工作实践,笔者认为与学生进行相互间
近年来,FPGA(Field Programmable Gate Array)技术飞速发展,由于其具备低功耗、可配置和可高度并行化的特点,成为计算密集型和大数据计算应用的重要加速平台。基于FPGA平台的
ue*M#’#dkB4##8#”专利申请号:00109“7公开号:1278062申请日:00.06.23公开日:00.12.27申请人地址:(100084川C京市海淀区清华园申请人:清华大学发明人:隋森芳文摘:本发明属于生物技
宫颈癌是常见妇科恶性肿瘤,2012年全球发病52.8万人,死亡26.6万人,在女性恶性肿瘤中其发病率和死亡率均排在第4位[1];2013年我国发病10.07万人,死亡2.64万人,发病率和死亡率
静电是引发油库安全事故的重要因素,油库一旦发生重大事故就会给人们财产和生命安全造成巨大的威胁。因此,深入认识油库区的静电机理和影响因素,采用合理的安全评价方法科学
在科学,工程,经济,商业等各个领域存在着许多实际优化问题。研究解决这些实际优化问题的方法有重要的理论意义和实际应用价值。群智能优化算法作为解决大规模复杂实际优化问
笔者通过多年的企业财务会计教学发现,坏账准备的计提和核算是重点也是难点,学生难学,老师难教。本文从原因分析开始,提出变换公式:"当期应计提的坏账准备金额=当期—上期+借-贷
“平时我们一个月销售2万吨左右钢材,如今我们每个月销售上升到了3万吨左右。”作为一家钢材贸易企业,海创在中国钢铁业面临最严峻的内忧外患中逆势而上。
由甘肃浙商刘子叶、重庆浙商周荣富、陈一新、粟兴旺联手打造的重庆市最大的灯饰批发市场——城外城灯饰批发城近日正式开门迎客。