论文部分内容阅读
近年来,伴随着地理信息系统技术的应用深入,政务GIS平台层出不穷,政府内部存在大量零散的业务数据无法直接在地理信息平台上集成,基于空间位置的搜索服务成为最迫切的需求,而这一功能是以地址匹配技术为支持的。本文在回顾已有地理编码技术的前提下,结合我国现有的基本国情,从用户需求角度出发,提出基于全文检索技术的POI地址匹配引擎设计思路,从技术、实现和应用三个方面做了详细的阐述。利用全文检索技术创建POI地址匹配引擎的核心思想在于:通过分词索引的建立,将拆分后的地名地址要素根据词频趋势赋予不同的角色,并以此评定其重要程度,从而作为确定匹配度的一个重要参数。
论文的主要研究成果如下:
第一,通过对目前地理编码和全文检索技术的发展和应用现状,提出基于全文检索技术构造POI地址匹配引擎思路的可行性,根据匹配量和匹配性质的不同组合,将POI地址匹配引擎分为四类:精确单项匹配、精确批量匹配、模糊单项匹配、模糊批量匹配,并分别针对四类匹配提出不同的性能评测标准。
第二,定义了POI“地名地址信息”,并分析其特点。通过实验确定分词器的选择标准,利用向量空间模型来实现模糊匹配的相关度评分,分别就不同的匹配方式,设计合适的匹配算法。特别针对模糊批量匹配,提出a指数(最佳结果判定阈值),并就a指数的经验取值做了测试。测试结果显示,POI地址匹配引擎在效率、用户输入自由度、结果可调性上都优于一般的匹配引擎。
第三,利用面向对象的编程技术,对算法进行封装,实现了POI匹配引擎。以滨海新区GIS政务办公辅助平台为例,将POI地址匹配引擎嵌入到Flex/J2EE的平台上,并针对批量匹配的网络传输效率问题,提出切实解决方案,达到较好的应用成效。