论文部分内容阅读
当前,随着计算机技术的飞速发展,智慧城市建设也如火如荼展开,数字化城市不断推进完善,地理信息系统也逐渐成为人们生活中不可缺少的重要方面之一。地名地址服务作为城市数字化和地理信息系统的基础地理要素,对地理信息化发展具有重要意义,在人们的生活中有着广泛的应用。因此,如何提高中文地名地址检索的效率,精确检索结果,多样化服务方式,已成为现阶段中文地理信息领域研究的重点之一,同时也是本文的主要研究内容。要完成中文地名地址检索工作,首先需要对中文地名地址短语进行分词。由于中文没有词语划分标识,分词难度较大。针对中文地名地址短语的特点,调研现有的中文分词方法,设计了行政区划专有名词字典、分词等级标识字典和同义词字典等分词词典,制定了准确高效的分词规则,将地名地址短语依次进行特征处理、歧义处理和同义处理,完成了词语分割,并提供地名地址词典修正方法,使得分词准确率能够不断提升。在准确分词的基础上,要提高地名地址检索的效率还需要建立合适高效的索引机制。Trie-tree是一种高效的前缀匹配索引,适用于建立在地名地址服务中。实现了基于trie-tree的中文地名地址索引方法,提高了地名地址检索效率。同时,基于中文地名地址trie-tree索引,实现了模糊前缀匹配、拼音匹配等一系列其他模糊匹配,使得本文在适用于精确检索的同时也可以用于模糊匹配,增加了检索的多样性。最后,根据广度优先算法,按照相关性和准确性对检索结果进行了排序,以使结果更符合用户的预期。在基于trie-tree索引的中文地名地址检索的基础上,为了充分利用地名地址数据中的层级信息,给用户提供更好的服务,本文实现了分级分类的地名地址检索方式。根据地名地址的空间层次信息设立三级分级,根据语义层次信息设置三级分类,用户可以选择具体的级别和类别,从而限定地名地址检索的范围,规范检索结果,减少冗余信息,降低非预期结果对用户的干扰。为了实现地名地址分级分类检索,经过分析和比较,基于postgreSQL数据库设计了层级数据结构,以确保用户检索的高效性。基于上述分词规则、检索索引和分级分类结构,设计并实现了地名地址服务的原型系统。基于B/S结构,利用web服务器,设计了原型系统的逻辑框架。在实现了地名地址检索功能的基础上,系统还实现了地名地址数据的管理、反向检索、拉框检索等一系列其他地名地址服务中的基本功能,给用户提供了多样化的检索选择,提高了系统可用性和友好性。系统关键技术已经应用于数字湘西系统。本文设计并实现的地名地址服务主要对地名地址检索进行了一系列相关工作,从提高检索效率、检索结果准确性、功能多样化和用户友好性等多方面进行研究,最终完成了地名地址服务原型系统的设计与实现。