【摘 要】
:
针对传统关系型数据库海量地名数据检索效率低下的问题,提出了一种盘古分词和Lucene全文检索相结合的地名数据库快速检索方法。首先,设计了一种地名数据表结构,比较了几种常
【基金项目】
:
国家科技支撑计划资助项目(2012BAH83F00)
论文部分内容阅读
针对传统关系型数据库海量地名数据检索效率低下的问题,提出了一种盘古分词和Lucene全文检索相结合的地名数据库快速检索方法。首先,设计了一种地名数据表结构,比较了几种常用开源分词器的中文分词性能,并选用性能优异的盘古中文分词器,通过扩展其词典来实现中文地名的有效分词。其次,利用内存索引和多线程并行处理技术提高Lucene创建倒排索引效率,并依据地名类别和显示优先级属性优化了检索结果相关度排序策略。最后,开发了一套具有快速搜索和地图定位展示的Web地名检索系统,使用500万条真实地名数据测试了其检索性能,查询平均耗时不到1s,比MySQL数据库模糊检索效率提高了15倍,匹配结果也更加准确,能够提供高效灵活的海量地名公共检索服务。
其他文献
在深入分析目前高校图书馆管理需求的基础上.采用粗糙集挖掘算法以及VC++开发工具.设计一个结合图书馆管理、读者数据分析的数据挖掘系统。系统界面友好、操作性强、安全高效.不但
随着科学技术的快速发展,信息化教学受到了教学工作着的广泛青睐。高职院校在教学改革中也将信息技术的应用作为重点工作。信息化教学突破了时空限制,充分发挥了学生学习的主
建立图书馆新的元数据标准既要考虑传统的元数据标准,又要考虑到非图书馆人员的实际应用情况,要把建立新的元数据标准提高到建立一种新的交换格式的高度来认识。《DC图书馆应用
文中采用自然浸泡法和硝酸银滴定法研究了在干湿循环作用下,氯离子在C30和C50混凝土中的扩散规律,结果表明:干湿循环作用对混凝土中氯离子渗透深度的影响不明显,随干湿循环次数的增大,混凝土中氯离子浓度增大,且对表层10mm以内混凝土氯离子渗透性的影响高于内部混凝土,距裸露面超过15mm时,影响不明显;干湿循环作用对C30和C50混凝土内部氯离子渗透性的影响规律大致相同。
采用理论和有限元方法分析腹板开孔冷弯薄壁型钢截面轴压构件弹性整体弯曲失稳、弹性畸变屈曲以及弹性局部屈曲的受力性能以及屈曲荷载。在理论分析的基础上提出了计算腹板开
大坝混凝土裂缝产生的一个重要原因是信息不畅导致措施与管理不到位,即信息获取的不及时、不准确、不真实、不系统,以及温控施工过程温差大、降温幅度大、降温速率大、温度梯
目的探讨急性坏疽穿孔性阑尾炎者在心理护理的应用效果。方法选取2012年1月~2013年1月在我院就诊的急性坏疽穿孔性阑尾炎患者78例作为研究对象,将其随机分为对照组和观察组,
<正>欢迎各位来到哈佛。大家来自不同的国家和地区,成长背景与生活环境也各有不同。在此,我想重申哈佛的办学理念和目标。每当新生到校时,我都会提起,哈佛是个多么多元化的大