论文部分内容阅读
随着信息技术、脑与认知等技术的发展,有关脑科学领域的研究越来越深入,大量相关的文献资料和数据不断涌现,如何及时获取并分享这些信息成为脑科学发展中非常迫切的问题。传统信息检索技术由于其自身所需解决的问题不同,在应用于脑科学领域有着很大的缺陷,难以满足人们对脑科学专业领域的检索要求。 本文首先分析对比了现有信息检索模型的特点及其局限性,并根据脑科学领域信息检索应用场景中的多领域交叉,高实时性和检索方式多样化等特点,将传统信息检索技术和专业领域需求相结合并加以改进,提出了适合于脑科学专业领域的一个新的检索模型——分布式增量信息检索模型。该模型主要解决的问题包括: 通过冗余词典信息和双层索引结构,提高了对多个子集合并发检索效率,并有效解决跨域访问等限制;设计实现了高效的索引合并策略,解决了索引增量更新问题,保证系统的高实时性要求; 引入了一致性hash和虚拟节点,提出了一套可靠的分布式架构解决方案,保证整个系统能够应对项目组及科研人员不断增长的需求,尽量减少节点增减对系统的稳定性的影响; 综合应用不同搜寻策略模型,满足科研人员多样化检索方式。在现有检索合并算法基础上,提出一种改进的自适应检索合并算法,实验结果表明,其有效提高了检索合并效率。 本文将上述研究方案应用于脑科学研究检索领域,同时对系统的各个部分都给出了详细的设计流程与实现细节,并在关键部分给出了实验分析对比,从不同角度说明了本文所述方案的实用性和有效性。