论文部分内容阅读
随着生物研究技术的快速发展,生物信息数据量呈爆炸式速度增长,如何从海量的数据中获取研究所需数据,成为了生物研究的重要需求。目前,大多数的生物信息检索系统提供的是单一层面,基因或者蛋白质层面的检索功能,由于生物信息之间关系复杂,单一的关系不能全面的表达生物信息之间的关系,因此,将生物信息之间不同层面关系进行融合的需求由此产生。 本文设计并实现了一个基于基因的生物信息融合系统。本系统从不同研究组织处获取生物信息间不同类型的关系数据,以基因为桥梁对其进行分析处理,生成基于基因的生物信息网状关系图,并提供检索功能,将检索结果以表格,可视化网络等形式呈现给用户。本系统采用LAMP技术架构,首先通过FTP协议获取并定时更新数据源文件,对文件进行解析处理形成网状数据结构之后进行持久化存储;然后使用全文检索工具Lucene对其进行索引的创建和管理,并使用Apache Solr提供索引检索功能,在用户搜索的过程中,对搜索结果进行memcached缓存处理,这样一方面减轻了服务器的负担,另一方面也提高了用户检索的效率;最后进行检索结果的显示,除了使用传统的表格显示之外,还使用了Cytoscape web进行网状数据的可视化显示,将融合之后复杂的生物信息关系直观的展现给用户。系统经过测试,各项功能均符合预期设计,系统能够提供稳定的服务。 本系统实现了生物信息间多种关系的融合处理,生成了生物信息网络关系图,并提供多种方式的检索结果显示方式,为用户提供了直观、准确的数据支持。