论文部分内容阅读
生物信息学是一门新兴学科,它综合运用生物学、统计学和计算机科学的各种工具和方法,来挖掘海量的生物学数据背后丰富的内涵。中国科学院微生物研究所网络信息中心多年来一直开展生物信息学相关课题研究,已经拥有大量的数据资源。如何充分利用这些数据资源,为生物信息研究人员提供方便就成了一个重要课题。
本文就根据以上需求提出建立一个主要面向生物信息学研究人员的统计分析平台。平台集成微生物研究所拥有的大量生物数据资源、利用现有的机器资源,旨在为生物信息学研究人员提供多方面的、快速的生物数据的统计和图形分析方法。使得研究人员可以利用各种数据资源进行统计分析。
本文首先从系统的设计及实现策略方面阐述了整个系统的分层体系结构及主要功能模块,重点阐述了平台的异构数据资源整合及统计分析两大模块。在异构数据资源整合模块,系统整合了中科院微生物所自我的多种数据资源,包括世界生物信息公共服务网的中国镜像站点Bio-Mirror系统、生物学数据的序列检索系统MRS系统及自建数据库等。所整合的数据资源都为用户提供了方便的检索接口。统计分析模块包括常用统计分析、生物统计分析以及Web在线分析处理三大部分,利用R语言结合Bioconductor软件包来实现后台的各种统计分析处理。特别是在阐述Web在线分析处理这一部分,考虑到系统的安全性,着重分析了如何对用户的代码进行安全性检验,以防止对系统的恶意攻击。
平台基本实现了预期的目标,实现了数据的检索、存储、展示、统计分析等功能,达到了信息检索、统计分析的一体化,为生物信息学的研究人员提供了良好的辅助。