生物统计分析平台的设计与实现

来源 :中国科学院研究生院 中国科学院大学 | 被引量 : 0次 | 上传用户:leisiyue520zh
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
生物信息学是一门新兴学科,它综合运用生物学、统计学和计算机科学的各种工具和方法,来挖掘海量的生物学数据背后丰富的内涵。中国科学院微生物研究所网络信息中心多年来一直开展生物信息学相关课题研究,已经拥有大量的数据资源。如何充分利用这些数据资源,为生物信息研究人员提供方便就成了一个重要课题。   本文就根据以上需求提出建立一个主要面向生物信息学研究人员的统计分析平台。平台集成微生物研究所拥有的大量生物数据资源、利用现有的机器资源,旨在为生物信息学研究人员提供多方面的、快速的生物数据的统计和图形分析方法。使得研究人员可以利用各种数据资源进行统计分析。   本文首先从系统的设计及实现策略方面阐述了整个系统的分层体系结构及主要功能模块,重点阐述了平台的异构数据资源整合及统计分析两大模块。在异构数据资源整合模块,系统整合了中科院微生物所自我的多种数据资源,包括世界生物信息公共服务网的中国镜像站点Bio-Mirror系统、生物学数据的序列检索系统MRS系统及自建数据库等。所整合的数据资源都为用户提供了方便的检索接口。统计分析模块包括常用统计分析、生物统计分析以及Web在线分析处理三大部分,利用R语言结合Bioconductor软件包来实现后台的各种统计分析处理。特别是在阐述Web在线分析处理这一部分,考虑到系统的安全性,着重分析了如何对用户的代码进行安全性检验,以防止对系统的恶意攻击。   平台基本实现了预期的目标,实现了数据的检索、存储、展示、统计分析等功能,达到了信息检索、统计分析的一体化,为生物信息学的研究人员提供了良好的辅助。
其他文献
图形处理单元(Graphics Processing Unit,GPU)从问世以来便迅速发展,并很快成为计算机系统中不可或缺的重要组成部分。目前GPU已在低端嵌入式系统、个人桌面应用、图形工作站乃
随着虚拟化技术的不断发展,虚拟机软件扮演着基础平台的角色。KVM(Kernel-based Virtual Machine)是一种基于硬件的完全虚拟化的系统仿真器,自Linux2.6.20之后,它被集成在Linux
城市三维信息的获取对城市建设、开发规划、信息服务等方便起着重大作用,且可用于三维模式识别、3D动画设计等新兴领域。计算机立体视觉是被动式测距方法中最重要的距离感知技
超龙一号系统是国家智能计算机研究开发中心提出的一种以应用为导向的技术路线。其中的算法可重构加速卡基于FPGA实现,是整个系统的一个重要组成部分,关系到整个系统的效率。而
随着计算机、通信、网络、嵌入式等技术的发展,普适计算的硬件环境和软件环境正在发生巨大变化。这种变化使得普适计算的信息空间,与人们生活和工作的物理空间逐渐融为一体。在
随着企业信息系统中的数据量飞速增长,用于实现数据缩减的重复数据删除技术日益为人们所重视。重复数据删除技术主要应用于数据备份系统和数据归档系统。由于数据归档系统需要
面部特征点定位是指在输入人脸图像上自动检测面部关键特征(如眼睛中心点,眼角点,嘴角点等)的技术,可以用于对齐待匹配的人脸图像,因而是全自动人脸识别中的关键步骤之一。此外,精
设A是一个字母表。如果语言X,Y(C)A*满足XY=YX,则称X,Y是可交换的。如果语言X,Y(C)A*满足XY(C)YX或YX(C)XY,则称X,Y是部分可交换的。目前已知:在自由半群A*上,若x,y∈A+,xy=yx,则存在t
生物信息学是当今世界非常热门的课题,近年来,人们注重对生物信息的数据整合和应用开发,使得生物学家能方便的进行生物信息研究。在和所内专家交流后发现:首先,面对庞大繁杂的生物
二十世纪七十年代,E.F.Codd提出了数据库的关系模型,开始了数据库关系方法和关系数据理论的研究,并逐渐应用到各个领域。这使得人们借助数据库对海量数据进行处理以及查询成