【摘 要】
:
本文的目标是研究生物信息数据仓库技术,并在此基础上建立一个统一的基因数据仓库平台,主要的工作包括: 1.在分析当前生物数据库特点的基础上提出了使用生物信息数据仓库技术
论文部分内容阅读
本文的目标是研究生物信息数据仓库技术,并在此基础上建立一个统一的基因数据仓库平台,主要的工作包括:
1.在分析当前生物数据库特点的基础上提出了使用生物信息数据仓库技术来集成生物信息数据库的模型。讨论了生物信息数据仓库的特点、系统结构、主题选取、数据组织等诸多问题。这不是对数据仓库技术的简单应用,而是结合生物数据和生物研究的特点,提出了和一般数据仓库技术不一样的生物信息数据仓库的构建原则和思路。
2.研究了生物信息数据仓库中源数据的抽取转换和知识的动态获取问题。分析了源数据的常用格式,设计了相应的源数据抽取转换算法,并实现该算法为一个数据抽取-转换模块;讨论了生物信息数据仓库中的动态知识获取问题,给出了一个较好的分配、集成策略,并动态地从本地或者外部数据源获取知识。
3.考虑到生物学家的普遍需求,本文利用上述生物信息数据仓库技术和两个工具模块,构建了一个基于疾病的基因数据仓库BioWorld,BioWorld从多个不同的生物信息数据库中集成了包括基因、蛋白质、DNA、疾病、文献在内的数据,并提供了丰富的WEB检索功能。
4.本文还对mRNA二级结构和停止子约束下的蛋白质相似性搜索的复杂性进行了分析,证明了该问题NP完备性,并设计了一个时间复杂度低,最优近似比比较好的近似算法。在这个近似算法的基础上,开发了一个蛋白质相似性搜索工具MRSO-Tool,对BioWorld进行了发展。
其他文献
随着千兆网络的建设和升级,传统防火墙在硬件和结构上不能满足性能的要求,本课题采用INTEL IXA架构开发的新一代防火墙,不仅能够更好地保护防火墙内部网络的安全,而且也保证
Femto是一种工作在授权频段、发射功率低、小范围覆盖、以固定宽带接入网络为回程的微蜂窝式基站设备。Femto技术的提出为解决蜂窝移动通信系统中室内覆盖效果不佳和容量低的
由于超强的计算能力,支持大规模数据级并行程序设计以及高速的访存带宽等特点,GPU集群已经成为现代高性能计算的主流技术和研究热点。但GPU给集群带来了复杂的体系结构特征,
随着高性能微机和高速计算机网络的发展,分布式应用系统得到广泛的使用.但由于存在多种硬件平台和多种操作系统,因此要开发一个能运行于多种异种平台,具有良好移植性和可靠性
随着科学管理方法的应用和推广,数据分析技术在企业质量管理中的作用得到了前所未有的发挥,ISO9000标准更是将它提到了基础地位加以强调.数据挖掘则是一种新兴的数据分析技术
现代密码学根据密钥体制的不同分为了非对称密码体制和对称密码体制,其中对称密码体制又可以分为分组密码和流密码,两种密码体制都在实际应用中扮演着重要的角色。本文讨论流
随着Internet和电子商务的蓬勃发展,商业活动范围不断扩大,企业与其分支机构实现互联的要求越来越迫切,有时甚至允许合作伙伴、设备供应商等外部机构访问自己的部分局域网资源。
传统教务管理耗时和耗费,教务管理部门操作起来很烦琐,开发一种基于分布、网络计算的智能教务管理平台迫在眉睫。本次硕士论文设计的重点是在研究多种信息挖掘技术方法的基础上
当前webGIS面临着两个问题:第一,如何将不同数据源、不同格式的地理数据融合在一起;第二,如何实现各种不同的WebGIS间的互操作,从而实现各种不同的WebGIS系统的无缝结合。 将We
数据挖掘是帮助人们在海量数据中发现信息和知识的工具。近年来数据挖掘技术成了商业智能的核心技术,被广泛应用到了诸多领域,引起了学术界极大的关注,如何提高数据挖掘的效