论文部分内容阅读
本文工作的主要内容包括两部分:粘细菌.Myxococcus xanthus DK1622基因组序列分析和新型随机兼并(arbitrary degenerated,AD)引物数据库(AD PrimerDatabase for Microbes,ADDB)的构建。
微生物基因组的序列分析需要借助于生物信息学技术,生物信息学技术大致可以分两个层次:数据管理和数据分析。数据管理是指通过数据库技术来有效地管理生物数据,本文将介绍一系列的生物学数据库。数据分析是指通过统计学、计算机技术从海量的生物数据中挖掘出信息和知识。对于微生物基因组序列分析,包括单个基因组序列分析和比较基因组分析。单个基因组序列分析主要包括基因组注释,以及基因组组分分析,如GC含量分析、GC skew分析和密码子偏好性分析。在基因组比较分析中,不仅包括基本的基因组特征比较,还包括分子系统发生分析的内容,即对序列进行相似性比较,以推测序列间的亲缘关系,从而构建进化树。
2003年11月,TIGR公布的黄色粘球菌DKl622(Myxococcus xanthusDK1622)基因组序列不含有注释信息,为了在重要功能基因的研究中抢占先机,我们对其进行了注释工作并做了相应的基因组序列分析,以此搭建微生物基因组序列的分析平台。
我们用Glimmer程序对DK1622的分析结果是查找到9314个ORF,并通过本地blast以及模式查找对ORF进行功能注释。在所有预测出的ORF中,去除了彼此之间有重叠的、短于90个氨基酸残基且功能未知的,以及一些移码的ORFs,从最初预测的9314个ORF中确定了7885个。从这7885个ORF中还可挑选出某些功能基因做下一步的研究。另外,我们对DK1622在全基因组范围内做了GC含量的分析,找到了8个特异区域。DK1622全基因组的GC skew图非常对称的,这与它的复制方式有关。我们还对DK1622所有预测的基因做了密码子偏好性分析,得到了DK1622的最优密码子集。从分析中可以大致看出DK1622是一种密码子偏好性很强的菌种,而且功能越重要的基因密码子偏好性越强。TAIL PCR是一种利用引物的热不对称性来分离已知序列侧翼未知序列的重要方法,由于其操作简单,高效灵敏等诸多优点,目前已被广泛使用。TAILPCR中,随机兼并(AD)引物起了关键性的作用。现有的AD引物主要是靠经验摸索而来,广泛应用于动植物,对于基因组GC含量分布广、碱基组成差异大的微生物的效率较低。为了提高TAIL PCR在微生物中的效率,规范AD引物的设计思路,我们在进行微生物基因组序列分析过程中,提出新型.AD引物的设计思路。我们将AD引物分成3个部分,每一部分都是从在基因组中的高频率出现的寡核苷酸中挑选出来的,3个部分要满足Tm值限制、结构限制和碱基分布限制三大限制条件,然后才将其组装起来。我们根据301个已测序微生物基因组序列设计出301套相应的AD引物,并构建了相应的微生物AD引物数据库(ADDB)。每套AD引物都可应用于亲缘关系较近或GC含量相近的菌株。
根据已测序的Myxococcus xanthus DK1622基因组设计的一套AD引物,用于Myxococcus fulvus strain HW-1(同属),Sorangium spp(近缘)和Streptomyces griseus(GC含量相近)的TAIL PCR,已被验证效率很高。根据已测序的Pseudomonas aeruginosa PAO1基因组设计的AD引物,用于一株未知的Pseudomonas spp,已被验证高效。
该工作的完成不仅提供了AD引物设计的新思路、新方法,更极大简化了相关研究中繁琐、盲目的引物筛选工作,从而有效解决了TAIL PCR在微生物中的应用瓶颈。不足之处是数据库的冗余度偏高,且缺乏足够多的实验证据。