论文部分内容阅读
基因岛是基因水平转移的产物之一,是研究生物进化的非常好的材料。基因岛具有各种各样的生物学功能,如致病性、异源物质降解、抗生素抗性、离子摄取和分泌活性等。某些基因岛可以达到自由地从染色体中环出并重新整合回染色体的动态平衡,这样的基因岛被定义为可移动基因岛。有些可移动基因岛可以通过转化、转导或接合转移到新的宿主中。通过精确定位可移动基因岛,研究其结构特征,有助于实现基因岛在不同菌株间的转移和构建有特定生物学功能的工程菌。 现有的应用生物信息学确定基因岛的方法主要可以分成四种类型:第一种类型是考虑基因岛同核染色体序列组成上的差异,其代表是SIGI-HMM和Centroid等;第二种类型是考虑基因岛的结构特征,其代表是Islander和GIDetector等;第三种类型是考虑基因岛的比较基因组学特征,其代表是IslandPick;第四种类型是将多个因素综合考虑的方法,其代表是MobilomeFINDER和IslandViewer。基因岛的可移动性要求基因岛有清晰的边界正向重复序列和可移动基因的存在。而上述的很多方法并没有考虑上面两个因素成为确定基因岛的必需要素。 我们分别建立了两种精确定位可移动基因岛的方法,首先将其应用在假单胞菌(Pseudomonas)中,取得了良好的结果。并将第二种方法应用到大肠杆菌(Escherichia coli)和沙门氏菌(Salmonella enterica)中,进一步验证了方法的可靠性。第一种方法考虑基因岛同核染色体序列组成上的差异和其结构特征;而第二种方法将基因岛的三种显著特点有机结合,即特有的结构特点中选取于基因岛可移动性相关的重要基因即整合酶、转座酶或重组酶的存在,比较基因组学的特点即基因岛只在某个菌株中存在而与其相近的菌株中不存在,水平基因转移的特点即异常的GC含量、二核苷酸偏向性和基因密度等,对基因岛进行了精确定位。对假单胞菌中所确定的部分基因岛进行了功能分析,并对大肠杆菌和沙门氏菌中的边界序列和整合酶的匹配关系进行分析,进一步确定第二种方法的可靠性。发现基因岛不仅可以整合在tRNA基因的3末端,也可以整合在其5末端。 在肠菌科中分析以tmRNA基因为整合位点的基因岛时发现了串联基因岛的存在,并且在25个大肠杆菌和17个沙门氏菌中串联基因岛不仅以tRNA基因和RyeB RNA基因为整合位点,还发现以外膜蛋白W基因和间隔序列为整合位点。并通过分析整合酶是否假基因化,边界正向重复序列的完整性以及残余可变区的存在而确定了基因岛串联的时序性,即最远离tmRNA基因的基因岛最先整合入染色体中,而最靠近tmRNA基因的基因岛最后整合入染色体中。串联基因岛中整合酶的作用位点从tmRNA基因的3末端到5末端移动,也就是越靠近tmRNA基因的基因岛的正向重复序列越长。如果串联基因岛中每个基因岛中整合酶都有活性,就可以形成更大片段的基因转移。 对整合位点为GMP合酶基因的34个基因岛的结构分析中发现,该类基因岛中的整合酶以P4整合酶为主,并确定了该类整合酶有共同的转录激活因子AlpA。通过对大肠杆菌和沙门氏菌中基因岛的分析发现P4整合酶和AlpA的关联普遍存在于各种tRNA基因、tmRNA基因、核酸外切酶I和间隔序列为整合位点的基因岛中。可以为提高包含P4整合酶的基因岛的可移动性提供相应的AlpA。