粘细菌大基因组中新型毒素及其免疫蛋白的信息挖掘

来源 :山东大学 | 被引量 : 0次 | 上传用户:wanganInsh888
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
制造和使用毒素是生命体最常见的生存竞争策略。细菌可以通过多种方式将蛋白质毒素分泌到环境中或直接输入相接触的其他细胞。这些蛋白质毒素大多具有酶活性,能够破坏靶细胞的重要细胞成分,如DNA、RNA、细胞壁肽聚糖、细胞膜等等。细菌还会产生与毒素蛋白相拮抗的免疫蛋白,以保护细胞免受自身或其他细胞的毒素所害。编码毒素蛋白及其相应免疫蛋白的基因通常在细菌基因组中位置相邻,从而构成毒素-免疫蛋白系统。许多研究显示,细菌的毒素-免疫蛋白系统在一些细胞事件中起关键作用。例如,许多细菌病原体的致病机制就是通过分泌毒素蛋白杀死或影响真核靶细胞而实现的。而在细菌之间,毒素-免疫蛋白系统则可以在各种冲突水平上被用来获取竞争优势。细菌中仍有许多毒素-免疫蛋白系统尚未被发现,大量被测序的基因组提供了通过计算分析挖掘识别毒素、相关免疫蛋白和输出机制新类型的机会。粘细菌(Myxobacteria)是一类具有复杂细胞群体行为的革兰氏阴性滑动细菌。粘细菌被发现无论在数量还是种类上均是土壤中的一类优势细菌。好氧粘细菌基因组大都在9Mb以上,尤其是堆囊菌亚目菌株被发现具有原核生物中最大的基因组。粘细菌的生存优势可能得益于其庞大基因组中所编码的多样的毒素-免疫蛋白系统,然而直到最近才有两种毒素-免疫蛋白系统在粘细菌中被报道了。本文从实验室前期发现的一系列表型突变菌株出发,通过大量比较基因组学和结构生物信息学分析,试图在粘细菌大基因组中挖掘新型毒素-免疫蛋白系统的信息。我们实验室前期通过转座子随机插入基因组对粘细菌模式菌株Myxococcus xanthus DK1622进行了随机突变,并在大量突变株中筛选到11株与野生菌株间存在菌落拓展界线的突变株。这些突变株的插入位点分散在基因组中,但相关基因均功能未知。由这些基因出发,我们通过一系列生物信息学分析在M.xanthus DK1622基因组中鉴定到了 7个与菌落拓展界线表型相关的基因簇,涉及来自9个同源家族(家族A-家族I)的50个基因。并且发现这些家族的同源基因广泛分布在各种粘细菌中,构成了至少68个类似的基因簇。进一步的蛋白结构模建和保守基序分析显示,家族E是AHH核酸酶毒素,而家族D则是其相应的免疫蛋白。在基因组中,家族E基因总是在下游相邻家族D基因,二者构成一类新型的毒素-免疫蛋白系统。而家族B蛋白则在结构上高度相似于PAAR蛋白,这是一类可以携带毒素蛋白输出的细菌Ⅵ型分泌系统的结构组件。由此我们推测菌落拓展界线表型涉及一类新型的由PAAR蛋白和Ⅵ型分泌系统介导输出的核酸酶毒素-免疫蛋白系统,其他几个家族可能是相关的辅助蛋白。此外,我们还发现有2个PAAR蛋白在C端带有新型的毒性结构域,而家族H的SMI1KNR4蛋白则是其免疫蛋白。在这些生物信息学分析基础上,几位合作者开展了大量相关实验工作,结果证明那些突变株正是由于免疫蛋白编码基因被破坏,导致其不能防御来自野生株的毒素攻击,从而在两菌落交界处形成了由大量死细胞构成的界线。本文对细菌基因组的大规模扫描显示,由家族E和家族D构成的新型核酸酶毒素-免疫蛋白系统广泛分布在各类细菌中。并且,这种保守基因对在许多细菌基因组中存在多拷贝现象,尤其是在粘细菌中的拷贝数最多。进一步的,我们通过大规模序列迭代搜索找到了家族D所有已知的非冗余同源蛋白。这2610个蛋白既不属于任何已知家族,也几乎不包含任何已知结构域,因此我们将它们归入一个新的蛋白家族MIP。为了确定MIP家族蛋白的结构特征,我们解析了来自M.xanthus DK1622的MXAN0049的三维结构,发现其折叠类型不同于所有已知结构,并且在蛋白表面具有一个巨大的酸性loop。基于系统发育分析,我们将MIP家族划分为7个各具特点的亚家族。其中5个亚家族的MIP基因总是上游相邻AHH编码基因(家族E),而另外2个亚家族则分别上游相邻DUF2380和Pentapeptide编码基因。基于保守基序分析,我们预测AHH和DUF2380蛋白在功能上可能是核酸酶,而Pentapeptide蛋白则可能是核酸的结构类似物,它们可能都是毒素效应物。除AHH核酸酶毒素已被我们实验证实外,合作者也已实验证明DUF2380蛋白是一种核酸酶毒素并可以被相应的MIP蛋白免疫。通过基因组上下文分析和结构域架构预测,我们发现这些毒素可能通过多种方式输出,包括T6SS(PAAR)、脂蛋白信号肽(SPⅡ)、VgrG、RHS、T7SS等等。总之,这个首次被报告的MIP蛋白家族表现出可以防御多种细菌分泌的核酸相关毒素的能力,据此本文在细菌基因组中预测了几百个未被报告过的毒素-免疫蛋白系统,其中许多来自病原菌。进一步的,本文又对PAAR蛋白(家族B)进行了全面系统的生物信息学分析。PAAR蛋白可以与VgrG蛋白一同构成细菌Ⅵ型分泌系统顶端的针状复合物,并携带毒素输出。除已知的PAAR结构域外,我们发现DUF4150和DUF4280这两种未知功能结构域的三维结构与PAAR高度相似,也应是PAAR超家族的成员。通过大规模序列搜索,我们找到了多达33901个含有PAAR超家族结构域的蛋白。这些PAAR蛋白来自几乎所有生物类群,但其中超过99%来自细菌,尤其是变形菌。在约25%完全测序的细菌基因组中发现了PAAR基因,并且其中超过60%的菌株具有多拷贝PAAR基因,尤其是在粘细菌中的拷贝数最多。结构域架构分析显示,超过55%的PAAR蛋白具有多结构域,其中的PAAR结构域几乎总是位于N端,并且至少20%的多结构域PAAR蛋白中带有未知结构域。我们重点关注了 PAAR蛋白的C端结构域,除最常见的Rhs elements相关结构域外,还有至少58种结构域高频出现,其中37种是已知的毒素,其余21种功能不明,推测它们可能大多也是毒素。并且这些结构域中至少有33种具有与核酸相关的活性,PAAR蛋白偏好携带具有核酸酶活性或者其他与核酸相关功能的结构域。此外,我们也分析了PAAR基因在基因组中的上下游区域,其周边基因多与Ⅵ型分泌系统相关,其中包括家族C(PKSKS)与家族G(DUF2169)。一些在PAAR基因上下游高频出现的保守基因对也被发现了,包括Ntox15与GAD-like、VRRNUC 与 DUF3396、Tox-REase-5 与 Imm52、PAAR+DUF2235+未知结构域与DUF2931、DUF3274与DUF2875等等,它们可能是潜在的新型毒素-免疫蛋白系统。为了寻找更多的毒素-免疫蛋白系统,本文在粘细菌大基因组中排查了所有的保守基因对。在所有23个完全测序粘细菌基因组的编码基因中,我们预测到来自4773个超家族的174992个结构域,这些结构域在蛋白中组合出了超过1万种不同的架构。其中,我们已确证的两种核酸酶毒素AHH与DUF2380分别在粘细菌中搜索到135个和81个拷贝,它们通常都在下游紧邻MIP家族免疫蛋白的编码基因。还发现了 44个编码核酸酶毒素Tox-REase-5的基因,它们都在下游相邻免疫蛋白Imm52的编码基因。这3类核酸酶毒素-免疫蛋白系统都主要分布在孢囊杆菌亚目,并且在单个菌株中的最大拷贝数均超过10个。181个PAAR基因和250个VgrG基因也在粘细菌中被发现了,二者在菌株中的拷贝数正相关,且高拷贝数菌株均出现在堆囊菌亚目。除VRRNUC外,粘细菌VgrG蛋白中没有其他的已知毒性结构域高频出现。而粘细菌PAAR蛋白中有5%在C端具有蛋白酶PeptidaseS41结构域,且此类PAAR基因可能与上游连续3个保守基因构成基因簇。还有3%的PAAR蛋白可能在C端具有新型的未知毒性结构域,因为其编码基因在下游相邻编码免疫蛋白SMI1KNR4的基因。此外,Pentapeptide蛋白也被发现在堆囊菌亚目中高频出现,并且其中超过20%在N端具有DUF2169结构域。还鉴定到7个编码HNHc核酸酶和SMI1KNR4免疫蛋白的基因对,4个编码核酸酶毒素Ntox16和未知功能的ANK结构域的基因对。最后,我们还发现粘细菌基因组中的保守基因对大量编码信号转导系统,包括超过300对sigma因子和anti-sigma因子以及超过200对的双组分系统。总之,本文通过生物信息学分析在粘细菌大基因组中挖掘识别了大量新型的毒素-免疫蛋白系统,并且其中一部分已被合作者实验证实。粘细菌基因组中这些毒素-免疫蛋白系统和其他功能重要的保守基因对,可能帮助其获得了广泛的环境适应性和与其他细菌间生存斗争的优势。这些发现有助于增加对细菌毒素系统的认识,而那些新型的核酸酶毒素和免疫蛋白也可能具有潜在的生物技术上的应用前景。
其他文献
酯类水解酶能够催化酯键的水解和合成,其广泛存在于植物、动物和微生物中。由于具有广泛的底物特异性、精确的化学选择性和区域选择性、反应不需要辅因子以及在有机溶剂中高度稳定等特性,酯类水解酶在工业上具有十分广泛的应用。糖酯酶是一大类糖类活性酶,能够催化酯类取代基从多糖的糖链上脱离,这些多糖来自于不同生物体,包括微生物多糖肽聚糖、动物多糖几丁质以及植物多糖木聚糖等。一些酯类水解酶还具有糖酯酶的活性。海洋中
肽聚糖是细菌细胞壁特有的基本组成成分,在维持细胞特定形状、保护细胞免受内部膨胀压破坏和参与细菌的生长和分裂过程中起重要作用。阐明细菌细胞壁肽聚糖的组织结构,是微生物学研究中的基本问题。解释清楚其结构对于研究细菌的生长和分裂机制、胞外聚合物与细胞壁的锚接形式、抗生素靶点的选择以及仿生学等都有重要意义。肽聚糖是由聚糖链和肽链组成的种类繁多、变化复杂的超分子复合物。到目前为止,细菌细胞壁肽聚糖主要的拓扑
自夸克模型和量子色动力学(QCD)理论的相继建立,直至标准模型的完善,人们在认识微观粒子的深层结构和性质上已经取得了极大成功。由于QCD理论在低能区域的非微扰性质,至今仍不能从第一性原理出发直接研究强子结构和强子谱等相关问题,尤其对于奇特强子而言,非微扰问题变得更加突出,因此很多研究中会使用基于QCD精神的有效理论以及相关唯象模型以分析这些问题。近些年来,实验上陆续发现了一系列性质奇特的介子和重子
第一部分人副流感病毒3型F蛋白HRB连接区结构与功能研究研究背景:人副流感病毒3型(human parainfluenza virus type3,HPIV3)为副粘病毒科(Paramyxoviridae)副粘病毒属(Paramyxovirus)病毒家族中的一种重要病毒,可引起5岁以下婴幼儿下呼吸道感染,导致支气管炎和肺炎。在病毒性呼吸道感染患者中,HPIV3的临床阳性检出率仅次于呼吸道合胞病毒(
分数阶微积分是一个古老而新鲜的话题,在早期,由于缺乏物理机理解释、应用背景研究等原因,分数阶微积分发展缓慢.后来随着科学技术的发展,关于分数阶微积分的研究内容由理论研究逐步转向应用研究,比如其在高能物理、反常扩散、生物医学工程、系统控制及复杂粘弹性材料力学本构关系中的应用.近年来,许多学者对分数阶微分方程的求解进行研究,但由于分数阶导数定义中的微分-积分卷积算子的存在,使得其具有历史依赖性和全局相
随着人类社会的发展和人类生产活动的增加,各类生态环境问题也愈发突出。在我国黄海海域,浒苔绿潮已经连续爆发13年,不仅严重威胁了周边海域的生态健康安全,也为沿海城市的水产养殖业和旅游业带来了巨大的经济损失。如何科学有效地防控浒苔绿潮的发生是当前的首要问题。目前,黄海浒苔绿潮的起源等问题有了初步的研究成果:黄海的浒苔绿潮最初形成于苏北浅滩的紫菜养殖区,该区域中含有大量的浒苔微观繁殖体,成为黄海浒苔绿潮
链球菌(Streptococcus)是一类球形的革兰氏阳性细菌,隶属于厚壁菌门,杆菌纲,乳杆菌目,链球菌科,链球菌属。这些细菌细胞分裂时总是沿一个轴,所以通常成对或者链状的。因为这些特征,他们被称作“链球菌”,区别于可以沿多个轴分裂而形成一团细胞的“葡萄球菌”(Staphylococcus)。其广泛存在于环境和人体。链球菌属包含了很多个种,既有对人类有益的菌种也有许多致病菌种。有一些链球菌能够引起
来源于植物的木质纤维素产量巨大、来源广泛,是自然界最为丰富的可再生资源。但木质纤维素由于其自身复杂的结构而导致其较低的降解转化效率严重阻碍了其大规模产业化应用。近几十年来,国内外研究报道了众多纤维素降解微生物及其纤维素水解酶系,并对纤维素的生物降解过程提出了多种机制阐述,为实现以木质纤维素为原料的可再生资源与能源的开发奠定了理论基础。好氧的革兰氏阴性菌Cytophaga hutchinsonii具
RARA融合基因阴性早幼粒细胞分化急性白血病的分子遗传学异常研究急性早幼粒细胞白血病(APL)是目前研究最广泛、最深入,也是疗效最显著的一类急性髓细胞白血病。该病的遗传及分子生物学特征的阐明也是最透彻的。17号染色体上的RARA基因发生断裂重排,与其它基因结合产生X-RARA(X代表一系列伙伴基因)融合基因是APL最重要的驱动基因突变。最常见的重现性染色体异常是15和17号染色体易位,即t(15;
研究背景与目的肝脏良、恶性肿瘤的早期诊断、鉴别诊断以及恶性肿瘤的分级评价对于临床治疗方案的制定和预后评估具有及其重要的意义[1]。肝细胞癌(HCC)是最常见的肝脏原发性高致死性恶性肿瘤,占世界癌症发病率的第6位和癌症相关死亡率的第4位,在中国发病率居第二位,每年有超过50万的新发病例[2,3]。HCC常发生于已有肝硬化或者慢性肝炎的病人,通常在晚期发现,因此相关死亡率相对较高,五年生存率低。动态增