论文部分内容阅读
非特异性过氧合酶(UPO)(EC 1.11.2.1)是真菌分泌的胞外酶。这种酶在十多年前首次被发现,代表了一种具有过氧酶和过氧化物酶活性的血红素蛋白的氧化还原酶亚类。UPO可催化转化300多种底物,能够催化多种氧化反应,如1-或2-电子氧化,选择性氧化功能化、环氧化、磺化氧化、芳构化、卤化物氧化以及最有效的过氧化,它们可应用在有机合成中,是具有应用潜力的工业生物催化剂。目前已鉴定的UPO中,有极少数具有不同性质的UPO,特别是MarasmiusrotulaUPO(MroUPO),其催化表现介乎于UPO与另一种血红素–硫氧化物酶(又称氯过氧化物酶(CPO))之间。UPO特殊的结构特征和催化功能促使我们在真菌界中寻找更多的UPO,用以研究它们与CPO的进化关系。本研究的重点是寻找新的UPO,同时研究它们的系统发育及进化,并建立一个可用于查询UPO编码蛋白质序列的数据库。
首先,开发了一个分析管道,用于搜索和鉴定来自800多个真菌基因组的新型UPO。该管道由多种过滤器组成,包括同源搜索、基于序列和基于图形的聚类以及模体搜索,有助于删除冗余和非UPO序列。该管道适用于任何已知基序模式的酶。使用此分析管道,从真菌数据库中数千个基因组蛋白序列中寻找具有蛋白质序列特征的UPO。
其次,本研究在真菌基因组中搜索了新型UPO,发现了分布在35种不同的真菌物种(或菌株)中的113个假定的UPO编码蛋白质序列,其中每个物种的单个序列与CPO一起进行系统发育研究。系统发育研究表明,UPO仅分布在真菌的担子菌门(Basidiomycota)和子囊菌门(Ascomycota phyla)中。序列分析有助于将UPO分为五个不同的亚科:经典的AaeUPO和四个具有潜在新特征的新亚科。这项研究还明了这五个亚家族中的每一个都有自己的特征基序。特别地,一些CPO似乎是UPO的一种类型,表明它们以前被错误地分类。此外,对得到的UPO和CPO进行选择压力和功能差异分析,以研究它们之间的相互关系。对UPOS中的重要基序进行了选择压力的观察,这些基序可能导致了UPOs的功能分化。此外,在一些基序和其他相关氨基酸残基上还发现了由功能分化引起的进化速率不同的位点。最后,预测了造成UPOs功能差异的关键氨基酸,并确定了UPOs、CPOs和MroUPO之间的一些序列差异,以预测其测距行为。这些结果提供了新的UPO编码序列,从CPO中看到了它们的进化,并对它们的功能差异提出了新的见解。这项研究提出了新的UPO分类,并对其系统发育学有了新的认识。
再次,数千个UPO编码序列的管道可搜索更多UPO,如果没有适当的组织的情况下难以进行分析,为此本研究建立了一个名为非特异性过氧酶数据库(UPObase)的在线数据库。UPObase(upobase.bioinformaticsreview.com)目前包括1948个编码真菌基因组蛋白质序列的过氧酶。它提供了有关每个序列的信息,包括分类,基序,新序列提交门户,针对UPObase的同源性搜索以及序列分析,如多序列比对(MSA)和系统发育树。数据库使用非常友好,便于系统搜索和筛选。UPObase允许用户按生物体名称,群集ID和登录号搜索序列。值得注意的是,先前提出的分类系统仍然存在。在这项研究中,使用数据库中的1948个UPO进一步识别了六个新的亚超家族(Pog-a,Pog-b,Pog-c,Pog-d,Pog-e和Pog-f)它们分别具有特征基序和两个不同的亚家族i和iii、ia和ib、iia和iib。
首先,开发了一个分析管道,用于搜索和鉴定来自800多个真菌基因组的新型UPO。该管道由多种过滤器组成,包括同源搜索、基于序列和基于图形的聚类以及模体搜索,有助于删除冗余和非UPO序列。该管道适用于任何已知基序模式的酶。使用此分析管道,从真菌数据库中数千个基因组蛋白序列中寻找具有蛋白质序列特征的UPO。
其次,本研究在真菌基因组中搜索了新型UPO,发现了分布在35种不同的真菌物种(或菌株)中的113个假定的UPO编码蛋白质序列,其中每个物种的单个序列与CPO一起进行系统发育研究。系统发育研究表明,UPO仅分布在真菌的担子菌门(Basidiomycota)和子囊菌门(Ascomycota phyla)中。序列分析有助于将UPO分为五个不同的亚科:经典的AaeUPO和四个具有潜在新特征的新亚科。这项研究还明了这五个亚家族中的每一个都有自己的特征基序。特别地,一些CPO似乎是UPO的一种类型,表明它们以前被错误地分类。此外,对得到的UPO和CPO进行选择压力和功能差异分析,以研究它们之间的相互关系。对UPOS中的重要基序进行了选择压力的观察,这些基序可能导致了UPOs的功能分化。此外,在一些基序和其他相关氨基酸残基上还发现了由功能分化引起的进化速率不同的位点。最后,预测了造成UPOs功能差异的关键氨基酸,并确定了UPOs、CPOs和MroUPO之间的一些序列差异,以预测其测距行为。这些结果提供了新的UPO编码序列,从CPO中看到了它们的进化,并对它们的功能差异提出了新的见解。这项研究提出了新的UPO分类,并对其系统发育学有了新的认识。
再次,数千个UPO编码序列的管道可搜索更多UPO,如果没有适当的组织的情况下难以进行分析,为此本研究建立了一个名为非特异性过氧酶数据库(UPObase)的在线数据库。UPObase(upobase.bioinformaticsreview.com)目前包括1948个编码真菌基因组蛋白质序列的过氧酶。它提供了有关每个序列的信息,包括分类,基序,新序列提交门户,针对UPObase的同源性搜索以及序列分析,如多序列比对(MSA)和系统发育树。数据库使用非常友好,便于系统搜索和筛选。UPObase允许用户按生物体名称,群集ID和登录号搜索序列。值得注意的是,先前提出的分类系统仍然存在。在这项研究中,使用数据库中的1948个UPO进一步识别了六个新的亚超家族(Pog-a,Pog-b,Pog-c,Pog-d,Pog-e和Pog-f)它们分别具有特征基序和两个不同的亚家族i和iii、ia和ib、iia和iib。