论文部分内容阅读
研究背景:
海洋中蕴藏着丰富的生物资源,其巨大的生物多样性和独特的生态环境使海洋生物成为新药发现的重要来源,这其中包括一类栖息在沿岸浅海中的剧毒眼镜蛇类——海蛇。青环海蛇(Hydrophis cyanocinctus)是我国主要的优势蛇种之一,药用价值极高,被《本草纲目》等多部药典收集入药,具有祛风燥湿,通络活血和滋补强壮等功效。现代研究表明,青环海蛇蛇毒及组织中含有抗炎抗风湿、抗菌、抗肿瘤和镇痛等作用的多种蛋白和活性多肽成分,但具体的活性分子单体及其靶点和作用机制并不明晰。
我们课题组前期通过构建青环海蛇毒腺噬菌体展示文库建立了以人TNF-α(肿瘤坏死因子α)及其受体TNFRs为靶标的抗炎活性分子筛选平台,并以TNFR1为靶点获得了22肽Hydrostatin-SN1。SN1在体内外具有一定的抗炎活性,但由于它与TNFR1和TNFR2都能结合,对靶点的选择性不强而可能带来副作用,其成药性并不高。为了提高多肽对TNFR1的选择性,我们通过序列截短及筛选实验获得了十肽Hydrostatin-SN10。SN10在体外能够专一性结合TNFR1,选择性地拮抗TNF-TNFR1的相互作用,对DSS和OXZ诱导的小鼠急性结肠炎模型有着显著的抗炎治疗效果,并表现出了良好的药代动力学性质,无明显毒性。与目前临床上治疗IBD(炎症性肠病)的主要药物TNF单克隆抗体等大分子制剂相比,SN10能够在封闭TNFR1传递的促炎有害信号的同时,保留与TNFR2有关的促进细胞增值修复和炎症抑制的信号通路,减少毒副作用,因此SN10具有良好的靶点选择性、体内外抗炎活性和安全性,有望开发成为治疗IBD等TNF-α相关疾病的海洋来源多肽类创新药。然而,SN10是否在体内水平也对TNFR1有选择性尚没有得到验证。同时,SN10对靶点TNFR1的选择性机制、拮抗方式及结合位点也不明确,这些都阻碍了对SN10抗炎分子机制的深入理解以及SN10的进一步结构优化与改造。
除了Hydrostatin-SN10之外,我们前期基于靶点TNF-α/TNFRs从青环海蛇毒腺噬菌体展示文库中又筛选出了多种抗炎活性小肽,而这些多肽在数据库中未发现与之同源且功能类似的序列,说明青环海蛇中存在独特的抗炎活性肽,且有潜力发展成为抗炎药物候选分子。我们期待从青环海蛇中找到更多的生物活性肽,但是遇到了两大瓶颈问题:一是基于噬菌体展示技术的生物淘选方法存在假阳性高、筛选时间跨度长、文库覆盖面限于转录组水平等缺点;二是海蛇样本采集困难,蛇毒活性成分富集几乎没有可能,且如果大量采集海洋生物样本可能会破坏海洋生态平衡,尤其是青环海蛇已被列为国家二级保护动物。
近些年来生物技术的飞速发展使高通量测序的成本和周期大大减少,陆续出现了第二代测序(NGS)、第三代测序(TGS)及染色体构象捕捉(Hi-C)等先进的测序技术。已有越来越多的药用海洋生物的多组学信息被测序,给海洋药物研发带来了很大的推动。由于蛇毒中的活性成分大都为分子量较小的蛋白/多肽,而全基因组信息中包含了全部蛋白/多肽的编码基因序列,包括在蛇毒中丰度很低但可能具有独特药理活性的蛋白/多肽,这为基于序列信息从多组学大数据中系统挖掘潜在的生物活性肽提供了可能。然而,目前青环海蛇尚没有全基因组序列报道,而其他海蛇类的基因组研究多基于二代测序技术,组装的质量较差,极大影响了活性分子发现的完整性。因此,我们亟待通过三代测序及Hi-C等技术获得青环海蛇高质量的全基因组、转录组、蛋白组等多组学数据,来对其中的生物活性肽进行系统、高效、精准的挖掘。
研究目的:
本课题首先将通过基因敲除动物模型确证多肽Hydrostatin-SN10在体内水平对靶点TNFR1的专一选择性;分析SN10与TNFR1的相互作用及结合位点,并利用体内外活性实验对多肽上的关键氨基酸位点进行验证,以此来全面深入地揭示SN10对靶点TNFR1的拮抗机制,并指导SN10进一步的结构优化改造。另一方面,联合三代测序、二代测序和Hi-C技术,获得药用海洋生物青环海蛇的高质量全基因组,毒腺转录组和毒液蛋白质组,注释得到青环海蛇全部的基因和蛋白质序列,并鉴定出所有的毒素相关基因,从而建立青环海蛇高质量的多组学数据库和完善的毒素组学数据库,为高通量、系统地、精准地挖掘青环海蛇来源的新型生物活性肽提供大数据支持。
研究方法:
一、青环海蛇抗炎活性肽Hydrostatin-SN10拮抗靶点TNFR1的机制探究与验证
1、通过DSS(葡聚糖硫酸钠)诱导分别建立野生型、Tnfr1和Tnfr2基因敲除小鼠的急性结肠炎模型,从小鼠疾病活动指数、体重、结肠长度、脾重指数、炎症因子表达、结肠组织病理改变以及TNF-TNFRs下游NF-κB和MAPKs信号通路的变化几个方面的指标来观察并比较SN10在不同基因型小鼠中的抗炎治疗效果,从而判断SN10在体内水平对TNFR1是否具有选择性。
2、使用Rosetta软件构建多肽SN10的三维结构模型,并利用Upside和Gromacs软件进行分子动力学模拟,获得SN10的主要结构。
3、利用Zdock软件将多肽SN10与TNFR1胞外区蛋白(PDB号:1NCF)进行分子对接,并通过Gromacs进行分子动力学模拟,得到TNFR1-SN10复合物结构模型;使用DiscoveryStudio软件分析结构模型中SN10与TNFR1的结合界面和相互作用氨基酸,对SN10上可能的结合位点进行丙氨酸突变,合成突变肽。
4、利用MST(微量热泳动)技术检测并比较SN10及其突变肽与TNFR1的亲和力,观察各突变肽的体外活性与SN10相比是否有显著的下降。
5、构建LPS(脂多糖)诱导的小鼠急性休克模型,使用SN10及各突变肽进行腹腔注射治疗(800μg/kg),观察各组小鼠的生存率,比较各突变肽的体内活性与SN10相比是否有显著的下降。
二、青环海蛇的多组学测序与组装
1、基因组二代测序与基因组勘测:提取海蛇肌肉组织中的基因组DNA,构建350bp插入片段大小的文库,在IlluminaHiSeqXTen平台上进行双端测序。原始数据经质控后进行K-mer分析,预估基因组的大小、杂合度和重复度。
2、基因组三代测序:构建青环海蛇肌肉组织的基因组20Kb大片段SMRTbell文库,在PacBioSequel平台上测序10~11个SMRTCell。
3、Hi-C测序:构建肌肉组织的Hi-C测序文库(300-500 bp),经质控合格后,用IlluminaHiSeqXTen测序仪进行双端测序,对原始数据进行过滤处理得到高质量的cleanreads。
4、基因组组装与质量评估:根据基因组勘测分析结果,利用Falcon和Falcon-Unzip等软件对PacBio三代数据进行预组装,得到contig水平的组装结果。然后利用三代数据对基因组进行一轮纠错。之后,通过Hi-C辅助基因组组装,构建染色体水平的scaffolds,并将PacBio三代数据回比Hi-C组装的基因组,填补基因组中存在的gap区域。最后,利用三代数据进行一轮纠错,再利用二代数据进行两轮纠错,得到最终的组装版本。利用BUSCO分别对青环海蛇和其他代表性蛇类基因组的完整度进行评估并比较。
5、三代全长转录组测序:提取海蛇毒腺组织的总RNA,构建10Kb的三代全长转录组SMRTbell测序文库,在PacBioSequel测序平台上测序1个SMRTCell。对原始数据进行质控分析后得到高质量的Isoform序列,然后利用二代数据进行校正,最后通过聚类得到Unigene序列。
6、二代转录组测序:分别提取3条海蛇的毒腺组织总RNA,使用Oligo(dT)富集的方法构建二代测序文库,使用IlluminaHiSeqXTen测序仪进行双端测序。原始数据经质控后,利用Trinity软件对转录本进行从头拼接,根据序列相似性以及长度,挑选出最长的一条作为Unigene。
7、毒液蛋白质组:提取毒液样品中的总蛋白,取一部分进行蛋白浓度测定和SDS-PAGE检测,另取一部分进行胰酶酶解及TMT标记,然后将各标记样品等量混合后进行反相液相色谱分离,最后对样品进行LC-MS/MS检测及肽段数据分析。
三、青环海蛇多组学的生物信息学分析
1、基因组注释:首先采用EDTA流程对重复序列进行预测。之后采用MAKER流程,调用BRAKER、Augustus和GeneMark-ES等多种软件,分别基于同源预测和从头预测的证据对编码基因进行多轮的结构注释。将结构注释得到的所有蛋白序列比对到NR、Swiss-Prot、KEGG、GO等功能数据库,筛选具有最高序列相似性的蛋白,从而得到功能注释信息。
2、基因家族聚类:通过OrthoFinder流程将近缘物种的蛋白序列基于序列相似性进行聚类。
3、系统进化分析:对各个单拷贝直系同源基因家族内的基因分别进行多序列比对,将比对结果合并连接后,使用软件RAxML通过最大似然法构建进化树,并进行物种分歧时间的估算。
4、基因家族扩张与收缩分析:使用软件CAFE模拟进化树上每个谱系的基因家族扩张和收缩事件。对于发生扩张和收缩的基因,进行GO和KEGGpathway功能富集分析,并用超几何分布检验的方法计算每个条目中扩张/收缩基因富集的显著性。
5、正选择分析:根据基因家族聚类的结果,对每个共有单拷贝直系同源基因家族,使用codeml程序通过支位点特异模型及卡方检验分析受到正选择的基因,并进行功能富集分析。
6、基因组共线性分析:对青环海蛇和草原响尾蛇所有基因最长转录本的CDS序列进行比对得到直系同源基因对,然后通过MCScanX软件获得共线性区块。利用Python软件包JCVI展现共线性结果。
7、毒素相关基因的鉴定:将青环海蛇基因组注释出的所有蛋白序列通过BLASTp比对到已知的毒素相关蛋白库中。比对结果去冗余后,将属于同一个基因的蛋白(protein isoforms)合并。然后利用Swiss-Prot的注释信息对这些基因进行进一步分析,确定毒素基因和毒液蛋白基因。
8、毒素相关基因的表达:将毒腺RNA-Seq的cleanreads比对到注释过的青环海蛇基因组上,获取落到每个样本中每个基因上的reads数目,然后采用FPKM算法来计算基因的表达量。
9、毒素相关蛋白的表达:对毒液蛋白组鉴定出的肽段,利用基因组注释出的蛋白数据库进行检索,并筛选可信蛋白。然后根据毒素相关基因的注释结果,进一步分析毒素相关蛋白在毒液中的表达。
研究结果:
一、青环海蛇抗炎活性肽Hydrostatin-SN10拮抗靶点TNFR1的机制探究与验证
1、在各基因型小鼠中构建DSS诱导的急性结肠炎模型并给予SN10治疗,结果显示:在Tnfr2-/-小鼠中,SN10治疗组在疾病活动指数、体重、结肠长度、脾重指数、炎症因子表达、结肠组织病理学改变以及TNF-TNFRs下游炎症相关信号通路的磷酸化激活这些指标上,与模型组相比都有明显的改善(p<0.05),其治疗效果与在野生型小鼠中相当;而在Tnfr1-/-小鼠中,SN10对这些指标都没有明显的缓解作用。
2、通过分子对接及分子动力学模拟,获得了四种TNFR1-SN10复合物的结构模型,分析SN10上与TNFR1结合的可能位点有D1、E2、E8、L9、H10。其中Model1为最优的模型,在Model1中,SN10结合到了TNFR1的CRD2和CRD3结构域,SN10的E8位点与TNFR1的R77和N110位点分别形成了静电相互作用和氢键。
3、MST测定SN10及各突变肽与TNFR1的亲和力结果表明,M1(E8A)的体外活性有较显著的变化,其亲和力KD值(>>171μM)较SN10(2.75μM)下降了62倍以上。
4、在LPS诱导的小鼠急性休克模型中,突变肽M1体内活性的变化最显著,使用M1治疗后小鼠的生存率(12.5%)较SN10治疗组(87.5%)下降了75%(p<0.01)。
二、青环海蛇的多组学测序与组装
1、通过基因组三代测序、二代测序和Hi-C测序,我们获得了1.98Gb的青环海蛇全基因组,组装出了18条染色体(7条大染色体和11条小染色体)。组装质量评估结果显示,青环海蛇基因组的contigN50为18.99Mb,scaffoldN50为264.25Mb,gap比例0.01%,BUSCO完整度90.1%。各项指标与已发表蛇类基因组相比,青环海蛇基因组的组装质量是最高的,并且与其他基于二代测序的海蛇类基因组相比,基因组的连续性提升明显(>100倍)。
2、通过三代全长转录组测序获得了青环海蛇毒腺的全长转录本18117条,最大长度12.1Kb;通过二代转录组测序及拼接获得毒腺转录本54344条。
3、通过TMT标记定量蛋白质组分析获得了青环海蛇毒液蛋白肽段序列7709条。
三、青环海蛇多组学的生物信息学分析
1、青环海蛇基因组注释得到了23898个基因,编码43062个蛋白(转录本)。
2、重复序列的分析结果表明,青环海蛇基因组在进化过程发生了LTR反转录转座子的明显扩张。
3、系统发生分析表明,青环海蛇与平颏海蛇及陆生眼镜蛇类的亲缘关系很近。真海蛇类约在1990万年前从陆生眼镜蛇类进化而来,而青环海蛇这一独立物种约在950万年前出现。
4、基因(家族)进化分析表明,青环海蛇基因组中有907个基因家族发生了扩张,1565个基因家族发生了收缩,这些基因主要与犁鼻器-嗅觉受体系统,盐离子跨膜转运,听觉、视觉感知,能量代谢及固有免疫应答等功能相关;有80个基因受到了正选择,这些基因主要与DNA错配修复,mRNA可变剪接,呼吸链,氧气感知等功能有关。
5、通过基因组共线性分析,鉴定出了青环海蛇的第5号染色体为性染色体Z。
6、在青环海蛇基因组中鉴定出了来自35个毒素相关家族的241个毒素相关基因,其中包括60个毒素基因。代表性的毒素相关家族有3FTx(三指毒素),PLA2(磷脂酶A2),CRISP(富含半胱氨酸的分泌蛋白),vKun(Kunitz型丝氨酸蛋白酶抑制剂),vCTL(C型凝集素),SVMP(蛇毒金属蛋白酶)。其中3FTx的毒素基因拷贝数最多(20个),包括5个LNTX(长链神经毒素)基因和9个SNTX(短链神经毒素)基因。同时,从中发现了一些编码潜在药用活性分子的基因,包括CATH(抗菌肽)、NGF-β(神经生长因子-β)及PLI-γ(磷脂酶A2抑制剂-γ)等。
7、通过对毒腺转录组和毒液蛋白组进行表达定量分析发现,青环海蛇蛇毒中表达量最高的两种毒素为3FTx和PLA2。在毒腺转录组中,123个毒素相关基因呈显著表达,其中3FTx表达量占毒素相关转录本的45%,且LNTX比例(30.8%)较SNTX(14.1%)高;PLA2转录本占39%。毒液蛋白组中鉴定到了毒素相关蛋白69个,包括毒素蛋白24个,其中3FTx家族检测到了3种LNTX毒素和1种SNTX毒素。
结论:
本研究首先确证了青环海蛇抗炎活性肽Hydrostatin-SN10在体内水平对靶点TNFR1具有专一选择性。进一步探究SN10对靶点TNFR1的拮抗机制发现,SN10很可能是通过E8(第8位氨基酸谷氨酸)占据TNF-α与TNFR1结合的关键位点,直接竞争性拮抗TNFR1与TNF-α的结合,从而抑制TNFR1-TNF复合物的形成及下游信号的激活。这对SN10的进一步结构优化改造,以及从海洋生物中筛选类似的专一靶点的先导活性肽具有重要的指导作用。
另一方面,我们获得了药用海洋生物青环海蛇的高质量染色体水平全基因组,毒腺的全长转录组以及毒液的蛋白质组,建立了具有完善注释的青环海蛇多组学数据库和毒素组学数据库,为高通量、精准挖掘青环海蛇来源的新型生物活性肽提供大数据支持;同时,对海蛇等海洋珍稀濒危品种生物资源的保护利用和海洋创新药物的研发也具有重要意义。
海洋中蕴藏着丰富的生物资源,其巨大的生物多样性和独特的生态环境使海洋生物成为新药发现的重要来源,这其中包括一类栖息在沿岸浅海中的剧毒眼镜蛇类——海蛇。青环海蛇(Hydrophis cyanocinctus)是我国主要的优势蛇种之一,药用价值极高,被《本草纲目》等多部药典收集入药,具有祛风燥湿,通络活血和滋补强壮等功效。现代研究表明,青环海蛇蛇毒及组织中含有抗炎抗风湿、抗菌、抗肿瘤和镇痛等作用的多种蛋白和活性多肽成分,但具体的活性分子单体及其靶点和作用机制并不明晰。
我们课题组前期通过构建青环海蛇毒腺噬菌体展示文库建立了以人TNF-α(肿瘤坏死因子α)及其受体TNFRs为靶标的抗炎活性分子筛选平台,并以TNFR1为靶点获得了22肽Hydrostatin-SN1。SN1在体内外具有一定的抗炎活性,但由于它与TNFR1和TNFR2都能结合,对靶点的选择性不强而可能带来副作用,其成药性并不高。为了提高多肽对TNFR1的选择性,我们通过序列截短及筛选实验获得了十肽Hydrostatin-SN10。SN10在体外能够专一性结合TNFR1,选择性地拮抗TNF-TNFR1的相互作用,对DSS和OXZ诱导的小鼠急性结肠炎模型有着显著的抗炎治疗效果,并表现出了良好的药代动力学性质,无明显毒性。与目前临床上治疗IBD(炎症性肠病)的主要药物TNF单克隆抗体等大分子制剂相比,SN10能够在封闭TNFR1传递的促炎有害信号的同时,保留与TNFR2有关的促进细胞增值修复和炎症抑制的信号通路,减少毒副作用,因此SN10具有良好的靶点选择性、体内外抗炎活性和安全性,有望开发成为治疗IBD等TNF-α相关疾病的海洋来源多肽类创新药。然而,SN10是否在体内水平也对TNFR1有选择性尚没有得到验证。同时,SN10对靶点TNFR1的选择性机制、拮抗方式及结合位点也不明确,这些都阻碍了对SN10抗炎分子机制的深入理解以及SN10的进一步结构优化与改造。
除了Hydrostatin-SN10之外,我们前期基于靶点TNF-α/TNFRs从青环海蛇毒腺噬菌体展示文库中又筛选出了多种抗炎活性小肽,而这些多肽在数据库中未发现与之同源且功能类似的序列,说明青环海蛇中存在独特的抗炎活性肽,且有潜力发展成为抗炎药物候选分子。我们期待从青环海蛇中找到更多的生物活性肽,但是遇到了两大瓶颈问题:一是基于噬菌体展示技术的生物淘选方法存在假阳性高、筛选时间跨度长、文库覆盖面限于转录组水平等缺点;二是海蛇样本采集困难,蛇毒活性成分富集几乎没有可能,且如果大量采集海洋生物样本可能会破坏海洋生态平衡,尤其是青环海蛇已被列为国家二级保护动物。
近些年来生物技术的飞速发展使高通量测序的成本和周期大大减少,陆续出现了第二代测序(NGS)、第三代测序(TGS)及染色体构象捕捉(Hi-C)等先进的测序技术。已有越来越多的药用海洋生物的多组学信息被测序,给海洋药物研发带来了很大的推动。由于蛇毒中的活性成分大都为分子量较小的蛋白/多肽,而全基因组信息中包含了全部蛋白/多肽的编码基因序列,包括在蛇毒中丰度很低但可能具有独特药理活性的蛋白/多肽,这为基于序列信息从多组学大数据中系统挖掘潜在的生物活性肽提供了可能。然而,目前青环海蛇尚没有全基因组序列报道,而其他海蛇类的基因组研究多基于二代测序技术,组装的质量较差,极大影响了活性分子发现的完整性。因此,我们亟待通过三代测序及Hi-C等技术获得青环海蛇高质量的全基因组、转录组、蛋白组等多组学数据,来对其中的生物活性肽进行系统、高效、精准的挖掘。
研究目的:
本课题首先将通过基因敲除动物模型确证多肽Hydrostatin-SN10在体内水平对靶点TNFR1的专一选择性;分析SN10与TNFR1的相互作用及结合位点,并利用体内外活性实验对多肽上的关键氨基酸位点进行验证,以此来全面深入地揭示SN10对靶点TNFR1的拮抗机制,并指导SN10进一步的结构优化改造。另一方面,联合三代测序、二代测序和Hi-C技术,获得药用海洋生物青环海蛇的高质量全基因组,毒腺转录组和毒液蛋白质组,注释得到青环海蛇全部的基因和蛋白质序列,并鉴定出所有的毒素相关基因,从而建立青环海蛇高质量的多组学数据库和完善的毒素组学数据库,为高通量、系统地、精准地挖掘青环海蛇来源的新型生物活性肽提供大数据支持。
研究方法:
一、青环海蛇抗炎活性肽Hydrostatin-SN10拮抗靶点TNFR1的机制探究与验证
1、通过DSS(葡聚糖硫酸钠)诱导分别建立野生型、Tnfr1和Tnfr2基因敲除小鼠的急性结肠炎模型,从小鼠疾病活动指数、体重、结肠长度、脾重指数、炎症因子表达、结肠组织病理改变以及TNF-TNFRs下游NF-κB和MAPKs信号通路的变化几个方面的指标来观察并比较SN10在不同基因型小鼠中的抗炎治疗效果,从而判断SN10在体内水平对TNFR1是否具有选择性。
2、使用Rosetta软件构建多肽SN10的三维结构模型,并利用Upside和Gromacs软件进行分子动力学模拟,获得SN10的主要结构。
3、利用Zdock软件将多肽SN10与TNFR1胞外区蛋白(PDB号:1NCF)进行分子对接,并通过Gromacs进行分子动力学模拟,得到TNFR1-SN10复合物结构模型;使用DiscoveryStudio软件分析结构模型中SN10与TNFR1的结合界面和相互作用氨基酸,对SN10上可能的结合位点进行丙氨酸突变,合成突变肽。
4、利用MST(微量热泳动)技术检测并比较SN10及其突变肽与TNFR1的亲和力,观察各突变肽的体外活性与SN10相比是否有显著的下降。
5、构建LPS(脂多糖)诱导的小鼠急性休克模型,使用SN10及各突变肽进行腹腔注射治疗(800μg/kg),观察各组小鼠的生存率,比较各突变肽的体内活性与SN10相比是否有显著的下降。
二、青环海蛇的多组学测序与组装
1、基因组二代测序与基因组勘测:提取海蛇肌肉组织中的基因组DNA,构建350bp插入片段大小的文库,在IlluminaHiSeqXTen平台上进行双端测序。原始数据经质控后进行K-mer分析,预估基因组的大小、杂合度和重复度。
2、基因组三代测序:构建青环海蛇肌肉组织的基因组20Kb大片段SMRTbell文库,在PacBioSequel平台上测序10~11个SMRTCell。
3、Hi-C测序:构建肌肉组织的Hi-C测序文库(300-500 bp),经质控合格后,用IlluminaHiSeqXTen测序仪进行双端测序,对原始数据进行过滤处理得到高质量的cleanreads。
4、基因组组装与质量评估:根据基因组勘测分析结果,利用Falcon和Falcon-Unzip等软件对PacBio三代数据进行预组装,得到contig水平的组装结果。然后利用三代数据对基因组进行一轮纠错。之后,通过Hi-C辅助基因组组装,构建染色体水平的scaffolds,并将PacBio三代数据回比Hi-C组装的基因组,填补基因组中存在的gap区域。最后,利用三代数据进行一轮纠错,再利用二代数据进行两轮纠错,得到最终的组装版本。利用BUSCO分别对青环海蛇和其他代表性蛇类基因组的完整度进行评估并比较。
5、三代全长转录组测序:提取海蛇毒腺组织的总RNA,构建10Kb的三代全长转录组SMRTbell测序文库,在PacBioSequel测序平台上测序1个SMRTCell。对原始数据进行质控分析后得到高质量的Isoform序列,然后利用二代数据进行校正,最后通过聚类得到Unigene序列。
6、二代转录组测序:分别提取3条海蛇的毒腺组织总RNA,使用Oligo(dT)富集的方法构建二代测序文库,使用IlluminaHiSeqXTen测序仪进行双端测序。原始数据经质控后,利用Trinity软件对转录本进行从头拼接,根据序列相似性以及长度,挑选出最长的一条作为Unigene。
7、毒液蛋白质组:提取毒液样品中的总蛋白,取一部分进行蛋白浓度测定和SDS-PAGE检测,另取一部分进行胰酶酶解及TMT标记,然后将各标记样品等量混合后进行反相液相色谱分离,最后对样品进行LC-MS/MS检测及肽段数据分析。
三、青环海蛇多组学的生物信息学分析
1、基因组注释:首先采用EDTA流程对重复序列进行预测。之后采用MAKER流程,调用BRAKER、Augustus和GeneMark-ES等多种软件,分别基于同源预测和从头预测的证据对编码基因进行多轮的结构注释。将结构注释得到的所有蛋白序列比对到NR、Swiss-Prot、KEGG、GO等功能数据库,筛选具有最高序列相似性的蛋白,从而得到功能注释信息。
2、基因家族聚类:通过OrthoFinder流程将近缘物种的蛋白序列基于序列相似性进行聚类。
3、系统进化分析:对各个单拷贝直系同源基因家族内的基因分别进行多序列比对,将比对结果合并连接后,使用软件RAxML通过最大似然法构建进化树,并进行物种分歧时间的估算。
4、基因家族扩张与收缩分析:使用软件CAFE模拟进化树上每个谱系的基因家族扩张和收缩事件。对于发生扩张和收缩的基因,进行GO和KEGGpathway功能富集分析,并用超几何分布检验的方法计算每个条目中扩张/收缩基因富集的显著性。
5、正选择分析:根据基因家族聚类的结果,对每个共有单拷贝直系同源基因家族,使用codeml程序通过支位点特异模型及卡方检验分析受到正选择的基因,并进行功能富集分析。
6、基因组共线性分析:对青环海蛇和草原响尾蛇所有基因最长转录本的CDS序列进行比对得到直系同源基因对,然后通过MCScanX软件获得共线性区块。利用Python软件包JCVI展现共线性结果。
7、毒素相关基因的鉴定:将青环海蛇基因组注释出的所有蛋白序列通过BLASTp比对到已知的毒素相关蛋白库中。比对结果去冗余后,将属于同一个基因的蛋白(protein isoforms)合并。然后利用Swiss-Prot的注释信息对这些基因进行进一步分析,确定毒素基因和毒液蛋白基因。
8、毒素相关基因的表达:将毒腺RNA-Seq的cleanreads比对到注释过的青环海蛇基因组上,获取落到每个样本中每个基因上的reads数目,然后采用FPKM算法来计算基因的表达量。
9、毒素相关蛋白的表达:对毒液蛋白组鉴定出的肽段,利用基因组注释出的蛋白数据库进行检索,并筛选可信蛋白。然后根据毒素相关基因的注释结果,进一步分析毒素相关蛋白在毒液中的表达。
研究结果:
一、青环海蛇抗炎活性肽Hydrostatin-SN10拮抗靶点TNFR1的机制探究与验证
1、在各基因型小鼠中构建DSS诱导的急性结肠炎模型并给予SN10治疗,结果显示:在Tnfr2-/-小鼠中,SN10治疗组在疾病活动指数、体重、结肠长度、脾重指数、炎症因子表达、结肠组织病理学改变以及TNF-TNFRs下游炎症相关信号通路的磷酸化激活这些指标上,与模型组相比都有明显的改善(p<0.05),其治疗效果与在野生型小鼠中相当;而在Tnfr1-/-小鼠中,SN10对这些指标都没有明显的缓解作用。
2、通过分子对接及分子动力学模拟,获得了四种TNFR1-SN10复合物的结构模型,分析SN10上与TNFR1结合的可能位点有D1、E2、E8、L9、H10。其中Model1为最优的模型,在Model1中,SN10结合到了TNFR1的CRD2和CRD3结构域,SN10的E8位点与TNFR1的R77和N110位点分别形成了静电相互作用和氢键。
3、MST测定SN10及各突变肽与TNFR1的亲和力结果表明,M1(E8A)的体外活性有较显著的变化,其亲和力KD值(>>171μM)较SN10(2.75μM)下降了62倍以上。
4、在LPS诱导的小鼠急性休克模型中,突变肽M1体内活性的变化最显著,使用M1治疗后小鼠的生存率(12.5%)较SN10治疗组(87.5%)下降了75%(p<0.01)。
二、青环海蛇的多组学测序与组装
1、通过基因组三代测序、二代测序和Hi-C测序,我们获得了1.98Gb的青环海蛇全基因组,组装出了18条染色体(7条大染色体和11条小染色体)。组装质量评估结果显示,青环海蛇基因组的contigN50为18.99Mb,scaffoldN50为264.25Mb,gap比例0.01%,BUSCO完整度90.1%。各项指标与已发表蛇类基因组相比,青环海蛇基因组的组装质量是最高的,并且与其他基于二代测序的海蛇类基因组相比,基因组的连续性提升明显(>100倍)。
2、通过三代全长转录组测序获得了青环海蛇毒腺的全长转录本18117条,最大长度12.1Kb;通过二代转录组测序及拼接获得毒腺转录本54344条。
3、通过TMT标记定量蛋白质组分析获得了青环海蛇毒液蛋白肽段序列7709条。
三、青环海蛇多组学的生物信息学分析
1、青环海蛇基因组注释得到了23898个基因,编码43062个蛋白(转录本)。
2、重复序列的分析结果表明,青环海蛇基因组在进化过程发生了LTR反转录转座子的明显扩张。
3、系统发生分析表明,青环海蛇与平颏海蛇及陆生眼镜蛇类的亲缘关系很近。真海蛇类约在1990万年前从陆生眼镜蛇类进化而来,而青环海蛇这一独立物种约在950万年前出现。
4、基因(家族)进化分析表明,青环海蛇基因组中有907个基因家族发生了扩张,1565个基因家族发生了收缩,这些基因主要与犁鼻器-嗅觉受体系统,盐离子跨膜转运,听觉、视觉感知,能量代谢及固有免疫应答等功能相关;有80个基因受到了正选择,这些基因主要与DNA错配修复,mRNA可变剪接,呼吸链,氧气感知等功能有关。
5、通过基因组共线性分析,鉴定出了青环海蛇的第5号染色体为性染色体Z。
6、在青环海蛇基因组中鉴定出了来自35个毒素相关家族的241个毒素相关基因,其中包括60个毒素基因。代表性的毒素相关家族有3FTx(三指毒素),PLA2(磷脂酶A2),CRISP(富含半胱氨酸的分泌蛋白),vKun(Kunitz型丝氨酸蛋白酶抑制剂),vCTL(C型凝集素),SVMP(蛇毒金属蛋白酶)。其中3FTx的毒素基因拷贝数最多(20个),包括5个LNTX(长链神经毒素)基因和9个SNTX(短链神经毒素)基因。同时,从中发现了一些编码潜在药用活性分子的基因,包括CATH(抗菌肽)、NGF-β(神经生长因子-β)及PLI-γ(磷脂酶A2抑制剂-γ)等。
7、通过对毒腺转录组和毒液蛋白组进行表达定量分析发现,青环海蛇蛇毒中表达量最高的两种毒素为3FTx和PLA2。在毒腺转录组中,123个毒素相关基因呈显著表达,其中3FTx表达量占毒素相关转录本的45%,且LNTX比例(30.8%)较SNTX(14.1%)高;PLA2转录本占39%。毒液蛋白组中鉴定到了毒素相关蛋白69个,包括毒素蛋白24个,其中3FTx家族检测到了3种LNTX毒素和1种SNTX毒素。
结论:
本研究首先确证了青环海蛇抗炎活性肽Hydrostatin-SN10在体内水平对靶点TNFR1具有专一选择性。进一步探究SN10对靶点TNFR1的拮抗机制发现,SN10很可能是通过E8(第8位氨基酸谷氨酸)占据TNF-α与TNFR1结合的关键位点,直接竞争性拮抗TNFR1与TNF-α的结合,从而抑制TNFR1-TNF复合物的形成及下游信号的激活。这对SN10的进一步结构优化改造,以及从海洋生物中筛选类似的专一靶点的先导活性肽具有重要的指导作用。
另一方面,我们获得了药用海洋生物青环海蛇的高质量染色体水平全基因组,毒腺的全长转录组以及毒液的蛋白质组,建立了具有完善注释的青环海蛇多组学数据库和毒素组学数据库,为高通量、精准挖掘青环海蛇来源的新型生物活性肽提供大数据支持;同时,对海蛇等海洋珍稀濒危品种生物资源的保护利用和海洋创新药物的研发也具有重要意义。