论文部分内容阅读
流行性感冒病毒(influenza virus),是正粘病毒科(Orthomyxoviridae)的代表种,简称流感病毒,包括宿主为人的人流感病毒和宿主为动物的动物流感病毒。流感病毒分为四型:甲(A)、乙(B)、丙(C)、丁(D),其中甲型和乙型流感病毒是流行性感冒(流感)的病原体,可引起急性呼吸道传染病,感染后的主要症状表现为咳嗽、高热、流涕、肌痛等,少数伴有重症肺炎,严重者导致心、肾等多种脏器衰竭诱发死亡,其中高致病性禽流感病毒感染所导致的病死率很高。甲型流感病毒抗原性易发生变异,多次引起世界性大流行。流感病毒为单股负链多节段包膜RNA病毒,基因组包含8个基因组节段,核苷酸长度在890 bp至2,341 bp之间。流感病毒的宿主特异性通常决定于两个因素,一个是感染侵入宿主细胞的能力,这主要取决于病毒表面蛋白血凝素蛋白(HA)和神经氨酸酶蛋白(NA),另一个因素则是病毒在宿主细胞内增殖复制的能力,这通常与复制相关蛋白密切相关,例如PA、PB1、PB2和NP蛋白。其中NP蛋白除了作为结构蛋白组成核糖核蛋白外,还参与病毒的复制从而影响流感病毒的复制效率,决定病毒宿主的特异性等相关功能。我们前期研究利用多种机器学习方法筛选、鉴定了甲型流感病毒人类适应相关的特征性单核苷酸(nt)和二核苷酸(dnts),发现基于NP蛋白的核苷酸特征可有效预测IAV对人类适应性。本研究则主要围绕流感病毒NP蛋白在氨基酸层面对甲型流感病毒宿主适应性的研究。本研究主要包括四个部分:第一部分:利用机器学习预测筛选甲型H1N1亚型流感病毒NP蛋白人、禽适应性位点。利用深度学习的基因组成性解析方法分析比较所有的人源、禽源甲型流感病毒密码子的核苷酸组成性表征,发现8个病毒基因组片段中,NP片段的人/禽序列特征差异最为明显。基于DCR(二核苷酸组成性表征)方法,进一步比对预测了NP基因与人宿主适应相关的位点,并按照位点ML(Machine learning)预测的重要性,筛选出30个氨基酸位点进行下一步研究。第二部分:H1N1流感病毒NP突变株的反向遗传学系统构建和拯救。根据机器学习筛选出人禽差异最大的30个NP突变位点,根据差异的密码子我们分别设计将人源的CA07病毒株向禽源方向的突变,并人工合成59个含有相应突变位点的感染性克隆NP突变质粒,利用反向遗传学原理将NP突变质粒分别和流感病毒CA07株其余7个片段质粒共转染293T/DMCK细胞,成功拯救获得59株NP突变病毒。突变病毒经测序后和目的序列一致,仅出现少量无义突变。第三部分:NP突变对病毒感染与致病特征的影响。利用蚀斑实验确定59个CA07-NP突变株的蚀斑特征和病毒滴度,各突变病毒蚀斑形态大多与野生型一致,个别在蚀斑孔径上有增大和缩小,滴度与野生型无显著差异。分别在34℃、37℃、39℃三个温度观察突变病毒株的生长曲线,与野生型CA07病毒的复制能力对比,33、217、293等9个位点的密码子突变(或氨基酸突变,多数是氨基酸突变引起)在多采样点出现了在哺乳动物细胞MDCK上复制能力降低,还有8个位点也具有单次的显著降低,另外12个位点对病毒增殖无显著影响。有意思的是,NP蛋白是流感病毒v RNP复合体的关键成分,在病毒复制中发挥重要作用,我们进一步比较突变株聚合酶活性,发现大部分突变株聚合酶活性较野生型都有所增强,但上升的幅度不大,增幅最大的突变株聚合酶活性约为野生型2倍。为了明确NP蛋白突变对病毒致病性的影响,通过小鼠滴鼻感染实验比较分析突变株与野生型毒力强弱,发现突变株毒力强弱变化与复制动力学结果基本一致,且有2个突变株与野生型毒力强弱差异显著。第四部分:NP突变对NP-v RNA互作的影响选取5个与野生型体内外生物学特征差异最大的突变株,利用真核293-T表达系统表达突变NP蛋白,并利用体外转录合成CA07野生型RNA基因组片段,对NP-v RNA互作开展BLI动力学分析,结果显示在生物学差异与野生型最大的两株突变株651-ATT、858-TCC在NP-v RNA结合力的表现上同样与野生型差异显著。其中,651-ATT突变株的NP-v RNA结合力明显降低而858-TCC突变株则显著升高,这与第三部分实验结果相一致。这可能是NP蛋白位点突变导致其结构上与RNA结合区域发生改变造成的结果。综上,本研究通过“生物验证+机器学习”的方法探究了基于NP蛋白预测流感病毒宿主适应性的方法并探讨了NP突变对病毒感染与致病特征的影响。本实验利用宿主适应性机器学习预测方法,分析了所有人源、禽源甲型流感病毒全核苷酸序列,基于DCR的卷积神经网络(CNN)模型筛选出在NP蛋白上人禽宿主靶向差异最大的系列核苷酸位点,利用反向遗传学构建并成功拯救出所有位点突变病毒株。生物学实验显示60%位点差异病毒在增值效率上与野生型有明显差异,验证了位点预测的准确性,同时NP宿主适应性相关感染致病特征的差异可能是由于NP-vRNA结合的影响导致的。