论文部分内容阅读
摘要 为了解析甘蔗线条花叶病毒Sugarcane streak mosaic virus (SCSMV)不同分离物HCPro基因的分子变异规律,本研究利用RTPCR法扩增获得SCSMV HCPro基因的序列,通过生物信息学分析,分别从重组、系统发生、选择压力等方面研究SCSMV HCPro基因的分子变异特征。共测定了44条SCSMV HCPro基因序列,相似性最低值为70%;HCPro基因重组频率较低,仅发现3个重组位点,其中一个系首次报道;与先前报道相比,部分新测定云南蔗区的SCSMV分离物在HCPro基因上形成一个新组-第Ⅲ组;HCPro基因处于很强的负选择压力作用,未发现正向选择作用位点。本研究结果进一步证明SCSMV HCPro基因具有高度的遗传多样性。
关键词 甘蔗线条花叶病毒; HCPro基因; 分子变异
中图分类号: S 435.661
文献标识码: A
DOI: 10.3969/j.issn.05291542.2017.02.005
Abstract The objective of this study is to assess the molecular evolution and divergence of SCSMV according to HCPro gene sequences. The HCPro gene sequences of SCSMV were obtained by RTPCR, and analyzed by bioinformatic software, in aspect of recombination, phylogenetics, selection, demography, and gene flow. In the present study, 44 HCPro gene sequences were determined with a 70% lowest similarity; only one novel recombination site together with two previous reported sites were found in HCPro gene, suggesting that infrequent recombination events were distributed in this gene of SCSMV; one novel lineage (lineage Ⅲ) clustered by SCSMV sequences determined here was found; strong purifying selection was found in the HCPro gene of SCSMV. Our genetic study further indicates that the HCPro gene showed high genetic diversity in the genome of SCSMV.
Key words Sugarcane streak mosaic virus; HCPro; molecular variation
甘蔗線条花叶病毒Sugarcane streak mosaic virus (SCSMV)是近年来从甘蔗花叶病株上鉴定出的一种新病原,属于马铃薯Y病毒科Potyviridae禾本科病毒属Poacevirus[12]。该病毒分子量大小约为10 kb,编码一个多聚蛋白,经水解酶切割后可产生10个成熟的蛋白质,在P3蛋白氨基端有一个PIPO蛋白[23]。自然条件下,该病毒可侵染甘蔗和高粱,目前尚未发现SCSMV的传毒介体[13]。2012年,我们在云南省甘蔗产区首次发现该病毒,经调查发现,SCSMV在云南省甘蔗主产区发生越来越普遍,部分地区呈现流行暴发趋势[1, 45]。因此设计合理的SCSMV防治策略对于抑制其在中国蔗区传播流行具有十分重要的意义。RNA病毒的分子进化研究有利于我们加深对于病毒传播途径、流行路线以及寄主相互适应方式等[67]的研究,从而为设计合理的病毒病害防治策略提供依据。目前,针对SCSMV的研究较少。Viswanathan等[8]和Bagyalakshmi等[9]发现SCSMV印度分离物存在较高的遗传多样性。我们的前期研究发现SCSMV具有一个典型的“准种”结构,普遍存在同种病毒不同分离物或株系混合侵染的现象[5];SCSMV依据不同基因可划分为9个组(第Ⅰ~第Ⅸ组),并且存在重组现象[5]。不同于Potyvirus,HCPro基因是SCSMV基因组中遗传多样性最高的一个基因[5],前期研究中由于基因序列的限制,无法对其进行一个系统的分子进化分析,因此,本研究试图选取不同地区的多个典型分离物,在重组、系统发生、选择压力等方面,对其进行系统全面的分子进化分析。
1 材料与方法
1.1 病毒分离物
2009-2012年间从云南省7个甘蔗主产区和国家甘蔗种质资源圃内采集到具有典型花叶症状(图1)的甘蔗样品324份。新鲜叶片样品经RTPCR法检测鉴定,将SCSMV阳性样品冷冻干燥后,-80℃保存备用。本研究中所用样品详细信息见表1。
1.2 克隆测序
根据GenBank已公布的SCSMV序列保守区,设计用于扩增HCPro基因的引物SCSMHCProF (5′TGGACTCATTTGACGCCAGG3′)和SCSMHCProR(5′CGCTAACCTTGTTGTGTCGT3′),预期扩增的目的片段大小约为1 500 bp。引物由上海生工生物工程有限公司合成。
采用TRIzol试剂法提取SCSMV甘蔗叶片中的总RNA,提取方法参照试剂盒说明书进行。取2 μL总RNA,采用Promega公司MLV反转录试剂盒,用反向引物SCSMHCProR进行反转录获得cDNA。以cDNA为模板进行PCR。PCR扩增采用50 μL反应体系:10×PCR buffer 5 μL,dNTPs (2.5 mmol/L) 4 μL,SCSMHCProF (10 μmol/L) 2 μL,SCSMHCProR (10 μmol/L) 2 μL,ddH2O 34.5 μL,long Taq polymerase (5 U/μL) 0.5 μL,cDNA 2 μL。PCR反应条件为:94℃预变性5 min;94℃变性30 s,55℃复性30 s,72℃延伸1 min,共30个循环;最后一轮循环后72℃延伸10 min。4℃保存。PCR反应结束后,吸取产物2 μL进行1%的琼脂糖凝胶电泳检测。PCR产物纯化后克隆至pGEMT载体上,并转化至大肠杆菌Escherichia coli感受态细胞DH5α中。经菌落PCR鉴定获得阳性重组质粒,将筛选获得的阳性克隆随机选择3~6个送至北京六合华大基因科技股份有限公司测序。测序结果首先通过峰图及序列比对分析排除由PCR扩增引起的突变,然后通过Bioedit 5.0.9拼接完成。 1.3 重组分析
本研究中,经测序所得SCSMV HCPro基因的核苷酸序列共44条(GenBank登录号分别为:KU314329~KU314372),BLAST检索结果显示其与麦类花叶病毒Triticum mosaic virus (TriMV)具有最近的亲缘关系。因此,本研究选择TriMV分离物(NC012779)对应的HCPro基因序列作为序列比对分析的外组(outgroup)[10]。结合GenBank中所有可用的SCSMV HCPro基因的核酸序列形成一个具有106条序列的数据集合。对该数据集合进行比对,过程如下:首先将核酸序列数据对应的氨基酸序列应用CLUSTRAL X2[11]和TRANSALIGN(由Georg Weiller教授惠赠)比对,以保证经过序列比对后得到的核酸序列能够正确地编译出氨基酸序列。经过序列比对后,得到的删除gap后的HCPro基因的序列长度为990个核苷酸(nucleotide,nt)。对比对所得序列数据,利用Datamonkey(http:∥www.datamonkey.org/)中GARD和RDP 4.0软件包[1213]中的RDP[12]、GENECONV[14]、BOOTSCAN[15]、MAXCHI[16]、CHIMAERA[17]、3SEQ[18]和SISCAN[19]7个程序进行重组检测,以发现可能存在的重组位点。在RDP 4.0检测时,各软件参数采用默认值,Bonferroni校正的P为0.05或者0.01,当某分离物有至少3个软件的检测结果P<1.0×10-6时,支持该分离物为重组体[2021]。在这些分析中,重组体序列会与非重组体序列存在部分相似,为了方便说明,我们将此非重组体作为该重组体的“亲本分离物”(parental isolates),据此,当重组体与亲本分离物位于同一组时,将此重组体命名为组内重组体(intralineage recombinant);当重组体与亲本分离物位于非同一组时,则命名为组间重组体(interlineage recombinant)[20, 22]。最后,将SCSMV序列数据中外组TriMV序列删除,去除TriMV对SCSMV序列造成的gap影响,直接检测确认SCSMV的HCPro基因區的重组位点。
1.4 系统发生分析
对上述处理后的序列分别利用PhyML 3.0[23]中的最大似然法(maximumlikelihood,ML)、MEGA 6.0[24]中的邻接法(neighbourjoining,NJ)以及SPLITSTREE 4.11.3[25]中的邻接网法(neighbornet,NN)进行系统发生分析。在ML法分析中,通过jModeltest 0.1.1[26]分析确定HCPro数据的最适核苷酸替代模型为GTR I Г4。在ML和NJ法分析中,支长皆用自举法(bootstrap)进行1 000次模拟复制计算检验。系统发育树由TREEVIEW[27]展示。核酸和氨基酸相似性分析分别依据Kimura twoparameter method[28]和Dayhoff PAM 001matrix[29]方法计算,种群内多样性分析由MEGA 6.0[24]计算。在本研究中,通过计算HCPro基因的dN/dS值(非同义突变和同义突变之间的比值)来预测该基因所承受的选择压力。计算基于ML法,通过以下两种方法进行检测。首先,利用Datamonkey(http:∥www.datamonkey.org/)中SLAC(singlelikelihood ancestor counting)、FEL(fixedeffects likelihood)和REL(randomeffects likelihood)在线检测不同位置密码子的选择压力;第二,在MEGA 6.0[24]中利用PamiloBianchiLi method[30]计算系统树不同分支上密码子的选择压力。当dN/dS<1时,该组分离物处于纯化或负向选择压力下;当dN/dS=1时,说明该组分离物处于中性选择压力中;当dN/dS>1时,说明该组分离物受正向选择或多样化选择作用。
1.5 多样性分析
利用DnaSP 5.0[31]估测不同种群分离物的核酸多样性(nucleotide diversity)和单体型多样性(haplotype diversity)。核酸多样性是指分离物序列间的平均差异;单体型多样性是指样本中单体型出现的频率和数量。一般而言,植物RNA病毒种群的单体型多样性的值较高,核酸多样性的值较低[5, 22, 3235]。SCSMV的HCPro基因的核酸和氨基酸间的多样性分布图可通过SDT 1.0[36]中的Clustal W[11]法计算获得。
2 结果分析
2.1 SCSMV HCPro基因的序列分析
2009-2012年对云南7个甘蔗主产地州和国家甘蔗种质资源圃内甘蔗花叶病中SCSMV的发生情况进行了调查分析,结果发现:SCSMV在云南省甘蔗种植区平均发病率30%(96个阳性样品);在甘蔗产区,SCSMV在沅江、开远、新平、常宁、红河和弥勒等县区分布较为广泛[4];在资源圃内,部分品种的甘蔗种质中SCSMV具有较高的检出率(59.1%)。
在SCSMV阳性样品中,选取28个具有典型花叶、线条花叶症状(图1)的样品,对其HCPro基因克隆测序。测序结果显示,每个样品中所得不同克隆的序列相似性很高,选取其中差异性较大的序列(44条)登录到GenBank数据库中。去掉引物序列,本研究所获得的HCPro基因区段序列长度为1 002 nt。在SCSMV的HCPro基因中,并没有发现在马铃薯Y病毒属病毒的HCPro基因中广泛存在的KITC、GE、FRNK和PTK等结构域。
2.2 重组分析结果
将本研究所测定的以及在GenBank中获取的共计105个SCSMV HCPro基因序列进行重组分析。在利用NN法构建的网状树中,部分分离物之间存在明显的序列交叉,表明部分SCSMV分离物在HCPro基因中存在明显的重组现象(数据未显示)。利用RDP 4.0[13]分析发现,在HCPro基因中共有3个明显的重组位点,分别位于SCSMV基因组(位点依据SCSMVID分离物,登录号: JF488066)的第1 575、1 736和2 273位点,其中,前两个位点在先前的研究中有过报道,2 273位点是本研究中新发现的一个重组位点(表 2)。在105个SCSMV序列中,共发现4个明显的重组体,分别为M117CL2、M117CL3、M117CL7和CB419。本研究所获得的SCSMV序列中没有发现明显的重组位点。 2.3 系统发育分析
将上述数据集合去掉重组体,对剩余的SCSMV序列进行系统发生分析,ML法和NJ法构建的系统发育树具有相似的拓扑结构,ML树如图2所示。在先前的报道[5]中,SCSMV依据不同基因至少可分为9个组(第I~第IX组),而依据HCPro基因包含第Ⅴ、Ⅵ、Ⅶ和第Ⅰ Ⅳ组。在本研究中,所有分离物共分为4个组,分别为第Ⅲ、Ⅴ、Ⅵ和第Ⅰ Ⅳ Ⅶ组,其中第Ⅴ组又可以分为4个亚组(Ⅴ1、Ⅴ2、Ⅴ3和Ⅴ4)。SCSMV不同地区具有较为明显的地理特异性,其中中国分离物主要集中在第Ⅲ和第Ⅴ组,而印度分离物主要集中在第Ⅵ和第Ⅰ Ⅳ Ⅶ组。本研究所得的SCSMV分离物在系统树中广泛分布,且部分来自于云南甘蔗产区的样品形成一个新组-第Ⅲ组。SCSMV在HCPro基因的dN/dS为0.21,没有发现正向选择作用位点;不同种群间的dN/dS值远小于1,其中第Ⅲ组具有最小的dN/dS值(0.036),说明SCSMV不同种群都处于较强的负选择压力作用下。
2.4 多样性分析结果
利用SDT 1.0[36]统计计算SCSMV在HCPro基因上的核苷酸多样性分布,结果如图3所示。所有SCSMV分离物序列在HCPro基因上的核苷酸多样性程度很高,相似性值低至70%(图3)。在系统发生所分的4个组中,第Ⅲ组具有较高的单体型多样性(0.982±0.022)和最低的核苷酸多样性(0.011 21±0.001 25)(表3)。相对于SCSMV印度分离物,在中国SCSMV不同分离物间遗传相似性程度更高(表3)。
3 结论与讨论
目前,已经报道了多种植物病毒分子进化与种群结构的研究,特别是Potyvirus,包括PVY[33, 3738]、TuMV[20, 22]以及TVBMV[35]等。我们先前对SCSMV的分子进化研究发现,HCPro基因是其基因组中遗传多样性最高的基因,但限于分离物数量有限,未能作充分的研究[5]。在本研究中,我們从云南省甘蔗产区以及国家甘蔗种质资源圃内选择了28个具有典型甘蔗花叶症状的样品,测定了其HCPro基因序列,结合GenBank中已报道的序列信息,对其进行系统的分子变异与种群特征分析。植物病毒在每个单独的寄主中,是以一个“突变云”或者“准种”[39]方式存在的。因此,经单斑分离获得单一纯化的生物克隆是进行分子变异和种群结构分析的必要条件。而在部分植物病毒中,由于没有单斑寄主,无法排除不同基因组片段间错误拼接的可能,因此通常集中于分析病毒的某些单一扩增片段[45]。在本研究中,我们通过单一扩增SCSMV的HCPro基因,测定不同克隆序列的方式进行分析,以确保不存在可能的拼接错误。
重组是遗传多样性的重要来源,是促进病毒进化的主要动力之一。在PVY[32]和TuMV[20, 22]等Potyvirus中,HCPro基因的重组发生频率很高。而在本研究中,SCSMV的HCPro基因中仅发现3个重组位点,这表明SCSMV HCPro基因中发生重组的频率很低。He等[5]的研究中,由于分离物的数量限制,SCSMV依据HCPro基因可分为4个组,分别为第Ⅴ、Ⅵ、Ⅶ和第Ⅰ Ⅳ组。本研究中测定的部分源自云南蔗区的分离物序列形成一个新组,对照SCSMV P1基因的系统树,将其定名为第Ⅲ组。第Ⅲ组SCSMV分离物的发现,增加了HCPro基因与P1和CP基因在系统发生分析上的一致性。SCSMV不同组间具有清晰的地理特异性,中国分离物主要集中在第Ⅲ组和第Ⅴ组。本研究测定的SCSMV资源圃和甘蔗产区分离物位于不同分支,遗传差异较大,具有很明显的亚组结构,这表明云南甘蔗产区和资源圃内SCSMV可能具有不同的起源。通常,大部分的动植物病毒处于强的负选择压力下。本研究中,HCPro基因的dN/dS远小于1,表明SCSMV在此基因上受到强的负选择压力作用,这可能是与其基因功能的稳定性相适应的。核苷酸多样性分布结果与系统发生结果相一致,进一步证明SCSMV HCPro基因具有高度的遗传多样性,而该结果可能与其功能相适应,尽管目前尚不明确SCSMV HCPro的基因功能。
参考文献
[1] Xu D L, Zhou G H, Xie Y J, et al. Complete nucleotide sequence and taxonomy of Sugarcane streak mosaic virus, member of a novel genus in the family Potyviridae[J]. Virus Genes, 2010, 40(3): 432439.
[2] Hema M, Sreenivasulu P, Savithri H S. Taxonomic position of Sugarcane streak mosaic virus in the family Potyviridae [J]. Archives of Virology, 2002, 147(10): 19972007.
[3] Li Wenfeng, He Zhen, Li Shifang, et al. Molecular characterization of a new strain of Sugarcane streak mosaic virus (SCSMV)[J]. Archives of Virology, 2011, 156(11): 21012104.
[4] He Zhen, Li Wenfeng, Yasaka R, et al. Molecular variability of Sugarcane streak mosaic virus in China based on an analysis of the P1 and CP protein coding regions [J]. Archives of Virology, 2014, 159(5): 11491154. [5] He Zhen, Yasaka R, Li Wenfeng, et al. Genetic structure of populations of Sugarcane streak mosaic virus in China: Comparison with the populations in India[J]. Virus Research, 2016, 211: 103116.
[6] GarcíaArenal F, Fraile A, Malpica J M. Variability and genetic structure of plant virus populations [J]. Annual Review of Phytopathology, 2001, 39(1): 157186.
[7] Gibbs A, Ohshima K. Potyviruses and the digital revolution [J]. Annual Review of Phytopathology, 2010, 48(1): 205223.
[8] Viswanathan R, Balamuralikrishnan M, Karuppaiah R. Characterization and genetic diversity of Sugarcane streak mosaic virus causing mosaic in sugarcane [J]. Virus Genes, 2008, 36(3): 553564.
[9] Bagyalakshmi K, Parameswari B, Chinnaraja C, et al. Genetic variability and potential recombination events in the HCPro gene of Sugarcane streak mosaic virus [J]. Archives of Virology, 2012, 157(7): 13711375.
[10]Fellers J P, Seifers D, RybaWhite M, et al. The complete genome sequence of Triticum mosaic virus, a new wheatinfecting virus of the high plains [J]. Archives of Virology, 2009, 154(9): 15111515.
[11]Larkin M A, Blackshields G, Brown N P, et al. Clustal W and Clustal X version 2.0 [J].Bioinformatics,2007,23(21):29472948.
[12]Martin D P, Rybicki E P.RDP: detection of recombination amongst aligned sequences [J]. Bioinformatics, 2000, 16(6): 562563.
[13]Martin D P, Lemey P, Lott M, et al. RDP3: a flexible and fast computer program for analyzing recombination [J]. Bioinformatics, 2010, 26(19): 24622463.
[14]Sawyer SA (1999) GENECONV: a computer package for the statistical detection of gene conversion [M]. Distributed by the author, Department of Mathematics, Washington University in Louis.
[15]Salminen M O, Carr J K, Burke D S, et al. Identification of breakpoints in intergenotypic recombinants of HIV type 1 by bootscanning [J]. AIDS Research and Human Retroviruses, 1995, 11(11): 14231425.
[16]Smith J M. Analyzing the mosaic structure of genes [J]. Journal of Molecular Evolution, 1992, 34(2): 126129.
[17]Posada D, Crandall K A. Evaluation of methods for detecting recombination from DNA sequences: computer simulations [J]. Proceedings of the National Academy of Sciences, USA, 2001, 98(24): 1375713762.
[18]Boni M F, Posada D, Feldman M W. An exact nonparametric method for inferring mosaic structure in sequence triplets [J]. Genetics, 2007, 176(2): 10351047.
[19]Gibbs M J, Armstrong J S, Gibbs A J. Sisterscanning: a Monte Carlo procedure for assessing signals in recombinant sequences [J]. Bioinformatics, 2000, 16(7): 573582. [20]Ohshima K, Yamaguchi Y, Hirota R, et al. Molecular evolution of Turnip mosaic virus: evidence of host adaptation, genetic recombination and geographical spread[J]. Journal of General Virology, 2002, 83(6): 15111521.
[21]Tomitaka Y, Ohshima K. A phylogeographical study of the Turnip mosaic virus population in East Asia reveals an “emergent” lineage in Japan [J].Molecular Ecology,2006,15(14):44374457.
[22]Nguyen H D, Tran H T N, Ohshima K. Genetic variation of the Turnip mosaic virus population of Vietnam: a case study of founder, regional and local influences[J]. Virus Research, 2013, 171(1): 138149.
[23]Guindon S, Dufayard J F, Lefort V, et al. New algorithms and methods to estimate maximumlikelihood phylogenies: assessing the performance of PhyML 3.0[J]. Systems Biology, 2010, 59(3): 307321.
[24]Tamura K, Stecher G, Peterson D, et al. MEGA6: Molecular Evolutionary Genetics Analysis version 6.0[J]. Molecular Biology and Evolution, 2013, 30(12): 27252739.
[25]Huson D H, Bryant D. Application of phylogenetic networks in evolutionary studies [J]. Molecular Biology and Evolution, 2006, 23(2): 254267.
[26]Posada D. jModelTest: phylogenetic model averaging [J]. Molecular Biology and Evolution, 2008, 25(7): 12531256.
[27]Page R D M. Tree view: An application to display phylogenetic trees on personal computers [J]. Bioinformatics, 1996, 12(4): 357358.
[28]Kimura M. A simple method for estimating evolutionary rates of base substitutions through comparative studies of nucleotide sequences [J]. Journal of Molecular Evolution, 1980, 16(2): 111120.
[29]Dayhoff M O, Barker W C, Hunt L T. Establishing homologies in protein sequences [J]. Methods in Enzymology, 1983, 91: 524545.
[30]Pamilo P, Bianchi N O.Evolution of the Zfx and Zfy genes: rates and interdependence between the genes [J]. Molecular Biology and Evolution, 1993, 10(2): 271281.
[31]Librado P, Rozas J. DnaSP v5: a software for comprehensive analysis of DNA polymorphism data [J]. Bioinformatics, 2009, 25(11): 14511452.
[32]Ogawa T, Tomitaka Y, Nakagawa A, et al. Genetic structure of a population of Potato virus Y inducing potato tuber necrotic ringspot disease in Japan; comparison with North American and European populations [J]. Virus Research, 2008, 131(2): 199212.
[33]Wei Taiyun, Yang Jinguang, Liao Fulong, et al. Genetic diversity and population structure of rice stripe virus in China [J]. Journal of General Virology, 2009, 90(4): 10251034.
[34]Yin Xiao, Zheng Fangqiang, Tang Wei, et al. Genetic structure of rice blackstreaked dwarf virus populations in China [J]. Archives of Virology, 2013, 158(12): 25052515.
[35]Zhang Chengling, Gao Rui, Wang Jie, et al. Molecular variability of Tobacco vein banding mosaic virus populations [J]. Virus Research, 2011, 158(1): 188198.
[36]Muhire B M, Varsani A, Martin D P.SDT: a virus classification tool based on pairwise sequence alignment and identity calculation [J]. PLoS ONE, 2014, 9(9): e108277.
[37]高芳鑾, 沈建国, 史凤阳, 等. 中国马铃薯Y病毒的检测鉴定及CP基因的分子变异[J]. 中国农业科学, 2013, 46(15): 31253133.
[38]高芳銮, 沈建国, 史凤阳, 等. 马铃薯Y病毒pipo基因的分子变异及结构特征分析[J]. 遗传, 2013, 35(9): 11251134.
[39]Roossinck M J. Mechanisms of plant virus evolution [J]. Annual Review of Phytopathology, 1997, 35(1): 191209.
(责任编辑:田 喆)
关键词 甘蔗线条花叶病毒; HCPro基因; 分子变异
中图分类号: S 435.661
文献标识码: A
DOI: 10.3969/j.issn.05291542.2017.02.005
Abstract The objective of this study is to assess the molecular evolution and divergence of SCSMV according to HCPro gene sequences. The HCPro gene sequences of SCSMV were obtained by RTPCR, and analyzed by bioinformatic software, in aspect of recombination, phylogenetics, selection, demography, and gene flow. In the present study, 44 HCPro gene sequences were determined with a 70% lowest similarity; only one novel recombination site together with two previous reported sites were found in HCPro gene, suggesting that infrequent recombination events were distributed in this gene of SCSMV; one novel lineage (lineage Ⅲ) clustered by SCSMV sequences determined here was found; strong purifying selection was found in the HCPro gene of SCSMV. Our genetic study further indicates that the HCPro gene showed high genetic diversity in the genome of SCSMV.
Key words Sugarcane streak mosaic virus; HCPro; molecular variation
甘蔗線条花叶病毒Sugarcane streak mosaic virus (SCSMV)是近年来从甘蔗花叶病株上鉴定出的一种新病原,属于马铃薯Y病毒科Potyviridae禾本科病毒属Poacevirus[12]。该病毒分子量大小约为10 kb,编码一个多聚蛋白,经水解酶切割后可产生10个成熟的蛋白质,在P3蛋白氨基端有一个PIPO蛋白[23]。自然条件下,该病毒可侵染甘蔗和高粱,目前尚未发现SCSMV的传毒介体[13]。2012年,我们在云南省甘蔗产区首次发现该病毒,经调查发现,SCSMV在云南省甘蔗主产区发生越来越普遍,部分地区呈现流行暴发趋势[1, 45]。因此设计合理的SCSMV防治策略对于抑制其在中国蔗区传播流行具有十分重要的意义。RNA病毒的分子进化研究有利于我们加深对于病毒传播途径、流行路线以及寄主相互适应方式等[67]的研究,从而为设计合理的病毒病害防治策略提供依据。目前,针对SCSMV的研究较少。Viswanathan等[8]和Bagyalakshmi等[9]发现SCSMV印度分离物存在较高的遗传多样性。我们的前期研究发现SCSMV具有一个典型的“准种”结构,普遍存在同种病毒不同分离物或株系混合侵染的现象[5];SCSMV依据不同基因可划分为9个组(第Ⅰ~第Ⅸ组),并且存在重组现象[5]。不同于Potyvirus,HCPro基因是SCSMV基因组中遗传多样性最高的一个基因[5],前期研究中由于基因序列的限制,无法对其进行一个系统的分子进化分析,因此,本研究试图选取不同地区的多个典型分离物,在重组、系统发生、选择压力等方面,对其进行系统全面的分子进化分析。
1 材料与方法
1.1 病毒分离物
2009-2012年间从云南省7个甘蔗主产区和国家甘蔗种质资源圃内采集到具有典型花叶症状(图1)的甘蔗样品324份。新鲜叶片样品经RTPCR法检测鉴定,将SCSMV阳性样品冷冻干燥后,-80℃保存备用。本研究中所用样品详细信息见表1。
1.2 克隆测序
根据GenBank已公布的SCSMV序列保守区,设计用于扩增HCPro基因的引物SCSMHCProF (5′TGGACTCATTTGACGCCAGG3′)和SCSMHCProR(5′CGCTAACCTTGTTGTGTCGT3′),预期扩增的目的片段大小约为1 500 bp。引物由上海生工生物工程有限公司合成。
采用TRIzol试剂法提取SCSMV甘蔗叶片中的总RNA,提取方法参照试剂盒说明书进行。取2 μL总RNA,采用Promega公司MLV反转录试剂盒,用反向引物SCSMHCProR进行反转录获得cDNA。以cDNA为模板进行PCR。PCR扩增采用50 μL反应体系:10×PCR buffer 5 μL,dNTPs (2.5 mmol/L) 4 μL,SCSMHCProF (10 μmol/L) 2 μL,SCSMHCProR (10 μmol/L) 2 μL,ddH2O 34.5 μL,long Taq polymerase (5 U/μL) 0.5 μL,cDNA 2 μL。PCR反应条件为:94℃预变性5 min;94℃变性30 s,55℃复性30 s,72℃延伸1 min,共30个循环;最后一轮循环后72℃延伸10 min。4℃保存。PCR反应结束后,吸取产物2 μL进行1%的琼脂糖凝胶电泳检测。PCR产物纯化后克隆至pGEMT载体上,并转化至大肠杆菌Escherichia coli感受态细胞DH5α中。经菌落PCR鉴定获得阳性重组质粒,将筛选获得的阳性克隆随机选择3~6个送至北京六合华大基因科技股份有限公司测序。测序结果首先通过峰图及序列比对分析排除由PCR扩增引起的突变,然后通过Bioedit 5.0.9拼接完成。 1.3 重组分析
本研究中,经测序所得SCSMV HCPro基因的核苷酸序列共44条(GenBank登录号分别为:KU314329~KU314372),BLAST检索结果显示其与麦类花叶病毒Triticum mosaic virus (TriMV)具有最近的亲缘关系。因此,本研究选择TriMV分离物(NC012779)对应的HCPro基因序列作为序列比对分析的外组(outgroup)[10]。结合GenBank中所有可用的SCSMV HCPro基因的核酸序列形成一个具有106条序列的数据集合。对该数据集合进行比对,过程如下:首先将核酸序列数据对应的氨基酸序列应用CLUSTRAL X2[11]和TRANSALIGN(由Georg Weiller教授惠赠)比对,以保证经过序列比对后得到的核酸序列能够正确地编译出氨基酸序列。经过序列比对后,得到的删除gap后的HCPro基因的序列长度为990个核苷酸(nucleotide,nt)。对比对所得序列数据,利用Datamonkey(http:∥www.datamonkey.org/)中GARD和RDP 4.0软件包[1213]中的RDP[12]、GENECONV[14]、BOOTSCAN[15]、MAXCHI[16]、CHIMAERA[17]、3SEQ[18]和SISCAN[19]7个程序进行重组检测,以发现可能存在的重组位点。在RDP 4.0检测时,各软件参数采用默认值,Bonferroni校正的P为0.05或者0.01,当某分离物有至少3个软件的检测结果P<1.0×10-6时,支持该分离物为重组体[2021]。在这些分析中,重组体序列会与非重组体序列存在部分相似,为了方便说明,我们将此非重组体作为该重组体的“亲本分离物”(parental isolates),据此,当重组体与亲本分离物位于同一组时,将此重组体命名为组内重组体(intralineage recombinant);当重组体与亲本分离物位于非同一组时,则命名为组间重组体(interlineage recombinant)[20, 22]。最后,将SCSMV序列数据中外组TriMV序列删除,去除TriMV对SCSMV序列造成的gap影响,直接检测确认SCSMV的HCPro基因區的重组位点。
1.4 系统发生分析
对上述处理后的序列分别利用PhyML 3.0[23]中的最大似然法(maximumlikelihood,ML)、MEGA 6.0[24]中的邻接法(neighbourjoining,NJ)以及SPLITSTREE 4.11.3[25]中的邻接网法(neighbornet,NN)进行系统发生分析。在ML法分析中,通过jModeltest 0.1.1[26]分析确定HCPro数据的最适核苷酸替代模型为GTR I Г4。在ML和NJ法分析中,支长皆用自举法(bootstrap)进行1 000次模拟复制计算检验。系统发育树由TREEVIEW[27]展示。核酸和氨基酸相似性分析分别依据Kimura twoparameter method[28]和Dayhoff PAM 001matrix[29]方法计算,种群内多样性分析由MEGA 6.0[24]计算。在本研究中,通过计算HCPro基因的dN/dS值(非同义突变和同义突变之间的比值)来预测该基因所承受的选择压力。计算基于ML法,通过以下两种方法进行检测。首先,利用Datamonkey(http:∥www.datamonkey.org/)中SLAC(singlelikelihood ancestor counting)、FEL(fixedeffects likelihood)和REL(randomeffects likelihood)在线检测不同位置密码子的选择压力;第二,在MEGA 6.0[24]中利用PamiloBianchiLi method[30]计算系统树不同分支上密码子的选择压力。当dN/dS<1时,该组分离物处于纯化或负向选择压力下;当dN/dS=1时,说明该组分离物处于中性选择压力中;当dN/dS>1时,说明该组分离物受正向选择或多样化选择作用。
1.5 多样性分析
利用DnaSP 5.0[31]估测不同种群分离物的核酸多样性(nucleotide diversity)和单体型多样性(haplotype diversity)。核酸多样性是指分离物序列间的平均差异;单体型多样性是指样本中单体型出现的频率和数量。一般而言,植物RNA病毒种群的单体型多样性的值较高,核酸多样性的值较低[5, 22, 3235]。SCSMV的HCPro基因的核酸和氨基酸间的多样性分布图可通过SDT 1.0[36]中的Clustal W[11]法计算获得。
2 结果分析
2.1 SCSMV HCPro基因的序列分析
2009-2012年对云南7个甘蔗主产地州和国家甘蔗种质资源圃内甘蔗花叶病中SCSMV的发生情况进行了调查分析,结果发现:SCSMV在云南省甘蔗种植区平均发病率30%(96个阳性样品);在甘蔗产区,SCSMV在沅江、开远、新平、常宁、红河和弥勒等县区分布较为广泛[4];在资源圃内,部分品种的甘蔗种质中SCSMV具有较高的检出率(59.1%)。
在SCSMV阳性样品中,选取28个具有典型花叶、线条花叶症状(图1)的样品,对其HCPro基因克隆测序。测序结果显示,每个样品中所得不同克隆的序列相似性很高,选取其中差异性较大的序列(44条)登录到GenBank数据库中。去掉引物序列,本研究所获得的HCPro基因区段序列长度为1 002 nt。在SCSMV的HCPro基因中,并没有发现在马铃薯Y病毒属病毒的HCPro基因中广泛存在的KITC、GE、FRNK和PTK等结构域。
2.2 重组分析结果
将本研究所测定的以及在GenBank中获取的共计105个SCSMV HCPro基因序列进行重组分析。在利用NN法构建的网状树中,部分分离物之间存在明显的序列交叉,表明部分SCSMV分离物在HCPro基因中存在明显的重组现象(数据未显示)。利用RDP 4.0[13]分析发现,在HCPro基因中共有3个明显的重组位点,分别位于SCSMV基因组(位点依据SCSMVID分离物,登录号: JF488066)的第1 575、1 736和2 273位点,其中,前两个位点在先前的研究中有过报道,2 273位点是本研究中新发现的一个重组位点(表 2)。在105个SCSMV序列中,共发现4个明显的重组体,分别为M117CL2、M117CL3、M117CL7和CB419。本研究所获得的SCSMV序列中没有发现明显的重组位点。 2.3 系统发育分析
将上述数据集合去掉重组体,对剩余的SCSMV序列进行系统发生分析,ML法和NJ法构建的系统发育树具有相似的拓扑结构,ML树如图2所示。在先前的报道[5]中,SCSMV依据不同基因至少可分为9个组(第I~第IX组),而依据HCPro基因包含第Ⅴ、Ⅵ、Ⅶ和第Ⅰ Ⅳ组。在本研究中,所有分离物共分为4个组,分别为第Ⅲ、Ⅴ、Ⅵ和第Ⅰ Ⅳ Ⅶ组,其中第Ⅴ组又可以分为4个亚组(Ⅴ1、Ⅴ2、Ⅴ3和Ⅴ4)。SCSMV不同地区具有较为明显的地理特异性,其中中国分离物主要集中在第Ⅲ和第Ⅴ组,而印度分离物主要集中在第Ⅵ和第Ⅰ Ⅳ Ⅶ组。本研究所得的SCSMV分离物在系统树中广泛分布,且部分来自于云南甘蔗产区的样品形成一个新组-第Ⅲ组。SCSMV在HCPro基因的dN/dS为0.21,没有发现正向选择作用位点;不同种群间的dN/dS值远小于1,其中第Ⅲ组具有最小的dN/dS值(0.036),说明SCSMV不同种群都处于较强的负选择压力作用下。
2.4 多样性分析结果
利用SDT 1.0[36]统计计算SCSMV在HCPro基因上的核苷酸多样性分布,结果如图3所示。所有SCSMV分离物序列在HCPro基因上的核苷酸多样性程度很高,相似性值低至70%(图3)。在系统发生所分的4个组中,第Ⅲ组具有较高的单体型多样性(0.982±0.022)和最低的核苷酸多样性(0.011 21±0.001 25)(表3)。相对于SCSMV印度分离物,在中国SCSMV不同分离物间遗传相似性程度更高(表3)。
3 结论与讨论
目前,已经报道了多种植物病毒分子进化与种群结构的研究,特别是Potyvirus,包括PVY[33, 3738]、TuMV[20, 22]以及TVBMV[35]等。我们先前对SCSMV的分子进化研究发现,HCPro基因是其基因组中遗传多样性最高的基因,但限于分离物数量有限,未能作充分的研究[5]。在本研究中,我們从云南省甘蔗产区以及国家甘蔗种质资源圃内选择了28个具有典型甘蔗花叶症状的样品,测定了其HCPro基因序列,结合GenBank中已报道的序列信息,对其进行系统的分子变异与种群特征分析。植物病毒在每个单独的寄主中,是以一个“突变云”或者“准种”[39]方式存在的。因此,经单斑分离获得单一纯化的生物克隆是进行分子变异和种群结构分析的必要条件。而在部分植物病毒中,由于没有单斑寄主,无法排除不同基因组片段间错误拼接的可能,因此通常集中于分析病毒的某些单一扩增片段[45]。在本研究中,我们通过单一扩增SCSMV的HCPro基因,测定不同克隆序列的方式进行分析,以确保不存在可能的拼接错误。
重组是遗传多样性的重要来源,是促进病毒进化的主要动力之一。在PVY[32]和TuMV[20, 22]等Potyvirus中,HCPro基因的重组发生频率很高。而在本研究中,SCSMV的HCPro基因中仅发现3个重组位点,这表明SCSMV HCPro基因中发生重组的频率很低。He等[5]的研究中,由于分离物的数量限制,SCSMV依据HCPro基因可分为4个组,分别为第Ⅴ、Ⅵ、Ⅶ和第Ⅰ Ⅳ组。本研究中测定的部分源自云南蔗区的分离物序列形成一个新组,对照SCSMV P1基因的系统树,将其定名为第Ⅲ组。第Ⅲ组SCSMV分离物的发现,增加了HCPro基因与P1和CP基因在系统发生分析上的一致性。SCSMV不同组间具有清晰的地理特异性,中国分离物主要集中在第Ⅲ组和第Ⅴ组。本研究测定的SCSMV资源圃和甘蔗产区分离物位于不同分支,遗传差异较大,具有很明显的亚组结构,这表明云南甘蔗产区和资源圃内SCSMV可能具有不同的起源。通常,大部分的动植物病毒处于强的负选择压力下。本研究中,HCPro基因的dN/dS远小于1,表明SCSMV在此基因上受到强的负选择压力作用,这可能是与其基因功能的稳定性相适应的。核苷酸多样性分布结果与系统发生结果相一致,进一步证明SCSMV HCPro基因具有高度的遗传多样性,而该结果可能与其功能相适应,尽管目前尚不明确SCSMV HCPro的基因功能。
参考文献
[1] Xu D L, Zhou G H, Xie Y J, et al. Complete nucleotide sequence and taxonomy of Sugarcane streak mosaic virus, member of a novel genus in the family Potyviridae[J]. Virus Genes, 2010, 40(3): 432439.
[2] Hema M, Sreenivasulu P, Savithri H S. Taxonomic position of Sugarcane streak mosaic virus in the family Potyviridae [J]. Archives of Virology, 2002, 147(10): 19972007.
[3] Li Wenfeng, He Zhen, Li Shifang, et al. Molecular characterization of a new strain of Sugarcane streak mosaic virus (SCSMV)[J]. Archives of Virology, 2011, 156(11): 21012104.
[4] He Zhen, Li Wenfeng, Yasaka R, et al. Molecular variability of Sugarcane streak mosaic virus in China based on an analysis of the P1 and CP protein coding regions [J]. Archives of Virology, 2014, 159(5): 11491154. [5] He Zhen, Yasaka R, Li Wenfeng, et al. Genetic structure of populations of Sugarcane streak mosaic virus in China: Comparison with the populations in India[J]. Virus Research, 2016, 211: 103116.
[6] GarcíaArenal F, Fraile A, Malpica J M. Variability and genetic structure of plant virus populations [J]. Annual Review of Phytopathology, 2001, 39(1): 157186.
[7] Gibbs A, Ohshima K. Potyviruses and the digital revolution [J]. Annual Review of Phytopathology, 2010, 48(1): 205223.
[8] Viswanathan R, Balamuralikrishnan M, Karuppaiah R. Characterization and genetic diversity of Sugarcane streak mosaic virus causing mosaic in sugarcane [J]. Virus Genes, 2008, 36(3): 553564.
[9] Bagyalakshmi K, Parameswari B, Chinnaraja C, et al. Genetic variability and potential recombination events in the HCPro gene of Sugarcane streak mosaic virus [J]. Archives of Virology, 2012, 157(7): 13711375.
[10]Fellers J P, Seifers D, RybaWhite M, et al. The complete genome sequence of Triticum mosaic virus, a new wheatinfecting virus of the high plains [J]. Archives of Virology, 2009, 154(9): 15111515.
[11]Larkin M A, Blackshields G, Brown N P, et al. Clustal W and Clustal X version 2.0 [J].Bioinformatics,2007,23(21):29472948.
[12]Martin D P, Rybicki E P.RDP: detection of recombination amongst aligned sequences [J]. Bioinformatics, 2000, 16(6): 562563.
[13]Martin D P, Lemey P, Lott M, et al. RDP3: a flexible and fast computer program for analyzing recombination [J]. Bioinformatics, 2010, 26(19): 24622463.
[14]Sawyer SA (1999) GENECONV: a computer package for the statistical detection of gene conversion [M]. Distributed by the author, Department of Mathematics, Washington University in Louis.
[15]Salminen M O, Carr J K, Burke D S, et al. Identification of breakpoints in intergenotypic recombinants of HIV type 1 by bootscanning [J]. AIDS Research and Human Retroviruses, 1995, 11(11): 14231425.
[16]Smith J M. Analyzing the mosaic structure of genes [J]. Journal of Molecular Evolution, 1992, 34(2): 126129.
[17]Posada D, Crandall K A. Evaluation of methods for detecting recombination from DNA sequences: computer simulations [J]. Proceedings of the National Academy of Sciences, USA, 2001, 98(24): 1375713762.
[18]Boni M F, Posada D, Feldman M W. An exact nonparametric method for inferring mosaic structure in sequence triplets [J]. Genetics, 2007, 176(2): 10351047.
[19]Gibbs M J, Armstrong J S, Gibbs A J. Sisterscanning: a Monte Carlo procedure for assessing signals in recombinant sequences [J]. Bioinformatics, 2000, 16(7): 573582. [20]Ohshima K, Yamaguchi Y, Hirota R, et al. Molecular evolution of Turnip mosaic virus: evidence of host adaptation, genetic recombination and geographical spread[J]. Journal of General Virology, 2002, 83(6): 15111521.
[21]Tomitaka Y, Ohshima K. A phylogeographical study of the Turnip mosaic virus population in East Asia reveals an “emergent” lineage in Japan [J].Molecular Ecology,2006,15(14):44374457.
[22]Nguyen H D, Tran H T N, Ohshima K. Genetic variation of the Turnip mosaic virus population of Vietnam: a case study of founder, regional and local influences[J]. Virus Research, 2013, 171(1): 138149.
[23]Guindon S, Dufayard J F, Lefort V, et al. New algorithms and methods to estimate maximumlikelihood phylogenies: assessing the performance of PhyML 3.0[J]. Systems Biology, 2010, 59(3): 307321.
[24]Tamura K, Stecher G, Peterson D, et al. MEGA6: Molecular Evolutionary Genetics Analysis version 6.0[J]. Molecular Biology and Evolution, 2013, 30(12): 27252739.
[25]Huson D H, Bryant D. Application of phylogenetic networks in evolutionary studies [J]. Molecular Biology and Evolution, 2006, 23(2): 254267.
[26]Posada D. jModelTest: phylogenetic model averaging [J]. Molecular Biology and Evolution, 2008, 25(7): 12531256.
[27]Page R D M. Tree view: An application to display phylogenetic trees on personal computers [J]. Bioinformatics, 1996, 12(4): 357358.
[28]Kimura M. A simple method for estimating evolutionary rates of base substitutions through comparative studies of nucleotide sequences [J]. Journal of Molecular Evolution, 1980, 16(2): 111120.
[29]Dayhoff M O, Barker W C, Hunt L T. Establishing homologies in protein sequences [J]. Methods in Enzymology, 1983, 91: 524545.
[30]Pamilo P, Bianchi N O.Evolution of the Zfx and Zfy genes: rates and interdependence between the genes [J]. Molecular Biology and Evolution, 1993, 10(2): 271281.
[31]Librado P, Rozas J. DnaSP v5: a software for comprehensive analysis of DNA polymorphism data [J]. Bioinformatics, 2009, 25(11): 14511452.
[32]Ogawa T, Tomitaka Y, Nakagawa A, et al. Genetic structure of a population of Potato virus Y inducing potato tuber necrotic ringspot disease in Japan; comparison with North American and European populations [J]. Virus Research, 2008, 131(2): 199212.
[33]Wei Taiyun, Yang Jinguang, Liao Fulong, et al. Genetic diversity and population structure of rice stripe virus in China [J]. Journal of General Virology, 2009, 90(4): 10251034.
[34]Yin Xiao, Zheng Fangqiang, Tang Wei, et al. Genetic structure of rice blackstreaked dwarf virus populations in China [J]. Archives of Virology, 2013, 158(12): 25052515.
[35]Zhang Chengling, Gao Rui, Wang Jie, et al. Molecular variability of Tobacco vein banding mosaic virus populations [J]. Virus Research, 2011, 158(1): 188198.
[36]Muhire B M, Varsani A, Martin D P.SDT: a virus classification tool based on pairwise sequence alignment and identity calculation [J]. PLoS ONE, 2014, 9(9): e108277.
[37]高芳鑾, 沈建国, 史凤阳, 等. 中国马铃薯Y病毒的检测鉴定及CP基因的分子变异[J]. 中国农业科学, 2013, 46(15): 31253133.
[38]高芳銮, 沈建国, 史凤阳, 等. 马铃薯Y病毒pipo基因的分子变异及结构特征分析[J]. 遗传, 2013, 35(9): 11251134.
[39]Roossinck M J. Mechanisms of plant virus evolution [J]. Annual Review of Phytopathology, 1997, 35(1): 191209.
(责任编辑:田 喆)