论文部分内容阅读
柴胡为伞形科植物柴胡Bupleurum chinenum DC.或狭叶柴胡Bwupleurum scorzonerifolium Willd.的干燥根。在中国,柴胡是一味有名的中药材,而且有着两千多年的用药历史。柴胡性味苦凉,有疏散退热、疏肝解郁、升举阳气之功效,常用于感冒发热、头痛目眩、寒热往来等症。在全中国各个省份都有柴胡的分布,根据历史统计资料记载,柴胡属植物在我国共有42种、17变种、7变型,而且柴胡属大部分植物自古以来已有药用的情况,各个地区也按其所产品种和历史使用习惯而在民间入药或者自产自销,其中包括具有毒性的大叶柴胡B.longiradiatum和含柴胡皂甙极其少的小柴胡B.hamiltonii等;在一些省份中,因为把当地所产的多种柴胡混合在一起使用,不仅致使市场上柴胡的品种混乱,药材的质量很不稳定,甚至造成致人死命的情形,这样严重影响了我国柴胡在国际市场上的声誉。因此,对柴胡进行鉴定到了刻不容缓的地步。在临床治疗上,中药经常被应用到诊治疾病上;而且中药材种类繁多,品种各异。即使药材的形状相异不大,但是它的治疗效果却会很不一样。一方面,来源同一物种的不同中药材也会受到当地种植的环境、气候因素的影响而呈现出不同的疗效;另一方面,在不同的使用条件和处理方式下,药材也会有不一样的治疗效果。因此,正是中药材的管理和分辨的复杂性的不确定因素,给市场上的假冒伪劣创造了条件,致使一部分劣质中药流入了市场。随着科学技术的飞快发展,经典的来源、性状、理化性质鉴定方法并不能满足中药真伪、优劣鉴别的需要;如对动物药材、道地药材、加工炮制的药材以及中药复方制剂组方就更是如此了。最近,随着生物技术的快速发展,中药材的鉴定方法也有了飞快的进步。DNA条形码技术不仅可以克服传统鉴别方法的一些困难,还可以对现有的分子标记技术进行弥补,使得DNA分子标记方法更加完善。DNA条形码技术通过标准化的小片段DNA序列对物种进行快速、准确、简便的鉴定分析。DNA条形码的基本操作过程主要为:引物设计,DNA提取,PCR扩增、PCR产物的纯化、测序以及进行序列分析。DNA条形码技术既可以弥补传统物种鉴定的缺点,也可以使标本鉴定过程更便捷和规范化。目前,单一的序列或者序列组合并不能很准确地对物种进行鉴别。叶绿体基因组序列保守性很高,平均长度为110-160kb,远远超过DNA条形码300-700bp的长度。因为叶绿体基因组包含着丰富的物种进化信息,所以能够体现足够的种间差异。因此,本实验拟基于叶绿体全基因组序列,对柴胡属药用植物进行高通量测序,探讨柴胡属的系统发育基因组学。本课题从全国各个省份收集了柴胡属药材的19个物种,51份样品。对条形码四个候选序列psbA-tmH,matk,rbcL,ITS2进行PCR扩增、测序和序列分析,利用综合扩增效率、测序成功率、barcoding gap和鉴定成功率四个指标来评价DNA条形码四个候选序列在柴胡属药用植物及其伪品当中的鉴别能力;提取北柴胡及狭叶柴胡叶绿体基因组DNA并纯化,运用高通量测序技术进行测序和拼接后,得到完整的叶绿体全基因组序列,并对其进行注释,获得了叶绿体基因组物理图谱,为柴胡属药用植物进行系统发育基因组学研究提供参考。一、柴胡DNA条形码鉴定方法的建立1、目的本研究对psbA-tmH、matk、rbcL、ITS2四个DNA条形码候选序列通过综合扩增效率、测序成功率、barcoding gap和鉴定成功率四个指标来评价对柴胡属及其伪品的鉴定能力。2、方法2.1样本收集柴胡属实验材料含有以下种:线叶柴胡、川滇柴胡、北柴胡、、三岛柴胡、多伞北柴胡、百花山柴胡、百花山柴胡、烟台柴胡、小柴胡、秦岭柴胡、大叶柴胡、南方大叶柴胡、马尔康柴胡、竹叶柴胡、窄竹叶柴胡、细茎有柄柴胡、多枝柴胡、红柴胡、四川柴胡、黑柴胡、小叶黑柴胡、银州柴胡,共19个物种(含4个变种,1个变型),51份样品(采集时间从2008年到2015年)采自云南、河北、陕西、甘肃等地方,经上海复旦大学药学院潘胜利教授鉴定,凭证标本保存于南方医科大学中医药学院标本馆。2.2特异性引物设计依据引物设计原则,设计柴胡属ITS2片段的特异性引物;rbcL片段、psbA片段、matK片段这三个片段扩增所用的引物均为参考相关文献。2.3 DNA提取用TIANGEN公司新型植物基因组DNA提取试剂盒,按照制造商提供的说明书,提取各样本DNA。2.4 ITS2片段扩增ITS 序列扩增引物:IT2(5’-CGTAG CGAAA TGCGA TACTT GGTG-3’)和ITS4(5’-TCCTCCGCTTATTGATATGC-3’)。PCR 反应体系为 251:DNA 模板 1μ1;正、反引物各 1μ1;2×Taq PlusPCRMasterMix12.5μl;ddH20 9.5μl;PCR反应循环参数:93℃预变性5min,50℃复性2min;93℃变性30s,50℃复性 45s,70℃延伸 45s(30 循环);70℃补齐 5min。实验中设置无DNA模板的空白对照组。2.5 rbcL片段扩增rbcL 序列扩增引物:1F(5’-ATGTC ACCAC AAACA GAAAC-3’)和 724R(5’-TCGCATGTAC CTGCAGTAGC-3’)。PCR 反应体系为 25μa:DNA 模板 1u1;正、反引物各 1μ1;2×Taq PlusPCRMasterMix12.5μl;ddH2O9.5μl;PCR反应循环参数:93℃预变性5min,50℃复性2min;93℃变性30s,50℃复性 45s,70℃延伸 45s(30 循环);70℃补齐 5min。实验中设置无DNA模板的空白对照组。2.6 matK片段扩增matK 序列扩增引物:390F(5’-CGATC TATTC ATTCA ATTTC-3’)和1326R(5’-TCTAGCACACGAAAGTCGAAGT-3’)。PCR 反应体系为 25μ1:DNA模板 1μ1;正、反引物各1,μl;2×Taq Plus PCRMasterMix12.5μl;ddH20 9.5pa;PCR反应循环参数:93℃预变性5min,50℃复性2min;93℃变性30s,50℃复性 45s,70℃延伸 45s(30 循环);70℃补齐 5min。实验中设置无DNA模板的空白对照组。2.7 psbA-tmH片段扩增psbA-tmH 序列扩增引物:trmHF(5’-CGCGC ATGGT GGATT CACAA TGG-3’)和 psbA3’f(5’-GTTAT GCATG AACGT AATGC TC-3’)。PCR 反应体系为 25μ1:DNA 模板 1μ1;正、反引物各 1μ1;2×Taq Plus PCR MasterMix 12.5μ1;ddH20 9.5μ1;PCR反应循环参数:93℃预变性5min,50℃复性2min;93℃变性30s,50℃复性 45s,70℃延伸 45s(30 循环);70℃补齐 5min。实验中设置无DNA模板的空白对照组。2.8四个条形码片段测序利用1.2%琼脂糖凝胶电泳对PCR产物进行检测,若有目标条带,则纯化后交由上海英俊生物工程有限公司完成测序,各个样品均采用正向及反向双向测序。2.9数据分析利用Chromas软件对测序返回来的序列进行拼接。第一,考察4个条形码PCR扩增效率;第二,不同序列种间和种内变异也被进行比较;第三,各序列的扩增和测序效率,然后进行barcoding gap的分析和鉴别能力。最终,考察候选条形码的鉴定成功率,采用的方法是相似性搜索算法(BLASTI)和最近距离法(Nearest Distance)。3、结果3.1、扩增成功率与测序成功率:ITS2和rbcL都为100%,psbA-tmH为96.08%,matK的扩增成功率最低,为66.67%ITS2和rbcL的测序成功率为100%,matK为 94.12%,psbA-tmH 稍低,为 87.76%。3.2、ITS2 片段长 226-227 bp;psbA-tmH 片段长 328-367 bp;rbcL 片段长(923~)932-933 bp;matK 片段长(823~)882-883 bp。3.3、种内种间差异分析:实验数据显示,种内变异最大的是psbA-tmH候选序列,次之是ITS2,然后是matK,最小的是rbcL候选序列。实验数据显示,种间变异最大的是ITS2序列,接着的是psbA-tmH序列,matk序列和rbcL序列种间变异最小。3.4、ITS2候选序列比其它三个DNA候选条形码序列具有较明显的优处,ITS2候选序列在柴胡属中的鉴定成功率为73.68%,与psbA-trnH联用后鉴定能力达到了 83.33%。GenBank数据库里面有记录柴胡的73种173个样品的数据;在物种水平层次,ITS2候选序列可以鉴别出GenBank数据库里面64.13%的柴胡属样品。3.5、通过BLASTI和Nearest Distance方法分析各候选序列的鉴定效率,ITS2候选序列的鉴定效率为73.68%,pabA-tmH候选序列的鉴定效率为72.22%,matK和rbcL候选序列的鉴定效率都低于50%;结果表明ITS2候选序列的鉴定能力最高。二、柴胡属叶绿体基因组研究1、目的利用高通量测序技术,获得北柴胡及狭叶柴胡叶绿体全基因组并进行相关分析;为后期柴胡属药用植物进行系统发育基因组学研究提供参考和数据支持。2、方法2.1样本收集北柴胡、狭叶柴胡。2.2叶绿体基因组提取按“叶绿体基因组提取”的方法提取基因组。2.3高通量测序采用Illumina公司开发的HiSeq 2500高通量测序平台。2.4叶绿体基因组序列拼接把测序公司返回的原始数据,载入Fast QC软件分析整体序列的质量;FastQ文件输入至CLC genomics workbench软件;过滤后的reads基于de Bruijn算法,参数K-mer值从头组装。2.5基因组注释和分析用DOGMA(Dual Organellar Genome Annotator)程序进行叶绿体基因组注释,必要时进行人工调整。构建物理图谱,并进行生物信息学分析。2.6构建系统发育NJ树选取NCBI上已发布的日本三岛柴胡和本研究获得的2个叶绿体基因组序列的注释结果,通过基因比对、切齐、进行建树。3、结果3.1北柴胡叶绿体基因组的拼接结果叶绿体基因组的全长为156763 bp,GC含量37.65%,由4个区组成,包括2个反向重复区(IRA和IRB,26293 bp)、1个小单拷贝区(SSC,17546 bp)和1个大单拷贝区(LSC,86631 bp)。经注释得到127个基因。3.2狭叶柴胡叶绿体基因组的拼接结果叶绿体基因组的全长为156766 bp,GC含量37.65%,由4个区组成,包括2个反向重复区(IRA和IRB,26315 bp)、1个小单拷贝区(SSC,17530 bp)和1个大单拷贝区(LSC,85607bp)。经注释得到127个基因。3.3构建系统发育NJ树所构建的NJ树分析表明,叶绿体基因组序列可以区分出北柴胡、狭叶柴胡和三岛柴胡。三、结论理想的DNA条形码序列应符合以下条件:一是使用单引物对可以扩增出目标条带;二是通过双向测序可以得到高质量的序列;三是要具有显著的种间差异和较小的种内变异。1、在本课题的研究中,虽然rbcL候选序列物种鉴定成功率只有26.32%,但是扩增效率和序列获得率均达到了 100%。实验中用通用引物进行对MatK候选序列进行扩增,扩增出来的是整个matK基因片段。但是其扩增效率只有66.67%,且其物种鉴定效率只有46.15%。因此,rbcL和matK两个片段在物种水平上鉴别柴胡没有优势。2、用自行设计的ITS2引物扩增出来的效果很好,在柴胡属中获得了 100%的PCR扩增率和100%的测序效率。其鉴定结果虽然只有73.68%,但与psbA-tmH候选序列联用后作为ITS2-psbA的复合序列对柴胡属的鉴定成功率达到了 84.21%。3、psbA-tmH候选序列的扩增效率为96.08%,测序成功率为87.76%,其物种的鉴定成功率为72.22%,且其种间变异比较大。4、提取北柴胡及狭叶柴胡的叶绿体基因组DNA并纯化,运用高通量测序技术进行测序和序列拼接后,得到完整的叶绿体全基因组序列;并对其实现成功注释,获得了各自的叶绿体基因组物理图谱。5、北柴胡叶绿体基因组的全长为156763 bp,由4个区组成,包括2个反向重复区(IRA和IRB,26293 bp)、1个小单拷贝区(SSC,17546bp)和1个大单拷贝区(LSC,86631 bp);其叶绿体基因组有127个基因。狭叶柴胡叶绿体基因组的全长为155766 bp,由4个区组成,包括2个反向重复区(IRA和IRB,26315 bp)、1个小单拷贝区(SSC,17530bp)和1个大单拷贝区(LSC,85607bp);其叶绿体基因组有127个基因。6、本文以北柴胡及狭叶柴胡为例,建立了药用植物叶绿体基因组序列获得及数据分析的流程,包括叶绿体基因组提取、测序、拼接与注释及序列分析。在本课题中,综合扩增效率、测序成功率、barcoding gap和鉴定成功率四个指标,发现ITS2候选序列较其他条形码候选序列具有明显的优势。进一步考虑后,排除了 ITS整个序列片段,继续推荐ITS2序列作为鉴定柴胡属药用植物方法的核心序列。柴胡属药用植物叶绿体全基因组的测序和拼接,将为柴胡属药用植物及其外类群的高通量测序提供参考;也为区别和鉴定物种的种下等级奠定了理论基础。