论文部分内容阅读
杨树(Populus)是具有重要经济和生态效益的树种。在林木生物学研究领域,杨树因其基因组较小以及生长迅速等特点被选为木本植物的模式物种。在杨树减数分裂过程中,DNA序列可能产生交换和非交换产物。作为交换产物的基因转换(Gene conversion)事件能改变等位基因频率,这可能导致遗传作图群体中分子标记出现偏分离现象,从而影响遗传作图的效率。在过去的研究中,基因转换由于传统分子标记分辨率低而很难进行研究。如今,二代测序技术允许我们快速廉价地获得大量的SNP标记用于研究基因转换事件。本研究使用二代测序技术对杨树减数分裂过程中的重组事件进行识别,并对基因转换事件与分子标记偏分离的关系进行进一步的探索。实验材料是由美洲黑杨和小叶杨及其杂交F1代中随机选取的10个子代构成。我们对包括两个亲本在内的12个个体进行了全基因组重测序,两个亲本测序深度为50?,共获得62.1 Gb的长为101 bp双端短读序(paired-end reads,PE)数据;子代个体的测序深度为25?,共得到137.69 Gb长为126 bp的PE数据。这些数据经进一步过滤获得高质量的数据后用于识别SNP和单倍型分型。首先使用软件BWA将每个个体的reads比对到毛果杨的参考基因组上,然后使用软件Samtools构建父母本的单倍型块,父本得到了188,942单倍型块,而母本则为216,915个。在父本的单倍型块内只保留分离类型为aa?ab的SNP,而在母本的单倍型块内则只保留分离类型为ab?aa的SNP,经这样筛选后父母本分别保有20,153和41,877个单倍型块,每个单倍型块的SNP数目大于或者等于6。利用已构建的父本和母本的高密度遗传连锁图谱的标记信息将这些单倍型块连接起来后,分别得到了父母本与19条染色体对应的长单倍型,父本的长单倍型包含的SNP数目为7,432个,而母本则为10,164个。子代的所有单倍型则是在识别单倍型块中SNP位点的基因型后推算得到,利用子代与亲本的单倍型比较的方式可以对重组事件进行识别。结果平均每个子代个体中识别出了父本减数分裂中的2,355个基因转换事件,而母本减数分裂中的基因转换事件则为2,771个。使用同样的方法,子代个体中平均识别出父母本的交叉事件数分别为21和18.8个。为了揭示基因转换事件与偏分离标记之间的关系,在父母本中分别识别出了1,088和1,186基因转换区域,每个区域至少在5个F1代个体中被识别出在亲本减数分裂过程中发生过基因转换事件。结合同一个杂交F1代群体中299个个体的RAD测序数据,在这2,274个基因转换区域发现了372个SNP至少在10个子代中具有高质量的基因型,经过卡方检验后发现298(80.1%)个位点出现了显著的偏分离(P<0.05)。研究结果表明,在杨树减数分裂过程中存在着相当数量的基因转换事件,远多于交叉事件出现的数量;遗传作图群体中偏分离分子标记的产生原因可能与基因转换事件有很大的关系。本研究提供了一个使用重测序数据研究林木中减数分裂重组事件的方法,所获结果可为在林木遗传作图中如何处理偏分离标记数据提供理论参考依据。