论文部分内容阅读
马尾松(Pinus massoniana Lamb.)是我国主要产脂树种之一,近些年来由于其森林面积和产脂树木的减少,导致松脂产量降低;采用经典的轮回育种策略对马尾松高产脂进行遗传改良所需周期较长,短时间内难以满足市场对马尾松高产脂良种的需求。运用基因组关联分析方法,通过筛选出与产脂性状显著关联的分子标记,开展分子标记辅助选择研究,对马尾松高产脂良种快速选育,缩短育种周期具有重要意义。而对于显著性关联标记所在基因序列进行深度挖掘,是发现控制目标性状重要基因的有效途径,对于深层次探究并最终揭示马尾松产脂量性状遗传调控机理具有重要意义。本研究基于马尾松产脂性状候选基因组关联分析和简化基因组关联分析研究所得到的3个显著性关联分子标记(1个SSR标记和2个SNP标记),开展相关基因序列深度挖掘工作。研究的主要内容包括:(1)基于高通量转录组测序结果对SSR-PCZ90标记所在基因序列进行追溯,并通过生物信息学软件分析SSR-PCZ90标记所在的mRNA序列,包括同源序列比对、蛋白结构(包括一级、二级和三级结构)和功能基因的预测;(2)基于通过简化基因组测序获得的SNP-M181697、SNP-M249970两个标记的序列片段,对2个SNP位点所在序列进行延长扩增,获得更多的序列信息为最终获得2个标记相关基因奠定基础。主要研究结果如下:(1)SSR-PCZ90标记的2代测序原始序列与油松、日本落叶松、白云杉和火炬松的TCHQD型谷胱甘肽S-转移酶(GST)同源性最高(90.95%以上),覆盖率各不相同。其序列长1636bp,可编码264个氨基酸;其分子质量为30910.65 Da,理论等电点为9.27,带弱正电荷,不稳定易分解,其第65位苏氨酸的亲水性最强,第153位亮氨酸的疏水性最强,在183-200位氨基酸之间存在两种跨膜螺旋结构,不存在信号肽和卷曲螺旋结构,含有21个磷酸化位点,主要分布于细胞质中。二级结构含有157个α-螺旋、13个β-转角、26个延伸链和68个无规则卷曲。三级结构含有谷胱甘肽S-转移酶家族的N端结构域和C端结构域。SSR-PCZ90标记的3代测序相关序列与油松、日本落叶松、白云杉和火炬松的TCHQD型谷胱甘肽S-转移酶(GST)同源性最高(91.52%以上),覆盖率各不相同。其序列长1222bp,可编码183个氨基酸;其分子质量为21429.71 Da,理论等电点为9.45,带弱正电荷,不稳定易分解,其第117位异亮氨酸的亲水性最强,第72位亮氨酸的疏水性最强,在100-120位氨基酸之间存在两种跨膜螺旋结构,不存在信号肽和卷曲螺旋结构,含有18个磷酸化位点,主要分布于细胞质中。二级结构含有122个α-螺旋、12个β-转角、12个延伸链和37个无规则卷曲。三级结构含有谷胱甘肽S-转移酶家族的C端结构域。通过GST的基本特征,推测其参与细胞免疫防御过程,在响应外界表达时使萜类代谢产物增加;或与之连锁的参与萜类代谢的基因,在其高度表达时因连锁关系,使萜类代谢产物增加。磷酸化位点含量高,推测其可能携带磷酸基团提供机体所需的能量。(2)对SNP位点M181697、M249970所在序列进行挖掘,扩增得到两个位点所在SLAF标签的中间未知序列,分别长127bp、178bp。进而通过染色体步移继续挖掘,因马尾松基因组庞大且高度重复序列比例高,引物结合位点错配率较高无法继续深入挖掘。有待通过全基因组测序等研究获得更多基因组信息后再继续深入研究2个SNP位点相关基因。