论文部分内容阅读
瘤背石磺(Onchidium reevesii)是生活于滩涂湿地的半咸水两栖性生物是一种具有很高的食用和药用价值的贝类[1,2]。其生活分布区域常见淡水与海水交汇处的高潮带,其温度适应能力十分强、分布范围广阔、野生资源量非常丰富,江苏盐城,上海崇明、浙江温州、福建福安等地一直以来均有销售,被认为是有助治料风湿病、哮喘病,产后大补身体的很有特色的水产品。从形态角度观察瘤背石磺并未进化出完整的心血管系统,仅在皮肤组织内部存有少量的血窦,使其通过皮肤呼吸来获取氧气的能力不足,因而瘤背石磺进化出“肺囊”来作为身体获取氧气的主要器官。行为学上,瘤背石磺也表现出长期且精确的“归家行为”,高潮期生活在巢穴、洞穴和岩缝中,低潮时段出来摄取暴露在潮间带滩涂泥土表面物上的腐殖质和藻类等食物,从不同巢穴中出来的石磺在潮水再次涨起来1小时前能同时回家,推测可能是因为其内在的位置记忆能力,体现出此过程的高度精确性和复杂性,分析可能由外部环境授时因子(光线强弱、海风大小、湿度变化和潮水声浪等)或者生物体内节律性分子机制的精确运转等因素的相互影响该归巢行为的产生。本研究旨在构建第一个瘤背石磺全长转录组数据,以及利用RNAseq技术筛选出与瘤背石磺归巢行为相关联的生物节律性和环境感知性的基因,期望为瘤背石磺高通量测序以及生物潮汐节律性研究提供参考。主要研究内容如下:1. 瘤背石磺神经环组织的全长转录本测序和RNAseq二代数据利用RNAseq二代转录组数据对Pac Bio三代测序结果进行纠错和去冗余之后,获得的全长转录组数据大小为346,560,411 bp,共有144,372个转录本,预测得到43,283个序列的开放阅读框(Open reading frame,ORF),以及分析预计有3,665个转录翻译蛋白属于分泌性蛋白,平均序列长度为2,400 bp,序列最长的可达到12,779 bp,序列最短的仅为367 bp,序列的中位数长度和N50长度分别为2,322 bp和2,719 bp。全长转录本序列的注释结果中显示,未能注释到的转录本数高达89,446条,占全部转录本的61.96%。而在各数据库中注释得到的结果中,占优势数量的转录本是参与到细胞过程、新陈代谢过程以及信号转导通路中。利用NGS测序技术,选取在不同潮汐时间段的瘤背石磺作为研究对象,构建测序文库,使用已获得的全长转录本数据作为参考转录组进行Map分析。经过差异表达分析可知,退潮期(A)与低潮期(B)的转录本比较显示,共有3,986个转录本有显著差异,其中上调转录本为2,145个,下调转录本为1,841个。而退潮期(A)与涨潮期(C)的转录本比较,共有3,538个转录本有显著差异,其中上调转录本为1,114个,下调转录本为2,424个。而低潮期(B)与涨潮期(C)的转录本比较,共有4,261个转录本有显著差异,其中上调转录本为1,230个,下调转录本为3,031个。将差异基因进行富集分析可知,富集到与信号转导有关的通路差异表达转录本基因在数量上是占优势的。作为瘤背石磺处理分析外界环境信号的中枢,在信号转导通路中转录本表达差异最多也符合一般认知。2. 节律性基因在潮汐感知过程中的功能分析节律性基因Period和Timeless是周期性振荡表达的基因,且其振荡周期大约是24小时,而每天的潮汐节律大概为24.8小时(两次潮),也接近于24小时。利用荧光定量PCR技术,分析在不同潮汐时刻节律性基因的表达变化。从瘤背石磺神经环组织中克隆得到了Or TIM1和Or TIM2的转录本序列。Or TIM1和Or TIM2基因的全长转录本序列长度为2,781 bp和4,995 bp。其中Or TIM1序列分析显示,其ORF框长度为1,431 bp,编码476个氨基酸残基形成多肽链,该转录本所编码的多肽链的相对分子质量为53.426 KDa,该多肽链的理论酸碱平衡等电点为4.70,氨基酸链中占比最高的氨基酸为亮氨酸(Leu,11.6%)和丝氨酸(Ser,11.6%)。其中Or TIM2序列分析显示,其ORF框长度为1,662 bp,编码554个氨基酸残基形成多肽链,该转录本所编码的多肽链的相对分子量为62.888 KDa,该多肽链的理论酸碱平衡等电点为5.14,氨基酸链中占比最高的氨基酸为亮氨酸(Leu,12.3%)。在高级结构预测中,Or TIM1和Or TIM2的氨基酸序列中都存在着TIMless超家族结构域,且与光滑双脐螺的亲缘进化关系更为接近。在对Or TIM1、Or TIM2和Or PER2基因在瘤背石磺神经环组织不同潮汐时刻下的表达量分析可知,三个基因的相对表达量变化趋势是大致相似的。在24小时内的两个潮水涨落过程中,既有表达量上升的时间段,也有表达量相对稳定时间,而且相对表达量趋势稳定的时间多位于取样时间为白昼的时刻。其中,比较明显的是,Or TIM1、Or TIM2和Or PER2三个基因在夜晚的表达量相比于白昼是较多的。推测所选的三个节律性基因的周期性振荡表达与昼夜节律的相关性更强。3. 低氧诱导通路在潮汐过程的表达分析当瘤背石磺从被潮水淹没状态出来后,其生物体细胞内的氧气含量应该是比较低的。本部分内容成功从瘤背石磺的神经环组织中克隆得到了Or HIF1?和ORFIH1两个基因的转录本序列。通过生物信息学分析可知,Or HIF1?和Or FIH1基因的全长转录本序列长度为4,980 bp和2,988 bp。其中Or HIF1?序列分析显示,其ORF框长度为1,827 bp,编码609个氨基酸残基形成一条多肽链,该转录本所编码的多肽链的相对分子质量为67.651 KDa,该多肽链的理论酸碱平衡等电点为5.97,氨基酸链中占比最高的氨基酸为亮氨酸(Leu,9.5%)和脯氨酸(Pro,8.7%)。其中Or FIH1序列分析显示,其ORF框长度为471 bp,编码157个氨基酸残基构成多肽链,该转录本所编码的多肽链的相对分子质量为17.813 KDa,该多肽链的理论酸碱平衡等电点为8.74,氨基酸链中占比最高的氨基酸为赖氨酸(Lys,10.2%)。在高级结构预测中发现Or HIF1?基因翻译的氨基酸链中有一个典型PAS结构域。进化树图形结果显示,两基因与同为腹足纲生物的光滑双脐螺和加州海兔的亲缘关系非常接近。Or HIF1?基因的表达趋势在14个潮汐涨落周期中是大致相似的,一般为在退潮期的时候表达量比低潮期和涨潮期相对较高。与此相对应的是,Or FIH1基因的表达趋势反而是在退潮期表达量最低。但是在5月20日21:20分时间点的取样规律却显示异常,两基因在该时间段表达量都很高。虽然以此假定瘤背石磺能及时归巢与体内的溶氧状态充足所致使的依然缺少足够的数据支持,但是可以为今后探讨瘤背石磺在潮间带滩涂区域适应性进化提供基础数据。4. 低频感知类基因在不同声波频率刺激下的表达分析集中探讨低频感知类基因在瘤背石磺感知低频声波中是否发挥着作用。通过克隆得到的Or PLC和Or CALMβ基因的全长转录本序列长度为2,578 bp和1,903 bp。其中Or PLC序列分析显示,其ORF框长度为1,881 bp,编码627个氨基酸残基构成一条多肽链,该转录本所编码的多肽链的相对分子质量为71.473 KDa,该多肽链的理论酸碱平衡等电点为6.52,氨基酸链中占比最高的氨基酸为丝氨酸(Ser,9.4%)和亮氨酸(Leu,9.1%)。其中Or CALMβ序列分析显示,其ORF框长度为501 bp,编码167个氨基酸残基形成一多肽链,该转录本所编码的多肽链的相对分子质量为18.972 KDa,该多肽链的理论酸碱平衡等电点为4.59,氨基酸链中占比最高的氨基酸为谷氨酸(Glu,12%)和天冬氨酸(Asp,10.2%)。在高级结构预测中,Or PLC蛋白链中分别拥有磷脂酶C典型的PH和EF hand结构域,而在Or CALMβ中则存在有FRQ结构域。两基因的进化关系上是与加州海兔更为接近。从对磷脂酶C的定量分析图中可以看出,通过与对照组进行相比较,可知在刺激声波频率为10Hz到70HZ的时候,Or PLC基因的表达量基本是稳定的,而当频率提升到100Hz-160Hz时,可以看出Or PLC基因表达的活性是被降低的。而在声波频率达到220Hz和280Hz时,Or PLC基因是属于高表达的状态。而在Or CALMβ的表达分析图中可知,在对照组的24小时的取样时间内,Or CALMβ的表达是有差异的,当声波刺激频率是40-70Hz时,Or CALMβ的表达趋势非常平稳。同Or PLC基因相似,在100Hz-160Hz时Or CALMβ的表达时呈现下降趋势,当声波刺激频率提升到220Hz时,Or CALMβ的表达在0.5 h有一个陡然升高的阶段。定量分析结果是支持瘤背石磺可以感知到空气中声波刺激,为今后进一步确认瘤背石磺等潮间带生物的适应性进化提供基础数据。