论文部分内容阅读
随着生物芯片和高通量测序等组学技术的快速发展,生命科学领域产生了大量有价值的组学“生物大数据”。有效地整合和分析不同层次的生物大数据用于人类疾病研究是备受关注的重要科学问题。本文利用生物医学大数据,从研究疾病发生发展的分子机制到甄选模式动物这两方面开展了深入探索,研究了鳞状细胞食道癌(ESCC)的致病机理,并搭建了帮助实验生物学家甄选模式动物的生物信息平台。ESCC在中国属于特异高发并且患者术后生存率较差的癌症,因此如何整合现有的生物医学大数据研究ESCC相关的转录标志物,并以此作为突破点深入了解ESCC致病机理是一个值得探索的问题。此外,随着越来越多的模式动物完成了全基因组测序,如何利用这些生物大数据帮助我们选择合适的模式动物研究人类的特定生物学分子机制,也是一个亟需解决的问题。本文首先研究了竞争性内源长非编码lncRNA在ESCC的作用。我们利用lncRNA基因和编码基因的表达谱对ESCC进行了亚型分析,鉴别出两种和患者术后生存期显著相关的ESCC亚型,并提示EGFR基因的表达是潜在的亚型分子标签。同时基于竞争性内源RNA假说,我们构建了不同ESCC亚型的mRNA与lncRNA差异竞争性通信(crosstalk)网络,通过此网络鉴别了ESCC相关的lncRNAs(PVT1,LINC00240等),并结合亚型特征阐述它们与致癌基因(PTTG1,KLF3)竞争性丢失是与ESCC发生发展的相关事件。最后我们还挖掘了lncRNA与mRNA竞争性通信的协同作用模块,揭示多个竞争性内源lncRNAs协同作用以维持神经发育、细胞分裂等相关功能,并且它们的调控异常可能和ESCC发生发展相关。本文还搭建了帮助实验生物学家甄选模式动物的生物信息平台—SysFinder,它是以研究人类的生物学分子机制主题为导向,用于模式动物选择、模式动物与人差异比较和辅助新动物模型开发的网络服务平台。SysFinder平台所提供的四大功能模块包括:(1)基于不同尺度的系统相似性,搜索适合研究人类相关特定主题的模式动物(2)在特定研究主题下比较模式动物和人编码基因的同源性及特异性(3)为用户提供便捷的导向RNA(sgRNA)以及同源重组序列设计,方便用户利用基因组编辑系统(CRISPR-Cas9),引入临床或功能相关的基因型进而开发新的动物模型(4)针对已有的模式动物查看合适的生物学研究主题。最后案例分析进一步证明了SysFinder的实用性和有效性。总之,本文深入研究了竞争性内源lncRNA在不同ESCC亚型中的作用,为探索ESCC致病机理提供了新思路。此外,本课题还建立了SysFinder平台,它是集模式动物选择、模式动物与人差异比较和辅助新动物模型开发为一体的网络服务平台,为模式动物服务人类相关研究提供了新方法。