长非编码RNA的计算分析方法研究及其在生物医学中的应用

来源 :中国科学院大学 | 被引量 : 0次 | 上传用户:li21104
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
近些年,对基因组中“暗物质”的研究已成为生命科学及临床基础医学研究中的热点问题。2010年,《科学》杂志将基因组中的“暗物质”列为十大科学突破之榜首。2012年,“垃圾DNA”才是掌控者这一结论被《时代》杂志列为年度十大医学突破。伴随着ENCODE计划第二阶段成果的发布,大量由基因组非编码区域所转录出来的非编码基因被揭示,其中对于长非编码RNA的大规模鉴定是该计划最重要的核心成果之一。高通量测序技术在近些年所取得的迅猛发展,使能够较为容易的获得大量生命组学的数据,这对于长非编码RNA的研究也带来了一个前所未有的机遇。目前,对基因组信息的认知只有1%左右,作为基因组中的“暗物质”,对长非编码RNA的认知也才刚刚起步。然而,在如此庞大及复杂的生命组学数据面前,“计算分析与解读”成为了摆在当前的迫切问题,也成为了迈向精准医学时代的“瓶颈”问题。  目前,虽然大量研究已证实长非编码RNA潜在的数量非常之多,然而其功能及调控机制层面的研究还很少。究其原因,一方面是由于缺少高效的长非编码RNA生物学实验研究手段,另一方面,关于长非编码RNA的先验知识较为匮乏,开展生物学实验往往无从下手。因此,基于生物信息学方法,开发长非编码RNA的分析工具,进而揭示其潜在的功能及调控机制,这将对下游的实验研究具有重要的意义和指导价值。  长非编码RNA作为一类不编码蛋白、仅在RNA水平发挥作用的分子,其主要在转录及转录后两个层面进行调控。当前的研究大都集中在转录层面,例如长非编码RNA的鉴定以及表达等,针对这些问题所开发的软件及计算方法也相继出现。然而,对于非生物信息背景的下游生物学实验工作者来说,将这些软件、计算方法进行整合分析是件异常困难的挑战。  目前该领域存在的问题主要包括以下几点:  (1)在方法学层面:尚无一套可供非生物信息背景的研究人员使用,且高效、便捷的长非编码RNA一站式生物信息分析系统。  (2)在生物学层面:由于缺少有效的长非编码RNA分析筛选工具,导致对于长非编码RNA的生物学机制研究困难重重。  (3)在临床基础研究层面:虽然已有大量研究证实RNA编辑在生命调控过程中具有重要的作用,且对于一些重大疾病的发生扮演着关键角色,然而关于长非编码RNA的编辑事件以及其所引发疾病的机制研究却鲜有报道。  基于此,本课题的开展一方面在为下游生物学实验人员提供长非编码RNA一站式系统分析工具的同时,也将对长非编码RNA在转录及转录后层面所发生的事件及意义进行研究。本课题主要包括以下主要研究内容及创新之处:  (1)本课题首次搭建了集长非编码RNA基因鉴定、功能注释的一站式计算分析体系,实现了方法学层面的创新。该体系为非生物信息背景的生物学实验和临床基础研究的人员提供了便捷、高效的挖掘长非编码RNA的工具。  (2)基于上述计算分析体系,通过对芯片数据和转录组高通量测序数据的分析,成功鉴定了与代谢相关的长非编码RNA以及与其参与调控的蛋白,并以此为线索指导下游生物学实验的顺利完成。  (3)基于该体系,通过对九个物种的多组织样本的转录组高通测序数据进行分析,在每个物种分别获得了数千至数万条长非编码RNA的集合,其绝大多数均为本研究首次发现,并基于计算手段对长非编码RNA在物种间保守性进行了创新性的研究。  (4)在长非编码RNA计算分析体系的基础上,本研究整合了全基因组重测序数据分析流程,建立了转录后层面的RNA编辑事件的鉴定方法。并以癌症发生及发展的过程为线索,以及癌症发展不同阶段的poly(A)+以及poly(A)-RNA测序数据为基础,在鉴定大量长非编码RNA编辑事件的同时,对RNA编辑位点在癌症不同阶段的特异性、其所影响的基因以及microRNA调控等方面进行了系统分析,并对其在癌症调控中的潜在机制进行了相关探索,得到了基础临床研究层面的创新成果。  据所知,该部分成果是首次对癌症发生与发展过程中的RNA编辑事件进行的计算分析研究,这将为下游癌症转录后调控机制的生物学实验以及临床基础研究提供重要的指导和数据支持。
其他文献
分布式拒绝服务(DDoS)攻击具有攻击目标十分广泛、攻击方法样式很多、容易发起等特点,严重威胁网络安全。因此,针对分布式拒绝服务(DDoS)攻击的检测十分重要。  DDoS攻击现有
随着信息技术的飞速发展和企业信息化水平的不断提高,邮政企业内部积累了越来越多的数据。如何充分利用这些大量的数据并发现有价值的信息,为决策者提供重要的决策信息,已经成为
图像中存在的文字,为图像数据的索引与搜索提供许多的信息。如果这些文字能够被正确的定位、分割、识别,就能为基于语义的场景识别提供重要的依据。本文首先对近几年来国外的重
在面向服务的计算环境下,分布在Internet上的各类资源都可以封装成Web服务的形式,并以统一的接口规范对外发布。通过把这些相对简单且功能单一的Web服务按照特定的过程组合起来
椭圆曲线密码系统的安全性建立在椭圆曲线离散对数问题的难解性上。同其它公钥密码系统相比,它的执行速度快、密钥长度短、安全性高。移动通信迅速发展的今天,椭圆曲线密码有着
中国的网络教育随着计算机的应用与互联网的普及得到迅速发展,但目前比较流行的网上教育一般以知识呈现方式表现,是传统的以“教”为中心的教学模式。这种模式不利于全面发展学
近年来,随着智能设备尤其是穿戴设备的快速发展,基于智能设备的人体动作识别研究越来越成为当前研究的热点。基于智能设备的人体动作识别技术广泛应用在健康监控、惯性导航、行
窃听者在一定范围内通过天线接收到空间辐射的计算机视频信号,可以对计算机显示的明文信息进行还原,从而窃取涉密信息。这种情报获取方式更及时、准确、广泛、连续,使涉密信息的
学位
随着网络全球化的热潮和移动计算技术的发展,信息和系统安全成为日益严重的问题。访问控制是信息安全领域中的一个基础性的核心组成部分。基于角色的访问控制(RBAC)是目前主流
Web服务是部署在Web上的软件构件。互操作性是Web服务最值得称道的亮点,基于任何平台/编程语言的应用都可以采用标准的Imernet技术和协议方便的访问Web服务。它解决了以往分布