基因转录调控网络构建与分析的研究

来源 :中国科学院计算技术研究所 | 被引量 : 0次 | 上传用户:kcb2639
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
传统的分子生物学着重于研究单个基因的功能。但是,生物体是一个复杂的系统,基因彼此相互作用形成网络。基因网络的功能并不简单的是单个基因功能之和。因此,在后基因时代,功能基因组的目标之一是从试验数据中挖掘基因网络,并分析其隐含的生物规律。   基因调控是理解基因功能的重要过程。本文的工作着重在于研究酵母的转录调控网络。本文提出了从表达谱数据以及ChIP-on-chip试验数据中推导可靠的转录调控关系的新方法,并将协作网络的概念引入到转录调控网络的分析当中。   首先,在第3章,提出了一种从表达谱数据中推导基因调控网路的新算法。在以前的研究中,为了减小推导过程数据维数过少的问题,许多方法集成了不同数据源的表达谱数据用于反推基因调控网络。但是在不同的试验条件下,基因之间的相关性并不一定是稳定不变的。因此,集成不同数据源推导的基因调控关系,并不一定能准确的反映在特定试验条件下基因的关系。然而,仍有可能在某些试验条件下部分基因调控关系形成的子网的结构是相对保持稳定的(我们称之为“一致结构子网”),从这些子网中能推导更加准确可靠的调控关系。   本文提出了一种基于秩序统计量和min-hashing& locality-sensitive hashing的高效可扩展的算法,用于从集成的表达谱数据中寻找一致结构子网。结果显示在我们找到的一致结构子网中,边的权重相对随机背景更强,并且在一个子网内基因之间相关性比较紧密。对一致结构子网的生物意义分析显示,大部分一致结构子网都功能相关或者是转录调控模块。并且,这些有意义的基因关系很多是传统方法所不能发现的。因此,一致结构子网方法是传统挖掘多表达谱数据功能模块方法的一个很好的补充。   在第4章,结合表达谱数据和基因的GO注释,评价从ChIP-on-chip试验中得到的基因调控关系的可靠性。使用ChIP-on-chip试验技术,通过全基因组规模的定位转录因子在DNA双链的绑定位置,可以获得大规模的基因转录调控关系。但是,当转录因子的绑定位点位于两个相反转录基因之间的公共promoter区域时,很难判断转录因子到底会调控哪一个基因。通常在这种情况下,由ChIP-on-chip试验注释的转录调控网络会将这两个基因都分配给该转录因子,因此带来不可避免的假阳性数据,从而给后续的网路分析带来误差。   本文使用了一种新的方法,通过计算表达谱的二次相关性,并结合基因的GO注释信息,来评价上述情况下,哪些基因更倾向于被转录因子调控,而哪些基因不倾向于被调控。使用文献已确认的调控关系来验证该方法的结果,发现大部分调控关系符合方法的预测。进一步分析发现,转录因子的绑定位点倾向于离可能调控的基因更近。最后,分析了由注释带来的假阳性调控关系对转录调控网络拓扑结构motif的影响,发现假阳性边通常仅影响调控网络的细节结构,而对网络主体框架影响不大,从而说明了调控网络的鲁棒性。   在第5章,在转录调控网络的分析中引入了一个新的概念——协作网。协作网通常被用于分析反映人际关系的社会网络。笔者将相似的概念用于转录调控网络,基于共享的转录因子建立了被调控基因的协作网,同样的,基于共享的调控基因建立了转录因子的协作网。   对被调控基因协作网聚类后发现,大部分类都显著的共享相同的GO注释。并且,具有一些GO注释的基因更倾向于调控机制相似。此外,应用在二部图分析中“孤立点”的概念到协作网的分析中,发现了“孤立点”和essential基因的关联。这个结果指出了,在调控网络的拓扑结构中,隐含了基因重要性的信息,而协作网的方法,是对其他调控网络分析方法的一个有意义的补充。
其他文献
数据库作为一个已经发展了几十年的相对成熟的领域,衍化的诸多产品比如IBM DB2,Oracle DB,Microsoft SQL Server已经成为了当前诸多的信息系统的重要组成部分。但是,由于数据库其
随着计算机技术和信息技术的不断成熟,人才需求的变化使得远程教育蓬勃发展,在线考试作为远程教育的考核和评估手段应运而生。它能解决传统基于纸和笔的考试存在的许多弊端,可以
随着光学遥感技术的发展,基于光学遥感图像的目标检测和识别技术一直是遥感图像处理领域的研究热点。舰船目标是重要的海上目标,光学遥感图像中舰船目标检测具有重要的民事和军
半监督学习是机器学习中的重要研究领域,一直为国际机器学习界所广泛关注,近几年来随着机器学习在数据分析和数据挖掘中的广泛应用,半监督学习的理论研究成果已经部分应用于实际
学位
随着信息网络化和经济全球化的发展,电子政务已逐渐成为当代信息化领域中重要的一环。尤其近几年我国各级政府通过建立门户网站、完善政府服务职能等工作,不同程度地推动了电子
无线传感器网络(wireless sensor network,简称WSN)是一种新型的无基础设施的无线网络,能够协作地实时监测、感知和采集各种环境或监测对象的信息,并对其进行处理,通过无线通信方
随着视频会议,远程医疗等基于多媒体数据传输,有较高的的QoS需求网络应用服务的迅速发展,当今互联网对于稳定高效的QoS路由协议的需求也日益增长。QoS路由选择是QoS路由协议的主
入侵检测系统是网络安全研究的一个热点,它能够动态监视网络的流量,发现非法的入侵行为,实时关闭非法的连接,是网络安全产品的基础和核心。   蜜罐是一种新兴的主动防御的网络
学位
云计算和Web2.0应用对分布式存储系统提出了如下性能要求:极高的聚合读写带宽,庞大的名字空间管理能力以及均衡的数据读写负载。然而现有分布式文件系统存在诸多设计和实现上
随着微电子技术、通信技术以及移动应用的发展,智能移动设备近年来得到前所未有的高速发展,已经成为用户随身携带的必需品而成为日常生活中不可或缺的一部分。为了取得功能和新