人类基因组转录调节模体距离保守性的研究与转录起始位点的预测

来源 :内蒙古大学 | 被引量 : 4次 | 上传用户:woyaoxiazai88
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
对人类基因组转录调节相互作用网络的理解,是现代分子生物学面临的一个直接的挑战。这里的一个中心问题是,如何从近邻物种的启动子的比较,来提取进化信息和搜索进化保守性。通过对人类转录因子结合位点(transcriptionfactor binding site,TFBS)序列中的核苷k联体(k-mer)在人类和小鼠中分布的比较,我们发现一对转录调节7-mer模体(motif)之间的平均距离在人类和小鼠启动子中是保守的。我们称这种保守性为“距离保守性”。这个距离保守性是一种新的进化保守性,不依赖于碱基在基因组序列中的严格定位。利用这种k-mer距离保守性可以发展非联配方法来实现在基因组范围快速地发现转录调节模体。本文中,我们用距离保守性在基因组范围对保守转录调节模体进行搜索,成功率为90%。另外,作为对距离保守性的进一步检验,我们研究了人类组织特异性的转录调节模体对(motif pair),发现在由距离参数构成的2维空间中,对于28个组织,模体对可以显著地区别于其对照。据此,我们由距离参数构成特征向量,采用Fisher判别分析对人类28个组织的顶上140对转录调节模体的最可几对进行了预测。 本文的另一个关于转录调节的相关工作是人类基因组转录起始位点(transcription start sites,TSS)的预测。启动子序列和转录起始位点的精确识别对于解释人类转录调节网络是至关重要的。随着统计理论的发展和机器学习算法在生物信息学预测方面的成功应用,发展新的高效的理论预测模型,在基因组尺度对转录起始位点进行辅助注释,已经成为当今生物信息学发展的主流方向之一。UCSC(University of California Santa Cruz)基因组浏览网站就接受了诸多的基因预测模型,作为基因组尺度的基因辅助注释工具。本文中,我们应用多样性增量结合二次判别分析(Increment of Diversity with Quadratic Discriminant analysis,IDQD)方法对人类基因组转录起始位点进行了预测。在典型的TSS数据集上,正负集数据比为1:58的情形下,我们的预测结果敏感性和阳性预报值均高于65%。使用ROC和PRC评估算法性能,在正负集数据比分别为1:679和1:113的情形下,auROC均高于96%,auPRC分别为26%和64%。对4、21和22号染色体的全基因组搜索,我们预测了单一启动子和可变启动子5’端的第一个TSS,在正负集数据比分别为1:138和1:68的情形下,auROC分别为93%和97%,auPRC分别为40%和65%。以上结果在相同口径下优于最新报道的国外SVM预测精度。我们的结果显示,多样性增量结合二次判别分析(IDQO)方法有能力解决复杂的生物信息学分类问题。 IDQD算法程序即及人类基因组TSS预测的相关数据资料可以在网址http://jichubu.imut.edu.cn/IDQD/idqd.htm找到。 全文共分5章,第一章到第三章主要是讨论距离保守性问题,第四章和第五章讨论IDQD算法以及该算法在人类基因组转录起始位点预测问题中的应用。其中,第一章提出距离保守性概念,第二章应用距离保守性概念提出一个非联配的转录调节模体预测模型,给出距离保守性的第一个检验实例。第三章应用距离保守性概念对人类组织特异性转录调节模体对进行预测,给出距离保守性的第二个检验实例。第四章,详细描述IDQD算法,第五章,应用IDQD算法对人类基因组转录起始位点进行预测。
其他文献
随着经济社会日新月异的发展,传统电视节目已经不能满足广大消费者的要求,利用网络收看高清视频已经成为人们的迫切需求。IPTV可以实现媒体提供者和媒体消费者的实质性互动。
世界海运网作为最古老的交通运输网络,承载着世界各地的货物往来,它的正常运行是世界经济全球化的重要保证。世界航运网是基础设施网络,其相关变动会危及世界经济,如2011年日本发
碳纳米管(CNTs)具有卓越的性能,应用领域十分广泛。制备结构完整、管径均匀、准直的优质碳纳米管,有效去除碳纳米管中的杂质获得高纯的碳纳米管,是发挥碳纳米管良好的特性以及进一步应用研究的基础和前提,是研究领域的热点问题。碳纳米管在聚合物中的定向排列一直也是国内外研究的难点。本文采用自主研制组装的“阳极弧等离子体法制备碳纳米管的实验装置”,通过阳极弧等离子体蒸发内含催化剂(Fe、Co、Ni)的石墨棒
1937年7月7日,日本帝国主义悍然制造卢沟桥事变,将中华民族置于腥风血雨之中。然而在此之前,就有许许多多的共产党人、革命志士对日本帝国主义亡我之心有所警惕,并进行了不屈不挠的斗争。我党早期卓越的政治活动家高君宇就是其中一位杰出的代表。   高君宇早在少年时代,就在同盟会会员的父亲的影响下,在幼小的心灵里播下了反帝爱国的火种。1912年考入山西省立第一中学后,他“目击时艰,痛国沉沦”,对“列强横
随着医学诊断技术的提高以及各种疾病的发展变异,传统的应用医疗设备产生的医学图像已经不用满足临床诊断的要求,医生需要更为直观、立体的图像来观查病灶器官的变化,医学图像的
带电的尘埃粒子广泛存在于宇宙空间、实验室的等离子体装置中和材料等离子体加工等环境中。近年来,人们认识到尘埃粒子是影响半导体集成电路加工质量的关键问题,尘埃与等离子体
本文以一维交变温度场的固体光声效应为理论基础,从声激发和激光激发超声两个方面分析了固体光声效应,并对生物组织(菠菜叶片组织和鸡的肝脏组织)的光声效应进行了实验研究。首