面向转录调控的遗传性因素分析与预测方法研究

来源 :哈尔滨工业大学 | 被引量 : 0次 | 上传用户:gameboy13888
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
高通量生物检测技术的广泛应用带来了分子生物学数据的指数级增长,使得生物数据的融合与生物知识的挖掘成为目前生物信息学面临的重大挑战。以高通量微阵列为例,其能够并行检测数以万计或百万计的基因组位点的生物特征信息,如基因的表达水平、SNPs以及DNA甲基化修饰水平等。  基因是决定性状的主要因素,其表达与否、表达量的高低受到不同遗传性因素的控制,包括SNPs与DNA甲基化修饰等。其中转录调控层面的遗传性因素从源头上控制着基因的表达而显得尤为重要。针对这些遗传性因素的数据融合与知识挖掘能够帮助人类认识自身发育、生长、成熟、衰老等过程的分子机理,甚至能够极大地帮助疾病的诊断与治疗。已有的生物信息学研究不能较好地利用高通量数据或者无法满足分析或预测精度上的要求,因此亟待更为高效的计算分析方法的出现。本文以高通量数据为基础,针对转录调控层面的上述两类遗传性因素设计或发展相应分析与预测方法以研究它们对基因表达的转录调控机制或自身规律。本文的主要内容包括:  (1)设计了面向全基因组关联性分析数据的转录调控SNPs的定量预测模型。  从全基因组关联性分析数据中进一步提取单个SNP与性状的相关性是一个亟待解决的热点问题。在转录调控层面,已有的生物信息学方法只能定性地给出单个SNP在性状中转录调控功能的可能性。本文充分考虑转录因子结合位点与非转录因子结合位点间的序列不相似性,把序列不相似性量化为 SNPs转录调控功能的度量,同时结合转录因子在不同性状中的生物功能差异,设计了性状相关转录调控 SNPs的定量预测模型。该模型在分析疾病相关的突变数据与骨密度的全基因组关联性分析数据中取得了较好的预测结果,证实了模型的正确性。  (2)提出了基于转录因子调控的不同性质DNA甲基化修饰的遗传规律分析方法。  DNA甲基化修饰的遗传规律研究能够帮助认识人类组织分化、发育、衰老等生命过程。转录因子被认为与 DNA甲基化修饰的遗传有关。已有的研究只能判断转录因子是否参与了DNA甲基化的调控而无法针对特定的DNA甲基化修饰给出具体的调控机制。本文从时间序列的微阵列数据出发,利用笛卡尔积定义不同性质的 DNA甲基化修饰(包括持续变高、持续变低、随机变化、保持不变且高甲基化、保持不变且低甲基化共五类),并通过随机抽取方式建立DNA甲基化修饰对照模式,进而构建基于转录因子的DNA甲基化修饰的遗传规律分析方法。该方法在卵巢癌微阵列数据的分析中,揭示了卵巢癌组织DNA甲基化修饰的遗传规律。  (3)论证了DNA甲基化修饰高通量微阵列数据的概率分布,并提出了相应的差异分析模型。  高通量微阵列是研究 DNA甲基化修饰的重要数据来源。针对这类数据的差异分析旨在寻找更有生物学意义的 DNA甲基化修饰位点成为最常见的分析内容。已有的经验贝叶斯分析模型没有回答其概率假设分布的正确性问题,且不考虑探针读取误差因素。本文针对常见的对数正态分布与Gamma分布,设计了相应的考虑不同误差因素的经验贝叶斯分析模型。通过比较不同模型的统计学与生物学性能,本文论证了对数正态分布模型的正确性,同时给出了相应经验贝叶斯模型并通过仿真实验验证了其可用性。  (4)建立了DNA甲基化修饰对转录因子的调控功能的定量预测模型。  DNA甲基化修饰能够通过阻碍转录因子在DNA序列上的结合而影响基因的表达。高通量微阵列数据为定量地分析这种关系提供了条件。已有的研究认为该关系能够用反向 Sigmoid函数模拟,但因无法定量估计函数参数而不能预测其具体调控功能。本文扩展了该模型,同时结合转录因子的基因表达调控模型,通过最优化DNA甲基化修饰对基因表达的调控关系给出了DNA甲基化修饰对转录因子的调控功能的定量预测模型。模型在多类组织之间的预测分析结果表明了该模型的可用性与DNA甲基化修饰调控功能的组织非特异性。
其他文献
手机已经成为绝大多数人日常生活不可分割的一部分,它能提供给人们的服务数不胜数。手机流量数据的统计分析不仅能为手机用户提供更好的用户体验,也能为运营商做出更好的营销
目前,随着国民经济的快速发展,房地产市场交易日趋活跃。信息技术的快速发展,带动了房地产行业的信息化进程。房产门户网站在市场交易中的影响愈来愈深刻,如58同城,21世纪不动产,新
随着半导体技术和嵌入式技术的快速发展,以及Java技术的广泛应用,Java的很多优点使其在嵌入式系统中的应用越来越广泛。但是,Java程序的运行,需要借助Java虚拟机(以下称为JVM),以及
为了清楚的了解人类的遗传机制,以便用于疾病的治疗和预防,对于生物序列的研究成为了研究分析遗传的基础。而最基本的序列研究就是序列比对与序列组装。随着新一代测序技术(N
在短道速滑运动中,体能发挥着极其重要的作用,为了使短道速滑技战术仿真系统能更加真实的模拟虚拟运动员比赛过程中的运动状态,提高仿真系统的实用性,设计一个科学合理的体能模型
嵌入在图像中的文本与图像内容存在着密切的关联关系,这些关系对于理解图像发挥着重要的作用。本文以新闻图像与字幕文本为研究对象,探索图像内容与字幕文本之间的内在联系,提出
近年来,Internet上群组性应用如视频会议、文件共享等越来越多,这些应用大多采用一个节点对多个节点或多个节点对多个节点的通信方式。传统的IP单播技术在这些群组性应用中效率
计算机视觉是当前人工智能领域的研究热点之一,而人类视觉的一个关键作用是对于运动物体的跟踪,现实生活中有大量的信息包含在运动中,所以对于运动物体的跟踪已经成为计算机视觉
随着Internet的迅速普及,互联网及其相关技术得到迅猛发展,互联网用户的规模及网络服务多元化是现今CDN面临的主要挑战。为了节约成本与提供更好的服务质量,与P2P融合的CDN技术
当今云计算SOA的架构模式成为当前企业的首选,这使得Web服务在数量上快速增长,随着用户群数量的不断增加,Web服务需求量也随之膨胀,在庞大的Web服务资源中,如何快速准确地为