论文部分内容阅读
作为表观遗传修饰的一个基本的组成部分,DNA甲基化在维持正常细胞功能、细胞分化与增殖、遗传印记、生物体老化、胚胎发育以及人类肿瘤的发生中起着重要作用,是目前新的研究热点之一。其中,DNA甲基化通过减弱转录因子在基因启动子区域结合是其参与基因表达调控的一个重要的途径。在DNA甲基化状态确定后,多种效应分子特异的读取修饰信息,并对基因的转录进行调控。虽然已经有很多实验测量了高分辨率的全基因组的DNA甲基化水平,但对不同的甲基化水平对转录因子结合的影响如何仍然知之甚少。因此,本文提出了一种方法来定量地研究DNA甲基化水平达到怎样的程度能够有效地降低甚至阻止某些转录因子的结合,从而对后续的基因表达进行调控。作为生物信息学的一个热点,转录因子结合位点的识别可用于对基因转录调控机制进行研究。本文首先基于EM算法对转录因子结合模体进行识别,并将识别的模体应用于基因启动子转录因子结合位点的分析中。EM算法作为一种参数估计方法,其核心思想是根据已知信息迭代计算一个似然函数,并使之收敛于某个最优值,从而对缺失数据进行推算。随后,本文提出一种定量的研究方法建立一个模型来描述转录因子结合位点处DNA甲基化和转录因子结合能力之间的关系。通过对转录因子结合状态和基因表达之间的相关性分析可以使模型的参数达到最优。根据所生成的模型,即可分析转录因子是否受到DNA甲基化的影响并具有调控基因表达的功能活性。在SH-SY5Y神经母细胞瘤细胞中,本方法成功找到了11个功能活性突出的转录因子。与基因调控元件的静态调控方式相比,表观遗传修饰能够动态地改变以对来自物理,生物和社会的外部环境信号做出快速的反应,因此,本文设计的方法能够对转录因子的功能活性进行动态的评估。运用本文的方法推导出的信息,还可以预测在启动子区转录因子结合的状态,从而进一步地分析一个特定的基因是如何被以特定的模式组织在一起的多个转录因子调控的。这对于诊断和治疗各种疾病,尤其是对于攻克各种癌症是非常有帮助的。虽然本方法仅仅考虑了DNA甲基化的影响,但其具有很大的潜力应用于其他的表观遗传修饰因素,例如组蛋白修饰。