基于结构数据的转录因子结合位点分析

来源 :东南大学 | 被引量 : 0次 | 上传用户:wsp1983
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
基因是遗传信息的物理和功能单位,基因功能的体现取决于其结构和表达调控状况。基因表达的调控就是把这些基因结构变换成多种多样基因功能的操作者。因此基因表达调控研究对揭示生命的奥秘具有重大意义。mRNA转录起始调控是调控的基本控制点,也是最重要的一环,其实质是转录因子结合相应的调控元件,影响了RNA聚合酶的活性,从而影响了基因的转录水平。针对目前国际上从结构角度研究较少的情况,本文从蛋白-核酸复合物的结构数据出发,分析氨基酸-碱基作用对,探索转录因子结合位点的预测方法。本文从PDB大分子结构数据库中查寻出所有记录的蛋白-核酸复合物。利用复合物作用力计算软件,对这些蛋白-核酸复合物的三维空间结构数据进行处理,得到复合物中可能存在的氨基酸侧链同核酸之间的作用对。然后依据SWISSPROT数据库对蛋白的注释,分成与调控过程相关的复合物集合和与调控无关的复合物集合。我们对蛋白-核酸复合物中的氨基酸侧链同核酸之间的作用对(包括氢键跟非键作用)进行统计分析。通过分析DNA跟转录因子的氨基酸残基作用的局部环境信息,发现一些三联或者五联残基片段总是结合DNA,因此我们提出猜想:在转录相关的蛋白-核酸复合物中,氨基酸残基环境或者碱基环境在一定程度上决定了中央残基或者碱基是否为作用位点。对非冗余的蛋白-核酸复合物数据集进行数据处理,提取结合序列和作用位点信息,用机器学习的方法初步探索了蛋白同核酸作用的结合模式。建立了一个反向传播神经网络,充分利用蛋白同核酸结合的信息,不断调整参数,反复进行训练学习,对DNA结合蛋白的结合残基进行了预测,发现局部环境信息能够以65.85%的NP较好地预测给出蛋白的结合残基。我们用支持向量机对结合碱基进行预测,选择不同窗宽和参数对数据进行训练和预测,并与神经网络方法进行比较,发现11个窗口长度的碱基环境的预测性能相对较好。使用径向基核函数,支持向量机成功预测为结合碱基的比例能达到89.72%,敏感性能达到66.71%。最后,我们对两种方法进行了比较,发现支持向量机预测结合碱基较为成功。本文利用蛋白-核酸复合物作用对数据,用机器学习的方法初步探索了蛋白同核酸作用的结合模式,证明了在转录相关的蛋白-核酸复合物中,局部残基环境或者碱基环境在一定程度上决定了中央残基或者碱基是否为作用位点。
其他文献
根据我国学术界的多年研究,班主任的管理风格大致可以分为三类.本文既然相应分析班主任管理风格对于班级凝聚力的影响,就需要了解班主任的管理风格,并切实知道这些不同的管理
在推行初中历史授课活动时,笔者认为,教育者没有定法,唯有适法.为了找到如此的渠道,就需要教育者有效地实施活动,积累下自己的感悟,结合教育者的学情实施相关的规划.在推行初
高职院校作为帮助我国培养人才的重要场所,为了保证人才培养的质量,通常都会进行各科学科的教学,尤其是重视数学课程的教学工作.做好高职数学课程的教学工作,能够促进相关人
阅读教学对于小学语文教学来说非常重要,而且阅读应该是一种学生的个性化行为,教师在教学中不能用自己的分析来代替学生的阅读感受,应该通过个性化阅读教学的开展,让学生真正
本文在全面综述国内外新型轻金属氢化物储氢材料研究进展的基础上,确定以TiO2、Al2O3改性NaAlH4作为研究对象,通过高能机械球磨法制备了纳米TiO2、介孔Al2O3改性及其复合改性
随着信息时代的到来,计算机信息技术已经渗透到了人类社会的各个领域当中,并成为一种不可或缺的应用技术,极大的改变了人们的生活和学习方式方式.信息技术在教育教学领域中具
在新时代的生活中,我们会发现人们越来越倾于去追求健康的生活.健康不仅是人们的“生活之本”,还能为人们的发展提供一定的条件.近些年国家相关部门越来越重视体育的教学,教
物理是一门逻辑性和强的知识,物理知识在生活中发挥的作用十分重要,随着素质教育改革的不断践行,初中物理教学模式也应该逐步创新和完善.由于物理知识的复杂性较强,很多初中
新时代赋予了当代学生新的要求,需要学生们专业知识过硬,综合竞争力强.初中数学,相对其他学科而言,对学生的要求更多,需要学生有良好的思维缜密性、思考的逻辑性以及良好的空
连铸保护渣对连铸工艺的顺行和提高铸坯表面质量具有重要影响,是连铸过程中关键材料之一。在连铸过程中,熔融保护渣渗入铸坯坯壳和结晶器铜壁之间形成由固渣层(1~2mm厚)组成的