基因表达及其转录调控机制的计算分析

来源 :国防科技大学 | 被引量 : 1次 | 上传用户:baichuan817
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
高通量实验技术的广泛应用积累了丰富的基因表达数据,这些数据反映出不同时空条件下基因的动态表达水平。利用各种计算方法对其进行分析和处理,提取内在的表达模式和特征,已成为认识和理解基因功能及相关作用机制的重要手段,也是当前生物信息学研究的重点和热点问题。本文围绕“基因表达及其转录调控机制”这一主题,针对基因表达数据缺失值估计、肿瘤样本分型识别、基因表达数据聚类分析、转录因子活动水平预测等问题进行了深入分析和研究,主要成果和创新点总结如下:1)针对时序基因表达数据提出了一种缺失值估计的新算法。缺失值估计是表达数据分析的重要预处理步骤。通过分析基因表达过程中共调控/共表达的时间特异性、并进一步提取时序表达数据的表达水平关联和表达趋势关联,本文提出了一种缺失值估计的新算法。该算法基于时间窗口捕获共调控/共表达的时间特异性,综合利用表达水平关联和表达趋势关联评估基因表达谱的相似性,并以这种相似性作为权值基于近邻基因表达谱实现缺失值估计。利用多组数据集设计数值实验与现有估计算法进行了性能比较,结果证实了本文算法的有效性和准确性。2)基于非线性维度规约技术进行肿瘤样本分型识别。分析肿瘤样本基因表达数据以提取其内蕴特征,能够为准确的分型识别提供依据,同时也有助于在分子层面增进对肿瘤发生及演化机理的认识和理解。然而,基因表达数据的“高维,小样本”特性导致适用于低维数据的特征提取算法性能受限。针对这一问题,论文采用非线性维度规约技术降低或消除数据噪音及各种干扰的影响,在规约后的数据空间上实施分型识别。我们重点研究了非线性维度规约算法的参数设置,分析比较了线性、非线性维度规约技术对肿瘤样本分型识别算法的性能影响。多组数值实验的结果表明,非线性维度规约技术能够更好地捕获肿瘤基因表达数据的内在非线性结构、提高分型识别的准确度。3)结合基因表达和功能注释数据设计了新的模糊聚类算法。聚类分析有助于提取基因表达数据中潜藏的功能模式,是理解表达数据和识别基因功能的重要手段。本文结合表达谱和功能注释语义信息评估基因之间的相似性,设计了新的模糊聚类算法,并利用功能注释数据提出了算法的初始化策略。数值实验表明,该算法能够准确预测基因功能并识别其所属的多个功能类别,得到更具生物意义的聚类结果。4)提出了转录因子活动水平预测的新方法。转录因子是基因转录过程的重要调控子,预测其活动水平有助于进一步理解基因表达的转录调控机制。基于非线性偏最小二乘回归模型,本文结合基因表达和ChIP-chip实验数据设计了一种预测转录因子活动水平的新方法。数值实验表明了该方法的有效性。此外,本文还基于该方法预测了11个已知与酵母细胞周期调控相关转录因子的活动水平,并进一步分析了转录因子活动水平的周期性和相关性,构建出酵母细胞周期的转录调控网络。
其他文献
随着钛合金在光学仪器的应用日益增多,对其表面状态及性能要求越来越严苛,不仅要求钛合金表面具有均匀的黑度,优良的耐蚀性,还要求其具有高红外发射率。钛合金黑色微弧氧化膜兼具优良的防护性能和消光性、红外吸收和发射性能等,在特殊服役环境中也呈现出良好的耐蚀性,耐光老化,耐磨性等,因此对钛合金黑色微弧氧化膜的研究有着非常重要的意义。本文采用了一种环保型碱性电解液,以(Na PO3)6和Na2Si O3为主盐
2μm激光器可广泛应用于军事雷达、环境监测、生物医学和通信等领域。目前2μm激光增益介质主要包括硅酸盐玻璃、氟化物玻璃和重金属氧化物玻璃等,锗碲酸盐玻璃声子能量低、机械性能和热学稳定性好,是一种良好的激光玻璃基质材料。本论文主要研究了新型稀土离子掺杂的重金属氧化物玻璃的设计制备及2μm波段发光性能,以获得一种2μm波段激光增益介质材料为研究目标。本文主要研究内容如下:1.设计制备了以氧化锗为主要玻
从数字基础设施、数字产业、数字融合三个维度构建数字经济发展水平的测度指标体系,基于2015—2018年我国30个省(区、市)的面板数据,通过计量模型研究数字经济对全要素生产率的影响效应,并引入技术进步作为两者的中介变量。研究结果表明:数字经济发展指数、数字基础设施分指数、数字产业分指数、数字融合分指数对区域全要素生产率均有显著的正向影响,影响系数分别为0.554、0.314、0.250、0.477
随着工业、农业和交通运输业的快速发展,重金属离子的使用和排放导致的环境污染问题日益突出,严重影响着人类的生活环境和身体健康。因此,研究重金属离子的去除和检测相关的技术,对治理和控制环境污染,改善人类的生活环境质量,提高人类生活水平具有重要的意义。如何准确检测重金属离子的含量已成为一项十分重要并且具有挑战性的工作。受现代分析仪器检测水平的限制,对痕量和超痕量元素的测量往往存在着测不出和测不准的问题。
现代社会生产和生活产生的污染物在水体、土壤中的过度排放,传统化石能源的过度消耗和枯竭以及燃烧过程中产生的有害气体造成的空气污染令新型的环境净化和绿色可再生能源技术的开发尤为重要。光催化是一种利用太阳能实现降解有害污染物、分解水产生H2和O2以及将CO2转化为碳氢化合物燃料的新技术,而其推广的关键是研发出环境友好、高效、低成本的光催化材料。本论文旨在利用不含贵金属、可见光响应和能带交错分布的半导体材
量子信息学就是研究用量子态来编码信息,利用其特有的相干叠加、纠缠等性质进行信息的存储、传输和处理的学科。纠缠(量子关联)是量子物理的核心内容之一,人们以纠缠为基础构造了各种新颖的信息处理方式,如:量子密码术、量子隐形传态、量子超密编码、量子计算等。作为量子信息的关键信息资源,纠缠的描述、制备、操控及其应用一直是量子信息学理论和实验研究中相当活跃的领域。光子系统作为纠缠的物理载体,在量子信息学的实验
多糖作为松露的重要成分之一,具有抗氧化,抗肿瘤和降血糖等多种生物活性。然而,多糖活性与其结构密切相关,但关于攀枝花黑松露中多糖组分的相关结构及其生物活性的研究鲜有报道。该研究采用水提法和Sephadex G-200分离纯化黑松露多糖,并对其结构及体外抗氧化、降血糖活性进行了初步分析。结果表明黑松露多糖的分子质量为1.29×104 u,主要由甘露糖、葡萄糖、鼠李糖和半乳糖组成,其摩尔比为2.89:1
在人类日常生活中,面部表情在非言语信息传递上,扮演着重要的角色。随着人工智能的迅速发展,面部表情识别(Facial Expression Recognition,FER)的研究在心理学、计算机视觉和模式识别领域获得了丰硕的成果。此外面部表情的自动识别在人机交互领域发挥着重要作用,在人工智能和物联网技术快速发展的时代,如果机器人能够自动识别人类面部表情,那将会极大地促进人机交互的发展。因此实现人脸表
语文作业是语文教学中的一个重要部分,该环节能够帮助学生巩固语文知识,同时也能及时检验学生的学习效果。传统教育模式下,教师坚持采用"一刀切"式教育模式,未根据学生的实际学习能力制定个性化的作业方案,导致学习能力不一的学生之间差距越来越大。本文就初中语文作业分层布置展开论述,阐述作业分层布置的原则,提出有针对性的作业布置方案,全面提升语文教学有效性。