【摘 要】
:
近年来,得益于基因组测序技术的进步和物质结构解析技术的发展,使有关生物序列和结构的数据与日俱增.面对海量的数据,如何对其进行科学的分析、处理和保存给计算机科学、数学
论文部分内容阅读
近年来,得益于基因组测序技术的进步和物质结构解析技术的发展,使有关生物序列和结构的数据与日俱增.面对海量的数据,如何对其进行科学的分析、处理和保存给计算机科学、数学等学科提出严峻的挑战,同时也吸引大量的数理科学工作者转向生命科学的研究领域,使得计算分子生物学应运而生.计算分子生物学的研究内容十分丰富,例如,序列比较、基因识别、分子进化、比较基因组学、RNA和蛋白质结构预测等等,其中大多数研究工作是以序列、结构的比较为基础,因此,生物序列、结构的比较不仅是计算分子生物学中最基本、最重要的课题之一,而且对生命科学的研究具有深远的影响.本文以该领域中的若干数学模型为研究对象,主要成果有:1、在第二章,提出了DNA序列的W-几何表示模型,并设计一种算法,用来寻找特定碱基含量丰富的片断;以相邻碱基对为对象,利用单元和系统的概念,设计了DNA序列的PNN-几何表示模型,并提取了一种简单有效的数值刻画量;指出了几何表示模型中的距离矩阵在刻画曲线时存在退化现象,并利用曲率矩阵克服了距离矩阵的缺陷.2、在第三章,构建了生物序列、结构的马尔可夫模型,比较了k步转移概率在刻画生物序列中的差异,并将模型拓展应用到结构比较、结构相似性搜索、进化分析等领域;利用加权相对熵构建了字统计模型和马尔可夫模型的混合模型,利用有效的评价性方法和大量实验表明混合模型提高了模型抽取信息的能力.3、在第四章,根据序列、结构中元素的分布存在随机性,定义随机分布函数,并引入回归分析模型来寻找分布函数之间的依存关系,进而发现序列、结构中元素的整体变化规律.另外,利用不同结构对应回归模型间的差异获得不同结构的相似程度,从而降低了结构比较的复杂度.4、在第五章,利用氨基酸打分矩阵,提出了“蛋白质空间”的定义以及“蛋白质空间”的字统计模型,并设计了字的编辑距离用来比较不同蛋白序列.通过系统的比较分析,对如何构建有效的“蛋白质空间”,如何选择合适的度量等问题提出了合理的建议.
其他文献
我国证券市场经过二十多年的发展,不断成熟,在国民经济占据着越来越重要的位置。但是我国证券市场仍然有诸多不完善的地方,最直接的问题就是反复出现股价的“暴涨暴跌”,一旦
《业主奏鸣曲》是我国第一部关注业主物权利益冲突这一当前热点话题的影片。影片将视角伸向了都市内的有房一族,关注点更是放在了社区里的业主、小区业委会与物业服务公司的
由原建设部总经济师、住宅与房地.产业司司长谢家瑾倾心著得的力作《房地l产这十年》,记录了房地产行业这十多年来跌宕起伏的全过程,作者以其切身经历,对从1998年房改开始至今房
近年来,随着移动通讯技术的发展和人民生活水平的提高,智能手机和平板电脑等消费类电子产品日益普及。作为消费类电子产业的上游,微电声行业从中获得了巨大的发展,吸引了一大批新兴企业进入微电声行业。但随着智能手机和平板电脑技术迭代变慢和市场趋于饱和,微电声行业的增长速度同样受到影响。由于中国制造技术的发展和微电声行业重心转移到中国大陆,微电声行业竞争从国际竞争转变为国内竞争。在此背景下,作为新进入者的S公
为确保层间结合质量,混凝土分层施工控制方法是大坝施工期重点关注问题,该问题的研究对保障大坝安全稳定具有重要意义和价值。但目前研究得到的施工控制方法仍难以完全保证层
肉鸡胫骨软骨发育不良(Tibial Dyschondroplasia,TD)是指快速生长、体型较大的肉鸡胫骨软骨细胞发育异常,其临床表现为行走能力部分甚至完全丧失、运动障碍、站立困难、骨骼
硅漂移(SDD)探测器是一种基于侧向耗尽原理的核辐射探测器。这种探测器因为比一般Si(Li)探测器输出电容小、电子噪声小、且只要简单的半导体制冷就能达到需要采用液氮制冷的S
能源是人类生存和社会发展的重要资源。全球能源需求与消耗的不断增加,导致了全球产生能源危机。可再生能源的开发和可持续利用成为世界各国能源发展战略中的重要部分。风能
不锈钢因其良好的力学性能和加工工艺性被广泛应用于工业生产中,但不锈钢设备在含氯离子溶液中容易发生应力腐蚀开裂,且应力腐蚀发生没有任何预兆,往往会造成严重的事故,对人
生物入侵是常见的生态现象,其吸引了包括数学在内的多领域学者的关注,是当前国际上多学科交叉的一个热点问题.种群自身复杂的生命周期和所处环境复杂多变的特点使其在入侵过