用HMM挖掘基因表达谱数据的功能信息及分子进化研究

来源 :清华大学 | 被引量 : 0次 | 上传用户:yuanxb2008
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
基因芯片技术是功能基因组学研究手段的一个重要突破,大规模基因表达谱数据为数据挖掘和知识发现提出了很大的挑战。该文发展了一种新颖的加权隐马尔可夫模型对基因表达谱数据进行功能分析,结果表明利用隐马尔可夫模型进行聚类分析能够得到很好的结果。通过引入外部和内部两套聚类结果评估方法,该文发现新方法的效果与流行的K-means方法和SOM方法相当,同时,该文发展了一种确定聚类数目的新策略,结果表明新方法在确定聚类数目方面要稍胜一筹。在对酵母细胞周期表达谱数据的聚类分析中,该文发现新方法不仅获得了具有显著生物学意义的聚类结果,而且还能够发现不同聚类之间存在的功能性联系,这些联系对于遗传网络的构建很有意义。在此基础上,该开发出相应的软件包,并在互联网上提供国际开放的下载服务。 丝氨酸蛋白酶是一类分布广泛的水解酶。在长期进化过程中,丝氨酸蛋白酶序列之间的差异性很大,但是仍然保持了一个稳定的核心催化结构。我们利用SSAP算法从蛋白质结构层次上进行超家族进化的研究,这是进化研究的一个新策略。此外,该文对丝氨酸蛋白酶催化结构域的两个子结构域也进行了结构与功能上的分析研究。结果表明,与序列分析相比,结构层次上的进化分析更能够对序列差异较大的超家族进行有效的进化分析,获得更多的进化信息,同时该文发现在进化过程中,催化结构域的结构与功能紧密联系,呈现出趋异和协同的复杂的进化模式,这些信息对于丝氨酸蛋白酶结构与功能的起源与进化以及相互功能关系的研究具有一定的指导意义。 SARS冠状病毒是一种全新的致病性病毒。该文利用支持向量机的方法对SARS病毒基因组中注释的ORF进行亚细胞定位预测,并同时结合相应的跨膜螺旋预测结果对基因功能进行预测,并结合已有的知识推导SARS病毒可能的生活周期,获得较为可信的结果,这些结果表明这种预测功能信息的新策略是可行的。此外,该文对SARS病毒全基因组序列进行多样性分析,尤其是对较为特异的香港毒株的分析表明SARS病毒的进化同传染途径和特异性的临床症状很有关联,而与此相关的特异性的变异将为疫苗的研发提供有用的信息。
其他文献
学位
解偶联蛋白属于线粒体阴离子载体蛋白超家族,是位于线粒体内膜的跨膜蛋白。一般认为,解偶联蛋白最基本的功能是通过介导质子渗漏,将线粒体电子传递产生的电势能转化为热能,并减少
自动指纹识别系统在身份认证领域得到了广泛应用,而该系统的稳定性和可靠性受指纹图像质量的影响十分严重。合理评价指纹图像质量有着诸多好处,最重要的是可以在采集过程中有效
特高压直流输电工程需要估算多种分裂型式导线的电晕损耗水平,需要通过电晕笼来开展更多不同导线的电晕损耗试验研究。在电晕笼内研究一套完整的高压直流导线试验方法能为后期进行大量高压直流导线的电晕损耗试验做准备,同时为直流输电工程的研究节约时间和减少不必要的投资。本文利用户外大电晕笼和宽频域电晕电流测量系统,对高压直流导线的电晕损耗试验方法进行研究。结果表明:要想得到更为准确的电晕电流测量值,需要在选好采
在电力系统的正常运行中,变电站是一个重要环节,随着综合变电站自动化技术的推广和应用,相对传统的变电站,无论是供电质量还是供电可靠性都有了质的飞跃,给我们日常生活带来了很大的方便。但我们同时也要清醒的看到综合自动化变电站目前存在的一些问题。论文首先介绍了变电站综合自动化的概念,研究了传统变电站存在的问题并对比提出综合自动化变电站的优越性,在回顾变电站综合自动化在国内外发展历史的基础上分析了变电站综合
大豆是一种广泛种植的作物,而大豆花叶病是侵害大豆的最普遍的一种疾病,在世界各处均有报道。大豆花叶病可导致严重的减产,每年都造成大量的经济损失。人们从可以抵抗SMV侵染
应用PCR-RFLP方法对云南省26个民族的31个群体,另外还加上一个湖南白族群体,共32个群体的1252个个体进行了Y染色体单倍型多态性分析.共检测12个Y染色体单核苷酸多态位点,发现
弓形虫是世界性分布的专性细胞内寄生原虫,可引起人兽共患的弓形虫病。成人弓形虫感染多呈无症状带虫状态,但先天感染可导致流产、畸胎或死胎,在免疫缺陷者(如器官移植、恶性肿瘤
随着现代电力系统规模的逐步扩大,同杆双回线的应用越来越广泛。因其会发生跨线故障,导致故障类型较多,因此双回线的故障分析十分复杂。由于传统的故障诊断模型在诊断含有双回线等特殊接线时,易形成组合爆炸或者造成推理死循环,且不能推导出具体的故障类型,因此对包含双回线的电力系统进行故障诊断模型的研究具有重要意义。为了能快速、准确的诊断双回线故障,本文提出了一种可用于诊断含有双回线的电网故障诊断模型。主要内容
单细胞测序技术能够实现单细胞分辨率水平的序列分析研究,探测细胞间异质性,被广泛用于诸如识别肿瘤细胞亚群、阐明肿瘤抗性机制等诸多研究。单细胞测序数据具有高转录本丢失、