面向遗传异质性聚类算法的研究

来源 :哈尔滨工业大学 | 被引量 : 0次 | 上传用户:xy255c
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
遗传异质性(genetic heterogeneity)是生物信息学研究领域中的重要研究方向之一,也是遗传学中普遍存在的现象.因此,国内外很多专家对遗传异质性进行了研究,但是传统的遗传异质性的研究局限于表型和基因型之间的概率关联,该类方法主要是利用遗传标记家系数据,基于由父代到子代的传递信息研究该类问题,由于标记位点的多态性信息传递的多基因互相作用的信息较微弱,因而限制该类方法的应用范围.由于DNA微阵列可以快速、并行、高效地检测基因表达水平,提供了一种解决遗传异质性问题的新途径,而基于基因表达谱数据进行遗传异质性问题研究较少,在这方面的深入研究具有重要理论意义和实际意义.该文首先对现有的基因表达聚类算法进行了研究,提出了双向迭代聚类算法.该算法通过对基因维和样品维反复聚类,可以动态地观察到基因和样品间的关联关系.在反复的聚类过程中,基因维的下降可以改善类的准确性,而这反过来又有助于进一步降低基因维.由于无论对于层次型聚类还是对分割型聚类,选择明显聚类的个数都是一个非常重要的问题,因此,该文对聚类算法中如何选择聚类个数进行了深入的研究,提出了基于MMSS(Minimize of Mean Split Similarity)的聚类个数选择算法,并把它应用到了双向迭代聚类算法中.基于MMSS聚类个数选择算法是一种可被广泛应用的聚类个数选择方法,能被用于不同类型的聚类算法.最后,通过实验对该文提出的双向迭代聚类算法与其他的聚类算法进行了详细的分析与比较.实验表明,双向迭代聚类算法具有更高的精确度.利用基因表达谱与亚型之间的关系,对基因表达谱数据进行聚类分析,来确认疾病类型和疾病亚型为遗传异质性的研究提供了新的思路,有助于新的诊断、治疗方法的实现和新型药物的研制.
其他文献
随着软件规模的日益扩大,软件系统的复杂性不断增加,传统的软件可靠性设计在实际的应用中存在的问题愈显不足。具备自适应地处理资源变化、用户需求改变和系统故障的能力成为保
随着机器翻译的发展,机器翻译评价也越来越受到重视.机器翻译评价是一项复杂的研究课题,最主要的困难在于评价指标的确定.如何评价一个机器翻译系统好与坏,如何在多个翻译系
目前人脸检测算法研究得已经相当深入,但对于复杂背景下的人脸检测仍难以取得较好的效果.基于灰度图的方法,虽然其应用范围最为广泛,由于其信息量的缺乏,以及光照和对比度等
近年来,基于非结构网格的数值模拟已经成为国际上油藏模拟的一个重要发展方向,也是下一代油藏模拟软件不可或缺的重要功能之一.本文基于中心已有工作,对非结构网格油藏数值模
软件质量作为软件产品的一个重要属性,引起人们的重视,特别是那些关系到国计民生的行业,尤其是航天型号软件对软件的质量有极高的要求.软件质量可以通过额外的软件测试来评定
税收网上申报是指纳税人将有关纳税申报的电子数据,通过计算机网络传递给税务机关,完成纳税申报手续的工作。它利用计算机、互联网等先进手段,使纳税申报更加方便、快捷、高效。
近些年来,生物特征识别技术因其良好的安全性越来越多的应用于身份识别。生物识别技术是利用人类自身生理或行为特征进行身份验证的一种解决方案,具有不可复制的特性。人体的生
需求工程是软件工程中最复杂的过程之一,其复杂性来自于客观和主观两个方面.从客观意义上说,需求工程面对的问题几乎是没有范围的.由于应用领域的广泛性,它的实施无疑与各个
三维地形生成技术是虚拟现实领域中的重点研究方向,其主要应用于虚拟战场环境仿真、城市景观规划、虚拟旅游、飞行模拟器训练及3D游戏等众多领域。随着航空航天、卫星遥感技
基于内容的图像检索是信息检索的重要分支,其检索所需的信息是从图像本身提取.它的目标是从海量的数字图像数据中检索出用户需要的图像.如今,它在网络安全、预防犯罪、知识产