论文部分内容阅读
随着信息科学技术的进步,用于获得生物信息的实验手段也日新月异。作为生物信息学的两大经典检测技术,基因芯片和高通量测序技术已经步入了成熟阶段,已经成功的应用在基因组学和转录组学等众多领域,并获得了惊人的成果。但这些成果大都是利用其中一种检测技术得到的,对某些研究而言,若将两种技术联合使用会得到更好的实验结果。本文从基因芯片和高通量测序技术的基本检测原理出发,寻找两种技术在基因表达信息检测中彼此存在的优势和缺陷,并进行融合分析。本文的主要工作如下:1、首先简述了基因芯片和DNA高通测序技术的研究背景及将其进行融合的意义,介绍了两种技术的应用和发展现状。2、分析基因的基本信息,简单的讲述了真核生物与原核生物基因转录和表达过程中一些名词的概念,理解芯片和高通量DNA测序技术的检测本质,找到可以将两种技术所测数据进行互补性分析的理由,为后续融合模型的建立提供依据。3、简单的分析了常用的特征融合方法(串行融合方法和并行融合方法)。而本文所要处理的数据对象不适合采用普通的特征融合方法,所以,本文提出了一种基于相关分析的模型融合方法,该方法在对两种技术测得的数据进行融合的同时也可以修正高通量DNA测序数据,可以得到更准确的数据,从而获得更好的实验效果。4、采用本文所提出的融合方法生成的数据,进行了基因表达差异分析。首先介绍了表达差异分析模型的基本原理、实现步骤,然后针对表达差异分析模型中的概率最大化这一步进行了深入的分析,由于该步骤中很难求取精确的解析解,而且求解过程非常复杂,所以,在对粒子群优化算法的优缺点进行剖析后,用粒子群优化算法对该步骤进行了实现。通过R语言对所设计方法进行编程实现,其结果验证了本文所提出的基于基因芯片和DNA高通测序数据融合的基因表达差异分析方法的合理性。