论文部分内容阅读
自从基因组研究重点开始转向功能研究,全局基因调控网络的构建与分析也就成了生物计算领域的一个重要课题。由于全局基因调控网络构建与分析的时间复杂度过大,因此如何利用如今热门的CPU和GPU协同计算来解决全局基因调控网络的构建与分析时间复杂度过大的问题成为了一个新的研究课题。 依据CPU/GPU的混合异构计算平台特性,设计了访存高效、加速比高、可扩展性好的全局基因调控网络构建并行算法。首先,对基因表达谱划分基本块,按对角线安排计算轮次减少数据访存冲突。然后,按CPU与GPU的计算能力来分配计算任务从而保证负载平衡。对于CPU端,首先按多级缓存容量将基因表达谱的基本块进一步合理划分成子块。然后根据数据访存局部性原理依次合理调度基因表达谱子块到多级缓存以保证较高的缓存命中率,减少数据访存交换次数。对于GPU端,依据线程结构的特点,设计双层多角线并行来提高GPU数以百计处理核心的利用率和减少访存冲突。利用纹理缓存优化访存模型,提高算法效率。最后根据基因互信息值集合的分布特点的分析结果,提出了新的基因互信息阈值选取算法,在较短时间内能计算出比较合理的基因互信息阈值,提高了初步筛选初始基因调控网络的准确性。 分析基因功能和基因表达的关系,采取融合基因自身的表达信息和全局基因调控网络的基因调控关系的方法,设计了基因亲密度模型,能较好地衡量基因之间关系的亲密性,在此基础上,设计了基于邻域和基因亲密度的边稳定系数模型;通过按边的邻域规模大小将边稳定系数的计算任务分配给各线程以平衡各线程的负载,提出了图剖分结果比较好的Levelized Nested Dissection并行化算法,采取并行地分析图剖分的几个子图社区结构的策略,设计实现了社区结构分析结果良好、高效的全局基因调控网络社区结构分析并行算法,在确保社区结构分析结果精度的前提下,本文提出的全局基因调控网络社区结构分析并行算法大大降低了分析过程所需的时间。