基因数据压缩算法的并行优化研究

来源 :华南理工大学 | 被引量 : 0次 | 上传用户:lzxldf2003
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着二代基因测序技术的发展及其在药物研发、疾病诊断等领域的广泛应用,基因测序数据呈现指数级增长。海量的基因测序数据需要有效的压缩方案来减小数据体积,以降低存储、传输测序数据的成本。为此,研究者们提出了多种专用基因测序数据压缩方法。这些方法虽然有效地提高了基因测序数据的压缩比,但是在处理速度等方面关注不足,未能得到实际应用。而另一方面,现代硬件的发展使得多核、向量处理等特性得到普及,GPU等加速设备的可用性也得到提高。利用现代硬件对专用基因数据压缩算法进行并行优化可以大幅提高处理速度,从而增强实用性。基于这一背景,本文研究了利用现代硬件对基因测序数据质量分数专用压缩算法LCQS进行并行优化,分别提出了在多核CPU环境和在CPU-GPU异构环境两个不同环境的优化方案。在多核CPU环境下,本文基于数据并行与流水线并行模式,通过多线程与共享队列实现了并行的LCQS。同时引入了轻量级的索引文件结构,满足高效地处理下游应用对压缩数据的随机访问解压需求。还对PAQ压缩这一耗时较多的重要模块采用向量化进行细粒度并行,可用于加速包括LCQS在内的数据压缩应用。实验结果表明,并行优化的LCQS在保持了高压缩比的情况下,压缩速度、随机访问解压速度整体上优于通用压缩工具和同类型的专用压缩工具,优化方案加速比高且具有良好的可扩展性,优化模块性能取得明显提升。在CPU-GPU异构环境下,本文将LCQS计算密集的编码过程迁移至GPU上进行计算,结合算法和GPU硬件特点,改进了数据组织形式和算法参数后进行移植实现。还通过循环展开、缓存分配优化等性能调优方法进一步优化,提高访存吞吐率、降低访存延迟。实验结果表明,性能调优方法大幅提高了GPU环境下编码过程的速度,调优后的GPU加速编码模块方案可以明显提高算法的整体性能。
其他文献
皮影艺术拥有悠久的历史文化,其独特之处在于融合音乐、美术、舞台表演等多元素,用皮制的影人以讲述故事的方式展现民间生活场景的各方面。在不同历史时期、社会环境地变迁下,皮影艺术拥有了其特有的基本属性和社会民俗功能,逐步成为民间生活农余时重要的民间娱乐文化形式,能够直接地映射与表达出民众的精神信仰寄托与思想感情。特别是在文化普及程度不高的村镇区域,皮影戏以表演说唱故事的形式教化民众,从而潜移默化地提升、
FBF平面凸点式封装是在QFN的基础上研发出的新型封装形式,是长电科技的最新研究成果。本文从结构和主要流程两方面的FBP与QFN的对比情况探讨了FBP的优势和特点,然后从基板形式
1998年12月-2004年12月,我院采用常规基础加中药治疗重症有机磷中毒(AOPP)22例,并与单用常规基础治疗的24例作对照,现报道如下.临床资料46例患者均为口服有机磷中毒,依据临床
长期以来,我国实行营业税和增值税两套流转税征收模式。但是进入“新时代”以后,营业税征收模式导致的全行业增值税抵扣链条断裂及重复征税等问题,严重阻碍了我国经济社会的
文章设计了一种用于高速流水线ADC的时钟管理器,该电路以延迟锁相环(DLL)电路为核心,由偏置电路、时钟输入电路、50%占空比稳定电路和无交叠时钟电路构成。该电路用0.35μmBiCMOS工