【摘 要】
:
本文在分析了传统的Overlap-Layout-Consensus方式和Euler方式对重复序列的处理策略之后,重点研究了基于定长子串和变长子串的两种Repeats预处理方法。并在这两种方法的基础
论文部分内容阅读
本文在分析了传统的Overlap-Layout-Consensus方式和Euler方式对重复序列的处理策略之后,重点研究了基于定长子串和变长子串的两种Repeats预处理方法。并在这两种方法的基础上,提出了构建不同的数据结构,定长子串统计表和变长子串统计表,详细记录两种方法各自扫描shotgun集合所得到的信息。然后,根据各自表中记录的具有相同定长子串或者变长子串的shotgun片段可能来自目标序列同一个位置或者相同repeats的原理,将这些shotgun片段进行预归并操作,并给出了各自具体算法。通过预归并一方面可以还原出DNA目标序列中的重复序列的形状;另一方面还可以大大减少shotgun集合中的片段数目,从而降低将来拼接时的计算复杂度。使之既适用于采用Overlap-Layout-Consensus方式,又适用于采用Euler方式的序列拼接算法的重复序列预处理工作。最后,进行了本文算法的计算机模拟分析。计算机模拟分析结果表明,本文算法不仅识别重复序列率较高,并且由于通过预归并缩减了shotgun集合的规模,有效地降低了拼接时的计算复杂度。
其他文献
对简单图G=(V,E),F是G的点(或边)子集,如果由VF(或EF)导出的子图不含圈,则称F是G的反馈点(或边)集。记fv(G)(或fa(G))为所有反馈点(或边)集的最小的阶数,称为G的反馈点(或边)数。
随着嵌入式系统越来越复杂,数据处理量成几何级增长,尤其在航空航天、工业控制、医疗、通讯等重要领域中,嵌入式系统的实时性和可靠性就显得尤为重要。本文基于嵌入式VxWorks
21世纪是海洋世纪,各国已将开发海洋资源、加强海洋勘测用于解决陆地资源日渐枯竭的主要途径,海洋已经成为各个国家着眼并着手的下一个开发之地。目前,全球性海洋开发的步伐,
作为日趋成熟的分布式系统,Hadoop拥有强大的海量数据存储与分析处理能力,在许多公司的应用之中都有良好的表现。本文所研究的HDFS(Hadoop Distributed File System)是Hadoop
放废物处置库性能评价是处置库选址乃至废物安全处置中的重要研究内容。针对这一研究内容,核工业北京地质研究院于1998年5月11日邀请了加拿大多年从事高放废物处置的专家——
随着Internet的日益普及,人们获取信息越来越便利,但同时也给怀有恶意的人提供了新的途径。一方面黑客利用系统的安全漏洞,不仅运用基本网络协议,还会在应用层协议基础上进行
数字修复技术主要是利用现代图像和视频处理技术修复图片和视频中存在的诸如划痕、斑点、闪烁等问题,其主要工作原理是利用数字图像待修复区域的邻域或受损连续影像的前后帧
关于编写《探矿工程科技进步100例》的初步设想左汝强刘壮志雷恒仁耿瑞伦李常茂(地矿部科技司北京100000)(中国勘查技术院北京100000)(地矿部高咨中心北京100000)为了展示改革开放以来探矿工程技术的巨大
随着大规模集成电路技术的发展,可用的片上资源越来越多,如何把丰富的晶体管资源转化为实际的计算能力,是当前体系结构研究中面临的基本问题。传统的超标量和超长指令字结构,