基于彩色编码技术的准种重建算法研究

来源 :广西师范大学 | 被引量 : 1次 | 上传用户:triyve
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
研究病毒准种单体型对了解病毒的基因序列,研制病毒疫苗以及制定有效的抗病毒治疗方法有着重要的实际意义。由于当前技术水平的限制,仅仅依靠生物学手段获取病毒准种单体型所需的金钱和时间成本很高。因此,利用计算方法来重建病毒准种单体型成为研究人员关注的热点问题。本文主要针对病毒准种单体型重建问题进行研究,设计并开发了一个系统软件包,具体工作如下:针对带有病毒准种单体型信息的测序片段来构造片段冲突图,引入模糊距离来衡量片段之间差异度,在带权冲突图模型下对单体型重建问题进行研究,提出了一种基于边权简约的改进重建算法IDsatur(Improved Dsatur)。IDsatur算法先根据阈值预处理片段冲突图;然后根据顶点的度及饱和度取值为图中顶点着色,着色遵循相邻顶点颜色相异的原则,直到着色完图中所有顶点;最终将同种颜色的顶点片段进行组装,从而获得准种单体型。实验采用模拟测序片段数据进行测试,比较分析算法IDsatur和Dsatur的重建性能和质量。实验结果显示,算法IDsatur能够获得更少的准种单体型种数和更高的重建性能,有效的处理并解决了当测序错误率增大时,重建数量过多的问题。针对准种单体型重建问题,提出了一种基于边权和着色的彩色编码算法CWSS(Coloring with Weight Sum and Saturation)。CWSS算法采用与IDsatur算法类似的算法流程,在冲突图着色时,利用边权和及饱和度来选定着色点。采用模拟测序片段数据对算法CWSS和Dsatur的重建性能和质量进行对比分析,实验结果显示,相对于算法Dsatur,算法CWSS能获得更准确的准种单体型种数和更高的重建性能,且其重建性能在测序错误率高的情况下仍表现良好。基于提出的重建算法IDsatur和CWSS,设计开发了病毒准种单体型重建的实用软件包。该软件包使用Python语言和装有wxpython库的JetBrains PyCharm Community Edition2016.2.3(64)作为开发工具,可以在任何安装了该开发工具的系统中运行。该软件包的功能包括参数设置、读入生物数据、重建准种、查看结果与帮助五大模块。参数设置模块可以根据实际情况,设置准种长度和边权和阈值的实验参数,读入生物数据模块可读入重建所需数据,在重建的过程中,可查看当前重建运行的进度,完成重建后可得到重建种数、重建包含的片段集和重建的基因序列以及根据重建指标得出的数值。综上所述,本文引入模糊距离,并使用阈值来预处理带权的片段冲突图,提出了一种一种基于边权简约的改进重建算法IDsatur和一种基于边权和着色的彩色编码算法CWSS。实验结果显示,两种算法都能获得更少的准种单体型种数,且其重建精度也更高,对于处理病毒准种单体型重建问题而言,两种算法都是行之有效的计算方法。为此,该相应软件包的开发也同样具有一定的实际应用价值。
其他文献
随着计算机的日益普及以及互联网技术的不断更新,电子档案的应用优势逐渐突出,越来越多的企业选择使用计算机实现对档案信息的录入和储存,这样不仅可以避免数据丢失,而且还能
由于人类长期的不合理开发利用资源,全球气候呈现出明显变暖趋势,极端事件发生频率不断增加,气候变化对自然生态和社会经济系统产生了巨大的影响和威胁。中国作为负责任的发
目前,温室气体,尤其是二氧化碳排放量的增加对环境、气候和生态造成了十分恶劣的影响。因此二氧化碳的回收再利用亟待开发。在解决此问题的过程中,研究人员发现,电化学还原二
南宁市万秀村少数民族流动人口融入城市生活过程中,形成了物质与制度层面的现实诉求,前者主要体现在居住场所、道路交通、环境卫生与休闲场所四个方面,后者主要体现在子女教
随着物联网应用的快速普及,医疗、运输、智能环境以及网络社交等领域都是物联网的主要应用范围。世界范围内的物联网将在不远的将来成为现实。但是,随着物联网应用场景的逐渐
欧盟作为国际政治中的非国家行为体,在国际社会上的地位日益重要。地理位置上的紧邻中东使得欧盟对中东地区有着多种不同的需求。经济贸易层面,中东国家是欧盟重要的贸易出口
在本文中,作者考虑了Heisenberg群H~n上的Radon变换,对偶Radon变换和Poisson积分,并得到了关于Radon变换的各种逆公式.此外,我们证明了Radon变换是一个从Sobelov空间W到L~2(H
量子纠缠的几何度量作为量子信息学中的一个热点问题在理论物理学、量子计算、凝聚态物理以及纠缠信道容量等多个领域内得到了广泛的应用,与之关系紧密的复对称张量的复最佳
蛋白质是执行生物体内各种重要生物活动的大分子,认识其功能对推动生命科学、农业、医疗等领域的发展意义重大。传统的生物实验测定蛋白质的功能需要消耗大量的人力、物力、
人口老龄化是我国面临的突出社会问题,与之相关的老年人精神贫困也越来越引起人们的关注,重庆市F区老人集聚区在老龄化社会的背景下值得研究。F区存在多处规模在40-250人不等