【摘 要】
:
基因组岛是基因组中的特定区域片段,与水平基因转移密切相关,具有特殊的结构,常常携带致病、耐药及与适应性等功能相关的基因。通过基因组岛在不同物种间的移动,可以造成相关
论文部分内容阅读
基因组岛是基因组中的特定区域片段,与水平基因转移密切相关,具有特殊的结构,常常携带致病、耐药及与适应性等功能相关的基因。通过基因组岛在不同物种间的移动,可以造成相关基因的跨种属传播,这对物种进化和新功能获得具有重要意义,也是目前微生物研究领域的热点问题之一。本文主要围绕基因组岛的识别算法展开,系统地研究了预测方案中的信息提取、特征挑选和识别算法,主要内容安排如下:1.综述了基因组岛预测中的信息提取方法,包含GC含量、遗传密码子使用偏好性、k-mer频率、tRNA个数、ORF的个数和重复片段个数等多种信息提取方法,重点介绍了Centroid,Alien_Hunter和Sighunt等基因组岛识别算法。由于信息提取和识别算法是基因组岛预测中的两个关键因素,上述综述为本文的后续研究提供了理论和实践基础。2.提出一种基于双样本t检验的预测算法。首先,通过置信区间筛选了宿主的特征;再利用特征分布的峰度差异实现核心特征的挑选;最后,通过双样本t检验实现对窗口的打分,结合显著性检验方法构建了基因组岛预测模型。本文以AUC为评价指标,系统地比较了不同的信息提取、特征挑选和打分方式对预测模型的影响。模拟实验的结果表明,本文提出的基于峰度的特征挑选方法和双样本t检验的打分方式表现较好,其AUC值比其它方法至少高出5%。3.提出一种基于多尺度检验的基因组岛预测算法。首先,利用大规模的特征挑选方法,结合小尺度的t检验来量化序列片段的组分差异;再使用小规模的特征挑选方法筛选动态特征,结合大尺度统计推断,识别包含多窗口的组分异常片段;最后,联合马尔科夫熵和CG分割算法实现对基因组岛的边界重定位。本文对四组真实数据进行测试分析,并与现有的预测方法进行系统的比较。结果表明,本文提出的MTGIpick识别率与回收率更高,而且所预测基因组岛长度与真实的也最接近。4.实现了基于Java的图形用户界面(GUI)设计。简述了GUI开发的基础知识,详细地介绍了MTGIpick软件的设计过程,用户可以根据自己的需求选择算法及其对应的参数进行测试分析。
其他文献
电力系统继电保护是电力系统安全生产正常运行的重要保障,与此同时电力系统继电保护也是电气工程专业的一门重要专业课,其实践性、应用性、综合性较强,在继电保护的研究和教学过程中需结合实验,以便分析复杂电力系统运行方式下的各种保护。因此,设计一套经济实用、准确高效的继电保护仿真实验装置对继电保护研究和教学具有重要的意义。本文首先分析了传统继电保护实验设备的优缺点,针对大多数继电保护实验设备功能单一、造价昂
植物电信号是在外界环境的刺激下,组织和细胞产生的静息电位,是一种可以表征植物生理过程及生长状态的植物生理信号,其特点是微弱且低频,幅值处于几十微伏,频率大部分在5Hz以
目的:肿瘤微环境(TME)促进肿瘤细胞耐药越来越被关注,但肿瘤微环境恶性转化细胞自身的耐药情况知之甚少。本文探讨TME中被胶质瘤干细胞(SU3)诱导恶性转化细胞株(ih DCTC)对化疗药的
古藏语是无声调且有浊音的一种语言,但在漫长的发展过程中,由于地理、政治、文化等不断的发展分化,各地区的藏语出现了明显的差异,由此形成了藏语的方言。在中国境内的藏语现
ClpS蛋白在以大肠杆菌为典型代表的革兰氏阴性菌中发挥着调节蛋白质降解的重要作用,它是此类菌中蛋白质降解复合物ClpAP的特异性调节蛋白,它可以识别蛋白底物的某些特定的氨
随着“工业4.0”的推进,工业生产向自动化和智能化的方向发展,在提升生产效率的同时,对系统动能提供的稳定性提出了更高的要求。三相异步电动机作为工业生产中重要的电力设备,一旦发生故障,不仅影响设备自身的运行状态,而且会影响生产系统的正常运行。因此为保证工业生产的安全稳定运行,需要研究一种合理可行的实时故障诊断技术实现三相异步电动机的故障诊断功能。针对三相异步电动机的故障诊断,本文作了以下研究:(1)
本研究从牛的瘤胃、瓣胃和皱胃,污水处理厂生物池进口处、生物池内取样,利用划线法分离筛选出厌氧细菌;采用吲哚试验、氧化酶试验和点滴试验、16SrDNA测序等技术对分离细菌进
随着科技的发展,通信安全开始受到广泛关注。量子通信因其信息传递的高效率和绝对安全而发展迅速。单级量子通信由于传输过程中受光纤或者大气损耗的原因距离较短。通过量子
肝脏再生是肝脏区别于其他脏器的显著特点,肝再生分子调控机理的研究也一直是肝脏研究领域的重点之一。目前,研究肝再生的模式生物一般为小鼠、大鼠或家兔,以海洋生物为研究
MicroRNA(miRNA)是一类非编码小RNA,在生物体中起着至关重要的转录后调控作用。MiRNA通常是通过RISC复合物与靶基因mRNA的3’未翻译区的靶位点序列互补结合,导致靶基因mRNA降