模体的并行聚类算法研究及在短柄草核心启动子预测的应用

来源 :天津师范大学 | 被引量 : 0次 | 上传用户:fanjolly
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着科学技术的飞速发展,基因测序的成本不断减少,目前已有成千上万物种的基因组被成功测序。由于一个生物体的生物学功能密码往往隐藏在它的基因组序列中,并且在这些密切相关的基因组序列中相对保守,所以人们设计了大量的基于比较基因组学的算法来解读这些已被测序的基因组中生物学功能的奥秘。  转录调控是基因表达的关键步骤之一,该过程主要是由转录因子控制的。每个转录因子的结合位点通常都具有一定的共性或特定的模式,我们把能够由同一转录因子识别的相似的一组转录因子结合位点称为一个模体。通常,我们通过模体发现得到一些假定的模体后,需要对这些假定的模体进行聚类,使得能够被同一转录因子识别的模体形成一聚类,而不同的聚类则分别对应了不同的转录因子所识别的模体。因此,设计一种新的模体聚类算法,用来将能够被同一转录因子识别的模体进行聚类是十分必要的。  首先,本文提出了一种全新的模体聚类算法——Clip算法,并且对其串行程序进行了并行化设计,大大提高了运算速度。然后,将CliP算法和另外两种著名的聚类算法进行了对比,数据显示CliP算法的聚类效果比其他两种算法更好。最后,利用该算法对短柄草核心启动子进行预测分析,取得了理想的结果。
其他文献
水电仿真软件是一个大型综合的实时仿真系统,能够真实地反映了整个电站的运行工况,实现在多种工况下的机组启动、停机和正常运行的监视及操作。水电仿真软件采用纯粹的软件方
信息技术的迅速发展使数据库的应用得到了极大的普及,数据库管理系统作为数据库存储和处理数据的核心软件,实现了更有效和更安全的创建、管理和保存大量的数据,其实现中的各
随着计算机和网络的普及,计算机系统和网络的安全问题日益突出。入侵检测是解决网络安全问题的主要方法之一。入侵检测分为基于误用的方法和基于异常的方法。异常检测是检测任
基于内容的图像检索(Content-basedImageRetrieval,简称CBIR)技术近年来得到了快速发展,现已广泛地应用于图像处理、计算机视觉和商标图像数据库等领域。该技术主要是利用图像
人类为了更深入地了解和认识自身,制定了宏伟的人类基因组计划。随着人类基因组计划的顺利实施,生物实验技术也在日新月异地进步,微阵列芯片技术正是其中最有代表性的一种。
词义消歧一直是计算语言学领域的一个重要研究课题,对机器翻译、信息检索、内容和主题分析、文本分类、语音识别等领域有着重要的影响,可以帮助解决语言信息处理中的一系列理论
移动IP技术的出现,使人们得以在不改变移动节点IP地址的情况下,实现了对本地系统的远程访问,简化了网络的管理。但是,在移动IP传输数据的过程中,数据随时有可能受到攻击者的拒绝服
在医学图像处理领域,肺部肿瘤的分割是一项具有实际应用价值的课题。基于精确的肺部肿瘤分割结果,可以进行相应的三维重建、分析解剖结构和计算肿瘤体积等相关研究,从而为医生提
随着信息技术的迅速发展和Internet的普及,Web日志资源越来越丰富。如何充分利用这些资源,从中提取出用户所感兴趣的信息数据,是当前计算机领域的一大挑战。Web日志挖掘就是利用
空值的研究是关系数据库领域的一个重要研究方向,具有重要的理论价值和应用价值。经典的二值逻辑和多值逻辑在空值的表示和处理上仍有不足,随着模糊数学理论体系的建立,人们