基因芯片设计中离散种子技术的研究

来源 :中国科学院计算技术研究所 | 被引量 : 0次 | 上传用户:liaqin18
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着人类基因组计划的完成,如何对大量序列进行处理成为了目前最重要的研究领域之一.因此,具有高度并行性,自动性,高效率的基因芯片技术应运而生. 基因芯片是生物技术与计算机技术融合的结晶,可以实现对基因数据的大规模检测.它通过在一个微小的固体载体表面固定大量的探针,构建一组微分析单元,来实现对生物分子准确,快速,大信息量的筛选或检测. 探针设计是基因芯片设计中的关键环节.由于探针是基因芯片的基本信息存储单位和基本功能单位,因此探针性能的好坏在很大程度上决定了基因芯片性能的好坏.如何设计好的探针是目前探针设计工具亟待解决的问题. 基于离散种子技术,本文提出基于Bayes推导和Spaced Seed做相似性估计的方法,并且研究了如何选择Spaced Seed使其产生的探针具有较好的性能.本文的主要工作包括: (1)基于Bayes推导的序列相似性估计方法. 由于DNA序列均由A、T、G、C四种碱基组成,并且每种碱基的分布是存在先验概率的, 那么对于长度为n个碱基的等长序列y1、y2,如果其中m个位置两序列对应碱基相同,m
其他文献
在现代超大规模集成电路中,每个芯片中都包含上百万个晶体管和互连线,其中任何缺陷都可能导致整个芯片设计失败.在后端物理设计中,要经历综合、布图规划、布局、布线等步骤,
在"龙芯"产业化过程中,"应用软件库"不丰富是一个重要的问题,对于用c/c++等平台相关语言编写的应用程序,移植和维护都需要大量的人力物力,只要"龙芯"产品投入市场,移植和维护
软件安全漏洞的存在及其带来巨大的危害使得软件漏洞检测技术的研究日益重要。其基本思想是通过对待测试软件程序采取不同的技术手段,分析程序的源代码、二进制代码或在对应
近十来年,互联网技术得到了快速发展,互联网用户不断增加,网络应用得到迅速普及,网络数据的增长速度超乎想象。XML语言(可扩展标记语言)作为互联网上数据交换和共享事实上的
随着数据仓库技术与数据挖掘技术的广泛应用和发展,企业管理人员对决策分析有了更高的要求。企业的中高层领导目前更多关注的是如何能够在现有大量数据的背后挖掘到有用的隐藏
随着网络服务要求的提高,网络系统的协议也变的越来越复杂,在这种情况下,需要合适的方法、技术来对协议进行正确性验证和测试[1][2].对协议本身的逻辑正确性进行校验的过程称
随着通信技术的持续发展,用户对于通信服务提出了越来越高的要求,视频通信由于其可视的业务特点以及其高速率的数据传输量和由此带来的对传输载体的性能要求而被关注.传输具
串联质谱 (Tandem Mass Spectrometry) 是蛋白质序列鉴定的重要方法,其目标是如何从已知实验质谱来推断未知肽段的氨基酸序列.在此过程中,如何从一个肽段序列精确地预测出对
网格技术将分布的资源集合并有效的利用,它为用户提供了访问、使用和控制分布在不同域的异构资源的能力,同时也为网格安全带来新的问题。认证和授权机制是网格安全的基础,它们相
学位
随着网络技术的不断发展,网络越来越多地承载各种关键业务,对广域网骨干链路进行流量测量能够有效地分析网络状况、掌握流量特性,由此有效地实施流量工程,改善网络服务质量.