【摘 要】
:
科技的飞速发展使得生物信息学得到广泛的关注,它的主要研究对象之一是基因组学。随着人类基因组全部序列测序的完成,核苷酸数据库中的序列和碱基数量得到迅猛的增长,因此能
论文部分内容阅读
科技的飞速发展使得生物信息学得到广泛的关注,它的主要研究对象之一是基因组学。随着人类基因组全部序列测序的完成,核苷酸数据库中的序列和碱基数量得到迅猛的增长,因此能够正确识别基因序列中的外显子部分是处理飞速增长的DNA序列数据的需要。本文将信号处理的方法与基因序列的生物特性相结合,根据基因序列编码区的周期特性实现了基因序列中外显子的预测。本文主要从四方面对基因外显子预测做了具体的介绍。第一部分介绍了生物信息学的相关背景知识,并且在此基础上进一步介绍了基因预测的研究现状及研究意义。第二部分从生物序列的特性出发,介绍了序列的数值映射方法,并且对序列在编码区的周期三特性作了具体的说明,为对序列进行特征提取打下基础。特征提取是对生物序列进行处理的关键部分,本文第三部分介绍了常用的时域和频域特征提取方法,如平均幅度差分函数、奇异值分解、DFT变换、成对加权谱旋转测量等,并且在此基础上将信息熵的方法以及音乐信号处理中常用的幅度差平方和函数用在基因预测中,并且取得了很好的预测效果。最后,在第四部分将多种不同时域和频域特征混合使用,通过统计学习的方法实现用多维特征对基因外显子进行预测。本文主要选取了GMM作为分类器,通过对其进行训练获得GMM的参数集,以此作为测试的依据对序列中外显子进行预测,这里重点介绍了GMM中的核心算法——EM算法。总之,通过对基因序列进行深入的研究,本文将信号处理的方法应用到生物信号领域,很好地实现了对基因外显子预测。
其他文献
阴道毛滴虫(Trichomonasvaginalis)是一种寄生于人体阴道及泌尿道的鞭毛虫,该虫引起的疾病统称为阴道毛滴虫病,是最普遍的非病毒性性传播疾病之一。阴道毛滴虫除引起滴虫性阴道
近年来,移动通信业务的迅猛发展对无线通信网络的性能指标提出了更高的要求,国内外的科研工作者对多输入多输出(MIMO:Multi-InputMulti-Output)技术已经进行了深入的理论研究,并
纹理映射过程是真实感模型绘制技术中的关键步骤,纹理图像生成的好坏对生成模型的真实感影响重大。纹理映射技术是计算机视觉和计算机图形学中的重要研究方向,具有重要的学术价
本研究首先采用质粒共转染和竞争性RT-PCR方法对本组从HTLV-I活化的人外周血T淋巴细胞MATCHMAKERcDNA文库中筛选到的NRE结合蛋白ITF2B在Jurkat细胞、B3D5细胞及BJAB细胞中对I
本研究将产自广东省博罗县的福田菜心、酥醪菜、耙齿萝卜三个名优蔬菜品种搭载“神舟四号”宇宙飞船,6天后发现种子萌发和幼苗发育以及抗氧化能力均受到影响。 空间环境可
在当今社会飞速发展的环境中,图像处理技术已经变得越来越重要,图像的数字化处理已经在科学研究、医疗卫生以及国防军事等领域发挥着越来越大的作用,大的方向包括国防上用的无人
互联网的快速发展方便了我们的生活,同时也给我们的个人信息安全敲响了警钟。我们银行卡里的钱可能被非法分子盗用,我们在网上的个人信息可能被黑客窃取并用于犯罪。越来越多的
p27Kip1基因编码一个周期蛋白依赖性激酶抑制蛋白(cyclin-dependentkiBaseinhibitor,CKI),属对CDK(cyclin—dependentKinase)-cyclin复合物具有广谱抑制作用的p2i家族。其编码
香糯竹(Cephalostachyumpergracile)——唯一一种用于烧制竹筒饭最佳的竹子,是植物系统分类学研究中具有重要学术价值并具有特殊文化内涵的珍稀竹种,由于其自然分布区狭窄,种质
序列对位是最常用的一类生物信息学研究方法。它在序列的功能、结构及进化关系预测、数据库搜索,系统发生树构建等方面有着广泛用途。然而,序列对位所得到的分值本身并不能说明