基于分段信息融合的蛋白质亚细胞位点测方法

来源 :上海师范大学 | 被引量 : 2次 | 上传用户:wangjuekenan
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
生物信息学是一门交叉学科,它包含了生物信息的获取、处理、存储、分发、分析和解释等在内的所有方面,它综合运用数学、计算机科学和生物学的各种工具,来阐明和理解大量数据所包含的生物学意义。生物信息学的研究方面十分广泛,其中,蛋白质亚细胞位点定位是目前热门的研究课题之一。一个完整的细胞可以分成许多不同的细胞区域,如细胞质、叶绿体、线粒体等,大多数蛋白质在核糖体中合成以后要被转运到特定的细胞器中,蛋白质只有在合适的位点才能执行其特定的功能,否则会产生其它影响,甚至导致疾病产生。因此,能够准确有效的预测蛋白质的亚细胞位点具有十分重要的生物学意义。   本文的内容如下:   第一章介绍生物信息学产生的背景、研究的对象、内容以及本文的工作。   第二章介绍生物信息学中有关分类问题中的一些机器学习方法,包括k-最近邻算法、贝叶斯统计、神经网络模型和支持向量机等。   第三章给出一种基于最优分割位点的蛋白质亚细胞位点预测方法。根据每条蛋白质序列的最佳分割位点,把序列分割成三部分:N端分选信号部分、中间部分和成熟蛋白质部分,然后在每个子序列中分别提取特征,这些特征包括氨基酸组分,双肽组分以及氨基酸的物理化学性质,最后再把这些特征融合在一起作为整条序列的特征。通过夹克刀检验,该方法在NNPSL数据集上得到的原核生物蛋白质序列和真核生物蛋白质序列的预测精度分别是92.1%和87.8%。  
其他文献
随机微分方程很广泛的应用于资产投资,种群系统, 工程控制, 生态学等各个方面. 近些年来,受到很多学者的广泛关注. 通常情况下, 对于大多数随机微分方程是无解析解的, 而带跳
本文中我们主要证明了C1平均共形排斥子和C1平均共形双曲集上不变测度的点维数跟该点的局部熵和Lyapunov指数之间的关系.在[1]中,Barreira和Wolf证明过C1+α共形排斥子和C1+α
压电材料作为最常用的智能材料之一,已广泛应用于许多技术领域.由于压电材料的力电耦合性及各层材料之间弹性系数的不连续性,数值方法对于求解智能压电结构问题具有重要意义.目
本文对关于Zygmund向量场的拟对称流的一些注记进行了研究。在文章[Re]中,Reimann证明了连续的Zygmund类A*的向量场的流是拟对称同胚。本文将主要研究光滑Zygmund函数类λ*或
本文主要研究了解析函数Banach代数D∩ A(D)中外函数生成的主理想。我们首先刻画零集有限的闭理想,由此得到D∩ A(D)中具有相同有限零集的任意外函数生成的主理想都相等;其次对