基于离散特征的蛋白质亚细胞定位预测方法研究

来源 :湖南大学 | 被引量 : 0次 | 上传用户:qqifha
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
蛋白质亚细胞定位与蛋白质功能,结构及相互作用都密切相关,因此建立可靠的亚细胞定位预测模型对理解蛋白质机能,生命活动以及药物研发都具有重大的意义。以蛋白质字母序列为研究对象,基于数学方法和计算机技术的预测方法成为了研究重点。虽然目前已经提出了许多此类预测方法,但是仍存在两方面问题:一、预测方法的时间复杂度和空间复杂度仍然较高。二、不能有效解决数据量有限且数据分布极度不平衡的数据集的预测问题。针对这两个问题,本文提出了两个基于离散特征的新型预测模型,主要创新工作概括如下:首先本文提出了基于蛋白质序列图形表达HR-Curve的亚细胞定位预测模型。HR-Curve的构建基于氨基酸理化性质分类和双向量,HR-Curve具有高可视性,信息完备性,分类可视性以及多应用性等特点。同时根据HR-Curve的特点,本文提出了一种高效的基于欧式距离的相似度计算方法MAV,该方法很大程度上降低了时间复杂度和空间复杂度。最后将HR-Curve应用到亚细胞定位预测。实验证明HR-Curve在保持较高预测准确性的同时,明显有效地提高了预测效率。针对第二个问题,本文提出了基于SVM的亚细胞定位迁移预测模型。该模型基于改进的基于亲疏水性的氨基酸分类的特征提取方法和SVM的迁移学习思想。通过加入自适应检测条件,在保证预测准确率的同时,迁移学习的收敛速度得到了有效地提高。最后从两方面验证了该迁移预测模型的特点和优势:一方面通过设计对照实验,证明迁移预测模型对特殊数据集的适用性及高效性。另一方面通过与其他方法对比,进一步说明迁移预测模型的特点和前景。
其他文献
复杂背景视频序列中微动目标的特征提取与分类算法研究,在运动目标的检测与提取的研究领域中,有着十分重要的地位。在对该领域的研究中,已有的算法大多是基于运动特征或能量等对
随着智能规划越来越多在实际问题中的应用,更多的学者开始关注和研究智能规划,人们从多个角度去完善,并提出了多种规划策略,其中,启发式规划方法作为智能规划领域的重要问题之一,在
云计算技术的飞速发展推动了信息化架构的大整合,但将高性能计算迁移到云服务上,仍面临着重重挑战。尤其是目前广泛用于海量数据处理的Hadoop体系,应用到科学计算的某些领域存在
随着人脸识别技术在模式识别、计算机视觉和多媒体技术等领域中的不断发展,人脸检测与跟踪作为人脸识别技术中的关键问题,越来越受到大量相关研究者的关注与重视。目前,人脸检测
云是大气中热力过程和动力过程的外部表现,同时也是水汽循环的重要环节。它在天空中表现出来的水汽状况、稳定程度以及高度和厚度,都是实时预测天气的关键性特征。因而对于人
随着传感器技术、无线通信技术以及嵌入式计算技术的飞速发展和日益成熟,无线传感器网络在军事、环境、家居、医疗等诸多领域得到了广泛的应用。无线传感器网络一般是由大量采
近年来,随着计算机网络的普及和应用,网络成为全球范围内信息转播主要渠道,为用户提供方便的网络接入服务已成为各个公共场所的常用服务之一,所以越来越多的场合需要用到网络审计
随着互联网上视频数据的海量增长,对视频数据的组织和管理成为当下的迫切需求。由于传统的基于属性和文本的视频检索存在许多不足之处,因此直接通过视频的内容特征为索引的视频
随着云计算技术的飞速发展,互联网和科学计算领域需要处理的数据呈现出级数式增长的趋势,并行编程技术在这海量数据处理中发挥着重要作用。当前运用较多的是由Google提出的MapR
无线Mesh网络作为一种宽带无线网络接入解决方案,将在未来通信系统中发挥着不可或缺的作用。与传统无线网络相比,无线Mesh网络不仅融合了无线局域网和Ad Hoc网络的特点,而且它还