【摘 要】
:
DNA结合蛋白作为一类能够在生物体中能够与DNA结合并形成复合物的蛋白质,在生物体中遗传与进化过程中发挥着重要的作用。研究预测DNA结合蛋白对医学、农畜牧业等生命的健康发展有着至关重要的意义。随着后基因组时代的到来,大量基于序列信息进行分析预测的方法被提出,极大的促进了DNA结合蛋白预测领域发展。本文从序列信息的角度出发,分别使用机器学习算法和深度学习框架构建DNA结合蛋白预测模型。具体内容如下:
论文部分内容阅读
DNA结合蛋白作为一类能够在生物体中能够与DNA结合并形成复合物的蛋白质,在生物体中遗传与进化过程中发挥着重要的作用。研究预测DNA结合蛋白对医学、农畜牧业等生命的健康发展有着至关重要的意义。随着后基因组时代的到来,大量基于序列信息进行分析预测的方法被提出,极大的促进了DNA结合蛋白预测领域发展。本文从序列信息的角度出发,分别使用机器学习算法和深度学习框架构建DNA结合蛋白预测模型。具体内容如下:(1)本文对现有DNA结合蛋白预测研究概况进行了总结。首先介绍了蛋白质相关的数据库,之后介绍了在DNA结合蛋白特征提取方面一些通用的特征提取方法,并简述其过程。最后陈述了一些较为流行的算法与原理。(2)使用传统机器学习算法,本文提出了一种基于伪进化信息的DNA结合蛋白预测方法。本文从蛋白质序列的进化信息角度出发,通过提取蛋白质序列的位置特异性得分矩阵,将矩阵划分为子矩阵,提取伪局部进化特征,并结合蛋白质的氨基酸组成等信息构成蛋白质的伪进化信息,通过使用径向基函数的支持向量机与减小偏差算法进行特征选择并对比不同分类器,最后生成预测模型。该方法在测试集上的预测结果准确率、马修相关系数分别为91.2%和0.826,优于现有的机器学习方法。(3)使用深度学习框架,本文提出了一种基于双向长短期记忆网络的DNA结合蛋白预测方法。本文使用嵌入的方式将氨基酸序列转化为向量,在含有卷积层,池化层,双向长短期记忆网络等结构的深度学习网络中,使用自主构建的数据集进行训练,在测试集上得到预测结果的准确率、马修相关系数分别为92.0%和0.841,优于其他方法在此数据集上复现的结果;此外,本文从Uni Prot中构建了不同物种的DNA结合蛋白数据集,探究模型在不同物种之间预测的效果。本文提出的两种不同的DNA结合蛋白预测方法都表现出良好的性能,所提出的方法可被进一步应用于其它蛋白质属性预测领域。
其他文献
车间是制造活动执行的基础环境,由于车间人员有意志自主性,其运动速度、状态、方式等难以表征,因此车间人员管控是车间生产作业中最难控制的环节,军工产品线更是如此。由于军工品产品的特殊性,往往对生产作业过程中的不同区域的人数、不同作业环节与工序等的人员位置有着严格要求。一旦危险发生,人员聚集过密将造成灾难性安全事故,严重威胁车间生产人员人身安全。因此,如果可以对该类车间生产作业人员进行实时准确管控,则既
机载导弹挂架是搭载空空导弹的装置,其设计质量的好坏对导弹发射性能有着重大影响,为提升机弹匹配性能及导弹发射控制精度,本文对一种机载导弹挂架进行设计,并围绕其弹射结构与原理、导弹脱离挂架时以及导弹点火前的物理信息提取、多目标优化算法研究、挂架弹射机构优化与主体减阻优化展开了研究。本文首先对一种双臂式弹射导弹挂架进行结构设计,着重对其弹射部分的结构进行原理研究,并分析出了导弹脱离摆臂时的起始角度、位置
近年来,随着电子通信、能源输送和水利水电事业的迅猛发展,非开挖技术得到了广泛的应用。随钻测量技术、定位技术和测深技术作为非开挖技术的关键技术,受到了技术人员越来越多的关注和研究。本论文围绕非开挖技术中的透地测深技术展开深入研究,搭建了高精度的测深系统。具体研究内容如下:论文首先分析了地下的电磁环境,将载有甚低频电流的含芯螺线管线圈作为地下发射天线,根据其所产生的准静态场的分布特性,利用地面接收线圈
无线传感器网络凭借其分布范围广、灵活性强、布置方便等特点被广泛应用于各种环境监测场合,实现了简单数据的及时获取。但是,对于图像信号的采集和处理一直受限于传感节点的处理能力和能耗问题,然而压缩感知理论的提出为图像的采集和处理提供了新的方向。本文以压缩感知理论为基础,实现图像信号的采集、处理和无线传输,为压缩感知理论与无线传感器网络的结合提供了一种新的硬件实现方式。论文首先简单介绍了压缩感知理论及其在
识别和理解人的行为是未来车间人员安全管控的主要任务之一,也是人机共融技术的主要难点和瓶颈。复杂车间中关键生产工位较多,当前车间生产监视系统虽可用于事后追责,但难以实现全面、实时、同步管控。鉴于此,本文提出一种基于计算机视觉技术车间的人员行为识别方法,对车间关键工位点的生产行为进行智能识别、分析与管理决策。本文以某航天车间关键工位点生产人员实时行为识别项目为背景,提出了一种基于生产人员改进骨架模型的
为打赢未来高科技局部战争,提升军队作战能力,高机动性能、高精度的作战装置逐渐成为了研究重点。火箭炮是一套典型的机电伺服系统,但是在其运动过程中存在参数确定、外部干扰、两轴耦合等因素,这些因素制约着伺服系统性能的提高。如何提高火箭炮发射平台瞄准目标的快速性、降低动能载荷发射初始扰动以及提高发射冲击载荷作用下系统的稳定性,逐渐成为研究的重点。本论文针对火箭炮机电伺服系统为研究对象,主要从以下几个方面展
行星滚柱丝杠副作为一种机电伺服系统的作动器执行机构,较高的承载能力与长时间运行下的可靠性使其成为在重载以及恶劣工况下的理想产品。但是,目前国产的行星滚柱丝杠副在承载极限、传动精度与可靠性等方面与国际先进产品仍存在明显的差距。本文从标准式行星滚柱丝杠副的结构切入,对在加工与装配时可能产生的各类误差进行了探讨,并对考虑误差状态下的啮合特性、接触特性以及传动精度等方面进行了理论研究与试验分析。首先,基于
链式弹仓是现代火炮自动装填系统中的重要环节,其到位精度和运动状态深刻影响着自动装填系统整体的工作可靠性。本文准备以滑模控制为基础,结合模糊控制理论和神经网络控制理论,对链式弹仓进行深入研究。本文的主要研究内容包括以下几个部分:(1)详细介绍了弹仓系统的基本组成部分和工作流程,并提出了相应的控制要求。根据系统的工作特性,推导出了系统机械运动方程和电气基本方程。同时考虑到系统建模的准确性,本文在弹仓系
数控加工设备正在朝着智能化和信息化的方向发展,本文以发动机传动体机匣生产线国产机床为研究对象,开展了发动机机匣生产线关键设备效能评估及预测性维护技术的研究。首先,针对数控加工设备效能监测过程中无法精准判别机床运行状态的问题,研究了基于能耗与数控系统信息集成的运行状态关键节点判别方式以及能量效率在线获取方式,并设计开发了设备加工效率及能耗监测数据模块,布置在哈尔滨东安公司机匣生产线的状态监测系统中,
随着城市的不断发展,城市内部及境外前往交通枢纽的流量迅速增长,路网规模及其复杂度不断增加,但目前对于交通枢纽指路标志系统的设置完善却相对较少,缺乏路网层面的综合性考量,连续性不足、系统性不够、智能化信息化应用水平低。因此,本文通过网-线-点的研究思路对城市交通枢纽指路标志设置进行探索和分析,借助地图API开发平台对路网层面对nO-1D的交通枢纽指路标志进行优化设置,具有重要的理论和应用价值。主要研