【摘 要】
:
细胞的生命活动大多以蛋白质相互作用的形式进行,对蛋白质相互作用进行深入研究,有助于人类更深入理解生物体生命活动的机理。当前基于深度学习的蛋白质相互作用预测方法能够克服传统实验方法的缺陷,通过对海量蛋白质数据进行处理和分析,取得不错的效果。然而,这些方法还存在以下不足,主要表现为:特征选取只考虑了蛋白质的序列特征而忽略了其它特征;序列模型训练速度非常慢;缺乏有效的方法基于蛋白质三级结构进行相互作用预
论文部分内容阅读
细胞的生命活动大多以蛋白质相互作用的形式进行,对蛋白质相互作用进行深入研究,有助于人类更深入理解生物体生命活动的机理。当前基于深度学习的蛋白质相互作用预测方法能够克服传统实验方法的缺陷,通过对海量蛋白质数据进行处理和分析,取得不错的效果。然而,这些方法还存在以下不足,主要表现为:特征选取只考虑了蛋白质的序列特征而忽略了其它特征;序列模型训练速度非常慢;缺乏有效的方法基于蛋白质三级结构进行相互作用预测。针对以上三点,我们在本文中提出了三个算法来改进当前蛋白质相互作用的研究。基于多特征和残差网络的方法是基于蛋白质序列数据进行预测,分别提升预测的准确率和速度,而基于3D网格的方法是本领域首创使用深度学习方法基于蛋白质三级结构数据进行相互作用预测,将蛋白质的结构和功能建立起关联。本文的主要工作如下:基于多特征的蛋白质相互作用预测算法结合了蛋白质的序列特征、局部特征以及物理和结构属性特征,将多特征融合后进行相互作用预测,能够进一步提升预测的准确率。基于残差网络模型的蛋白质相互作用预测算法结合了深层次残差网络的强大特征提取能力,以及卷积神经网络模型能够充分利用GPU的性能进行高效计算的优势,可以在保证高准确率的同时,大大减少训练时长。基于3D网格模型的蛋白质相互作用预测算法利用蛋白质三级结构中原子跟3D图像中像素点的表示方法类似的特点,使用处理方法将蛋白质三级结构数据转换成3D网格,进而使用3D残差网络提取特征和实现蛋白质相互作用预测。
其他文献
大规模的工业化曾为建国初期中国国力的迅速增长提供了主要的动力。在一些集中重点发展工业的城市,不仅形成了主要由工厂及其配套设施所构成的特殊的城市面貌,同时还出现了一种城市市民独特的居住形式和生活空间——工人福利生活区。比起作为一个地域概念,将“福利生活区”理解为一种社会制度更加贴合本质。在过去,分布于城市大大小小的工人福利区规定了绝大多数市民包括衣食住行在内的几乎全部日常生活、精神生活和政治生活,这
气体绝缘开关柜(Gas-Insulated Switchgear,GIS)广泛运用于当代电力系统,其绝缘状况与电网的安全稳定息息相关。局部放电是反映电力设备绝缘缺陷的重要指标,针对局部放电信号的特征学习与模式识别方法的研究具有重要意义。局部放电模式识别任务具有鲜明的特点,例如真实局部放电事故发生概率小,数据难以获得。当前研究主要依靠物理仿真数据,但仿真数据依旧存在样本不足、多样性缺乏等问题。此外,
分布式联合信源信道编码(Distributed Joint Source-Channel Coding,DJSCC)将分布式信源编码(Distributed Source Coding,DSC)技术与信道编码联合起来考虑,同时实现了压缩与抗差错功能,更适合实际的应用场景,深受国内外研究学者们的关注。本论文对基于原模图LDPC码的分布式联合信源信道编译码的关键技术展开研究,具体工作如下:1、针对无记
活性分散染料是解决超临界CO2中天然纤维染色局限性的重要选择之一,积极开发活性分散染料,对于天然纤维的无水染色加工具有重大意义,也符合当今绿色生产的发展要求。活性分散染料发展至今已获得了一定的成效,且对于超临界CO2的广阔应用前景而言,这种特殊结构染料的研发将成为今后该领域的研究热点。为此,本课题设计并合成了偶氮型三原色活性分散染料:活性分散红SCFX-AYRL、活性分散黄SCFX-AYYL和活性
木质纤维素作为环境友好、价格低廉的可再生资源,具有广泛的应用,可以通过化学法或生物法转化为乙醇、乙二醇和糠醛等小分子化合物或转化为汽油、柴油以及航空燃油等高价值燃料,在人类社会能源可持续发展中占有重要的意义。木糖是自然界含量仅次于葡萄糖的第二丰富的糖类物质、在木质纤维素中占有较高的比例、实现木糖的高效转换利用是实现木质纤维素高值化利用的关键因素和前提条件。木糖酸是一种五碳有机酸,应用广泛,可作为螯
制程提高和技术创新为NAND Flash带来了更高的存储密度,但也让其数据可靠性问题日益恶化。其中,耐久度(Endurance)的不确定性及差异性不仅降低了闪存使用寿命,也导致使用者依据远低于最小实际值的标称值而过早地更换闪存设备,造成极大的寿命浪费。若能准确地预测闪存耐久度,即可利用预测结果实施坏块预警和优化磨损均衡策略,这将有效地延长闪存设备使用寿命和避免突发性失效导致的严重损失。为此,提出一
本文主要研究修正导数项的有限体积HWENO(Hermite Weighted Essentially Non-oscillatory)格式,并结合两步四阶时间离散方法,应用于求解双曲守恒律方程。我们研究修正导数项的有限体积HWENO格式,这种格式既有高精度,又具有本质无振荡特性。为了控制解在间断附近的伪振荡,我们首先修正解的一阶导数项。然后,我们使用同一套模板,直接重构解和解的一阶导数项。HWEN
α,β-不饱和醇是香料、药物及一些精细化工产品的重要原料和反应中间体。传统均相体系需要使用价格昂贵的金属氢化物(如NaBH4或LiAlH4)还原α,β-不饱和醛/酮,但存在反应条件苛刻、产物分离和提纯困难等问题。以多相催化选择加氢的方式连续生产α,β-不饱和醇可以带来生产效率、环境友好和经济效益等方面的优势。巴豆醛是一种结构简单的α,β-不饱和醛,C=C键侧仅有一个甲基相连,空间位阻比苯基等长链取
目的:(1)将人角质形成细胞(human epidermal keratinocyte,HEK)与人脐带间充质干细胞条件培养基(Human Umbilical-derived Mesenchymal Stem Cell,HUMSCCM)共培养,探究其能否发生上皮间质样变(Epithelial Mesenchymal Transformation,EMT)样变。(2)探究HUMSC-CM中促进在EM
在违约损害赔偿的体系中,可得利益赔偿是其重要的组成部分,目前,我国《合同法》对可得利益赔偿尚无系统、完善的规制,虽然在该法的第113条规定了对可得利益的保护,并确立了可预见性规则,但是该法规为原则性、指导性的规定,对司法实践来说,其操作性不强。虽然最高人民法院在司法指导意见中,对可得利益的几种类型进行了列举,并规定了可得利益赔偿的基本计算方法,但是,在具体的实践中可操作性不大且无法满足日益增长的可