基于密集连接神经网络模型预测化合物与蛋白质绑定的研究

来源 :兰州大学 | 被引量 : 0次 | 上传用户:zhoubear
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
传统的药物研发(合成新物质的方法)耗时,又昂贵,成功率低,该模式遇到发展瓶颈。近现代的实验化学、理论化学、药理学和毒理学等学科的发展,揭示了一些化合物与蛋白质之间绑定的特征,但仍然有限,这制约了药物研发的进程。基于天然植物、动物、矿物化学成分的方法在药物研发过程中一直占有重要位置,并积累了大量的实验数据。如何从这些实验数据中抽取更多化合物与蛋白质之间绑定的特征,预测新的化合物与蛋白质之间绑定关系,对于药物研发具有重要的提示性作用。近些年,随着人工智能得到迅猛发展,各领域积极引入基于深度学习的实验方法,并且取得了突破性进展。深度学习也称为分层学习,该方法主要是受生物大脑启发所设计出来的模型。深度学习在规模较大的原始数据规模上,通过逐层变化自动提取特征,并对提取的层次化特征自动学习。由于深度学习可以对特征自动进行提取,对研究者的专业知识没有太高要求,并且速度快,精度高,对处理数据量规模较大的实验占据很大优势,从而为抽取更多化合物与蛋白质之间绑定特征提供了新的途径。本文利用了深度学习模型中的密集连接,通过在不同层之间增加跳跃连接加强了模型的信息交流,帮助模型学习到更加鲁棒的特征,还可以解决深度神经网络训练中的梯度消失问题,保证模型的收敛。本文最终使用的深度神经网络模型由化合物特征网络、蛋白质特征网络以及联合判别网络组成,每个网络分别由3,3,4个密集连接块组成,每个密集连接块内的神经元数量分别为1945、1912、1284,1386、2107、1027,2652、1515、2345、2325,参数总量约为36.63M。本文从数据处理,构建,训练,优化模型从而训练得到最终模型,该过程尝试多种方法,耗时两年时间,得到最优模型在测试集的Accuracy为98.29%,Precision为93.55%,F1-Score为94.04%,Recall为94.54%。本文使用的基于密集连接神经网络模型对化合物与蛋白质绑定关系的研究得到了较好的结果,为后续的研究提供了新的思路和实验数据。
其他文献
无粘结预应力加筋土技术的核心是通过对预应力筋施加预拉力,使侧压板、预应力筋、墙面板共同对填料形成主动约束,提高加筋土结构的整体性。本文利用模型试验和数值模拟相结合
在现代农业中,随着农业机械化的发展,土壤的机械压实问题日益严重,并给农业生产造成严重的影响。现在我国对土壤压实的评价主要通过多道面波法、土壤紧实度法、土壤容重法以及土壤孔隙度法来测量土壤的机械压实度,但大都是土壤压实后的测量,而无法研究土壤压实过程中的土压力变化。近年来,国内外开始采用土压力传感器来测量土壤土压力变化,但是还存单向测量土壤应力、传感器有线连接、结构繁琐以及土壤扰动大等缺点。为了解决
大型油轮燃油辅锅炉是油船上的重要设备之一,锅炉的稳定运行是船舶安全航行的前提条件,确保汽包水位在允许的范围内波动对锅炉以及船舶的安全经济运行具有十分重要的意义。对
紫花苜蓿(Medicago stativa L.),豆科苜蓿属,多年生草本植物,是目前为止种植最广泛的牧草作物之一。但是紫花苜蓿中的木质素成分会降低其在牲畜体内的消化率,影响紫花苜蓿的经
绵羊基因表达谱显示,KRT2基因在不同毛色绵羊皮肤的mRNA表达有差异,暗示KRT2可能对皮肤黑色素的形成有关。为探索KRT2对羊驼皮肤黑色素细胞黑色素生成的影响,首先采用免疫组
港口对于城市经济发展具有重要促进作用,为大力发展经济,我国沿海各港口城市在其辖区内建设了众多港口,而快速建设的港口出现了临近区域港口重复建造、港口之间恶性竞争等现象。港口群内复杂的竞争关系和不合理建设为其进一步规划建设增加了难度。当面临需求不确定时,港口的货运需求无法准确预测,其投资建设就更加具有难度。因此考虑上述因素对区域港口投资决策进行研究对于促进区域经济发展、提高港口资源利用率具有重要意义。
船舶动力定位是指船舶仅依靠自身推进器产生推力抵御海洋环境扰动的影响,以一定姿态保持在海平面某期望位置或沿着某一设定轨迹航行。船舶动力定位系统具有定位精度高、作业
高熵合金不同于传统合金,其新颖的设计理念赋予了材料科学新的发展方向以及很好的发展前景。随着材料技术的发展,高熵合金的范围逐渐扩大。最初定义高熵合金是由至少五种元素按照等原子比或近似等原子比组成,之后逐渐出现了三元、四元以及非等原子比高熵合金。目前虽然对于高熵合金的定义还没有一个定性的结论,但其从构型熵或者混合熵的角度来设计新型合金的这种突破性理念已引起大多数学者的重视和兴趣。在日常生活中,金属部件
某些检疫性植物病害,由于其传染性强、传播途径广、危害性大等特点,难以获得大量的样本,数据存在着严重的不均衡性,在应用深度学习方法对其进行分类识别时很难取得理想的效果
随着工程结构的不断发展,基于响应的结构健康监测、损伤识别和振动主动控制等方法在很多领域得到了广泛的应用。然而,在机械和航空航天等领域中,由于工作环境恶劣、布线的限