基于机器学习的赖氨酸琥珀酰化位点预测研究

被引量 : 0次 | 上传用户：hyman_han

【摘要】

：

【机构】

：

景德镇陶瓷大学

【发表日期】

：

2023年01期

下载到本地 , 更方便阅读

下载此文赞助VIP

声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架

论文部分内容阅读

蛋白质翻译后修饰（PTMs）是调节蛋白质功能的重要机制,使得蛋白质类型更多样、结构更复杂以及功能更完善,在生物学过程和信号通路中发挥着不可替代的作用。近年来,赖氨酸琥珀酰化修饰被发现是一种新型PTMs,能够引起蛋白质特性的改变,对蛋白质结构和功能影响显著。琥珀酰化位点的准确识别对于研究蛋白质细胞功能以及相关疾病的病理研究具有重要意义。由于传统生物实验方法成本高、效率低且实验过程复杂,很难在短时间内获取大量的位点修饰信息,并且现有的计算方法对于预测琥珀酰化位点的效果不佳,有必要开发预测性能更好的计算方法。本文针对以上问题,运用机器学习算法对琥珀酰化位点预测展开研究,主要研究内容包括以下几点:1.建立基于特征融合和Stacking集成学习的预测模型p Suc-FFSEA,通过EBGW、One-Hot、CBOW、CGR和AAF＿DWT提取序列特征和理化性质,应用LASSO方法选择最优特征子集,运用宽度学习、SVM、Light GBM和逻辑回归等机器学习算法构建Stacking集成分类器,对已发表文献中收集到的琥珀酰化位点数据集进行预测,预测准确率达到77.73%,AUC为0.8501。与其它先进模型对比结果表明,本文建立的模型p Suc-FFSEA具有更强的泛化性能。2.建立基于密集卷积块与注意力机制模块的预测模型p Suc-EDBAM,采用OneHot来获取蛋白质序列的特征图,并通过一维CNN生成低级特征图。在特征学习过程中,利用密集卷积块获取不同层次特征信息。同时引入通道注意力机制模块评估不同特征的重要程度。最后使用Softmax分类器对琥珀酰化位点进行预测。结果表明,独立测试集下预测准确率达到74.25%,AUC达到0.8201。与其它先进模型对比发现,p Suc-EDBAM具有更佳的预测性能,并基于同一测试集对模型p Suc-FFSEA和p Suc-EDBAM进行对比测试,结果表明模型p Suc-EDBAM更具优势。3.为了给研究人员提供便利,本文结合Python的Web应用框架Flask基于模型p Suc-EDBAM开发了琥珀酰化位点在线预测平台,可以从https://bioinfo.wugenqian g.top/p Suc-EDBAM/网址访问,该预测平台提供了单条蛋白质序列预测和文件批处理预测两种预测方式,并在网站中提供了用户指南,通过此平台,研究人员可以便捷地实现潜在的琥珀酰化位点预测。

其他文献

基于改进狼群算法在陶瓷烧制组合优化问题的应用研究

组合优化问题指的是从一组对象中选择若干满足约束条件的对象,同时优化某个目标函数,从目标函数的所有可行解中寻找最能符合原问题约束要求的最优解。典型的组合优化问题包括旅行商问题、背包问题、装箱问题,常用的求解方法有分支定界法、动态规划法等。狼群算法是通过模拟自然界中狼群追踪猎物的行为,利用多个狼群的协同搜索对目标问题进行求解的群智能优化算法。该算法具有全局搜索能力强、收敛速度快、适应性强以及可扩展性好

学位

个性化陶瓷产品智能设计系统

随着人工智能以及工业技术的快速发展,现代制造业也异军突起。传统的陶瓷产业的发展较为滞后,随着3D打印技术的出现,现在已经可以实现智能化的陶瓷生产,但目前对于个性化陶瓷产品的智能设计研究较少。由于陶瓷种类繁多且名称繁杂,并且非专业人员对陶瓷器型以及陶瓷制造技术认识不全面,导致其设计存在周期长、难度大的问题。针对这些问题,本课题研究并开发了满足多模态需求的个性化陶瓷产品智能设计系统,通过人工智能技术能

学位

江西省医疗资源配置效率评价及影响因素分析

学位

基于Spark的中文文本情感分析研究

互联网的快速发展推动着大数据时代的到来,人们每天接收的信息在爆炸式的增长,对海量数据的存储能力和计算能力的高要求正在推动着大数据技术的进步。如今越来越多的用户活跃在各大网络平台上,喜欢通过文字表达自己的情感,随之而来的是海量文本数据的产生,如何对这些海量文本进行情感分析成为当下的研究热点。云计算技术的出现为海量数据的存储和计算提供了基础条件,从而推动着大数据技术生态的蓬勃发展,其中Spark作为计

学位

图像混合识别方法在陶瓷文化赋能上的应用

陶瓷是中国古代的伟大发明,具有高熔点、不易氧化、易清洗等优点,并对酸、碱、盐具有良好的抗腐蚀能力,可以长时间储存而不变质不变色,因此成为优秀的文化艺术载体。“陶大定制”和“瓷语故事”是本人所在团队开发的两款微信小程序,前者是一款陶瓷产品个性化定制程序,后者应用新一代信息技术,通过识别陶瓷表面的个性化定制图案,匹配图案背后的故事和其文化属性。其关键技术就是实时的图案精准识别,达到100%匹配不出差错

学位

基于文本挖掘与多源数据的前列腺癌药物重定位研究

学位

机器学习框架下的戊二酰化位点预测

蛋白质翻译后修饰（PTM）作为协调各种生物过程和功能的关键,广泛存在于动植物蛋白质功能的机制中。戊二酰化是一种蛋白质翻译修饰,发生在蛋白质中特定赖氨酸残基的活性ε-氨基上,与各种人类疾病有关,包括糖尿病、癌症和戊二酸尿I型。因此,对于蛋白质戊二酰化位点的预测显得尤为重要。随着计算机科学的发展进步,基于计算方法的蛋白质翻译后修饰位点的预测已成为新的研究方向,并可以解决传统实验方法昂贵且费时的缺陷。本

学位

基于卷积神经网络的日用陶瓷表面瑕疵检测算法

随着人工智能技术的发展,中国制造2025的战略构想被提出,中国制造业企业纷纷响应国家政策进行技术革新提高生产效率,中国制造工厂正向着高端化,智能化发展。目前,部分日用陶瓷企业已基本实现自动化生产,但唯独质检环节还采用人工质检的方式。人工质检不仅效率低下,而且对员工的身体健康存在极大影响,而传统机器视觉的方式要对每种瑕疵设计专门的特征算子,不能应付日用陶瓷表面瑕疵的复杂变化。针对以上问题,本文研究了

学位

基于改进粒子群优化算法在陶瓷配方问题的应用研究

陶瓷是我国优秀传统文化之一,古代陶瓷产品作为艺术品,工匠们为了提升陶瓷产品的美观度通过大量试验总结了许多陶瓷配方。现代工业中,陶瓷产品作为优秀的非金属功能材料广泛应用于建筑、航天、汽车工业、军工业等不同领域,不同于古代以陶瓷原料配料比作为陶瓷配方,现代陶瓷配方是由化学组成构成的化学配方。求解陶瓷配方问题,即根据原料和目标配方选择配料比,使其化学成分误差最小,实质是个典型的最优化问题。在求解最优化问

学位

数据挖掘在古陶瓷断代及陶瓷原料分类中的应用研究

当前,随着数据挖掘领域的飞速发展以及陶瓷行业的蓬勃兴起,数据挖掘在陶瓷行业的应用研究也越来越成为当今业界的一个热点议题。而对于数据挖掘在古陶瓷断代以及陶瓷原料分类中的应用研究同样也聚焦了数据挖掘领域以及陶瓷行业专家学者的视线。在过去,古陶瓷断代中,基于专家的鉴定经验,通过手摸、目测以及其他的感官功能来确定古陶瓷的朝代,但由于个人的主观因素,难免导致鉴定结果“唯专家论”;陶瓷原料分类中,基于过往的陶

学位

基于机器学习的赖氨酸琥珀酰化位点预测研究

其他学术论文