【摘 要】
:
蛋白质无序结构是蛋白质中的一种特殊结构,在天然条件下,其空间结构不唯一确定,并表现出一定的柔性。但是它在生物中广泛存在,并依然维持着正常的生物学活性,特别是真核生物
论文部分内容阅读
蛋白质无序结构是蛋白质中的一种特殊结构,在天然条件下,其空间结构不唯一确定,并表现出一定的柔性。但是它在生物中广泛存在,并依然维持着正常的生物学活性,特别是真核生物中,其包含的无序蛋白质占比可以达到27%-41%。对无序蛋白质的研究可以辅助理解蛋白质的折叠过程,确定蛋白质结构,设计新的人工蛋白质以及制造药物,具有重大的意义。使用传统的试验方法测定蛋白质无序区域,虽然具有较高的精度,但是耗时耗力,需要投入大量的成本。因此,基于机器学习的生物信息学研究方法也被用于预测蛋白质无序区域。并且近年来,随着生物数据,包括蛋白质结构数据的爆发式增长,已经形成了海量的数据规模,而目前常用的机器学习预测方法的训练样本数量都较小,因此本文尝试使用分布式的SVM算法对海量数据进行建模,并使用改进方法尝试解决SVM算法对长无序区域的不适应问题,提升了预测效果。主要工作如下:(1)基于PDB蛋白质结构数据库,筛选并获取原始结构数据。(2)提取蛋白质序列并进行标记以及特征提取,得到数据集。(3)对数据集进行整理得到样本集,分别训练常规模型、小数据集模型、样本平衡模型和改进的双层模型。(4)使用交叉验证和独立验证方法,对模型预测结果进行统计分析和评价。实验结果表明,改进方法在各个统计指标上都有一定的提升,并且在标准测试集上,也比其它的同类型方法有更好的表现。因此本文中提出的方法是合理可行的,并且证明基于大数据背景的生物信息学研究是有意义的,同时也是非常必要的。
其他文献
合成氨工业对国民经济与国防具有非常重大的意义,因为氨是制造化肥、促进粮食生产的主要原料,是生物所需活化态氮的主要来源,同时也是协调能源短缺和环境污染问题的重要的可再生燃料和理想氢能载体。传统的铁基合成氨催化剂需要较高的反应压力和温度,钌基催化剂作为第二代氨合成催化剂,相较于前者,在低温低压下具有更高的合成氨催化活性。由于载体和助剂可以显著改变钌活性位点的结构和电子分布,从而极大地影响钌基合成氨催化
客车作为道路交通运输重要载体,其碰撞安全性关乎人民生命财产安全和社会经济良好有序发展。近年来,客车正面碰撞引起的人员伤亡事故频发,社会影响恶劣。客车正面碰撞事故中,发生率最高的碰撞形式为正面偏置碰撞,而我国对大客车偏置碰撞乘员损伤及乘员保护方面研究较少,因此开展客车偏置碰撞乘员损伤研究对降低客车碰撞伤亡率具有重要社会意义。本文通过大客车不同重叠率偏置碰撞仿真试验,探究不同重叠率、不同位置、不同约束
商业银行作为金融市场的中坚力量,其资金持有量、贷款发放量、业务成交量均在国内金融体系中占极大的比例。然而需要关注的是,伴随着创新驱动金融改革的进行,银行业的发展趋
混凝土徐变问题一直是工程实际中难以解决的问题,它是混凝土这种粘弹性材料在持续荷载作用下的时变特性。由于徐变的产生机理及其影响因素的复杂性,很难准确地考虑和计算混凝土构件或结构中的徐变效应。虽然目前混凝土徐变预测模型有很多种,但大多是基于素混凝土提出的。在实际工程中,大部分是配筋结构,所以现有徐变预测模型对钢筋混凝土的适用性需要研究。同时在实际工程中,结构或者构件如果发生应力减少或者卸载时就会涉及到
随着脉冲功率技术不断的发展,金属丝电爆炸的特性得到了广泛和深入的研究。本文搭建了金属丝电爆炸的实验平台,开展了铝丝电爆炸的实验研究;构建了描述金属铝热力学状态的物态方程,并结合简化的磁流体力学模型开展了金属丝电爆炸的数值模拟研究。金属丝电爆炸实验平台主要包含小型脉冲电流源、触发回路和真空系统。小型脉冲电流源主要包含一次侧回路和二次侧回路,一次侧回路包含初始储能电容、真空触发开关和脉冲变压器,二次侧
精密合金Ni42冷轧卷属高精度冷轧带钢,用户对其质量要求严格。宝钢特钢有限公司是国内首家、全球第二家采用EAF-AOD-LF-VD-CC流程生产Fe-Ni类精密合金的钢铁企业,冷轧生产过
近些年来,房地产企业为了不断扩大自身在行业中的影响,实行快速发展、高周转模式来抢占份额。房地产企业开始全国布局,区域深耕,因此房地产项目逐渐有着跨区域,多项目的特点。大量的项目建设施工,对房地产企业质量管理提出新的要求。房地产企业开始意识到产品质量的重要性,通过设立专门的质量管理部门,对工程质量实行监控。由于房地产第三方服务行业的兴起,房地产企业开始慢慢引进第三方质量评估机构,通过这种新质量评估方
抗生素是最具代表性的微生物次级代谢产物,已经广泛的应用于农业、医药和科研等众多的领域。随着抗生素耐药性的愈发严重,新型抗生素的需求量逐渐增加。研究微生物次级代谢合
本试验以原代培养猪脾脏淋巴细胞为模型,研究了黄芪多糖、刺五加皂苷B、人参皂苷F3、绿原酸、党参炔苷、硫酸锌、甘氨酸锌、亚硒酸钠和硒代蛋氨酸等对猪脾脏淋巴细胞体外增殖
本文研究广义数字限制集的Assouad和下Assouad维数以及分形方块的拓扑Hausdorff 维数.设 b ≥ 2 是整数,Ib={0,1,…,b-1},D1,D2(?)Ib,D1∩D2 =(?),设N是正整数集,S1,S2(?)N,S