【摘 要】
:
二十世纪末,随着大量的蛋白质序列和核酸序列涌入公共数据库,人类进入了后基因时代。生物信息学作为后基因时代的核心技术,目的是分析和解读蛋白质和核酸序列中所表达的关于结构
论文部分内容阅读
二十世纪末,随着大量的蛋白质序列和核酸序列涌入公共数据库,人类进入了后基因时代。生物信息学作为后基因时代的核心技术,目的是分析和解读蛋白质和核酸序列中所表达的关于结构和功能的信息,而蛋白质的功能与其亚细胞定位是密切相关的,所以蛋白质亚细胞定位的预测也成为后基因时代的重点研究内容。本文研究的是凋亡蛋白的亚细胞定位预测问题,凋亡蛋白是一类与很多疾病有关的蛋白质,获得凋亡蛋白的亚细胞定位信息有利于细胞凋亡机制和凋亡蛋白功能的研究,同时有助于新药的开发和了解疾病产生的机理。进行凋亡蛋白的亚细胞定位预测,首先根据凋亡蛋白的亚细胞位置的不同建立凋亡蛋白数据集,这是进行凋亡蛋白亚细胞定位预测的第一步工作,蛋白质序列特征提取和分类算法也是凋亡蛋白亚细胞定位预测中决定识别精度的关键性问题。本文基于UniPortKB/Swiss-Port数据库建立了六类真核凋亡蛋白数据集apoptosis-887;提出了基于序列N-端、C-端的位点氨基酸频数分布信息和物化特性紧邻二联体频数信息的一种新的序列特征提取方法;分别采用多样性增量方法、支持向量机方法、多样性增量结合支持向量机的方法和组合分类器方法对凋亡蛋白数据集apoptosis-887的亚细胞位置进行预测,在5-fold交叉检验下,各个分类器的识别总精度分别为68.77%、75.87%、76.44%和79.26%,可以看出采用组合分类器取得了比单分类器好的预测效果。研究表明:(1)从凋亡蛋白质一级序列出发,可采用多维组合特征来表征凋亡蛋白质序列,多种特征参数融合的特征提取策略可以提高预测结果精度;(2)N-端和C-端的位点氨基酸频数分布信息是凋亡蛋白序列的一种主要特征参数;(3)采用组合分类器,融合各分类器的优点,减小各参数之间的分歧,可以有效的提高识别精度。
其他文献
锂离子电池作为一种典型的新型储能装置,由于具有循环寿命长、能量密度高、安全无污染等优点,被广泛地应用于便携式电子设备的电源。氧化锌是一种理想的嵌入型电极材料,拥有可多
姜属(Zingiber)为姜科的模式属,是姜科中仅次于山姜属(Alpinia)、豆蔻属(Amomum)的第三大属。姜属植物的传粉机制和繁育系统多样,是研究繁殖生态学和系统发育的理想类群。本
本文在对若干测向方法进行考察和比较的基础上,构建了一个用于雷达对抗的瞬时(单脉冲)测向装置框架;并结合当前的技术能力从工程实现的角度论证了测向保精度实现所要注意的原则
本文通过分析现代设计在生活中的作用,定义设计师应该有的正确价值观。即在保证企业合理利益的基础上,多为人民群众考虑。从而论证服务大众也不等于不赚钱,应该使设计出来的
近年来,利用半导体材料光降解污染物成为研究焦点。不同于单一的半导体光催化材料,复合半导体能够有效降低光生电子空穴对的再结合,提升催化剂的催化活性,针对这一问题,论文选用水热法制备出MoS2/ZnS复合材料,并研究其光催化性能。首先,采用水热法制备ZnS微球,将其分散在MoS2源料中,通过改变反应时间、反应温度、Mo:Zn比、Mo:S比等实验参数用二步水热法制备MoS2/ZnS复合材料。其晶体结构、
书者,抒也,抒其性情;书者,散也,散其怀抱;书者,如也,如其学,如其性,如其人......书法艺术,民族之魂,虽历劫波而生机勃发;艺术之光,逾千万年而恒耀寰宇。如今,艺术形式日臻完
采用醇—水溶液加热法制备了ZrO2(3Y)、掺杂Ce的ZrO2(3Y)和Al2O3/ZrO2(3Y)复合材料,对样品进行了差动热分析(DAT)、扫描电子显微镜(SEM)和X射线衍射(XRD)、紫外可见吸收(UV-vis)以及敏感特性
羊膜动物中脑、间脑听觉核团和体感觉核团在细胞构筑、电生理特征、神经联系以及神经发生等方面具有明显的核心区一壳区结构。核心区被认为是进化上先进的脑区,参与某种特定
随着Internet的广泛使用,在其上浏览的信息包容的范围越来越广。IT中很多是多媒体信息,因此对多媒体数据的检索要求就越来越高,不仅要求速度,而且要求精度。以前对多媒体信息
本论文主要包括拟南芥表皮蜡质合成调控机制及内质网相关蛋白降解途径(ERAD)的功能研究两部分内容。植物表皮蜡质是覆盖在陆生植物表皮细胞外的复杂亲脂性混合物,包括烷烃、一