核酸定量结构功能预测

来源 :重庆大学 | 被引量 : 0次 | 上传用户:hakbin
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着人类基因组计划的完成,生物学研究已进入了后基因组时代,研究重点正从积累数据向解释数据转变。面对急剧膨胀的基因组序列数据,传统的生物学方法已很难满足需要。目前,生物信息学方法已成为核酸结构功能研究的重要手段。   本文通过一种新的途径,即以广义碱基性质得分(SGBP)结合自交叉协方差(ACC),线性判别分析(LDA)和支持向量机(SVM)建模,进行了DNA色谱保留指数、人类miRNA、脊椎动物启动子和人类蛋白质编码基因预测或识别,采用自检验、交互验证、外部验证等方法验证模型的预测能力。   SVM建模所得结果如下。①DNA色谱保留预测:留一法得到的Q2cv可达到0.851,MSE为0.1123。②miRNA预测:交互验证正确率(Acc)可达到77.29%。外部验证Acc可达到75.12%。灵敏度(Sn)和特异度(Sp)分别为70.51%和82.61%,马修斯相关系数(MCC)为0.5160。③启动子预测:交互验证Acc可达到85.12%。外部验证Acc可达到86.55%。Sn和Sp分别可以达到91.65%和81.47%,MCC为0.7336。④人类的蛋白质编码基因预测:交互验证Acc可达96.18%,外部验证Acc可达97.58%,Sn和Sp分别为97.28%和97.64%,MCC为0.9141。SVM建模结果均不同程度相当或者优于LDA建模所得结果。   研究表明,SGBP-ACC组合方法能够较好表征核酸序列特征,其含信息量大且易操作,SGBP-ACC-SVM在核酸定量结构功能预测领域具有较好的前景。
其他文献
介绍了TCA2003全自动全站仪的工作原理和关键技术ATR。介绍了TCA2003在滑坡监测中的应用,并解决了全自动全站仪的数据远程传输、数据预处理和数据存储管理问题。首次将RS-232串行口光电隔离远传模块和GPRS用于全自动全站仪的数据远传。提出用数据库管理带有时间标签的滑坡监测数据的方法,并做了验证。这些技术的开发,为滑坡监测研究做出了贡献。
人表皮生长因子(human epidermal growth factor,hEGF)发现于1962年,是一种由53个氨基酸残基组成的单体多肽。已证实hEGF是一种关键性的创伤愈合因子,通过与其受体的结合,它能对
Landsat8提供了100米空间分辨率的热红外数据,基于该数据反演的高空间分辨率地表温度信息,对支持城市热岛效应、地表蒸散发估算等研究具有重要意义。本文提出了一个改进的地表
  It is well established that steroids like androgen and estrogens regulate brain structure and function through their nuclear receptors,which need coactivato
会议
会议
本文着眼于解决煤气管网在生产管理中存在的实际问题,将GIS应用于煤气管网管理中,将实现煤气管网的科学化、系统化管理,提高工作效率和服务水平,降低管理成本。 本文从地
立式金属罐是石油、液体石油产品以及其他液体物质的主要存储设备,罐体是由高强度低合金钢制壁板拼接焊制而成,在制造使用过程中,罐体会出现不同程度的几何变形。当罐体变形过大
人粒细胞-巨噬细胞集落刺激因子(human granucyto-macrophagecolony-stimulating factor,hGM-CSF)是一种重要的具有免疫调节功能的糖蛋白,在造血调控和免疫调节方面具有重要作
中国是世界上湿地类型多,面积大且分布广泛的国家之一。近年来,由于人口数量的急剧扩张,人们需要更多的土地进行粮食生产以及城市发展,自然资源被严重开采,造成我国很多湿地资源受
地理信息系统的迅速发展和广泛应用积累了大量的空间数据资源,通过网络来共享这些分布异构的空间数据资源是必然的趋势。但是因为各商业GIS系统之间的空间数据模型不同,因此