基于序列和结构信息的长链非编码RNA的亚细胞定位预测

来源 :内蒙古大学 | 被引量 : 1次 | 上传用户:tangtongyue
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
长链非编码RNA是指一类长度大于200个核苷酸单位、不编码蛋白质的RNA。之前人们普遍认为编码蛋白质的基因才是主角,但是越来越多的研究表明,人类基因组中高达98%的非编码基因同样具有重要的作用,而不是所谓的“转录噪声”。针对长链非编码RNA的功能研究表明,其在转录起始的调控、转录及转录后的调控中均发挥着重要作用,因而影响着各种各样的生物学过程。许多长链非编码RNA的序列已知,但是其功能却知之甚少,大量研究表明长链非编码RNA在不同的位置会发挥相应不同的功能,为了解长链非编码RNA的功能信息,获得其亚细胞位置信息是非常重要的。目前实验可以检测出长链非编码RNA亚细胞位置信息,但是比较耗费时间和经费。随着大数据时代的发展,各种生物信息学数据正在不断丰富和飞速增加,为生物信息学研究奠定了基础。因此,发展一种快速而有效的算法来预测长链非编码RNA的亚细胞位置是非常必要的。本研究新建了一个关于长链非编码RNA的亚细胞定位数据集,包含细胞核、细胞质、细胞质基质、核糖体和外泌体五个子集,提取了长链非编码RNA的k-mer频率信息、嘌呤/嘧啶约化(MN约化)信息、强键/弱键约化(PQ约化)信息、三种阅读框信息、保守模体信息、二级结构信息、六种几何柔性信息等多种特征,并对各类特征进行了特征融合。在利用SMOTE(Synthetic Minority Oversampling Technique)方法对数据集进行平衡优化的基础上,采用支持向量机(SVM)算法对长链非编码RNA的亚细胞定位进行了分类预测。在Jackknife检验下,其总体预测成功率达到了86.86%,计算结果表明长链非编码RNA的两种序列约化特征、几何柔性结构特征以及阅读框信息对于长链非编码RNA的亚细胞定位预测有较好的效果,可以为了解长链非编码RNA的生物学功能提供帮助。
其他文献
学位
学位
学位
学位
转杯纺是新型纺纱的一种,具有高速度、大卷装、短流程、废落棉适纺性好等特点。转杯纺纱过程中,纤维由分梳辊开松梳理,梳理之后的纤维进入输棉通道,被输棉通道中的气流带动,
作为康巴作家群中的一员,达真基于自己的亲身感悟与深刻思考,饱含激情地对康巴地域上所生发的精神文化与人性进行书写。达真成长于康巴大地,康定特有的地理和人文环境决定了达真创作中充满独特的地域色彩,他的系列小说创作大部分也是以康巴大地上的风云事件为背景,将康巴的历史、文化浸入到人物灵魂之中。同时,他的创作笔触细腻而真挚,饱含藏族作家对本民族文化的坚守与批判,也不乏对其它文化的包容与思考。达真站在一个更高
学位
随着科技的增长,大部分的行业都可以运用科技的进步所带来的高自动化生产链来缩短成本跟提高产量。当中,有一些行业并没有享受到高智能生产链所带来的便利而继续依赖传统的人
翻译作为不同语言之间沟通的桥梁,不同国家不同民族之间需要通过其交流文化、文明。此外,翻译在生产生活中也起着至关重要的作用。文学翻译则指的是文学作品在不同语言之间的转换,也是传播文化和文明不容忽视的一个途径。文学翻译中需要关注的话题有很多,不少学者对译者、译作与翻译评论者(以下简称评者)做了不同层面的研究,而有关底本的研究相对比较少。底本在文学翻译中不容忽视,无论是译者还是评者,都需要引起对底本的重
学位
为了全面阐述细胞内各种生物物种在生物学事件中的作用,各种检测技术已经被开发和改进。迄今为止,用于细胞内物种检测的荧光探针己经取得了良好的进展,高荧光量子产率、良好生物相容性、强荧光信号、稳定荧光发射、良好结构柔性的荧光团仍然是荧光探针设计合成中应该考虑的一种重要策略。因此,具有优良化学和生物学性质的苯并噻喃酮被我们选择作为荧光团,对生物体不会造成创伤,推动荧光探针更加适用于生命成像分析。最近几年来
我国是抗生素原料药的生产和出口大国,而抗生素制药生产过程的排放是环境中抗生素的重要来源之一。制药生产废水经污水处理厂处理后,在地表水、地下水和土壤中仍可检测到抗生素残留物及其代谢产物,对生态环境和人体健康构成潜在的影响和威胁,因此对抗生素废水中特征污染物开展监测及筛查具有重要的理论价值和现实意义。抗生素废水具有成分复杂、特征污染物识别及检测难度大等特点,其污染因子和去除特性研究尚不完善。基于此,本
学位