基于时间序列理论方法的流感病毒DNA序列特征分析

来源 :江南大学 | 被引量 : 0次 | 上传用户:ppmm112233
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
流感是一种反复出现的传染病,在全球引起了高发病率和高死亡率.流感病毒分为三类:甲型(A型),乙型(B型),丙型(C型).在这三种类型中甲型流感病毒是最致命的流感病毒,给人类带来了严重的疾病.2009年流感病毒大流行再次爆发,以及20世纪人类经历了好几次流感病毒的爆发,都表明我们对流感病毒的认识还不全面,它们的很多特性还有待于我们进一步挖掘.流感病毒给人类健康带来很大威胁,因此对流感病毒的DNA序列和蛋白质序列的进一步研究是一项迫在眉睫的工作,它们的特征分析对流感病毒的预防、新疫苗的研制、药物分子设计、控制及治疗都具有重要意义.在介绍了生物信息学的研究背景后,本文介绍了研究生物序列特性的主要方法即时间序列理论方法.该方法主要是通过处理动态数据,进行分析、预测和控制.对本文要用到的ARIMA(p,d,q)模型和ARFIMA(p,d,q)模型的定义、性质及方法作了阐述,为研究流感病毒DNA序列和蛋白质序列特性作了理论上的准备工作.基于CGR坐标将流感病毒DNA序列转换成CGR弧度序列,并引入长记忆模型ARFIMA模型来分析.发现从甲型流感病毒DNA序列中随机找来的10条H1N1序列和10条H3N2序列都具有长相关性且拟合很好,并且还发现这两种序列可以尝试用不同的ARFIMA模型去识别,其中H1N1可用ARFIMA(0,d,5)模型去识别, H3N2可用ARFIMA(1,d,1)模型去识别.接着,对乙型、丙型流感病毒DNA序列进行了分析研究,发现随机找来的10条乙型序列和10条丙型序列同样具有长相关性且拟合很好,还发现这两种序列也可尝试用不同的ARFIMA模型去识别.作为一个具有完善算法的经典时间序列模型,ARFIMA模型能帮助我们挖掘流感病毒DNA序列中未知的特性.采用ARIMA模型预测甲型流感病毒中H1N1亚型DNA序列碱基,这对H1N1病毒研究有着重要的意义.我们选取1970年-2010年同源性相对较高的41条HINI流感病毒数据,利用ARIMA(p,d,q)模型对前20个位置去拟合并且预测,除极个别外由预报区域显示原始数据都在预报区域内,表明模型建立合理,预报效果很好.基于此,用同样的方法对甲型流感病毒H1N1亚型血凝素氨基酸序列进行了研究分析,同样发现预报效果很好.
其他文献
自2008年以来,江苏高考历史试卷由选择题和非选择题构成,各占60分。一般而言,选择题易得分,非选择题不易得分,故有“得选择题者得天下”之说。但每道选择题有3分,这样选择题
请下载后查看,本文暂不支持在线获取查看简介。 Please download to view, this article does not support online access to view profile.
期刊
人们对圆环系统的研究已持续近一个世纪。环形系统的稳定性关系着机械运转的安全性。在目前已有的研究成果中,已经有学者考虑了预应力和陀螺效应等因素对非拓展圆环线性振动特
本文主要通过多重反射法对受到外部激励作用下周期梁结构中波的传播进行研究,文章以多重反射法为理论基础,通过与传递矩阵方法的对比验证多重反射法的有效性,说明了多重反射法有比较广泛的适用范围,在对振动相关问题的研究方面,多重反射法有广阔的研究前景。本文的主要研究工作如下:首先,简要介绍了对周期结构中波的传播研究背景、意义,以及对周期结构中波的传播的研究现状。第二,介绍了梁的动力学偏微分方程,并对此四阶偏
教学过程应从学生的自学开始,教师如果可以高度重视预习、静心思考预习、合理设计预习、多样评价预习,从而教会学生预习,以此为基石,学生的自主学习就不会是一句空谈,学生的
德国的教育家雅斯贝尔斯说过这样的话:教育本质上意味着一棵树摇动另一棵树,一朵云推动另一朵云,一个灵魂唤醒另一个灵魂.经常我们在分析、解析这句话的时候,是站在一个教育
该文引进4连通图可去边的概念,并给出4连通图G中不存在可边的充分必要条件是G=C或C,同时给出了n阶4连通图的一个构造.
本文主要研究有限维空间中约束集为Polyhedric的扰动问题.在文中首先描述了Polyhedric集法锥正则co-导数的表达形式,通过这个结果可以表示出Polyhedric型约束优化问题解映射的
非线性现象在自然界中是普遍存在的。研究非线性作用机制,对于物理学,化学,生物学,工程学以及社会科学都有指导意义。然而,非线性行为的作用机制是很复杂的,为了便于研究,有时不得不