基于数据驱动的非编码基因功能注释方法研究

来源 :吉林大学 | 被引量 : 0次 | 上传用户:yuhy07
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
广泛存在于公开数据库和零散文献中的海量生物芯片数据是认知生物遗传信息的“知识宝库”。这些数据由于实验背景、获取条件差异较大,通常情况下并不具有可比性;同时也因为缺乏可靠的数理分析工具,多数只是经过简单的差异统计即被搁置一旁。本文围绕非编码基因及其功能鉴定方法,提出由不同的基因芯片数据驱动,借助计算方法建立联系,鉴定新的非编码基因、非编码持家基因。具体工作包括:首先从生物技术及计算预测两个层面对非编码基因的鉴定方法进行详细阐述,分析非编码基因的生物特征,包括核酸序列开放阅读框的长度、密码子偏好性、密码子替换频率、序列保守性、二级结构等,并论述了长非编码RNA的功能特异性;其次本文提出了一种基于编码、非编码双色共表达网络的非编码基因功能预测方法,将此方法用于Affymertrix公司所生产的Human Genome U133A芯片,在25,000个探针中重注释了1,120个非编码基因并对这些基因的功能做出预测;最后,为了使更多来自于不同生物背景的芯片数据具有可比性,本文提出一种基于傅立叶分析的非编码持家基因预测方法,运用该方法在基于Human Genome U133A芯片的人类Hela细胞时序芯片中预测了510个持家基因,其中包括93个非编码持家基因。对比实验证明本文方法可覆盖已有3个公开报道的阳性数据集,计算方法具有准确性、鲁棒性,生物学结论可靠。本文所提出的网络模型和预测算法可以较好解决当前的非编码基因的鉴定与功能注释问题,对其他领域相似数据分析也有借鉴意义。
其他文献
回 回 产卜爹仇贱回——回 日E回。”。回祖 一回“。回干 肉果幻中 N_。NH lP7-ewwe--一”$ MN。W;- __._——————》 砧叫]们羽 制作:陈恬’#陈川个美食 Back to yield
在现代复杂工程产品的设计优化中,计算机仿真技术已发展成为不可或缺的重要手段。随着计算机技术的飞速发展,仿真分析模型有限单元尺寸越来越小,数目越来越多,仿真精度得到极
针对QY25CS汽车起重机在安装与维修中面临的困难,研制汽车起重机上车电气系统工作原理演示和故障分析试验台。在研制过程中,利用PLC技术,试验台真实地再现汽车起重机上车电气
导数综合题型中有一类含有一次式的不等式问题.其题型新颖,结构简单,但入口隐蔽,只有通过细心观察之后,才会发现这些题都披着一层伪装——切线,只要拨掉这层伪装就会变成熟悉
大众创业、万众创新,创新创业成为时代的最强音。开店计划书的写作是大学生创新创业教育的重要组成部分。对开店计划书写作的逻辑思路进行了思考,对其写作中可能出现的一些困
特征提取是目标识别、图像配准、图像检索及景象匹配等许多图像处理问题的基础。在不同成像条件下获得的图像中,同一目标可能具有不同的表现形式,为此,提取的特征需要具有“
回 回 产卜爹仇贱回——回 日E回。”。回祖 一回“。回干 肉果幻中 N_。NH lP7-ewwe--一”$ MN。W;- __._——————》 砧叫]们羽 制作:陈恬’#陈川个美食 Back to yield
回 回 产卜爹仇贱回——回 日E回。”。回祖 一回“。回干 肉果幻中 N_。NH lP7-ewwe--一”$ MN。W;- __._——————》 砧叫]们羽 制作:陈恬’#陈川个美食 Back to yield
目的了解某院实习护士职业暴露现况并分析原因,为降低实习护士职业暴露风险提供理论依据。方法自行设计调查问卷,对2014年9月份甘肃省妇幼保健院来自甘肃省10所大中专院校的