基因数据的可视分析研究

来源 :天津大学 | 被引量 : 0次 | 上传用户：oibaggio

【摘要】

：

随着人类基因组研究的重点向功能基因组转化,生物信息学研究的重点已悄然从生物数据的积累转到生物数据的处理和信息提取。传统的生物信息技术往往采用人工智能、机器学习、

【作者】

：

刘经纬

【出处】

：

天津大学

【发表日期】

：

2004年期

【关键词】

：

基因数据分析 gSpan 相关系数互信息

下载到本地 , 更方便阅读

下载此文赞助VIP

声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架

论文部分内容阅读

随着人类基因组研究的重点向功能基因组转化,生物信息学研究的重点已悄然从生物数据的积累转到生物数据的处理和信息提取。传统的生物信息技术往往采用人工智能、机器学习、数据挖掘等方法,对生物数据进行搜集、处理及利用。随着基因与蛋白质的表达在其功能研究方面的不断深入,基因表达的数据量呈指数级增长,如何对海量、高维的基因数据信息进行分析,并有效地从全局到局部对生物信息进行解释、理解、评估和推理,已成为生物信息领域非常重要且迫切的问题。本文提出了一种名为基于gSpan的目标基因挖掘算法,算法旨在从海量基因数据中挖掘出目标基因。基因数据通常分为实验组和对照组两组,组内性状相似组间性状不同。本文根据目标基因应为组内差异较小、组间差异较大的特性,使用方差对数据进行了两次初步筛选。接下来,本文分别计算了对照组和实验组两组组内两个样本的相关系数,对所有相关性较小的样本对,筛选出两个样本间差异较小的基因片段。本文还计算了不同组的两个样本的相关系数,对所有相关性较大的样本对,筛选出两个样本间差异较大的基因片段。对三次筛选获得的基因片段集合,本文将实验组筛选结果和组间筛选结果取并集作为实验组集合,将对照组筛选结果和组间筛选结果取并集作为对照组集合。对于这两个集合所包含的基因数据,本文根据互信息计算基因数据相互之间的关联性,之后以基因为节点,其关联性作为基因之间的边,将每个样本的基因数据分别构成一个网状图,并应用gSpan(Graph-based substructure pattern mining,基于图形的子结构模式挖掘)算法对两组网状图分别进行频繁子图挖掘,最终得到的频繁子图上的基因节点即为实验结果。已有的基因可视化分析主要使用可视化手段作为最终结果的展示,或者开发一种可视化框架,较少使用可视化手段来辅助决策。本文不仅使用了灰度图对基因数据进行可视化来直观显示算法结果,还使用了折线图和灰度图等可视化手段来辅助分析和算法决策。本文实验部分通过针对人类龋齿病所采集的基因数据进行算法分析,实验结果对龋齿病基因的覆盖率为100%,同已有算法效果相似;龋齿病基因占实验结果的比重为33.3%,高于已有算法的15%-20%,取得了较好的结果。

其他文献

网络犯罪的类型及其司法认定

网络犯罪是我国刑法中一种特殊的犯罪形态,随着我国计算机的普及,网络犯罪大有蔓延之势。我国刑法对网络犯罪作了专门的规定,设立了相关罪名,为惩治网络犯罪提供了法律依据。从刑法教义学分析,网络犯罪主要可以分为纯正的网络犯罪与不纯正的网络犯罪两种类型。当然,这种分类还是不够的,还应当根据网络犯罪的具体内容对网络犯罪进一步分类。从刑法立法与司法的逻辑来看,可以将网络犯罪分为针对计算机信息系统的网络犯罪、利用计算机网络实施的传统犯罪和妨害网络业务、网络秩序的犯罪。本文对上述网络犯罪的类型进行了刑法教义学的论述。

期刊

网络犯罪纯正的网络犯罪不纯正的网络犯罪

高校本科学生党支部思想政治教育工作研究

党的十八大以来,全面从严治党向基层延伸向纵深发展。党的十九大胜利召开,把全面从严治党纳入“四个全面”战略部署之列,并将全面从严治党作为党坚持和发展中国特色社会主义

学位

高校本科大学生学生党支部思想政治教育

基层职能部门如何发挥一线监督作用

十九大以来,党中央坚定不移推进全面从严治党",有权必有责、权责要对等"的观念深入人心。但从基层实际看,一些职能部门对权责关系的认识存在偏差,一线职能监督作用发挥不充分

期刊

监督职责制约和监督如何发挥

稀土元素Er及热处理工艺对Al-Si系导电铝合金组织和性能影响的研究

铝合金是工业中应用最广的有色金属材料之一,它广泛用于航空航天、机械制造、轮船、电力等行业。Al-Si系合金铸造性能好,焊接性能强,导电、导热性能优,常被用作架空输电线材

学位

Al-Si合金稀土Er热处理导电率力学性能

阴道微环境与人乳头瘤病毒感染相关性的研究进展

人乳头瘤病毒(HPV)感染是唯一可以明确的导致宫颈癌的致病因子,但HPV感染并不等于已是宫颈癌或者宫颈癌前病变,而提示有一种向宫颈病变发展的可能性。因此,有效的筛查和预防

期刊

阴道乳头状瘤病毒科微生物群宫颈上皮内瘤样病变

潮汕神前赛大猪

潮汕是广东第二大平原。北面和西北面,莲花、凤凰诸山脉筑起了与客家和广府地区的屏障;东面是历史上福建移民进入的陆路通道;向南,是“红头船”载着代代潮人向海外拓展的帆影

期刊

潮汕人

基于数据挖掘技术的道路交通事故空间特征分析

道路交通安全是广受关注的社会问题。交通事故的产生主要有人、车、路、环境四方面的因素,其中路和环境都与交通事故的空间属性密切相关,但已有研究在空间数据采集、研究手段

学位

交通事故数据挖掘空间特征

一般培训与特殊培训——贝克尔的观点

本文根据加里·贝克尔《人力资本——特别是关于教育的理论与实证分析》一书中关于在职培训的论述,从以下五个方面对贝克尔的一般培训与特殊培训理论进行简单的梳理和介绍:理

会议

在职培训一般培训特殊培训

志贺氏菌激发的粘膜免疫与粘膜保护

将家兔分为三组,分别经口服、滴眼或皮下接种活福氏2a 志贺氏菌。用 BA-ELISA 技术测定血、唾液、泪和粪中 IgG、IgM 和 IgA 类特异抗体。结果表明:滴眼组兔血 IgG 抗体迅速

期刊

志贺氏菌粘膜免疫粘膜保护

高校封闭校园的开放适宜性评价研究

以高校封闭校园作为研究对象,通过定量与定性结合的方式制定能够应用于高校封闭校园的开放适宜性评价体系,找到能够衡量校园空间是否适合开放的方法,并做出相应的空间开放引

学位

开放校园开放街区街区制层次分析法

基因数据的可视分析研究

其他学术论文