基因数据的可视分析研究

来源 :天津大学 | 被引量 : 0次 | 上传用户:oibaggio
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着人类基因组研究的重点向功能基因组转化,生物信息学研究的重点已悄然从生物数据的积累转到生物数据的处理和信息提取。传统的生物信息技术往往采用人工智能、机器学习、数据挖掘等方法,对生物数据进行搜集、处理及利用。随着基因与蛋白质的表达在其功能研究方面的不断深入,基因表达的数据量呈指数级增长,如何对海量、高维的基因数据信息进行分析,并有效地从全局到局部对生物信息进行解释、理解、评估和推理,已成为生物信息领域非常重要且迫切的问题。本文提出了一种名为基于gSpan的目标基因挖掘算法,算法旨在从海量基因数据中挖掘出目标基因。基因数据通常分为实验组和对照组两组,组内性状相似组间性状不同。本文根据目标基因应为组内差异较小、组间差异较大的特性,使用方差对数据进行了两次初步筛选。接下来,本文分别计算了对照组和实验组两组组内两个样本的相关系数,对所有相关性较小的样本对,筛选出两个样本间差异较小的基因片段。本文还计算了不同组的两个样本的相关系数,对所有相关性较大的样本对,筛选出两个样本间差异较大的基因片段。对三次筛选获得的基因片段集合,本文将实验组筛选结果和组间筛选结果取并集作为实验组集合,将对照组筛选结果和组间筛选结果取并集作为对照组集合。对于这两个集合所包含的基因数据,本文根据互信息计算基因数据相互之间的关联性,之后以基因为节点,其关联性作为基因之间的边,将每个样本的基因数据分别构成一个网状图,并应用gSpan(Graph-based substructure pattern mining,基于图形的子结构模式挖掘)算法对两组网状图分别进行频繁子图挖掘,最终得到的频繁子图上的基因节点即为实验结果。已有的基因可视化分析主要使用可视化手段作为最终结果的展示,或者开发一种可视化框架,较少使用可视化手段来辅助决策。本文不仅使用了灰度图对基因数据进行可视化来直观显示算法结果,还使用了折线图和灰度图等可视化手段来辅助分析和算法决策。本文实验部分通过针对人类龋齿病所采集的基因数据进行算法分析,实验结果对龋齿病基因的覆盖率为100%,同已有算法效果相似;龋齿病基因占实验结果的比重为33.3%,高于已有算法的15%-20%,取得了较好的结果。
其他文献
网络犯罪是我国刑法中一种特殊的犯罪形态,随着我国计算机的普及,网络犯罪大有蔓延之势。我国刑法对网络犯罪作了专门的规定,设立了相关罪名,为惩治网络犯罪提供了法律依据。从刑法教义学分析,网络犯罪主要可以分为纯正的网络犯罪与不纯正的网络犯罪两种类型。当然,这种分类还是不够的,还应当根据网络犯罪的具体内容对网络犯罪进一步分类。从刑法立法与司法的逻辑来看,可以将网络犯罪分为针对计算机信息系统的网络犯罪、利用计算机网络实施的传统犯罪和妨害网络业务、网络秩序的犯罪。本文对上述网络犯罪的类型进行了刑法教义学的论述。
党的十八大以来,全面从严治党向基层延伸向纵深发展。党的十九大胜利召开,把全面从严治党纳入“四个全面”战略部署之列,并将全面从严治党作为党坚持和发展中国特色社会主义
十九大以来,党中央坚定不移推进全面从严治党",有权必有责、权责要对等"的观念深入人心。但从基层实际看,一些职能部门对权责关系的认识存在偏差,一线职能监督作用发挥不充分
铝合金是工业中应用最广的有色金属材料之一,它广泛用于航空航天、机械制造、轮船、电力等行业。Al-Si系合金铸造性能好,焊接性能强,导电、导热性能优,常被用作架空输电线材
人乳头瘤病毒(HPV)感染是唯一可以明确的导致宫颈癌的致病因子,但HPV感染并不等于已是宫颈癌或者宫颈癌前病变,而提示有一种向宫颈病变发展的可能性。因此,有效的筛查和预防
潮汕是广东第二大平原。北面和西北面,莲花、凤凰诸山脉筑起了与客家和广府地区的屏障;东面是历史上福建移民进入的陆路通道;向南,是“红头船”载着代代潮人向海外拓展的帆影
期刊
道路交通安全是广受关注的社会问题。交通事故的产生主要有人、车、路、环境四方面的因素,其中路和环境都与交通事故的空间属性密切相关,但已有研究在空间数据采集、研究手段
本文根据加里·贝克尔《人力资本——特别是关于教育的理论与实证分析》一书中关于在职培训的论述,从以下五个方面对贝克尔的一般培训与特殊培训理论进行简单的梳理和介绍:理
将家兔分为三组,分别经口服、滴眼或皮下接种活福氏2a 志贺氏菌。用 BA-ELISA 技术测定血、唾液、泪和粪中 IgG、IgM 和 IgA 类特异抗体。结果表明:滴眼组兔血 IgG 抗体迅速
以高校封闭校园作为研究对象,通过定量与定性结合的方式制定能够应用于高校封闭校园的开放适宜性评价体系,找到能够衡量校园空间是否适合开放的方法,并做出相应的空间开放引