面向生物实验数据的信息挖掘及计算方法研究

来源 :中国科学技术大学 | 被引量 : 0次 | 上传用户:q80602655
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着生物技术的发展,生物实验生产了海量数据,为了对这些数据进行处理,从系统层次理解生物系统的“系统生物学”被生物学家们提出并得到了迅速发展。在疾病研究领域,疾病的发生发展是有一定过程的,生物实验中与疾病有关的数据常常包含时序信息。如何有效地运用数据中的时序信息是生物数据处理中的一个研究热点。在生物实验中,常常由于各种原因导致生产的数据中样本数太少,而数据中特征的维度很高;同时一些疾病表现形式过于复杂,造成数据中的样本标记可能错误。生物小样本数据中的类别标记错误对于数据中信息的发掘有很大影响。本文关注于生物时序数据的分析以及小样本数据中错标记问题的研究,完成的主要工作有:   1.生物标记物可以用于表征系统、器官、组织、细胞等功能或结果的改变以及可能发生的改变,寻找并发现有价值的生物标记物可以为疾病的诊断和治疗提供有效帮助。本文给出了一种面向时序组学数据的生物标记物选取方法,运用数据中的时序信息选出了一批可用于疾病分析的生物标记物。   2.依据疾病的产生会影响生物体有序组成结构的思路,针对人体糖尿病的血液蛋白质组数据采用多种方法分析糖尿病个体与正常个体之间差异,结果表明糖尿病个体内的蛋白表达较为混乱,同时糖尿病前期是一个高熵状态。   3.针对现有的工作中对生物小样本数据中的错标记分析研究不够深入,本文深入地分析了错标记对生物小样本数据造成的影响,并从数据特征角度出发提出了多种方法用于错标记样本识别,实验表明这些方法具有较好的效果。
其他文献
基于数字高程模型DEM的数字地形分析已成为地理信息系统GIS的重要组成部分,广泛应用于测绘、遥感、城市规划、军事作战等各个方面,其中的特征地形要素分析研究尤为活跃。  
随着Web信息技术的不断发展,网络信息采集技术也日趋完善,作为许多Web信息服务的基础及重要组成部分,它被广泛的应用于搜索引擎、机器翻译等自然语言处理的各个方面。面对互联网
随着计算机与网络技术、移动通信技术及移动嵌入式技术的发展,移动计算技术已逐渐将人们从具有时空局限性的、传统的桌面计算中解放出来,使得人们能够以更为自然、本能的方式
随着NAND闪存智能移动终端的广泛应用,NAND(?)闪存上的数据恢复技术也日益彰显其重要性。与传统的磁存储器相比,NAND闪存一方面在硬件上具有耐擦写次数低且不支持原地擦写的
随着科技的不断发展,领域文献和术语词典不断累积,将非结构化的领域文献转变为结构化的知识库日益成为知识工程的研究重点。然而,现阶段特定领域知识库构建往往缺乏相应的信
在过去的几十年,神经网络的动力学分析因其重要的理论和实际意义,受到了各领域学者和专家的广泛关注。神经网络有着广泛的应用背景,与计算机、数字网络、嵌入式系统、以及人工智
近年来,随着信息技术的快速发展并逐渐运用于军事领域,计算机信息化管理对征兵工作起到了极大的推动作用。现行的以单纯的计算机管理和传统的手工管理相结合的工作模式,已经很难
识读视频中的数字时钟是一个重要的应用问题,在智能监控、娱乐等领域有着重要的应用价值。文献中已有算法可以很好地识读视频中的数字时钟,但是这样的算法还存在两方面的问题
随着二维条码技术的不断发展以及智能手机性能的不断提高,手机二维码已经在在各个行业中得到了广泛的推广,给人们的生活带来了极大的便利。随着移动网络增值业务的不断发展,其应
随着互联网及其应用的快速发展,互联网上的数据量急剧增长,网页上的数据已经成为一个巨大的数据库,其中包含着大量潜在的有用信息,如何从中抽取出用户感兴趣的数据已经成为人们关