基于基因本体的肿瘤分类特征基因选取研究

来源 :西南科技大学 | 被引量 : 0次 | 上传用户:tianshi6868
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
肿瘤是目前危害人类健康乃至生命的重大疾病之一,它的发生发展与受损DNA上基因的异常表达密不可分,然而利用基因芯片技术测量得到的成千上万个基因的表达水平中,仅有为数不多的几十个甚至几个基因真正与肿瘤的发生发展过程有关。因此,如何使用特征选择技术从高维小样本的肿瘤基因表达谱数据中挖掘出那些具有样本类别辨别力的特征基因,帮助病理学工作者在临床医疗中准确地预测肿瘤类型并确定有效的治疗方案,是目前生物信息学研究的重要内容之一。   本论文针对传统特征选择过程中,没有充分考虑特征基因所蕴含的生物学信息以及基因表达谱数据自身缺陷所引起的计算误差问题,提出了一种特征选择算法,利用基因本体的语义知识对基因表达谱数据进行修正,实现最佳特征基因子集的选择。算法充分考虑了“基因-样本”的相关程度和“基因-基因”的冗余程度,在保证分类准确率的前提下,考虑了如何最大限度的减少特征基因数量。通过急性白血病数据集和结肠癌数据集的实验验证,表明本文方法可行有效,在提高了分类的准确率的同时也获得了特征基因的生物学解释。  
其他文献
随着互联网的飞速发展,网络信息量和网络信息用户的数量也在急剧膨胀,网络已经成为人们重要的信息来源。然而,语言的多样性导致使用一种语言的用户在获取其它语言的信息时会碰到
DNA元件百科全书计划(EncyclopediaofDNAElements,ENCODE)的研究表明人类基因组蓝图是一个复杂的网络系统。认识和解读人类基因组蓝图是后基因组时代生命科学领域中面临的最具
Web服务作为一种新型的分布式计算模型,具有高度的互操作性、跨平台性和松耦合等特点,得到了世界范围内学术界和工业界的极大关注。但是单个Web服务功能有限难以满足复杂的用
数码相机的出现与普及,使得数字图像早已成为我们日常生活的一部分。而由于数字图像容易修改的特性、再加上图像处理软件功能的日渐强大,过去被认为能够记载真实场景的图像,
股票市场作为金融市场的主体,在国家的经济发展中起着至关重要的作用。股票价格指数是对整个股票市场总的股票价格水平和波动情况进行描述的指标,预测分析股票价格指数(简称股票指数),从微观方面看,影响投资者们的投资策略,从宏观方面看,为国家的宏观决策提供依据。因此,很多海内外的研究者们对股票指数进行了预测研究,并且证明了从时间序列角度对股票指数进行分析是较为有效的方法。当前对股票指数时间序列的研究,主要有
立体匹配是计算机视觉研究领域的热门课题,也是立体视觉中最为关键和困难的一步。它的最终目标是得到匹配图像的视差图。立体匹配问题通常可表达为求全局能量的最小化问题,首
肺癌是目前对人类健康和生命威胁最大的疾病之一。CT扫描已成为肺癌的早期检测和诊断的主要手段,基于CT图像的结节检测和良恶性判别也成为国内外研究的热点。识别肺结节的特
P2P技术在资源的整合与利用方面有着独特的优势,但对等实体行为无约束的工作模式可能影响P2P应用的普及,为此业界引入信任机制来约束P2P用户行为。作为信任机制的选择依据,信任
随着互联网技术与应用的迅速发展,Web服务作为一种新兴的Web应用模式及远程访问标准,很好地解决了异构平台上的数据和应用的整合与共享问题。但是,传统的Web服务缺乏语义信息,语
数字农作系统是数字农作技术研究的核心。近年来,随着计算机和3S技术的快速发展,数字农作系统的研制更加趋于综合集成。然而,当前作物模型应用系统及作物模型组件的开发往往采用