基于传统特征提取和深度学习方法相结合的基因表达数据降维研究

来源 :西安电子科技大学 | 被引量 : 0次 | 上传用户:slchen168
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
DNA微阵列技术的使用促使越来越多的基因表达数据产生。大量的信息蕴含在基因表达数据中,通过分析基因表达数据,能够增加对肿瘤细胞和正常细胞之间的基因表达差异的了解,同时也可以找出与肿瘤形成关系密切的基因,这对于癌症的诊断、治疗和预防都具有非常重要的意义。分类是实现癌症诊断的重要手段,然而,由于基因表达数据具有特征维数高、存在大量冗余信息等特点,如果采用传统的分类方法对样本直接分类,可能会出现“维数灾难”。如果采用传统的特征降维方法先降低原始数据的维数,可以解决基因表达数据的“维数灾难”问题,但会影响基因表达数据的分类正确率。因此,选择合适的特征提取方法是对基因表达数据分类前的关键一步。深度学习是一种特征学习方法,能够学习高维数据中的复杂结构。因此,本文首先研究自动编码器对基因表达数据的降维作用,并与传统的特征提取方法主成分分析方法、线性判别分析方法和核主成分分析方法进行比较。实验结果表明在8种基因表达数据集上,自动编码器的降维效果整体要优于主成分分析方法、线性判别分析方法和核主成分分析方法,同时,也验证了自动编码器对基因表达数据降维的有效性。由于基因表达数据特征维数比较高,自动编码器学习原始数据中的特征计算复杂度比较高,耗时比较长,针对这个问题,本文基于自动编码器提出如下改进算法:(1)基于PCA、KPCA和自动编码器相结合的特征学习方法。该特征学习方法通过两个阶段进行特征学习,首先是基于PCA和KPCA的阶段,其次,基于PCA特征以及KPCA特征,自动编码器获得用于分类的更高级和更复杂的特征。(2)基于PCA、LDA和自动编码器相结合的特征学习方法。(3)基于KPCA、LDA和自动编码器相结合的特征学习方法。最后,通过MATLAB对本文提出的改进算法在8种基因表达数据上进行仿真实验,证明了改进算法的有效性。实验结果表明本文提出的改进算法优于对比方法,且大大降低了自动编码器学习原始数据特征的计算时间复杂度。同时,通过比较三个改进算法,得出如下结论:基于PCA、LDA和自动编码器相结合的特征学习方法对于多类别数据具有优势,基于KPCA、LDA和自动编码器相结合的特征学习方法对于两个类别数据具有优势。
其他文献
<正>一、潜移默化的作用——让主题墙会说话"让幼儿园的主题墙会说话"是当前教育界流行的口号,作为新时代的教师逐渐认识到要促进孩子健康和谐的发展,环境创设是很重要的一环
随着智能手机这类电子产品的普及,人们对电子产品的依赖越来越严重,机不离手的现象随处可见,再加上现代生活和学习的压力变大,视力问题给越来越多的人带来困扰,因而护眼产品开始走进更多人的生活。自2013年以来,微信用户数量大幅增加,微信的功能日趋多样,微信营销模式也呈现出爆发式增长趋势,微信产品通过附近的人、公众平台、二维码、开放平台、微商城、微支付等途径为品牌信息的传递打造出一个动态的生态链,引起移动
为了更清楚地认识国际消防设备市场对于消防泵类产品的要求,以UL 448-2013《固定式离心消防泵》(以下简称UL 448)标准为研究主体,将其与国内标准进行对比。通过从结构、材料
<正>本刊讯近日,首都医科大学附属北京同仁医院韩德民院士团队在耳鼻咽喉头颈外科成功完成全国首例骨桥植入手术。与此同时,另外3例听觉障碍的患者也被成功实施骨桥植入手术
往复压缩机广泛应用于石油、化工领域,主要负责煤化气、天然气、乙烯等危险气体的压缩与运输,其内部一旦出现故障不仅会造成重大的经济损失,同时还会对人身安全造成严重威胁,
如今时代随着战争要求不断提升,在科技日益发展的今天,无人化的武器系统成为研究热点,着重增强无人体系的自动化水平和智能化程度,不断发掘其在民用和军事领域的应用潜力。水
颜色丰富着我们的生活,它存在于任何文化之中。当人们用颜色来表达感情并赋予它一定的含义时,它就变成为了符号,可以表征另外一种事物,也就是它的"所指"。本文将结合符号学理
随着我国社会经济的持续进步,建筑业的施工工艺也随之改变,建筑行业已迈进了崭新的时代,同时也要重视另一方面,即加强建筑工程的施工安全监督和管理体系,本文简单分析了当前
随着土木工程建筑施工要求的越来越严苛,土木工程中混凝土建筑物在施工过程中,由于设计图纸的变更或施工材料质量问题等原因导致混凝土建筑物出现使用功能变化或质量安全等问
目的:建立肺炎支原体(MP)感染BALB/c小鼠肺炎支原体肺炎(MPP)模型;应用清燥救肺汤及其拆方干预支原体感染小鼠,探讨清燥救肺汤及其拆方对MP诱导的MPP小鼠模型的NLRP3炎性小体相关因子表达的影响,进一步明确其作用靶点。材料与方法:筛选SPF级Balb/c小鼠108只,随机分成正常组、模型组、清燥救肺汤组、拆方Ⅰ组、拆方Ⅱ组、阿奇霉素组,每组18只。除正常组外,其余各组均使用支原体菌液滴