【摘 要】
:
时至今日,癌症仍然是人类最高危的疾病之一。由于基因芯片技术的迅猛发展,海量的癌症基因表达数据能够成功获取并用于研究。利用基因表达数据来分析诊断病症,已成为后基因组
论文部分内容阅读
时至今日,癌症仍然是人类最高危的疾病之一。由于基因芯片技术的迅猛发展,海量的癌症基因表达数据能够成功获取并用于研究。利用基因表达数据来分析诊断病症,已成为后基因组时代的热点之一。基因表达数据的分类是针对具体功能基因表达的分析,其准确分类有助于提高疾病诊断的效率。但是,基因表达数据普遍具有样本数量少、单个样本维数极高、数据非线性等基本特点。针对基因表达数据的基本特点,本文采用基于稀疏表示的特征选择和分类方法。第三章提出一种基于稀疏表示的基因选择方法进行降维去燥和冗余检测。首先我们利用稀疏表示计算基因与类别之间的相关性,并进行排名,用于初步的特征选择。然后将选择后的特征子集进行分组,并迭代的对每组进行冗余检测,并对剔除冗余后的小组进行分类预测,直到所有分组都被迭代完毕,即获得最终子集。该方法能够保证了最大限度的剔除冗余特征,并且能够保证在迭代过程中,获得的子集的分类能力处于上升的趋势。针对目前稀疏表示算法的时间复杂度很大的问题,本文第四章设计了一种基于元样本的字典对迭代学习的分类算法进行肿瘤分类,我们称为MDPLC。该方法主要包括两大阶段,首先通过奇异值分解(SVD)提取每一类的元样本,组成元样本字典。然后将该字典分解成综合字典和分析字典,并进行交替迭代求解最优稀疏编码系数。该算法不仅能够在保证分类精度的基础上快速的进行求解系数编码,而且具有较好的泛化能力和算法稳定性。在公开数据集上,该算法跟其他几种基于稀疏表示分类的方法相比具有更好的分类性能。
其他文献
准噶尔盆地白家海凸起彩9井区头屯河组2012年在探明区外恢复试油,意外收获2m储层内日产油14.0t,气1200m3的高产井,打开了勘探的新局面。由于前期关注不够,研究区缺乏统一地层
野马泉地区位于东昆仑造山带祁漫塔格,区内地质演化复杂,三叠纪岩浆活动强烈,同期成矿作用显著,成矿潜力巨大。本文通过对研究区三叠纪岩浆岩时空分布规律、地质特征、岩石学
本论文以鄂尔多斯盆地马岭油田延长组长8油层组砂岩储层作为研究对象,以沉积学、石油地质学和储层地质学等理论为指导,结合岩心、测井、录井等资料,系统研究了储层沉积背景、
科学研究发现,人类视觉系统能够快速并且高效地从复杂的自然环境中发现令人感兴趣的信息。然而,如何通过模拟人类视觉系统来设计视觉显著性检测模型仍是计算机视觉中备受关注
近来年随着并行计算和互联网技术的迅速发展,集群系统开始大量出现,并且由于其性能优越、可扩展性强、成本低廉、可靠性高等特点已逐渐成为高性能计算的主流平台。同时,对于
随着计算机技术的飞速发展,智能系统被广泛的应用于工业生产、国防、航天探索等领域而且变得越来越复杂,呈现出多处理器协同工作的趋势。多处理器上的多类型实时任务调度作为
化学驱是注水开发油藏到中后期的必经阶段,而复合驱则是化学驱技术中使用较多且有成功先例的驱油技术之一。复合驱虽能充分发挥波及和洗油效率的协同作用,但色谱分离效应使规
目的:恶性肿瘤细胞产生的多种生物活性分子,抑制机体的免疫功能,构成肿瘤免疫逃逸的重要机制。灵芝多糖的抗肿瘤作用已被很多实验证实,灵芝多糖可增强细胞免疫和体液免疫。本
金平地块位于金沙江-红河富碱侵入岩带的南段,区内出露的中酸性岩脉主要有正长花岗岩、正长花岗斑岩、细晶正长花岗岩及石英正长斑岩等,呈小岩株、岩脉、岩墙等形态产出,矿物
近年来,遥感技术在矿产勘查和成矿预测方面的应用越来越广泛。运用遥感数据提取蚀变信息可以进行快速的矿体定位,提高找矿效率。东昆仑地区发育典型的石英脉型金矿,热液蚀变