基于非负矩阵分解的癌症基因表达谱数据的特征提取

来源 :安徽大学 | 被引量 : 0次 | 上传用户:fyq20061001
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
DNA微阵列技术作为一种新兴的技术成为对肿瘤基因表达谱进行分析研究的有力工具。越来越多的肿瘤专家用它来分析正常组织和肿瘤组织之间的基因表达差异。然而基因维数大而样本小是基因表达谱数据的一个显著特点,每个样本都记录了组织细胞中所有可测基因的表达水平,但大多数基因与样本类别无关,并不包含样本分类信息,这些噪声基因会使得分类的准确率降低。因此需要从实验数据中提取有关基因的结构与功能信息,找到在功能上相互联系的基因,尽可能除去无关基因。如何有效地提取特征基因、降低数据的维数是癌症分类研究中关键的步骤。本文利用非负矩阵理论从基因表达谱数据中提取特征,进而使用分类器分类来验证本文特征提取方法的有效性和可行性,主要研究内容是:1.提出将非负矩阵分解算法应用在基因表达谱数据的特征提取中。非负矩阵分解算法的基本思想是将一个非负矩阵近似分解为两个非负矩阵的乘积,来反映数据潜在的结构。首先对基因表达谱数据进行筛选,然后构造非负矩阵并对其进行分解得到维数低、能充分表征样本的特征向量,最后用支持向量机对特征向量进行分类。2.提出将局部非负矩阵分解算法应用在基因表达谱数据的特征提取中。该算法是在非负矩阵的基础上对迭代条件进行三方面的约束,这三个限制条件更加强调了原矩阵分解过程中基本特征成分的局部化。首先对基因表达谱数据进行筛选,然后构造局部非负矩阵并对其进行分解得到表征样本的特征向量,最后通过支持向量机对特征向量进行分类。3.提出将稀疏非负矩阵分解算法应用在基因表达谱数据的特征提取中。该算法是对系数矩阵添加稀疏性约束条件后发展起来的一种非负矩阵算法,首先对基因表达谱数据进行筛选,然后构造稀疏非负矩阵并对其进行分解得到表征样本的特征向量,最后选用支持向量机作为分类器来验证特征向量提取的有效性。
其他文献
无论多么优美洁净的校园,如果缺少琅琅的读书声,便不再生机勃勃。如今学生沉溺电子阅读,全都静默无声,这是快餐式的浅阅读,不是原生态的深阅读,收效甚微。有声读物不是传统意义上的
针刺治疗先天愚型80例冯淑兰靳瑞广州中医药大学(广州510407)先天愚型即Down氏综合征,又称“伸舌样痴呆”、“21—三体综合征”,是人类常染色体最常见的一种畸变,患者染色体组包含一条额外的21号染
对基地现状进行调研分析,基于地域文化背景下对焦作市温县荣蚰河景观设计进行论述,打造满足城市居民需求的城市滨水景观,推动城市生态建设更进一步发展。
采用反相高效液相色谱法测定参维灵片中人参皂昔Rb1和维生素B6的含量,以此作为该制剂的质量控制指标。
目的:通过对本院441例鼻咽癌患者进行回顾性分析,探讨影响鼻咽癌放射治疗的预后因素,为临床治疗提供参考。方法:对2003年1月至2007年11月在广西医科大学附属肿瘤医院接受首诊并
观察电针夹脊穴及局部取穴对性剂关节炎大鼠痛阈的影响.采用Wistar雄性大鼠28只,随机分为正常对照组、模型组、电针夹脊穴组、电针局部取穴组.用辐射热测痛法测量大鼠双后肢
针对低压双燃料低速船舶发动机的特点,为保障其试验台架使用的安全性,在燃气站建设及双燃料试车台改造过程中,对燃气安全技术如,燃气双层壁管路抽风系统、天然气探测器系统、
随着国内各大企业全面预算管理不断深入推进,人们预算管理的认知结构不断优化,无论是国有企业还是其他类型企业在全面预算管理方面的深度和广度也不断增强,在企业推行全面预
目的:目前常用的二线治疗方案有单药多西他赛、培美曲塞化疗,单药厄洛替尼、吉非替尼口服靶向治疗,这四种治疗方案的疗效、临床受益率、药物成本等均有差别,本研究针对这四种
《短剑》这首诗创作于诗人第一次流放高加索时期。诗人自比"忠贞不渝、意志坚定"的短剑,表达了诗人坚定不移的斗争意志与人生理想。本文从该诗的创作背景、"剑"之意象、诗的