基于模糊支持向量机的基因表达数据分类方法研究

来源 :湖南大学 | 被引量 : 0次 | 上传用户:qq174548079
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着分子生物科学和信息科学的快速发展,生物信息技术作为新型学科成为前沿研究领域,通过基因分类可以将海量的基因表达数据划分成数量相对较少且具有生物意义的组,并在此基础上从中抽取具有价值的信息,以便弄清楚不同基因组合的功能关系和工作方式。如何对基因数据进行有效的分类,以提取对生理学和医药学等有价值的生物信息成为研究的热点。所以本文研究的模糊支持向量机的基因分类技术具有实际意义。模糊支持向量机既有支持向量机的泛化能力强、全局最优等优点,又有模糊技术的不依赖被控对象模型、鲁棒性强等优点,近几年得到了广泛的发展。本文把模糊支持向量机应用到基因分类这一领域中,能够有效的区分分类的中的噪声和野值样本,提高了分类的精度,具有良好的可行性。本文主要研究模糊支持向量机算法在基因分类中的应用,提出了改进的模糊支持向量机算法,并应用到基因分类中。在重视分类面附近的样本的基础上,提出了基于分类超平面的模糊最小二乘支持向量机算法。在分类过程中,位于分类超平面附近的样本点很有可能成为支持向量,对分类的结果影响比较大,因此在隶属度设计中,对这些样本赋予了较大的隶属度权值。实验结果表明该算法提高了分类的精度。最小二乘模糊支持向量机很好的解决了凸二次规划的问题,在模糊隶属度设计过程中,除了要考虑了样本与类中心之间的关系,还应该充分的考虑了样本与样本之间的关系,为此本文提出了一种基于密度的最小二乘支持向量机算法,通过样本在该样本周围一定范围内的样本数量来确定密度,并以此来设计隶属度函数,很好的减小了噪声或野值样本对分类的影响。并将该算法应用于基因分类中,实验表明该算法能够有效的区分噪声和野值样本,提高了分类精度。
其他文献
多标签分类问题中每个数据样本往往对应一个由多个相关标签构成的标签子集合,而这个标签子集则反映了该样本所具有的多种语义意义。考虑到传统分类问题中每个样本有且仅有唯
网络的飞速发展,为我们提供了丰富的资源、信息,给我们的生活带来了方便,也为无数的学习者提供了快捷、方便的学习方式,使学习可以不受时间和空间的限制。与此同时,随着教育
由于Web镜像和网络转载抄袭,完全重复以及近似重复的网页数据对于当前的搜索引擎产生了一系列的问题:它不仅增加了网页数据索引的存储量而且给搜索引擎的检索服务带来了沉重
重构指在不改变软件外在行为的前提下,改善软件内部结构,从而在软件演化过程中优化软件质量,提高软件可理解性、可维护性和可扩展性等。二十多年来,人们对重构技术进行了深入地研
正交频分复用(OFDM)技术被当今社会普遍认为是4G的核心技术之一。目前已经被应用于无线局域网(WLAN:Wireless Local Area Networks),无线城域网(WMAN:Wireless Metropolitan
随着计算机网络技术的不断成熟,网络化考试系统成为计算机辅助教学的一个重要应用,而校园网建设的日渐完善,为考试系统的应用提供了更加有利的平台。作为考试系统的核心和难
HITTING SET-问题是组合学中的一个经典计算问题,它和集合覆盖(Set Cover)问题等价,其任务是计算有限集合S的一个基数较小的子集D使之满足和集合C的每一个元素相交非空,其中
学位
企业级软件产品规模庞大,模块众多,配置复杂,其中最典型的代表就是ERP企业管理软件。一个企业如果将采购、生产、销售、财务管理全部使用ERP企业管理软件来管理,往往需要耗费一、
条码技术是集编码、印刷、识别、数据采集和处理于一体的综合技术。一维条码在生产和生活的各个方面得到了广泛应用,但是一维条码本身的缺点--信息量少、依赖数据库等缺点也日
USB(Universal Serial Bus)是目前应用非常广泛的一种总线形式,其即插即用、热插拔、接口体积小巧等优点给计算机外设连接技术带来重大变革。μC/OS-Ⅱ是一个源码公开、完整