受限玻尔兹曼机分类算法的改进

来源 :厦门大学 | 被引量 : 0次 | 上传用户:baoma123ertswe_ss
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
深度学习算法的兴起使得机器学习取得了革命性的突破。受限玻尔兹曼机(Restricted Boltzmann Machine,RBM)作为深度学习的基础算法之一,不仅可以有效地提取特征,拟合任意形式的离散分布,也可以为传统的神经网络提供良好的初始值,改善模型的泛化能力,同时扮演着深度置信网络基础构成模块的重要角色等。此外,RBM也可以用作独立的分类器(ClassRBM)去处理分类问题。通常,训练ClassRBM有三个目标函数可以选择,分别是生成式目标函数(Generative Objective Fucntion,GenF)、判别式目标函数(Discriminative Objective Function,DisF)和它们的加权和。然而,已有的ClassRBM还存在着许多不足,比如:用GenF训练时,由于GenF函数值的计算需要遍历模型中所有节点的可能状态,复杂度极大,难以计算,一般通过抽样方法进行估算,使得模型准确率不高;用DisF训练时,目标值可以精确计算,但计算过程相当耗时;而用GenF和DisF加权和训练时,加权系数需要进行优化,增加了模型的复杂度。本文针对ClassRBM的不足,进行了两个改进。首先,针对单纯用GenF或DisF或它们的加权和训练ClassRBM的不足,提出一种交替用GenF和DisF训练ClassRBM的方法(ANGD),并在多个数据集上进行对比实验,结果表明ANGD提高了 ClassRBM的分类性能,特别是隐藏层节点数较多的时候。其次,利用ClassRBM的概率输出,提出了一种多分类器集成算法ClassRBM-MCI,进一步改善分类性能。在ClassRBM-MCI中,先用ANGD方法训练ClassRBM得到一个分类器C1;接着将对C1的概率输出较小的训练样本过滤出来组成一个训练样本子集,然后用ClassRBM、支持向量机和随机森林三种方法在此样本子集上训练得到分类器C2、C3和C4。对于一个测试样本,首先将其投入C1,如概率输出值大,直接用C1的结果作为其分类结果,否则用C1、C2、C3和C4的组合作为分类结果。通过与目前主流分类器进行实验对比,结果表明ClassRBM-MCI提升了ClassRBM的分类性能,并取得了比传统主流分类器更好的结果,尤其是训练样本比较多时,无论是测试准确率还是训练效率上都有一定的优势。
其他文献
小家鼠(Mus musculus)属哺乳纲(Mammalia),啮齿目(Rodentia),鼠科(Muridae),小家鼠属(Mus),是全球分布的人类共栖种。小家鼠是全世界实验使用最广泛的实验小鼠的祖先,并且是
浮游植物作为海洋生态系统中最主要的初级生产者,其群落结构的组成影响着海洋碳循环,对海洋生物地球化学循环有非常重要的意义。水色遥感反演浮游植物群落结构分布具有高时空
粘胶纤维又称人造棉,是以棉短绒,木材和竹子等为原料,通过浆粕溶解,制成粘胶,纺丝后处理生产出粘胶纤维,粘胶纤维可自然降解,性能非常的接近棉花。随着我国纺纱行业的技术进
随着经济贸易交往的空前发展,商事关系在交易结果、交易方式方面也表现得更为错综复杂,在诸多的商事领域,同一商事关系中涉及到多方当事人争议的情形越来越多。日渐增多的多
游离小孢子培养已经成为园艺植物现代育种的一项重要内容。综述了园艺植物小孢子培养的研究进展,详细讨论了小孢子胚胎发生的影响因素,包括材料的基因型、小孢子发育时期、供
甘露醇是一种六碳糖醇,静脉注射后不易从毛细血管透入组织,因而可使血浆渗透压迅速提高,引起组织间隙水分向血管内转移,而产生脱水作用.临床上常用于治疗脑水肿、青光眼、大
期刊
目的观察和分析替罗非班对急性非S T 段抬高心肌梗死( non ST segment elevation myocardial infarction,NSTEMI)患者血清肌韩蛋白T( cardiac troponin T ,cTnT)水平及近期预后的