局部核分类器及其在脉象分类中的应用

来源 :哈尔滨工业大学 | 被引量 : 0次 | 上传用户:h597144280
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
局部学习方法理论上具有较小的泛化误差,近年来在机器学习领域受到了一定关注。与全局学习方法相比,局部学习方法更加注重样本的局部分布,并且通过合理的选择局部参数达到比较好的分类效果。本文重点研究一种最新的支持向量机方法,即局部核分类器(FaLK-SVM)方法。它是一种有效的局部核学习方法。在训练阶段,它采用覆盖树算法寻找k’-近邻,用贪心算法进行中心集合覆盖,并进而训练以这些中心k-近邻为局部问题的模型;在预测阶段,对于给定的一个未知样本点,用覆盖树检索它的最近邻,并用最近邻的局部模型来预测未知样本的类别。然而,如何选择适当的一个局部分类器仍然比较困难,并且因为采用贪心算法进行k’-近邻中心集合覆盖,因此,离未知样本点最近的那个训练样本点有可能在多个的局部模型内。为此,我们基于局部核分类器方法,提出了使用多个局部模型联合预测某一未知样本点的自适应加权融合方法(FaLK-SVMa),该方法用该训练样本点所在的所有的局部模型联合预测未知样本点,使得该分类方法更加稳定。另外我们还提出了两种权重计算策略,使得离未知样本点最近的训练样本点所在的每个局部模型对最终的预测结果都有一个贡献分量。这些都使得预测结果更加合理,而且更加稳定。我们把改进后的局部核分类器方法,即自适应加权融合方法应用在两类问题和多类问题的UCI数据集上,其中,两类问题包括14个较小数据集和3个大的数据集;多类问题包括3个多类数据集。从实验结果可以看出,这种加权融合方法整体上不仅性能上预测精度较局部核分类器方法更高,而且训练阶段的时间复杂度还没有任何的增长。因此,可以看到我们提出的这种融合方法的优势所在。我们进一步将上述我们提出的自适应加权融合方法应用到脉象分类研究中,研究了基于局部核分类器的中医脉形分类问题。我们对从二一一医院采集的脉象样本进行预处理和提取单周期脉形特征,然后我们把这种自适应加权融合方法应用在整理后的中医脉形数据的两类脉象分类问题和多类脉象分类问题上,做了大量实验对比了几种方法,并深入的分析了相关的局部参数对这几种分类方法产生的影响。实验结果表明,我们提出的这种自适应加权融合方法(FaLK-SVMad和FaLK-SVMar)不仅在两类中医脉形分类中能够取得了较好的分类结果,而且也在多类问题中都达到了92.43%的分类精度。另外,我们还把我们提出的这两种自适应加权融合方法和其他几种分类方法进行比较,经过3-折交叉验证实验可以看出,我们提出的自适应加权融合方法的分类精度要高于其他几种分类方法,分别达到了92.27%和92.23%的分类精度。
其他文献
伴随着互联网在人们日常生活中的普及以及电子商务的应用,安全和隐私已成为广大网民关注的热点话题。传统的加密技术能够保护网络通信内容的安全,但是并不能抵御流量分析等攻
本文提出一种基于数据流架构的表面等离子体共振仪软件开发模式。表面等离子共振仪的开发属于虚拟仪器的开发范畴。虚拟仪器是90年代以来随着计算机技术的进步而逐渐发展起来
本设计项目基于当前采场煤岩应力监测系统的缺点,从而提出了一种更为理想的采场煤岩应力监测的方法。该方法改进了应力采集所用到的传感器的结构构造设计,使其由单应力轴变为
为进一步加快儿童语音产品的市场化,设计制作适合儿童认知和学习的语音内容,面向互联网的知识汇聚技术,实现基于知识驱动的儿童益智型语音系统,设计针对儿童的基于语音交互进
随着当今社会的发展,大量的无线音频出现并逐渐发展,分布式音频编码应运而生。在分布式音频编码系统中,解码端生成的边信息Y与编码端的音频源X构成了一个虚拟依赖信道。由于时空
互联网技术飞速发展的今天,网络空间所包含的大量文本数据中既蕴含着智慧的结晶,又存在着潜在的风险。在此背景下,基于自然语言处理技术的舆情监控、观点抽取和情绪分析等研
食品安全是保障民生的重要内容之一,而最近几年频频发生的食品安全问题事件引发了人们的高度关注。面对频发的食品安全问题,现如今缺乏对食品安全问题监测的关键技术,同时在
随着计算机科学技术的不断发展,计算机图像处理和模式识别等方向的研究越来越引起人们的重视。近十年中,由于网络化和信息化的迅速普及对于身份的鉴别成为越来越重要的问题,
随着信息技术和数据库技术的高速发展,人们每天都要面对巨大的数据量,数据挖掘正是致力于数据的分析和理解、揭示数据内部蕴藏知识的技术,是当前人工智能研究中非常活跃的领
随着数字时代的到来,媒体内容的形式逐渐由模拟向数字转变,而模拟内容和数字内容的本质区别是:首先是模拟内容与介质相关,而数字内容与介质无关;其次是数字内容可以克服内容短