多值属性和多标记数据分类

来源 :中南大学 | 被引量 : 0次 | 上传用户:Longee
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着计算机技术、网络技术和数据库技术的迅速发展,现实中越来越多的应用都与多值属性、多标记数据密切相关,因此多值属性和多标记数据的分类算法成为了当前数据挖掘和机器学习领域的一个研究热点。目前的研究主要集中于多标记数据的分类算法,没有考虑多值属性的问题,而且大多数算法没有充分学习标记之间的相关信息,加上现实中多样本的数量少、标记困难等问题,对传统的分类算法提出很多新的挑战。本文的主要工作分为3个部分:(1)提出5种多值属性分解算法,结合已有的多标记分类算法,建立多值属性多标记分类的学习框架,并通过实验比较了不同分解算法的优劣,验证了按照取值顺序进行分解的学习效果最好;(2)改进已有的贝叶斯网络算法,提出了结合通用贝叶斯网络GBN和多网贝叶斯网络MBN的多标记学习算法,能够有效获取多个标记之间的相关信息,较大地提高了分类的精度;(3)针对多标记数据标记样本少的问题,结合实际对基于多标记组合算法的缺点进行了深入分析,建立多标记组合的分层模型,并提出基于不确定度的主动学习和基于置信度的半监督学习,交替选择最有效的样本进行学习,最终建立分层多标记分类器模型,实验验证了该方法能够大大提高多标记分类器的有效性和鲁棒性。本文的研究成果为学习多标记之间的相关信息以及在少量标记样本下的多标记分类学习提供了有效的方法,并通过结合多值属性分解的算法,为多值属性多标记数据的分类建立了新的学习框架。
其他文献
基于图像的三维重建技术是近年来计算机视觉技术与计算机图形学技术相结合而产生的一门新的技术。与传统的基于几何学的建模技术相比,基于图像的三维重建技术能够简单、快速地
相控阵雷达在军事上取得了非常广泛的应用,低成本、高性能的移相器的研究正成为一个热点。本文采用成本低廉、易于集成和加工的色散延迟线代替实时延迟线,应用于相控阵雷达中
图像分割是图像处理中的关键步骤。本文从图像边缘检测方面着手对图像分割进行研究。本文主要围绕相位信息理论与蚁群算法两种不同的理论方法展开研究,将这两种理论应用到图
图像分割方法一直是数字图像处理领域研究的热点问题。在图像分割中分割的精确性与易分割性、过分割和欠分割是我们经常要面临的矛盾,而这些矛盾在固定尺度下是很难解决的。
随着智能电网进入引领提升阶段,智能电能表作为连接电力公司和用户之间的纽带,被广泛使用,其可靠性不仅关系到智能电网能否安全、可靠的运行,也关系到千家万户的切身利益。如何保证智能电能表安全、可靠的长时间运行,是当前电能表行业所关注的热点问题,然而我国在智能电能表可靠性方面的标准体系还不完善,不能依靠现有的标准评价其可靠性水平。因此,对智能电能表的可靠性进行研究是一件非常有意义的工作。本文主要研究了智能
信息技术和通信技术的发展很大程度上影响和改变了人们的生活,促进了数字电视媒体的发展。在国内数据广播信息服务是一项比较新的数字电视业务,可以作为数字电视系统中的一项
随着地质勘探技术的不断深入,我们越来越希望由地震资料获取更全面的地下介质信息。时间域、频率域的全波形反演,山于目标函数的高度非线性和实际波场低频成分的严重缺失,很
无线紫外光(Ultraviolet,UV)通信是利用紫外光大气散射特性的通信方式,具有非直视通信、抗干扰能力强等特点。根据无线紫外光通信的特点及直升机降落过程中的信道特征,设计无
在现代数字通信系统中信道编译码技术已经成为通信系统保证信息传输可靠性的重要手段之一。Turbo码自发明以来就因其优异的性能成为信道编码领域的研究热点,并且目前已经被广
与传统的固体激光器相比,光纤激光器具有更好的光束质量、更高的转换效率、整体结构紧凑并且方便热控管理,已在光通信、光传感、工业加工、激光医疗、航空航天和激光武器等领