基于图的半监督分类算法研究

被引量 : 0次 | 上传用户:bdysh
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
在机器学习和数据挖掘领域,半监督学习越来越受到科研人员的关注,逐步成为当前的研究热点。半监督学习中,半监督分类利用大量非标签数据辅助少部分标签数据进行监督学习,从而提高分类的性能。基于图的半监督分类是现在研究较多的方法,该类方法具有较好的分类性能。然而基于图的方法计算复杂度比较高,当图规模比较大时,需要的时间和存储代价都非常大,而且基于图的方法都是直推式的,对新数据无法进行分类,这在一定程度上限制了基于图的方法使用。本文主要针对基于图的半监督分类存在的这些问题,进行了分析与研究。本文主要针对基于局部和全局一致性算法进行研究,该算法的基本思想是基于已标记样本和未标记样本建立一个图,用边的权重来表示样本之间的相似度,然后让每个样本的标记信息迭代地向其邻近样本传播,直到达到全局稳定状态,该方法直观、灵活,但是计算复杂度大,且无法对新数据进行分类。本文针对该算法存在的不足之处进行了改进,应用于图像分类中,并和其他方法进行了比较与分析。本文的研究工作主要包括以下几方面:(1)介绍了图像分类的相关理论,半监督学习的基本理论,当前国内外研究现状,且对半监督学习中基于图的方法所涉及的理论基础、研究现状以及该方法中所存在的问题和难点进行了综述,对半监督学习的主要应用进行了阐述,并且重点介绍了基于局部和全局一致性算法。(2)针对图像提出了一种基于图的半监督分类方法,该方法对图的相似矩阵的度量方法进行了改进,使用更能准确地反映样本间拓扑结构的测地距离对相似矩阵进行度量,并且运用了复合核的策略,结合了图像的谱信息和空间信息,进而使算法的分类性能有所提高。实验结果表明,采用该算法较之于原算法,获得了更好的分类性能。(3)为解决基于图的半监督分类算法的计算复杂度比较高和对新数据无法分类的问题。本文提出了一种将K均值算法和基于图的方法相结合的分类算法,利用已标记样本的标签信息,通过K均值方法获取更多的已标记信息,减少基于图方法迭代过程的迭代次数,从而降低了图方法的计算复杂度;算法最终确定的类中心解决了基于图的分类算法无法对新数据进行分类的问题,增强了其对新数据分类的扩展性;通过设置参数取值的实验结果分析,找出了参数的最佳取值范围。实验结果表明,提出的算法在计算效率和分类正确率方面有明显的提高。
其他文献
新建地方本科院校作为教学型大学,培养应用型人才是其根本任务,教师队伍建设成为制约学校发展的根本问题.新建地方本科院教师队伍建设在取得重要成就的同时,依然存在着教师专
目前高校图书馆的人才管理与其他行业一样,存在着诸多问题。总的看来,无非是管理者、被管理者、管理机制三者之间的不协调。该文就这三个方面进行分析,以便清楚地发现图书馆
1937年7月7日日本发动侵华战争,中国政府决心起而抗战,是时民生实业公司总经理兼四川省建设厅厅长卢作孚的抗日之心是激昂的,认为国家对外战争开始了,民生实业公司的任务也就
数学习题课是以讲解、练习数学习题为主的一种课堂教学形式。根据职业高中数学教学大纲和计划的需要,有计划、有目的地、经常地上一些数学习题课,对于帮助职中学生消化课堂教
<正>苏教版高中语文必修教材是在语文新课标推出、语文教学思想大转变的背景下出台的,充分体现了语文新课标的要求和语文教学的新理念,具有不少特点,我认为其中一个重要的特
在现行共犯理论中,教唆行为必受刑事处罚已成定论;而司法实践中,对于某些完全符合教唆行为的法律特征的行为予以刑事处罚又于理难容。基于现行共犯理论与实践的冲突,文章提出了不
为消除产品概念设计过程中可能产生的二层问题的负面影响,提出了一种基于质量功能配置与创造性解决问题理论的三种技术工具综合的产品概念设计方法。该方法通过质量功能配置
近年来,产业转移这一经济现象受到经济学界的广泛关注。产业转移是一种经济发展到一定阶段,随着区域分工的发展而产生的一种特殊经济现象。它的产生主要归因于地区产业结构调整
改革开放三十余年,我国的经济建设和社会发展取得了举世瞩目的成果,国民经济快速发展,城乡居民收入大幅提高,人民群众的生活水平得以改善。与此同时,我国行业之间、区域之间
随着互联网技术的普及,网络传播变得方便快捷,打破人们传统新闻传播模式,新闻生产传播变得不再高高再上,信息传递的成本日益下降,普通民众拥有了参与新闻生产制造的可能,许多学者将