【摘 要】
:
多标签分类旨在准确分类出同一个图像中不同物体所属的类别,广泛应用于文本分类、图像识别等实际场景中。多标签分类研究中存在两个核心问题,第一,如何利用多个类别标签之间的相关性,通过已分类样本标签推测其他可能存在的类别;第二,分类数据集中不同类别的样本数量通常相差巨大,从而引起类别不平衡的问题。针对这两个问题,本文提出了一个新的多标签分类模型GMLC(Graph Net for Multi-label
论文部分内容阅读
多标签分类旨在准确分类出同一个图像中不同物体所属的类别,广泛应用于文本分类、图像识别等实际场景中。多标签分类研究中存在两个核心问题,第一,如何利用多个类别标签之间的相关性,通过已分类样本标签推测其他可能存在的类别;第二,分类数据集中不同类别的样本数量通常相差巨大,从而引起类别不平衡的问题。针对这两个问题,本文提出了一个新的多标签分类模型GMLC(Graph Net for Multi-label Classifiction)。该模型引入图卷积网络学习不同标签之间的依赖关系,并通过有效样本数量下的权重损失函数缓解了类别不平衡的问题。此外,我们发现另一个非常具有挑战性的任务——复合表情识别,其本质上也属于多标签分类问题。因此我们将本文提出的GMLC模型加以改进应用到复合表情识别中,取得了优异的识别效果。现将本文的主要工作及创新概括如下:(1)为了更加准确地挖掘标签之间的相关性,本文利用图结构来构建多个标签之间的依赖关系。确切地说,我们将图的节点视作类别标签,将边视为标签之间的依赖关系。在此基础上通过图卷积网络使得标签的语义信息在不同节点之间传播,并将最后一层图卷积的输出作为标签相关的分类器。这些分类器将进一步应用到全局图像特征中帮助模型更好完成分类任务,从而形成一个端到端的网络系统GMLC。(2)为了解决多标签分类任务中类不平衡的问题,本文从模型的损失函数入手,采用有效样本数量的思想,去除原始数据集中对模型优化不产生实际作用的近似样本。并在此基础上对普通交叉熵函数进行改进,根据类别的有效样本数量对每个类别进行重加权操作,以此来提高少数类别对模型的贡献。(3)在复合表情识别中,一个样本图像同时对应着多个类别标签,例如惊喜(高兴+吃惊),这正是多标签分类要解决的问题。基于以上发现,本文认为复合表情识别本质上也是一种多标签分类问题,并创新性地对本文提出的GMLC模型进行改进以引入复合表情识别中。通过图卷积网络来挖掘不同基本表情在语义空间下的依赖关系,并利用二阶协方差池化来捕捉面部肌肉的扭曲情况,从而进一步提升识别准确性。实验结果表明,无论是在传统的多标签分类场景还是在复合表情识别任务中,本文模型都取得了很好的识别效果,并且在大多数评价指标下的表现都优于现有模型。
其他文献
气吹微缆表面质量作为产品质量的重要组成部分,对其检测是产品质量检测过程中重要一环。目前,光缆生产企业对于微缆表面缺陷检测主要依赖于人工检测,检测效率低、漏检率高。近年来,基于机器视觉检测技术在行业应用中发展起来,利用其实现微缆表面缺陷自动检测成为可能。在研究中发现目前存在检测误报率高、基于特定生产线研发等问题,影响检测效果以及在线缆行业中推广。本文围绕存在问题,对检测系统中的照明系统、检测算法、特
共享单车的出现有效地解决了用户出行“最后一公里”问题。然而单车资源随着用户出行在时空上呈现不规则的动态分布变化,造成“单车堆积”和“无车可借”现象。在共享单车资源再分配及废旧车回收的工作中,运营企业又存在成本高和路径规划不合理等问题。针对上述问题,考虑到单车使用需求在平峰期和高峰期中的差异,本文提出分时段的调配模式,研究不同时段下的调配路径优化模型,并基于改进鲸鱼群算法对模型进行求解。具体研究工作
随着互联网、物联网、无线通信和智能制造技术的发展,工业界收集、存储数据的能力不断增强,收集的数据量以指数方式增长,大量的数据也为工业界带来了处理和挖掘信息的新视角。在故障诊断领域,现代工业可以通过分析收集到的设备运行数据得出设备的健康状况。但是,数据采集速度通常快于诊断人员的分析速度,如何高效地从工业大数据中提取可用特征并准确识别相应的健康状况成为当前急需研究的课题。本论文结合实际的工业物联网应用
近年来,人工智能技术得到了社会的广泛关注,利用人工智能方法解决实际问题日渐成为主流。众所周知,每年的自然灾都会危害人们的正常生活,给国家、社会造成严重的财产损失和人员伤亡。而雷暴是最具威胁的自然灾害之一。雷暴的产生、强度和移动方向等特征很难通过人工分析方法准确做出判断。传统上,气象方面对雷暴自然灾害的预测受制于人工经验,耗费精力,效率不高,国内目前对雷暴预测还没有一套行之有效的方法,因此,如何利用
从周作人、鲁迅、梁实秋、丰子恺、老舍到沈从文、汪曾祺,乡土文学一直是文学界研究的关注点。而阿成和沈从文、汪曾祺等乡土作家一样,都是以个人生活地域为限,“靠回忆重组来描写故土生活”,带有浓重的乡土气息。阿成的文学创作可以说是中国乡土文学的当代延续。因此,本论文意从地域、民生、民间三个角度研究阿成的乡土文学创作,以探寻阿成乡土文学创作的特色以及其乡土文学创作在中国乡土文学发展中的地位及意义。阿成扎根黑
分数阶非线性Schr(?)dinger方程中的分数阶算子是非局部的伪微分算子,其性质和特点与整数阶算子有很多的不同之处,这也使得分数阶方程在晶体错位,准地流转,最优化等物理学,金
目的:吻合口漏是低位直肠癌保肛术后最严重并发症,增加死亡率,引起肿瘤局部复发,降低远期生存率。本研究通过比较经肛联合盆腔双套管负压冲洗与单纯盆腔负压冲洗对直肠癌术后
零维金属硫化物四面体团簇具有纳米级尺寸、丰富元素组成、精确原子结构以及显著半导体特性。过去近三十年,基于此类簇基晶态材料的合成和性能探索一直成为学界关注的研究热
中国经济发展已由高速增长阶段转变为高质量发展阶段,科技创新是经济增长的重要动力,产业结构作为最重要的经济结构,对科技创新的发展具有支撑作用。围绕产业结构调整和科技
二氧化钛(TiO2)是重要的无机功能材料之一,其与SiO2的复合有助于得到多种形貌的TiO2-SiO2复合材料。在光催化领域,TiO2-SiO2复合材料形成的钛硅复合界面结构能有效提升钛硅复