基于标记分布的噪声标记问题研究

来源 :东南大学 | 被引量 : 0次 | 上传用户：laopoxqq

【摘要】

：

【作者】

：

刘云鹏

【机构】

：

东南大学

【出处】

：

东南大学

【发表日期】

：

2021年01期

【关键词】

：

噪声标记标记分布标记增强偏多标记学习噪声标记学习

下载到本地 , 更方便阅读

下载此文赞助VIP

声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架

论文部分内容阅读

监督学习是应用最为广泛的机器学习范式之一,监督学习算法可以在数据驱动下有效地学习特征空间到标记空间的映射关系。但当训练数据中出现错误标记时,基于监督学习范式训练的模型会学习到错误的映射关系,导致模型的泛化性能下降,这样的问题被称为噪声标记问题,错误标记也被称为噪声标记。标记多义性是引起噪声标记问题的重要原因之一,标记多义性的示例没有明确的类属性特征,在标注过程中更容易被错误标记,从而产生噪声标记问题。标记分布是一种新型的标记方式,它为每个关联标记都赋予了表示类别描述度的连续型数值,在处理标记多义性问题上具有天然的优势。在噪声标记问题中,标记分布记录了全部关联类别上的描述度信息,这对于定位噪声标记和挖掘真实标记具有重要的价值。基于这样的认知,本文针对噪声标记问题提出了基于标记分布的解决方案,具体的研究工作将围绕通过标记分布来进行标记消歧的思路展开。标记与示例的关联性具有二值化属性:1表示具有相关性,0表示不具有相关性。根据这一性质,可以将标记噪声划分为两类形式:一类是无关标记翻转为相关标记,另一类是相关标记翻转为无关标记,这两类噪声形式的组合构成了噪声标记问题的多样性。本文首先研究了仅包含一类噪声形式的噪声标记问题:偏多标记学习（Partial Multi-Label Learning,PML）问题。在PML问题设定下,每个示例关联一组候选标记集合,其中仅有部分标记是示例的真实标记,其余标记均为噪声标记。研究工作采用了基于标记分布的标记消歧策略来差异化候选标记集合中的真实标记与噪声标记,并通过实验验证了标记分布解决PML问题的有效性。接下来,本文考虑了同时包含两类噪声形式的噪声标记问题:噪声标记学习（Learning with Noisy Labels,LNL）问题。在LNL问题设定下,存在一个无关标记被标注为关联标记,而原本真实的关联标记被错误标注为无关标记,这使得噪声标记的形式更加复杂。为了解决这类噪声标记问题,本文提出了基于标记分布的标记置信度生成算法来检测标记的质量,检测结果被用于辅助模型的训练。上面两部分的研究工作验证了标记分布在噪声标记问题中的适用性和可扩展性。本文共分为五章。第一章主要介绍了噪声标记问题的研究背景以及本文的研究内容。第二章详细介绍了标记分布的定义和相关的研究工作。第三章介绍了基于标记分布解决偏多标记学习问题的研究。第四章介绍了应用标记分布解决更加复杂的噪声标记学习问题的研究。第五章对全文的内容进行了总结和展望。

其他文献

面向软件工程知识图谱构建的实体识别方法研究

学位

一个面向时序规约模式的软件需求引导工具的设计与实现

学位

基于知识图谱的可解释推荐算法研究与实现

学位

基于CNN的端到端中文语音识别算法设计与FPGA验证

语音识别作为人机交互的第一接口,广泛应用于智能音箱、智能家居、汽车电子等领域。卷积神经网络凭借其强大的非线性表达和特征提取能力,被广大研究者应用到语音识别算法声学模型的研究。然而相对于传统语音识别算法,基于卷积神经网络的语音识别算法拥有更多的参数量和计算量,对硬件条件要求更高,使得其部署在移动终端存在巨大的困难。因此,基于软硬件协同设计,实现高效快速的语音识别算法具有重要的现实意义。本文基于卷积神

学位

语音识别卷积神经网络语谱图连接时序分类FPGA加速器

动态环境下融合语义信息的视觉定位方法研究

定位是无人智能系统自主导航、精确行为和安全应用的关键技术之一,也是智能体根据任务做出正确决策和路径选择的基础。在各类定位技术中,视觉SLAM具有自主性强、成本低、感知信息丰富等优势。现有的视觉SLAM技术大都基于静态环境的假设,即利用静态的场景信息估计自身运动,场景中的动态物体会破坏定位系统的特征关联,进而降低运动估计的精度和算法的鲁棒性。另一方面,但在一些诸如自动驾驶的实际场景中,在估计相机自身

学位

语义信息动态场景视觉直接法运动估计

基于运动模式约束的行人导航误差修正方法研究

行人导航是导航领域中一个重要分支,基于微惯性测量单元（Micro-Inertial Measurement Unit,MIMU）的行人导航系统能够在卫星导航信号受外界干扰而缺失的情况下,提供短期的自主导航服务。可运用于个人导航服务、火灾救援现场等领域,具有重要的理论研究与社会应用价值。本文研究基于运动模式约束的零速检测及误差修正方法,以提升行人导航在无外界辅助信息环境下的导航定位精度。本文主要的研

学位

行人导航微惯性测量单元零速区间零速修正运动模式

从语言社会化视角浅析网络切口 ——以微博超话社区为例

学位

基于深度学习的CT图像肝脏肿瘤分析

肝癌是全球范围内最严重的癌症之一,在肝癌的早期及时发现病灶并进行治疗,对病人来说大有裨益。然而临床实践中,放射科医生往往需要对腹部CT图像进行逐张检查才能对病情进行诊断。这个过程依赖医生的经验,需要耗费大量时间和人力。为了避免耗时繁重的阅片工作,自动化的肝脏和肿瘤分析算法亟待研发。在对肝脏肿瘤分析要求较高时,可用图像分割来获得肝脏和肿瘤的区域;在仅需简单诊断或硬件性能有限时,可用目标检测来判断肝脏

学位

深度学习肝脏肿瘤分割三维卷积目标检测自注意力

景观大道B匝道立交桥力学性能研究

随着我国现代桥梁建设的快速崛起,现场施工效率和施工环境逐渐受到各部门重视。在城市桥梁建设中,由于传统施工方法现场施工时间较长会给交通带来一定影响,现场环境也会受到较大程度的影响。临汾市滨河西路与景观大道立交桥,采用钢-混组合梁桥结构,能够节约模板的使用以及减少支护工序,从而大大缩短工期,很好地解决了由于桥梁施工而引起的城市交通堵塞问题,在城市桥梁建设中表现出广阔的发展前景。钢-混组合梁桥在受力方面

学位

钢-混组合连续梁桥徐变负弯矩区受力有限元力学性能

诸暨市同山高粱酒厂品牌传播策划案

学位

基于标记分布的噪声标记问题研究

其他学术论文