场景文本检测的主动学习和增量学习研究

来源 :华南理工大学 | 被引量 : 0次 | 上传用户:mmmzyh
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
场景文本检测是计算机视觉领域的重要任务,包括水平文本检测和曲线文本检测等。基于深度学习的场景文本检测方法已经取得了非常不错的成果,但它们的训练十分依赖大规模的标注数据。由于实际工程中标注数据的成本预算是有限的,所以研究减少数据标注量同时保证模型性能的工作具有重要意义。本文使用增量学习和主动学习方法,针对场景文本检测任务设计了一个增量-主动学习框架,并分别在基于回归和基于分割的文本检测方法上验证了该框架的有效性。本文的主要研究工作和贡献如下:1.针对场景文本检测任务,本文提出了增量-主动学习框架,该框架下的增量学习和主动学习可以互相促进。首先,增量学习能扩充训练数据和优化模型,使用更好的模型有助于主动学习挑选出更合适的样本。其次,场景文本检测任务十分复杂,增量学习自动标注的数据往往是简单或标错的样本,导致模型无法通过增量学习学到新知识。主动学习通过引入新数据的方法促进模型更新知识,帮助增量学习突破知识瓶颈。2.基于回归的检测方法输出的检测框置信度只表示分类概率,不包含位置是否准确的信息。为了评价检测框位置的准确程度,本文提出了位置置信度,并在此基础上提出了评价整张图像的指标。根据这个指标,本文将基于回归的检测方法应用在增量-主动学习框架上,通过实验证明了该框架能有效减少标注成本。此外,本文改进了双阶段的文本检测器。该检测器通过双向的特征融合网络提高特征提取能力,以及通过改进损失函数来改善模型的优化目标,因此相比原模型更能精准检测水平场景文本。3.在分割的文本检测方法输出的分割图中,像素值只表示像素点属于文本区域的概率,缺乏像素点的空间位置信息。本文提出的邻域差异度通过对比像素点与其邻域像素点的差异,得到像素点的空间位置信息。根据这个指标,本文将基于分割的文本检测方法应用在增量-主动学习框架上,并证明了该方法能有效减少曲线文本的标注成本。
其他文献
多环芳烃(PAHs)是环境中普遍存在的典型持久性有机污染物,具有毒性和生物累积性,甚至能致癌,严重威胁生态环境,因此研发绿色有效的技术来修复PAHs污染至关重要。微生物降解是一种经济安全的治理技术,且菌群比单菌株更具应用优势,但目前关于菌群对混合PAHs的降解研究相对较少。生物炭在环境修复方面得到了广泛应用,但主要集中在生物炭对污染物的吸附去除作用,而有关生物炭协同特定微生物降解混合PAHs的报道
颗粒增强铝基复合材料(Particle reinforced aluminum matrix composites,简写为PAMCs)是一种轻质结构材料,具有低密度、高比刚度比强度、高导热导电性和尺寸稳定性等优良的综合性能,在交通运输、电子封装和航空航天等方面具有广阔的应用前景。包含多孔预制体制备和铝液浸渗两个步骤的真空压力铝液浸渗法是制备PAMCs的主要方法之一。预制体孔隙特征对铝液浸渗与PAM
由于化石燃料的过度消耗造成了能源危机和一系列环境污染的问题,氢能逐渐受到了人们的重视。在众多产氢的方法中,电催化分解水被认为是最有前途的方法,因为反应产物纯度高且过程无污染。电催化分解水由析氢反应(HER)和产氧反应(OER)组成。相比HER,OER的反应动力学缓慢限制了整个电解水技术的发展。目前,氧化铱(Ir O2)和氧化钌(Ru O2)是常用的商业OER催化剂,但低丰度和高成本使它们无法广泛应
脑机接口(Brain Computer Interface,BCI)是一种建立在大脑和外界环境之间的信息交互通道,人们可以通过它实现没有神经和肌肉参与的“意念”控制。BCI在医疗助残领域中发挥着重要作用,患有肢体残疾或其它功能障碍的病人通过BCI可以与外界进行交流,其生活水平和自理能力得到极大的提高。混合BCI是将一个脑电信号和另外一个(或多个)脑电信号(或非脑电信号)作为控制信号源的BCI,研究
随着传统化石能源储备的日益减少与工业污染,人类一直在寻找可替代的新能源以满足日益骤增的能源需求。锂离子电池作为当代新能源研发中的重要组成部分,近年来针对其正、负极材料、电解液、隔膜的研究数不胜数,使得电池的比容量、功率、充放电性能以及循环稳定性等得到大幅提升。隔膜在锂离子电池内部起到隔离正、负极以及提供离子传输微通道的作用,所以其结构与强度对电池的安全性能起到十分重要的作用。为了弥补商用电池隔膜亲
2-(4-甲氧基苯氧基)丙酸具有显著的甜味改良作用,2000年被我国批准纳入GB2760中,作为一种食品添加剂应用于月饼、糖果、冰淇淋、果酱、馅料等生产过程,在美国、巴西、欧洲多个国家和地区均有使用。本文属于国家自然科学基金项目研究内容,通过对2-(4-甲氧基苯氧基)丙酸进行分子改性,以探究其分子结构与甜味改良的构效关系,寻求更多具有高效甜味改良作用、成本低廉且没有不良异味的甜味改良物质应用于生产
镍钴锰三元层状材料由于能量密度高、成本较低且绿色环保,被认为是动力电池领域极具前景的正极材料之一。但是由于镍钴锰三元层状材料具有热稳定性较差、阳离子混排程度高、表层结构不稳定和过高的表面碱含量等缺点,导致其循环性能差、安全性能不高等诸多问题,严重限制了其在动力电池领域中的商业化应用进程。大量研究表明镍钴锰三元层状材料的诸多问题均起源于材料/电解质界面,或者以某种方式破坏了该界面的稳定性。为了解决上
无人驾驶技术作为智能交通系统中重要的一环,推动着智慧城市的建设,在提高城市服务质量和交通运输效率发挥着重要作用。而无人驾驶清洁车辆作为城市服务类车辆的重要组成部分,研究其路径规划与轨迹跟踪控制技术,对提高车辆日常运行过程中的作业效率、保障行驶安全,具有重要的研究价值和实践意义。本文主要以无人驾驶清洁车辆作为研究对象,重点研究其在结构化的园区环境中进行全覆盖路径规划与轨迹跟踪控制的方法。本文的研究内
多输入多输出(Multiple-Input Multiple-Output,MIMO)阵列将整个阵列分为发射阵列与接收阵列,利用主动探测特有的收发机制,虚拟出了远超真实阵元数目的求和协同阵列(Sum co-array)。相比传统均匀阵列,MIMO阵列虚拟出的求和协同阵列在同等阵元数目的情况下无论是在阵列的连续孔径还是阵列自由度上都有巨大的优势。结合波达方向估计(Direction-of-Arriv
螺纹连接因其结构简单、连接可靠、拆装方便等优点,已经广泛运用于航空航天、轨道交通、机车车辆、建筑、医疗等行业中。在一些安全领域中,一旦出现螺纹连接的松、脱、掉、裂等问题,造成的结果将会是灾难性的。在许多工业应用中,螺纹连接松动造成的设备失效、密封泄漏、环境噪音等问题也一直困扰着人们。螺纹连接在振动、冲击的条件下容易产生连接失效现象,造成松动的振动激励类型有轴向和横向,但主要是横向振动引起的。因此,