【摘 要】
:
主动学习解决了有监督学习训练样本数量巨大的问题,核心是制定样本选择策略问题,达到模型快速收敛的目的。在池样本选择模式下,按照批次选取样本会存在信息冗余问题,从而导致主动学习效率降低。通过对信息冗余问题的研究,该问题主要存在于待标记样本集中和待标记样本集与有标记样本集之间。在带有MLP(Multi-layer Perception)的神经网络条件下,定义了信息冗余度矩阵,并据此给出了DRAL(Dis
论文部分内容阅读
主动学习解决了有监督学习训练样本数量巨大的问题,核心是制定样本选择策略问题,达到模型快速收敛的目的。在池样本选择模式下,按照批次选取样本会存在信息冗余问题,从而导致主动学习效率降低。通过对信息冗余问题的研究,该问题主要存在于待标记样本集中和待标记样本集与有标记样本集之间。在带有MLP(Multi-layer Perception)的神经网络条件下,定义了信息冗余度矩阵,并据此给出了DRAL(Discriminative And Redundancy Active Learning)和LDRAL(Labeled Discriminative And Redundancy Active Learning)优化方法。对于待标记样本集中的信息冗余问题,提出了DRAL优化方法。通过用原方法选择大量的无标记样本构成候选集,选择与其最为相似的样本构成初始待标记样本集,之后每次从候选集中选择与待标记样本集最不相似的样本放入待标记样本集。对于待标记样本集和有标记样本集之间的信息冗余问题,提出了LDRAL优化方法。随着迭代次数增加,有标记样本集样本数量越来越大会导致计算量超出硬件极限。对此,通过定义不确定度阈值选出不确定有标记样本集代替有标记样本集,在候选集中仅选择与不确定有标记集最不相似的样本为待标记样本集。上述两种方法在Mnist、Fashion-mnist和Cifar-10数据集上,用不确定度缩减方法选择样本,在相同准确率下,DRAL优化方法最少可以减少11%有标记样本,LDRAL优化方法最少可以减少8.3%有标记样本,可以有效地优化信息冗余问题。
其他文献
人脸三维重建技术可以通过二维图像来认知并恢复面部的几何结构。与传统图像相比,人脸三维模型具有姿态不变性,不会因环境和观察角度的变化产生差异,可广泛应用于人脸识别、生物医学等领域。然而,传统重建算法受限于采集系统和算法精度,长期面临两个问题的挑战:一是无法重建面部皱纹、毛孔等高频细节特征;二是缺少高光贴图,模型的光线反射效果不理想。针对上述两个问题,本文通过理论分析和实验验证,围绕如何重建面部高频细
2010年5月6-7日,广东省北部、东部及珠三角大部分地区出现暴雨到大暴雨、局部特大暴雨的强降水过程。本文运用NCEP再分析资料、地面加密观测资料、高空观测资料、多普勒雷达观
全球定位系统是新一代精密卫星导航定位系统。其中以GPS为典型,系统具有全球、全天候、连续实时的精密三维导航和定位能力。在定位系统中,观测点定位一直是一个重要研究和应用
汽车悬架系统是汽车的主要组成部分之一,可分为被动悬架系统与主动悬架系统。主动悬架系统因克服了被动悬架系统的不足,是目前汽车采用最多的悬架系统。悬架系统性能的优劣对于驾驶的安全性与舒适度有着重要的影响。采用科学的方法对悬架系统进行控制,可提高汽车行驶的稳定性和舒适性。汽车由于长期行驶会使部分元件失效、老化,或在受到意外的外部干扰情况下,悬架系统的控制器、传感器、作动器通常可能出现故障,如作动器的卡死
近年来,随着三维点云数据处理技术的发展,其中未知环境中自主定位,实现全局拼接有着广阔的发展前景。以往的拼接不能实现在未知环境中自主的进行特征点提取,自主完成点云数据的拼
在这个信息爆炸的时代,自动文本摘要技术为人们提供了一种简便快捷的阅读方式,也使其成为当今研究热点之一。目前的文本摘要方法大多都基于Seq2Seq和Transformer两种深度学习框架,其较传统的方法有很大的改进,但仍存在两点不足:(1)对于Seq2Seq模型,其生成的摘要总是丢失一些能表述原文主要内容的关键信息,同时解码时还倾向于生成相同的词而导致重复;(2)对于Transformer模型,其编
近几十年来,中子星一直是天体物理、粒子物理,以及核物理领域学者们研究的热门课题。目前,观测到的脉冲星已经达到两千多颗,这为中子星的理论研究提供了丰富的观测数据。当前对中
我们发表了由Spitzer空间望远镜红外摄谱仪获取的16个红移约为0.3的光学光谱选后星暴类星体(Post-Starburst Quasars, PSQs)的低分辨率中红外光谱。这些宽线活动星系核(Activ
度量数论是数论研究领域重要的研究分支.常见的数的表示方法有20多种,这些展开的度量性质和维数性质是描述与认识这些展开的数的最佳方法,因为每一种展开所具有的特殊性,其展
据统计,建筑耗能在全球能源消耗总量中所占比例达30%,各国学者正在积极地将各种新型能源应用于建筑领域。其中,氢能源燃料电池在为建筑物供能的同时不产生任何污染物,这为绿色建筑的发展提供了选择。但是,安全高效地储存氢气是氢能源燃料电池在实际使应用时的技术瓶颈。氢化镁(MgH_2)具有体积和质量储氢容量高(110 g/L,7.6 wt%)、成品低廉、可逆性好等优点,是一种非常具有发展前景的储氢材料。然而