【摘 要】
:
在机器学习领域,如何解决标记端的多义性问题一直受到研究人员们的广泛关注。标记分布学习范式通过引入“描述度”这一概念,用于精确地刻画每个标记对一个示例的重要程度,从而有效地解决了这一问题。近些年来,研究人员们在标记分布学习这一方向上取得了一定的进展,但仍存在一些问题亟需解决。一方面,在当今的大数据时代,研究人员们公开了越来越多的大规模标记分布数据集。然而,大部分现有标记分布学习算法在训练阶段或者测试
论文部分内容阅读
在机器学习领域,如何解决标记端的多义性问题一直受到研究人员们的广泛关注。标记分布学习范式通过引入“描述度”这一概念,用于精确地刻画每个标记对一个示例的重要程度,从而有效地解决了这一问题。近些年来,研究人员们在标记分布学习这一方向上取得了一定的进展,但仍存在一些问题亟需解决。一方面,在当今的大数据时代,研究人员们公开了越来越多的大规模标记分布数据集。然而,大部分现有标记分布学习算法在训练阶段或者测试阶段的时间复杂度过高,这使得它们往往不适用于解决大规模标记分布学习问题。另一方面,在构建大规模的标记分布数据集时,相应的人工标注成本会非常高昂。为了解决上述问题,本文首先结合了哈希/二进制编码技术,提出了两种高效的标记分布学习方法。然后,对标记增强技术展开研究,探索了如何从标注代价相对较低的逻辑标记和示例特征中恢复出示例的标记分布,并提出了两种高效的标记增强方法。通过多个常规规模和大规模数据集上的实验,验证了本文方法的有效性和优越性。本文的主要工作和贡献如下:基于哈希技术的标记分布学习研究。本文方法(BC-LDL)首先利用训练示例在标记分布间的相似性关系来指导哈希映射函数的学习,并通过映射函数为示例生成高质量的二进制编码;然后,通过快速的位运算或者向量乘法运算,实现示例间高效的查询并为测试示例预测其标记分布;此外,为了减少测试阶段的时间消耗,本文构建了编码查询表,用于存储相同编码的训练示例标记分布的均值,避免了一些重复检索。基于离散哈希技术的标记分布学习研究。针对BC-LDL存在着量化损失的问题,本文为带有标记分布的示例设计了一种离散哈希方法,并提出了DBC-LDL方法。与BC-LDL不同,DBC-LDL中训练示例的二进制编码是直接学习得到的,并非通过哈希函数映射生成的,因此避免了量化损失。此外,训练示例原始的标记以及在标记分布间的相似性关系被同时用于学习哈希映射函数,提升了测试示例的二进制编码质量。快速的标记增强研究。本文方法(FLE)引入了非负矩阵分解技术,用于灵活地处理标记分布的约束条件(即:描述度为非负实数,候选标记描述度和为1)。并且,本文提出了一种有效的标记重要性挖掘方法,使得FLE可以利用每个类别对于示例的重要性信息为训练示例恢复出准确的标记分布。此外,本文为FLE设计了一种高效的优化策略,同时对其收敛性进行了理论证明。基于双空间映射的标记增强研究。现有标记增强算法通常利用特征空间中的流形结构信息来指导模型学习,它们严重依赖于示例的特征质量。当特征质量不高时,所得的流形结构信息并不可靠。与现有的标记增强算法不同,本文方法(BMLE)首先利用逻辑标记空间中的内在相似性信息来指导标记分布的恢复,它可以通过逻辑标记映射的方式实现。其次,BMLE引入了逻辑标记重构项,使逻辑标记空间中的信息得到进一步保留。最后,本文对逻辑标记映射和重构的稳定性进行了理论分析。
其他文献
陶行知的“三力论”是当今学生核心素养观的中国表达,本文结合小学习作课堂的教学实践,从以下三个方面:研究习作学情,聚焦学生习作核心困难,培养习作自动力;生活中建立联系,创设情境,指向交流,实践中发展生活力;挑战中任务驱动,游戏中体验快乐,展示中享受习作,培养创造力,浅谈“三力论”视角下的小学习作教学支架的应用策略,以供借鉴。
强化学习广泛用于环境未知的序列决策问题,对通用人工智能的实现具有重要意义。在线值函数近似(Online value function approximation,o VFA)包括Q学习、时间差分学习等,是强化学习的重要分支。值函数指从状态(或状态动作对)到累计奖励期望的映射,是制定决策的依据,其中累计奖励也称回报;近似指使用表格、线性函数、神经网络等模型来拟合值函数;在线指根据当前时刻的奖励来预测
目的 分析疑似肺结核患者肺泡灌洗液(BALF)非结核分枝杆菌(NTM)菌种分布及抗结核药物耐药性。方法 选取2020年8月-2022年10月舟山医院收治的疑似肺结核患者140例为研究对象,其中58例诊断为NTM肺病(NTM肺病组),82例诊断为肺结核(肺结核组),总结NTM肺病临床特征、菌种分布及耐药性。结果NTM肺病组既往患支气管扩张比例高于肺结核组(P<0.05);NTM肺病组血中性粒细胞占比
鱼肉含有丰富的营养物质,如水分、蛋白质等,肌肉组织脆弱,极易腐败变质,经常通过冷冻来保存。解冻作为冷冻鱼食用前的必经步骤,对冷冻鱼的最终品质具有重要的影响。传统的解冻方法不仅解冻时间长而且容易使鱼肉汁液流失严重、色泽劣变、蛋白质变性和脂质氧化等。因此,本研究以速冻小黄鱼为研究对象,采用不同频率组合和工作模式的超声波对速冻小黄鱼进行解冻,研究其对小黄鱼品质的影响;从超声波解冻对鱼肉水分迁移规律,肌原
目的:探讨糖尿病肾病维持性血液透析(DN-MHD)患者低血糖恐惧感现状及相关因素。方法:用便利抽样法选取2020年2月-2022年3月在抚州市第一人民医院行MHD治疗的86例DN患者,分析DN-MHD患者低血糖恐惧感现状及相关因素。结果:DN-MHD患者低血糖恐惧感评分为(40.02±6.12)分。单因素分析显示,不同焦虑情绪、过去一个月低血糖发生次数、低血糖严重程度、透析年限DN-MHD患者的低
钢铁产业作为国民经济的重要基础产业和实现工业化的支撑产业,是国家经济水平和综合国力的重要标志。棒材是钢铁最常见的型材,其生产采用单线高速轧制生产。堆钢事故是红钢飞出轧制轨道的严重事故,若没及时发现,很容易损坏设备导致停产,甚至造成人身伤害。当前各个钢铁厂多采用人工观察的方法进行堆钢监控,由于人工观察和后续操作的滞后性,恶性堆钢事故经常发生。堆钢事故快速发现、快速处理成为棒材轧制过程亟待解决的技术难
唐末五代北方人口南迁是我国移民史上三次北方人口南迁浪潮之一,前后经历近200年,对迁出地迁入地的政治、经济、文化都产生了深刻影响,尤其对南方地区经济开发、区域文化塑造影响较大。同时大规模的北方人口南迁也为宋元时期南方经济的快速发展奠定了坚实的基础。
研究背景与目的食管癌是常见的消化道恶性肿瘤,我国约90%的食管癌为食管鳞状细胞癌(ESCC)。由于早期症状隐匿、诊断晚、预后差,食管癌已成为威胁人民生命健康的沉重疾病负担。食管癌分布具有明显的地域差异,且环境因素与食管癌的发生发展密切相关。尽管已有广泛的研究,导致某些地区食管癌持续高发的危险因素尚未阐明。亚硝胺是与食管癌相关的最可能的环境致癌物之一。但是,目前亚硝胺致人食管癌的直接证据尚不充分。本
瓣膜性心脏病作为临床常见病、多发病,是心血管疾病发病率和死亡率升高的重要原因。当前瓣膜性心脏病的主要治疗方式是瓣膜置换术,其手术效果与植入的人工瓣膜密切相关。临床上人工瓣膜的选择主要取决于医生的经验和技术。对人工瓣膜生物力学机制的研究可以为瓣膜选择和手术效果优化提供初步的理论依据。运用计算数学的方法建立瓣膜仿真模型,并进行瓣膜置换虚拟手术是当前瓣膜研究的一个重要手段。本文首次提出基于瓣膜各向异性的
地面监听设备已经被安全部门广泛采用,但地面监听设备监听性能往往受到地面障碍物的影响。可按需部署、可移动的无人机更适合于安全部门的监听行动。相比于地面监听设备,无人机监听设备的机动性更强,视距通信链路带来更好的监听信道质量。为保证监听成功,无人机可以快速移动找到最佳监听位置,并且采用主动干扰来提高监听性能。因此,无人机合法监听系统具有重要的应用前景。本文针对无人机监听和防窃听系统进行功率优化和性能分