弱领域知识下的反绎学习方法研究与应用

来源 :南京大学 | 被引量 : 0次 | 上传用户:bestdzik
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
引入领域知识以辅助机器学习已逐渐成为人工智能领域重要的研究方向之一,反绎学习是一种将机器学习与逻辑推理互促结合的新型机器学习框架,直接利用由一阶逻辑表示的领域知识帮助学习训练。在实际应用中往往难以获取一阶逻辑形式表示的领域知识,本文针对仅包括具体事实或领域知识不充分等弱领域知识的情况开展反绎学习的研究,主要取得了如下创新成果:研制了基于启发式规则扩张领域知识库的反绎学习方法GABL,该方法依靠增广的启发式规则、根据模型预测结果对知识库进行检索,并在检索过程中考虑模型给出的置信度信息,从而实现反绎推理。分析了反绎学习的性质,并发现反绎学习训练效果与初始模型之间的关系。实验表明GABL方法能利用由具体事实表示的弱领域知识和无标记数据提升模型性能。研制了利用原始特征辅助过滤具体事实的反绎学习方法RAABL,该方法利用专家给出的人工规则,构建了基于原始特征过滤器,动态地删除反绎推理时不必要的候选。所提方法应用于刑期预测任务,有效降低了构建具有可解释性的模型所需要的标记数据规模。实验表明RAABL方法可以借助人工规则提升反绎学习训练模型的效果。
其他文献
寨上-马坞矿集区位于西秦岭多金属成矿带,有寨上金矿、马坞金矿、锁龙金矿、新庄里金矿、雪花山钨矿、半沟铅锌矿等矿床产出。前人对寨上-马坞矿集区的地质特征,成矿规律,成矿模式,物化探特征,矿床成因等方面开展了大量深入研究,然而,传统找矿预测方法进展有所减缓,急需一种新方法为该地区找矿预测工作带来新进展以及新思路。人工智能以及NLP(Natural Language Processing)技术在该区域的
学位
学位
学位
中国近代工业建筑是“现代建筑技术的先导”,作为近代时期萌生的“新建筑类型”,不论是建筑历史、结构还是风格都颇具研究意义。刘先觉教授认为“中国近代建筑史应该反映中国新兴工业建筑从无到有发展的历史”,提倡给近代工业建筑一定的地位。自其产生以来,近代工业建筑相关的研究记录众多,但是一直没有关于此类研究的梳理。中国近代工业建筑的研究大致经历了三代建筑学研究者不同程度地推动:第一代研究者中,以梁思成和徐敬直
有机发光二极管(Organic Light-Emitting Diode,OLED)由于其轻薄、宽视角、响应快、亮度高以及可弯曲的优势为照明和显示技术提供了一种新型高效且可持续的方法,并且正在取代市场上的部分技术,例如液晶显示(Liquid Crystal Display,LCD)。OLED有着广泛的商业、医疗以及工业应用。除此之外,OLED在未来可穿戴设备应用中也具有极大的潜力。目前,许多研究都
在土壤的形成过程中,我们通常假设一个自上而下的发育模式,即土壤是由其下基岩风化而形成的。这个模式并没有考虑到风尘对土壤的贡献,而该贡献却是不可忽视的。延伸达上千公里的中国黄土沉积区域反映了风尘对土壤形成的巨大贡献,但在更多非典型风尘沉积带的土壤,风尘贡献研究却严重不足。由于风尘的矿物和化学组成上与上部大陆地壳平均成分有较高的相似性,这让我们对一般土壤中的风尘识别变得困难。玄武岩与风尘在矿物与化学组
小样本学习是机器学习的一个重要研究方向,聚焦于解决实际应用场景中常见的样本数量短缺的问题。近年来,飞速发展的神经网络为小样本学习各任务的研究带来了新的思路:在计算机视觉领域,目前小样本学习的研究主要聚集在解决小样本图像分类问题上。在这个问题上,学者们依照不同的思路对问题提出了各式各样的解决方案,包括基于扩充数据的、基于模型结构设计的、基于不同形式的推理过程的方法。但是,这些方法大多需要对单个图像以
在互联网技术高速发展的时代背景下,人们在享受获取丰富资源的便捷性的同时,也面临着信息过载的问题。推荐系统的诞生为人们从海量数据中筛选出感兴趣的信息提供了新的可能性,因此,近年来推荐系统在电子商务、在线广告系统、社交媒体等领域的实际应用中扮演着越来越重要的角色。在实践中,完整的推荐系统通常包括候选集生成阶段和排序阶段,本文主要关注排序阶段的算法研究工作。推荐排序算法的关键在于如何有效利用丰富的特征及