基于PAC-Bayes的元学习算法研究

来源 :电子科技大学 | 被引量 : 0次 | 上传用户:cc_7722
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
机器学习算法作为一类针对于大数据场景的解决方案,已经被广泛应用于图像识别,自然语言处理,推荐系统等实际问题中。但大多数机器学习算法所表现出的高性能,需要依靠海量数据的支撑。同时模型训练也是一个费时费力的过程,要求使用者能够提供足够的计算资源,这也限制了机器学习算法的应用范围。现在只有在掌握足够计算和数据资源的组织和机构里,这些算法才可能会发挥出它们应有的效果。除此之外,参数调整与模型选择也会引入大量的人力和物力成本,而它们又是确保机器学习算法有效不可避免的操作。这些实际问题一直是机器学习研究者们最关注的领域之一。元学习,也被称为“学习如何去学习”,旨在设计一类模型,使得在只有少量训练样本的条件下,可以快速地学习新的技能或者适应新的环境。而在人工智能系统中,元学习可以被简单定义为获取知识的多功能性。人类作为最聪明的生物之一,能够以很少的信息快速完成各种各样的任务。例如,人类可以只通过看过几幅新物体的图片就可以识别它。亦或是可以快速完成更复杂任务,像是人类可以再学会骑自行车的情况下学会驾驶摩托车。虽然人工智能系统可以代替人类完成一些简单的任务,甚至表现超过人类,但它们在多任务处理方面仍然表现很差。因此,实现真正的“智能”需要人工智能系统“学会如何学习”,这也就是元学习算法考虑的问题。本文提出了一个新的元学习算法,它是一种不依赖模型的元学习算法,并与任何使用梯度下降训练的模型兼容,适用于多种不同的机器学习问题,包括分类、回归和强化学习等。该算法基于PAC-Bayes框架,但在设置方面区别于类似的工作。现有的大多数研究考虑从各个任务的与数据相关后验提取公有信息,并整合于同一个数据无关先验分布,然后使用该先验信息加速新任务的学习过程。该框架要求各个任务具有很强的相似性,才能保证学到的先验可以实现加速新任务的目的。但由于数据分布在大多数情况下是未知的,也就是说这个假设在大多数情况下是很难保证的。为了增加该假设的灵活性,本文提出了一个新的元学习泛化误差PAC-Bayes界,该结论允许引入与数据相关的先验分布。除此之外,将后验概率设置为Gibbs分布,同时借助优化算法Entropy-SGD,并通过简化最小化误差界的方式解决元学习问题。本文通过在真实数据集以及模拟数据上做实验,证明该算法可以在元学习任务中展现出优于传统竞争对手的效果。
其他文献
克劳斯·马森[Klaus Massem]是一个叙述者,他的作品是人的故事,也是生活故事。他不是以仔细的综观来描述各种生活情况,而且用人生中的恒量,例如妊娠、诞生与死亡。此外,
重庆松藻煤电公司金鸡岩洗选厂是使用胶带运输机的大户,全厂共有胶带运输机40多台,主要用于煤炭和煤矸石等物料的运输。在实际的使用过程中,运输物料在滚筒上的出现粘结的现
商务英语函电是一门实践操作性很强的课程,而“商务模拟公司”教学模式是人为创造的经济活动仿真模拟环境,实现感性知识和理性知识的双向转化,使课堂教学和实践活动有机结合。因
基于1960-2012年徐州市逐日降水数据,采用超门限峰值方法来提取极端降水事件。在泊松回归方法基础上,分析徐州市极端降水的特征及变化趋势。结论指出:徐州市年最大日降水量呈现
背景:骨不连是创伤骨科中困扰临床的并发症之一,目前自体骨移植等临床主要治疗方法的治愈率难以令人满意,严重影响患者的生活质量。近年来随着组织工程技术研究的深入,干细胞
目的 探究小儿支气管哮喘患儿应用整体护理干预的临床效果.方法 使用2015年2月-2016年6月在我院进行诊治的70位小儿支气管哮喘患儿,分为实验组以及对照组.对照组用一般的护理