记忆减退型在线序列极限学习机

来源 :大连大学 | 被引量 : 0次 | 上传用户:zydolphin
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着人们对互联网的需求日益增强,许多行业的数据更新速度越来越快。随着时间推移而不断更新的数据称为流式数据。基于流式数据建立模型时,要求预测模型能够随着流式数据更新而进行相应的更新。在线学习算法可以按照时间先后次序应用流式数据对预测模型进行实时的更新。在线序列极限学习机算法(Online Sequential ELM,OS-ELM)是基于极限学习概念的在线学习算法。流式数据更新之后,OS-ELM可以利用最新数据快速地更新预测模型。流式数据在更新过程中,同时还具有两个特性。一是时效性。所谓时效性是指在线学习中数据随着时间的推移而逐渐失效。二是差异性。所谓差异性是指有效数据因新旧程度对预测模型的贡献不同。通常来说,新数据比旧数据对模型的贡献要大。OS-ELM算法无法解决流式数据的时效性和差异性。为此,本文对基于OS-ELM算法提出了记忆减退型在线序列极限学习机算法(Memory Degradation based OS-ELM,MDOS-ELM)。本文的主要工作如下:(1)针对流式数据的时效性,本文借鉴带遗忘机制OS-ELM(OS-ELM with Forgetting Mechanism,FOS-ELM)算法所提的有效时段的概念。有效时段是指数据样本从被采集或测量到最终失效这一段时间。当数据样本在超过其有效时段,则这些数据就会变为失效数据。失效数据的使用往往会降低模型的预测精度。为此,MDOS-ELM算法采用遗忘机制及时淘汰失效数据。(2)针对流式数据的差异性,本文引入记忆因子自动调整新旧数据的比重。在流式数据更新过程中,新数据比旧数据更能反映当前数据的特点和变化趋势。因此,新旧数据的信息在模型中所占比重不同。也可以这样理解,随着时间的累积MDOS-ELM对新旧数据的记忆能力不同。越靠近当前时刻的数据“记忆越深”;越远离当前时刻的数据“记忆越浅”。记忆因子是由新旧数据的相似度以及上一代所获模型对当新数据的预测误差共同决定的。MDOS-ELM算法来解决在线学习的两个问题:一是数据的时效性,二是有效数据样本之间的差异性。同时为了验证所本文提出的MDOS-ELM算法的性能,采用9组回归数据集和14组分类数据集进行实验。并与OS-ELM算法和FOS-ELM算法进行对比,实验结果表明本文所提的MDOS-ELM算法具有更高的预测精度。
其他文献
羟基磷灰石(HAp)作为脊椎动物骨骼和牙齿中无机成分的主要组成物质,具备良好的生物活性和生物相容性,在材料科学以及生物工程领域引起了研究者们的广泛关注。而通过调控HAp晶粒
目的:通过分析本院宫颈癌及宫颈鳞状上皮内病变患者的高危亚型HPV感染情况,了解本地区宫颈癌及宫颈鳞状上皮内病变与高危亚型HPV感染的关系,为本地区HPV感染的预防、治疗提供一定的参考依据。方法:回顾性纳入2018年01月-2019年06月于川北医学院附属医院妇科就诊,经病理科确诊为宫颈癌或SIL,同时在检验科进行HPV分型检测的患者;HPV检测采用高危HPV分型核酸测定试剂盒进行;针对HPV感染情
本文是译者根据英译汉翻译实践项目《民主生态社会主义:应对气候危机的南非及全球方案》第七章和第八章所撰写的翻译实践报告。原书由14位南非的政治学、经济学、社会学和环境科学等领域的专家学者合著,深入分析了造成全球气候危机的原因并提供了一些解决方案,具有较高的实用价值。目前该书在国内尚无中文译本,翻译本书或许对生态相关领域的政策制定者具有一定的启发意义。在翻译学领域,目的论对应用翻译的指导意义一直受到国
水文干旱作为极端水文事件之一,是地下水与地表水异常偏少的现象,是气象干旱的延续与发展,其演变特征不仅与气候变化有关,而且与社会系统的物理机制联系密切。研究水文干旱对
3D 打印皮肤组织表皮层的种子细胞常用人角质形成细胞系和分离自皮肤组织的角质形成细胞。人角质形成细胞系为转化细胞,其性状和基因表达与正常的角质形成细胞有差异;分离自皮肤组织的角质形成细胞则扩增次数有限。表皮干细胞(Epidermal stem cells,EpSCs)能不断增殖,并分化成表皮层各种细胞,是3D打印组织工程理想的种子细胞,具有很好的应用前景。目前以EpSCs为种子细胞打印皮肤组织的报
在科技迅速发展的今天,国家日益注重创新人才的培养,任何人可以在任何地方进行发明创造,同时,学校也越来越重视学生创造力的培养。创客教育作为创客精神与教育相遇的产物,也应运而生,其项目式学习、创新教育的思想,符合中小学生的发展特点,使学生有机会进行动手操作与创造发明,因此,有众多的中小学以校本课程或社团活动的形式在学校开展了创客教育,旨在培养学生的创新思维、创新能力与动手操作能力,创客教材作为知识的载
我国已进入道路养护时代,大量服役道路面临着巨大的养护压力,微表处具有开放交通快、经济效益好、低能耗、绿色环保等诸多优势,被国内外广泛用于路面养护。但经传统微表处养护后的路面仍会面临诸多与温度有关的病害,如低温开裂,冬季路面积雪、低温结冰,影响行车安全和使用性能。为改善经微表处养护后路面的性能,减小或消除与低温有关的病害,本文提出将相变材料掺入微表处混合料,利用相变材料随温度变化而改变物质相态释放或
聚类算法作为数据挖掘算法中常用的一类方法正受到越来越多的关注。其中基于密度峰值查找的快速聚类算法CFSFDP(Clustering by fast search and find of density peaks)算法是
在信息时代,大量信息在互联网上传播。对于那些感兴趣的有价值的信息,人们除了浏览外,还更希望能够收集并存储起来。针对这样的需求,Web信息提取这一研究领域应运而生。Web信
大数据时代,Big Data往往并不意味着Big Knowledge。例如当突发事件发生时,相关的事件新闻报道数目呈指数式增加,如何从海量新闻大数据流中高效动态追踪特定突发事件的发展态