虚拟样本生成技术研究与工业建模应用

来源 :北京化工大学 | 被引量 : 7次 | 上传用户:lzc
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
大数据时代,小样本问题仍然存在、不可忽视。伴随信息化技术的发展和应用,石化行业累积了海量数据,然而由于样本数据发生或重复的机率较低、样本数据获取成本过高等原因,可为研究所利用的样本数据较为有限。由于小样本数据集的样本不但数量不充足,而且样本的分布性亦不均匀、不平衡,因而基于小样本的训练学习泛化性能不佳、预测建模精度较低、质量不佳。如何有效地解决小样本的训练学习问题并得到精确而稳健的模型无疑是数据驱动建模中亟待解决的问题。虚拟样本生成技术是小样本问题的有效解决方法,这一方向的研究选题具有重大理论意义和应用价值。小样本数据集的特点是数据量不完整和数据分布不平衡,在其基础之上建立精确而可靠的预测模型主要有两类解决途径:基于灰色模型和机器学习算法直接对小样本数据进行建模以及借助虚拟样本对小样本数据进行建模。在综述总结了文献研究的基础之上,本课题提出了一种基于Monte Carlo方法和粒子群优化算法的新的虚拟样本生成方法,以提高基于小样本数据的模型精度。这种方法在原始小样本数据的基础上,利用Monte Carlo方法和粒子群优化算法生成符合原始小样本分布的虚拟样本,有效地填充样本间的信息间隔,并利用虚拟样本改进极限学习机预测模型的精度。通过两个典型的化工过程数据集(精对苯二甲酸溶剂系统和乙烯生产系统)实例验证了该方法的有效性、实用性和先进性。实验结果表明,极限学习机的建模精度得到显著提升。
其他文献
针对轻洪泛冗余查询消息数多、对稀有资源搜索延迟大的问题,提出一种结合无结构P2P搜索技术和双向Chord环的混合式搜索方法。该方法利用节点的异构性,在k-walker随机走的基础
为解决智能学习系统查询语言的转化问题,提出一种自然语言向SQL代码转化的方法。利用所建立的字典扫描单词和理解语义,采用改进后的单词提取技术扫描自然语言串,以生成语义依
但凡用过Firefox或Chrome浏览器的用户都对多标签页带来的多窗口或多任务的高效管理有着绝对的好感。既然如此,我们为何只让浏览器才拥有这样的功能呢?既然有需求便会有供给,类似于Clover改变资源管理器的工具便诞生了,但是这款工具使用场景太过有限,为了把Windows所有软件都添加标签管理,笔者特地找来了WindowTabs,有了它我们便可随意地将系统中所有的应用切换和拖拽分组,大大提高了操
由于Firefox是一款开源的浏览器,因此网络中有很多第三方编译版本,这些版本相对于官方版本进行了很多的优化。可是这些版本一般都是英文版本,没有中文的操作界面,而国内用户要想使用的话就必须要安装中文语言包才行。那么除此以外有没有什么方法,让这些火狐版本直接显示中文界面呢?  一、释放语言包中的信息  今天我们就以知名的苍月浏览器Pale Moon为例进行介绍。首先下载最新的苍月浏览器版本,以及对应
矿区沉陷水域一般为封闭系统,不与外界流通,不易排除有害物质,受煤尘及周边环境的影响较大,其主要水源携带周边污染物,进而影响工农业生产。高光谱遥感技术具备常规水域监测
在智能手机大普及的时代,聊微信、刷微博、逛淘宝成为了掌上生活的必需品,但身边总有朋友在抱怨流量用得快、流量太贵,运营商的流量价格仍旧居高不下,4G套餐一出炉,绝大部分的人还