基于t-SNE的虚拟样本生成技术研究及建模应用

来源 :北京化工大学 | 被引量 : 0次 | 上传用户:Fishfag
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
在流程工业中,需要建立基于数据驱动的软测量模型来获取一些难以直接测量的关键变量。数据的数量和质量对构造精准的数据驱动的软测量模型起着重要作用。不幸的,在流程工业中数据会面临样本不足或数据波动小的问题。有限的样本中很难获得足够的信息,会产生小样本问题,导致软测量模型的精度低。针对小样本问题,本文提出了一种新的基于T分布随机邻域嵌入(t-SNE)特征的虚拟样本生成方法。首先,使用T分布随机邻域嵌入(t-SNE)获得输入数据的特征。接着使用近邻点插值算法生成虚拟的t-SNE输入特征,然后构建t-SNE特征和原始数据之间的模型以及输入输出之间的模型以获得虚拟样本的输入输出值。最后使用随机森林建立软测量模型验证虚拟样本的建模效果。解决了小样本问题之后,为了进一步提高软测量模型的精度,解决函数链接神经网络(FLNN)模型性能不足的缺点,本文提出了一种新的补偿型的FLNN模型。首先构造输出值的原始FLNN模型并计算残差,利用残差信息构建输入数据与残差之间的残差FLNN模型。将残差FLNN模型的输出结果补偿到原始FLNN模型,提升原始FLNN模型的建模精度。本文使用标准数据的小样本数据集和精对苯二甲酸(PTA)生产过程的小样本数据集验证所提出的基于t-SNE的虚拟样本生成方法的有效性。仿真结果表明,本文提出的基于t-SNE的虚拟样本生成方法有效地解决了小样本问题。本文使用数据扩充后的PTA数据集和乙烯生产的工业数据集以验证提出的补偿型的FLNN算法的有效性。仿真结果表明,解决小样本问题之后,本文提出的补偿型的FLNN算法能够更进一步地提高模型的精度。
其他文献
给水管网是一个城市中不可缺少的基础设施,是城市居民生活和工业生产的生命线工程。随着人口的逐年增长以及城市的扩张,城市用水需求持续增加,城市现存的老旧给水管网不能满足城市用水需求,使得城市给水管网改扩建工程十分必要。科学合理的给水管网设计方案不仅能够节省管网建设成本和运行维修费用,还可以增加供水系统的可靠性。本文通过研究给水管网的优化设计,设计了给水管网优化模型,提出了一种改进麻雀搜索算法,对给水管
学位
流程工业的规模发展越来越大,有效建立过程模型对于生产过程优化控制有重要意义。当前基于数据驱动的智能建模成为了控制科学与工程领域的研究热点。神经网络技术是典型的数据驱动技术,已经广泛应用于过程建模。其中,回声状态网络(Echo State Network,ESN)作为典型的递归神经网络,训练速度快,泛化能力强,能够有效处理动态时序数据,因此研究新型可靠的ESN用于复杂工业过程建模具有重要的理论意义和
学位
本文全面分析的了无人机集群编队的控制策略,对无人机集群编队系统的运动学模型进行了数学建模,同时对无人机集群的协同控制器进行深入的研究,针对传统无人机编队控制策略存在过于依赖领航者以及通信延迟的问题,进一步完善了无人机编队建模的方法;同时针对滑模控制器的指数趋近律进行优化,并优化改进控制算法,采用理论分析结合仿真、实际飞行实验的数据来加以验证。主要研究内容如下:首先,本文基于弹性系统模型,在不考虑环
学位
建筑施工安全生产过程中积累了大量安全检查纪要、专项安全检查报告和安全事故报告等相关数据,这些数据中隐含着安全隐患和安全事故的重要信息。利用深度学习模型对安全检查纪要文本中的数据进行提取并对进行文本挖掘,可以挖掘出安全隐患的空间分布规律、时间分布规律和强关联规则等信息,这些信息对建筑施工安全管理具有重要的意义。但是用深度学习模型对安全检查纪要进行文本挖掘时,面临着数据集规模小、样本数据分布不均衡、安
学位
近几年过程工业发展愈发快速且多变,如何有效地对生产过程进行故障诊断受到广泛关注。值得注意的是,实际工业运行过程中往往存在多种类型的故障,并且正常样本和故障样本之间具有极度的类别不平衡性,所以开展面向类别不平衡数据的多故障诊断方法研究具有一定的现实意义和应用价值。本文着重开展面向类别不平衡数据的多故障诊断方法研究。主要研究内容包含以下几个部分:(1)针对实际复杂工业过程数据的类别不平衡性问题,提出了
学位
微机电系统(Micro Electro Mechanical System,MEMS),指尺寸可以达到毫米及以下的高集成化科技装置,在此技术基础上产生的MEMS加速度传感器由于功耗低、体积小、价格低廉等优点,广泛应用于麦克风、姿态控制、振动检测等方面。由于MEMS加速度计在日常生活中的广泛应用,在保持其精度的同时,如何降低功耗,是当下研究的热点。MEMS加速度计检测电路是MEMS传感器的核心模块之
学位
塔式起重机相对于其他起重机占地面积小,工作半径大,广泛应用工厂码头等地,是一种重要的物料搬运工具。变绳长塔式起重机系统是一类典型的强耦合、非线性、欠驱动系统,而且在工作过程中受到负载、摩擦、环境变化的影响,难以获得其精确全面的数学模型。这给塔式起重机的控制设计带来巨大挑战。本课题针对这类具有未知动力学的欠驱动系统控制问题进行深入研究,探索了塔式起重机位移目标跟踪和缆绳摆角抑制相关的问题,进行了以下
学位
伴随着我国高速铁路建设的不断发展,如何有效利用高铁这种全新的可重复、宽频带分立谱的人工震源,实现高铁高架桥附近地表结构和物性高精度的探测,具有十分重要的意义。高铁列车行驶激发的高铁地震波存在着明显的尺度效应,即响应与介质微结构特征有关。高铁地震波必能借此感知微结构尺度的变化。因此,运用反演算法从高铁地震记录中,构建微结构尺度参数模型的思路是可行的。本文基于研究组前期结合理论与实际实验数据的研究成果
学位
印刷电路板(printed circuit board,PCB)易受到静电放电的危害,继而影响电子产品的正常使用。为了获得PCB的静电放电能量耦合规律,对简化的PCB进行静电放电测试。通过对PCB轨线上的耦合电压的测量,研究了放电位置、轨线特性及放电电压对静电放电电磁场耦合的影响。测试结果表明,放电位置、轨线宽度、长度和端接电阻会影响耦合电压的大小和变化趋势,放电电压和耦合电压呈现良好的线性关系。
期刊
在生物学和医学领域,对细胞的检测是一项非常重要的内容,细胞通过显微镜来观察和记录,并通过计算机将图像进行存储。如何将细胞从图像中准确的分割识别出来和开发自动追踪细胞算法是细胞生物学研究的一大难题。对于悬浮细胞,细胞外形区别较小,空间分布分散,成像过程中夹杂噪声和细胞移动,这些都是悬浮细胞识别和追踪过程中的难题。本文围绕如何对悬浮细胞进行准确的识别和追踪做了如下工作:(1)本文先通过预处理操作对图像
学位