论文部分内容阅读
基于数据挖掘的排序决策方法和技术被广泛运用于工程实践与管理中。传统的排序决策方法包括数据包络分析、层次分析法等,在排除主观因素时分析评价指标两两之间相关性上具有明显优势,但它们难以适应处理客观和情感、线上和线下、数量和质量等大规模的互联网决策评价数据。以生态效率评价为例的一类复杂决策系统,因其传统排序决策数据和在线评价数据的结构特征存在较大差异,数据挖掘领域中用于评价预测的方法如基于粗糙集的属性约简模型和支持向量机分类算法在处理这些数据时也面临着新的困难。因此,本文首先提出了生态效率系统数据空间,构建了在线监测数据驱动的多属性排序决策的数学模型,并在系统数据不完备性、舆情数据分析以及多源异构数据融合等方面提出了新的模型算法和决策机制。主要研究内容包括:
(1)针对生态效率系统的数据特征,首先构建时序数据排序决策的新模型。从多源异构性、多属性、多口径与多粒度、不确定性四个方面,分析了生态效率系统新特征。结合粗糙集理论保持分类能力不变的前提下能够进行知识约简的优势,采用改进的粗糙集的属性简约算法方法,提出了基于属性重要度的不完备数据填补算法-优劣解距离法(IDFAAI—TOPSIS)动态评价模型。该排序决策模型及其算法,创新性地解决了数据缺失不完备造成的数据信息遗漏问题,提高了数据处理及评价模型性能。最后,通过某园区生态效率的数值实验验证了所提出方法的有效性。
(2)考虑生态效率系统的互联网数据呈现爆炸式增长,首次提出了面向主题搜索和情感分析的互联网线上数据观点提取的新模型。该模型在传统的统计数据评价模型基础上,利用了支持向量机分类功能,拓展了在小样本条件下降低维度能力的排序决策方法,增强了观点提取模型的预测性能。使用关于园区生态效率影响因素的主题情感分析数值实验,验证了线上数据生态效率评价预测方法的合理性。
(3)提出了基于粗糙集和情感分析的数据融合和决策新模型。首先利用了矩阵因式分解和三角模糊数的相关理论,实现了多异构数据的数据级融合,通过实验仿真和结果对比发现,该方法在数据融合速度和误差控制方面均表现出良好的性能。进而,提出了多源异构数据融合决策的新模式,实现了对数据库的进一步扩容,对来自线上和线下、客观和主观、数量和质量的不同类型的数据进行了归一化表达,对园区生态效率的改善方向提供了支持辅助的作用。通过研究基于三角模糊数的异构数据量化处理方法,基于OWA算子设计了数据融合算法,通过实验仿真实际说明了算法的可行的和有效性。
(4)提出了基于粗糙集属性约简和支持向量机的园区生态效率预测新方法。利用粗糙集知识对园区生态效率原始影响因素进行离散化处理,选取样本值进行训练,运用支持向量机方法模拟预测结果,进而与样本值进行效果对比检验。最后,对园区生态效率的实证研究表明,本文的研究可以显著提升园区生态方面管理预测能力,对园区生态规划顶层设计具有很重要的意义。
(1)针对生态效率系统的数据特征,首先构建时序数据排序决策的新模型。从多源异构性、多属性、多口径与多粒度、不确定性四个方面,分析了生态效率系统新特征。结合粗糙集理论保持分类能力不变的前提下能够进行知识约简的优势,采用改进的粗糙集的属性简约算法方法,提出了基于属性重要度的不完备数据填补算法-优劣解距离法(IDFAAI—TOPSIS)动态评价模型。该排序决策模型及其算法,创新性地解决了数据缺失不完备造成的数据信息遗漏问题,提高了数据处理及评价模型性能。最后,通过某园区生态效率的数值实验验证了所提出方法的有效性。
(2)考虑生态效率系统的互联网数据呈现爆炸式增长,首次提出了面向主题搜索和情感分析的互联网线上数据观点提取的新模型。该模型在传统的统计数据评价模型基础上,利用了支持向量机分类功能,拓展了在小样本条件下降低维度能力的排序决策方法,增强了观点提取模型的预测性能。使用关于园区生态效率影响因素的主题情感分析数值实验,验证了线上数据生态效率评价预测方法的合理性。
(3)提出了基于粗糙集和情感分析的数据融合和决策新模型。首先利用了矩阵因式分解和三角模糊数的相关理论,实现了多异构数据的数据级融合,通过实验仿真和结果对比发现,该方法在数据融合速度和误差控制方面均表现出良好的性能。进而,提出了多源异构数据融合决策的新模式,实现了对数据库的进一步扩容,对来自线上和线下、客观和主观、数量和质量的不同类型的数据进行了归一化表达,对园区生态效率的改善方向提供了支持辅助的作用。通过研究基于三角模糊数的异构数据量化处理方法,基于OWA算子设计了数据融合算法,通过实验仿真实际说明了算法的可行的和有效性。
(4)提出了基于粗糙集属性约简和支持向量机的园区生态效率预测新方法。利用粗糙集知识对园区生态效率原始影响因素进行离散化处理,选取样本值进行训练,运用支持向量机方法模拟预测结果,进而与样本值进行效果对比检验。最后,对园区生态效率的实证研究表明,本文的研究可以显著提升园区生态方面管理预测能力,对园区生态规划顶层设计具有很重要的意义。