论文部分内容阅读
地理信息系统(GIS)目前是空间数据管理和分析的主要方式,但它缺乏对空间数据中各种隐含的空间模式、空间关系和空间分布规律的自动发掘能力。空间数据挖掘将一般数据挖掘技术应用到空间数据中,结合GIS强大的空间分析和操作能力,实现在大量的非结构化的空间数据中发掘出隐含的、潜在有用的空间特征和空间模式,从而为科学研究、空间决策服务。水资源管理与规划涉及的空间数据和属性数据具有来源广泛、类型多样、数据量大、变化快等特点,传统的GIS已经不能满足解决复杂的水资源问题。利用空间数据挖掘技术可以有效的管理、分析这些数据,并从中挖掘出有用的知识和规律,为水资源评价、规划与决策管理提供重要依据。本论文以第二松花江为研究对象,建立基于SQL Server的空间数据仓库,并在此基础上运用GIS、统计数据挖掘方法、可视化数据发掘、BP神经网络等手段进行数据预处理、水质评价预测模型的构建以及水质状况空间分布规律的分析。其中,主要评价预测模型的构建采用改进后的BP神经网络。输入层选择13个水质参评指标;输出层节点数为6个,表示分类级别,并采用“0,1”识别模式;通过不断试验比较,以优化网络结构为目标,最终选定13-9-5-6的双隐含层结构。经过精度分析,该模型达到水质评价要求,具有较好的预测与实用价值。本文共分六章:第一章,主要阐述了空间数据挖掘与水资源评价方法的研究现状、提出了本文的研究目标、意义及其工作路线等。第二章,介绍了研究区第二松花江的自然环境与社会经济状况,以及水资源开发利用现状等。第三章,数据准备,主要包括数据预处理(数据集成、数据清洗、数据转换、数据加载)、数据仓库的构建以及水资源评价知识的建立。第四章,构建改进的BP神经网络水质评价预测模型,并进行精度分析。第五章,基于可视化数据挖掘的结果分析,主要包括二松水质状况的空间分布规律以及影响因子分析。第六章,结论部分,对全文进行概括总结,并提出了模型存在的不足以及对下一步工作的展望。