论文部分内容阅读
我国森林资源管理尤其是森林资源调查和监测工作起步较早,具有丰富的森林资源监测数据,积累了大量的管理信息和管理资料。随之而来的是森林资源信息管理系统的建立,大量信息被储存并提供查询,激增的数据背后隐藏着许多重要的信息,简单的查询和统计已经无法满足林业的需求,需要出现一种挖掘数据背后隐藏的知识的手段。数据挖掘是从大量的、不完全的、有噪声的、模糊的、随机的数据中,提取隐含在其中的、人们事先不知道的但又是潜在的有用信息和知识的过程。数据挖掘是一个新兴的边缘学科,它汇集了来自机器学习、模式识别、数据库、数据仓库、统计学、人工智能以及管理信息系统等各学科的成果。聚类分析是数据挖掘中的一个重要研究领域,是一种数据划分或分组处理的重要手段和方法。早期的聚类算法是计算模型中各点的距离,需要多遍扫描数据,才能识别分组。可伸缩期望最大化算法(Scalable Expectation Maximization,简称SEM算法)与之不同,它根据群体的密度来创建聚类,最多只需扫描一次源数据,并且在计算过程的任何一点都可以提供合理的结果。它最大的好处是只需有限量的内存。在算法处理记录时,它会创建一些聚类,并随着处理数据的增多调整这些聚类的中心,从而找到一组最能描述相似事例的特征。整个过程执行的速度快,而且不会耗费所有可用的内存,避免机器瘫痪。时间序列也是数据挖掘中的一个重要研究领域,是指同一种现象在不同时间上的相继观察值排列而成的一组数字序列。时间序列预测方法则是通过时间序列的历史数据揭示现象随时间变化的规律,将这种规律延伸到未来,从而对该现象的未来做出预测。传统的时间序列分析方法在林业中的应用,主要是确定性的时间序列分析方法,包括指数平滑法、移动平均法、时间序列的分解等等。Box和Jenkins提出了以随机理论为基础的时间序列分析方法,使时间序列分析理论上升到了一个新的高度,预测的精度大大提高。时间序列分析的基本模型有:ARMA模型和ARIMA模型。林分生长模型是一种间接谷?椒āK荻圆煌髦衷诓煌せ肪程跫碌牟煌⒂锥蔚纳で榭龅鞑?用一定的数学方法处理,以图、表、公式或计算机程序等形式间接预估林分的生长与收获。林分生长模型用来预测林分自然状态下的生长,也用来预测经营措施对林木生长影响,为制定优化经营方案以及定向培育奠定基础。它的应用为森林经营基础理论的新发展以及现代森林经营技术的利用提供必要条件和基本手段。传统方法将生长模型划分为全林分模型、径阶分布模型和单木模型,这些模型又大多是基于单形曲线的,其易造成研究区内不同林分生长速率是相同的,且传统方法建模,常常只注重因变量和其它各因子的表面关系,因此易出现因子间的“相互预报”,方程组间的“循环估计”等问题,精度不是很高。一个好的生长模型应尽可能少的基于假设,不应有过多的自变量,在模型中应只包含一个因变量(预测值),一个自变量(年龄),以避免出现因子间相互预测的问题。所以本文采用多形曲线法构建多形生长模型。在多形曲线法构建生长模型过程中,样本的分类很重要。由于林分所处地理位置不同,随着年龄增长林分生长趋势发生很大变化,因此本文利用了SEM聚类对地理因子分类,并用时间序列算法构建树高生长导向曲线。实验证明利用地理因子分类比直接用树高和年龄因子分类构建树高生长导向曲线实用性更好,且多形导向曲线法的构建立有助于林分生长模型走向更精细,更准确。林分多形生长模型可以解决林分生长模型形式多样的问题,用一个模型描述同一生物不同生境下的生长曲线。多形林分生长模型构建中只选择年龄单因子做自变量,按照每个林分立地质量不同,每个林分都有一条生长曲线。研究表明多形生长模型能够更精确描述样本数据能有效减小系统误差。从研究结果可以设想用一个多形生长模型来拟合一个省甚至更大范围的某一树种的生长,此生长模型可用于这一树种的生长预估及计算机仿真。随着Internet技术的快速发展,面向Web的信息系统表现出巨大优势。目前很多林业部门和企业正在建立或积极筹备集成多功能、面向Internet的森林资源信息管理系统。森林资源信息管理系统是我国林业信息化建设的基础部分,基于struts2、spring、hibernate开发的信息系统具有开发维护简单、可扩展性强(基于JAVA语言,可扩展到无线应用,方便林业调查记录)、部署方便的特点,可避免盲目开发,降低开发维护成本,具有一定的研究价值。本文的创新点主要表现在:将数据挖掘的方法引入林业应用,从而为林业的经营决策提供一条新的思路;建立多形林分生长模型时,只含一个因变量和一个自变量,从而避免因子间相互预测的问题;在聚类时,使用SEM算法,执行速度更快,效果更优;聚类完成后,采用的是时间序列分析拟合模型,而不是生长曲线,除了预测结果更好,还可以对未来进行预测;基于struts2、spring、hibernate开发的信息系统具有开发维护简单、可扩展性强、部署方便的特点,为林业调查的建档和续档提供方便。