基于聚类和时序分析的林分生长模型

来源 :福建农林大学 | 被引量 : 11次 | 上传用户:refreshingmind
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
我国森林资源管理尤其是森林资源调查和监测工作起步较早,具有丰富的森林资源监测数据,积累了大量的管理信息和管理资料。随之而来的是森林资源信息管理系统的建立,大量信息被储存并提供查询,激增的数据背后隐藏着许多重要的信息,简单的查询和统计已经无法满足林业的需求,需要出现一种挖掘数据背后隐藏的知识的手段。数据挖掘是从大量的、不完全的、有噪声的、模糊的、随机的数据中,提取隐含在其中的、人们事先不知道的但又是潜在的有用信息和知识的过程。数据挖掘是一个新兴的边缘学科,它汇集了来自机器学习、模式识别、数据库、数据仓库、统计学、人工智能以及管理信息系统等各学科的成果。聚类分析是数据挖掘中的一个重要研究领域,是一种数据划分或分组处理的重要手段和方法。早期的聚类算法是计算模型中各点的距离,需要多遍扫描数据,才能识别分组。可伸缩期望最大化算法(Scalable Expectation Maximization,简称SEM算法)与之不同,它根据群体的密度来创建聚类,最多只需扫描一次源数据,并且在计算过程的任何一点都可以提供合理的结果。它最大的好处是只需有限量的内存。在算法处理记录时,它会创建一些聚类,并随着处理数据的增多调整这些聚类的中心,从而找到一组最能描述相似事例的特征。整个过程执行的速度快,而且不会耗费所有可用的内存,避免机器瘫痪。时间序列也是数据挖掘中的一个重要研究领域,是指同一种现象在不同时间上的相继观察值排列而成的一组数字序列。时间序列预测方法则是通过时间序列的历史数据揭示现象随时间变化的规律,将这种规律延伸到未来,从而对该现象的未来做出预测。传统的时间序列分析方法在林业中的应用,主要是确定性的时间序列分析方法,包括指数平滑法、移动平均法、时间序列的分解等等。Box和Jenkins提出了以随机理论为基础的时间序列分析方法,使时间序列分析理论上升到了一个新的高度,预测的精度大大提高。时间序列分析的基本模型有:ARMA模型和ARIMA模型。林分生长模型是一种间接谷?椒āK荻圆煌髦衷诓煌せ肪程跫碌牟煌⒂锥蔚纳で榭龅鞑?用一定的数学方法处理,以图、表、公式或计算机程序等形式间接预估林分的生长与收获。林分生长模型用来预测林分自然状态下的生长,也用来预测经营措施对林木生长影响,为制定优化经营方案以及定向培育奠定基础。它的应用为森林经营基础理论的新发展以及现代森林经营技术的利用提供必要条件和基本手段。传统方法将生长模型划分为全林分模型、径阶分布模型和单木模型,这些模型又大多是基于单形曲线的,其易造成研究区内不同林分生长速率是相同的,且传统方法建模,常常只注重因变量和其它各因子的表面关系,因此易出现因子间的“相互预报”,方程组间的“循环估计”等问题,精度不是很高。一个好的生长模型应尽可能少的基于假设,不应有过多的自变量,在模型中应只包含一个因变量(预测值),一个自变量(年龄),以避免出现因子间相互预测的问题。所以本文采用多形曲线法构建多形生长模型。在多形曲线法构建生长模型过程中,样本的分类很重要。由于林分所处地理位置不同,随着年龄增长林分生长趋势发生很大变化,因此本文利用了SEM聚类对地理因子分类,并用时间序列算法构建树高生长导向曲线。实验证明利用地理因子分类比直接用树高和年龄因子分类构建树高生长导向曲线实用性更好,且多形导向曲线法的构建立有助于林分生长模型走向更精细,更准确。林分多形生长模型可以解决林分生长模型形式多样的问题,用一个模型描述同一生物不同生境下的生长曲线。多形林分生长模型构建中只选择年龄单因子做自变量,按照每个林分立地质量不同,每个林分都有一条生长曲线。研究表明多形生长模型能够更精确描述样本数据能有效减小系统误差。从研究结果可以设想用一个多形生长模型来拟合一个省甚至更大范围的某一树种的生长,此生长模型可用于这一树种的生长预估及计算机仿真。随着Internet技术的快速发展,面向Web的信息系统表现出巨大优势。目前很多林业部门和企业正在建立或积极筹备集成多功能、面向Internet的森林资源信息管理系统。森林资源信息管理系统是我国林业信息化建设的基础部分,基于struts2、spring、hibernate开发的信息系统具有开发维护简单、可扩展性强(基于JAVA语言,可扩展到无线应用,方便林业调查记录)、部署方便的特点,可避免盲目开发,降低开发维护成本,具有一定的研究价值。本文的创新点主要表现在:将数据挖掘的方法引入林业应用,从而为林业的经营决策提供一条新的思路;建立多形林分生长模型时,只含一个因变量和一个自变量,从而避免因子间相互预测的问题;在聚类时,使用SEM算法,执行速度更快,效果更优;聚类完成后,采用的是时间序列分析拟合模型,而不是生长曲线,除了预测结果更好,还可以对未来进行预测;基于struts2、spring、hibernate开发的信息系统具有开发维护简单、可扩展性强、部署方便的特点,为林业调查的建档和续档提供方便。
其他文献
为降低新建建筑节能投入和既有建筑节能改造的成本,研究设计了可用于与普通(5+12+5mm)中空玻璃配套的常用建筑窗扇的薄型活动中置百褶帘遮阳中空玻璃。试验实测表明,虽然厚度减小,但
在能源日益紧缺和节能减排日益重要的全球背景下,合同能源管理这种以市场导向促进节能的服务机制在发达国家得到了普遍的推行。合同能源管理模式在被引入中国后,融资困难问题
湖南是个地理环境优越、民族众多的省份,其民歌体裁丰富,风格纷繁,这种民歌的盛况让人意识到,即使在一个省的行政区划内,当地理环境、生活习性、方言都不相同时,其民歌所具备
摘要:通过正交试验方法,研究了水泥掺量、脱硫石膏掺量、粉煤灰掺量、水灰比对水泥土渗透性的影响;运用灰色关联度分析和分层分析分别得到4种变量对水泥土渗透性的影响顺序及影
内蒙古是国家重要的商品粮基地和畜产品基地,主要农畜产品产量位居全国第一。近年来,随着农畜产品质量安全事件的不断出现,消费者对农畜产品质量安全信息的需求日益强烈。然而,由
激光诱导击穿光谱(laser-induced breakdown spectroscopy,简称LIBS)是20世纪后期发展起来一种全新的原子发射光谱分析技术。利用高功率激光脉冲经过聚焦透镜聚焦后作用到待测
APOBEC3G(hA3G)是在人的淋巴细胞中表达的一种RNA/DNA编辑酶,归属于APOBEC蛋白超家族成员。最新的研究结果表明hA3G可以高效抑制病毒的复制,是宿主细胞中固有的艾滋病病毒的
电子邮件作为一种高效的网络通信技术已经在电子政务工程中得到了广泛的应用。作为政府工作的中坚,政府领导之间往往需要通过电子邮件传达大量机密、敏感信息。本文以甘肃省
池莉倡导“原生态写作”,被誉为“新写实小说”的代表作家,,她的大多数作品以凝重写实的风格,表现了人的生存艰难和生命卑微。由此便使人忽略了在其作品中自然的潜性的女性观