数据挖掘技术在围网渔业渔情预报中的应用研究——渔情预报中强影响因子的挖掘

来源 :上海海洋大学 | 被引量 : 0次 | 上传用户:hcpysw3
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
本论文主要研究内容为以下几个方面: (1) 我们改进了传统的基于可辨识矩阵的属性约简算法,采用启发式搜索方法,利用属性在可辨识矩阵中的出现频率作为启发条件,来对决策表进行搜索进而获得约简属性,为了获得较优的约简,在算法中增加了反向删除策略,判断每个约简属性是否独立,直到不能删除为止,最终获得有效的最小约简。这种算法可以有效获得属性集的一个最小约简,而不是传统算法得到的一个约简的超集。 (2) 根据研究得到的新型属性约简算法,对影响围网渔业产量的4种不同类型海洋环境因子:海水温度因子(5个)、海面高度因子(2个)、海面风速因子(1个)和海水叶绿素浓度因子(1个)进行数据挖掘,以得到其中对围网渔业产量影响的核心因子集合。通过收集相应海洋环境因子,经过合适预处理后,得到度量一致,结构统一,赋予有效性的海洋数据集。由于属性约简算法对数据的特殊要求,需要将数值属性的概念层级提升,以获得合适的属性相等标准,故而根据面向属性归纳的思想,对数据集进行数据泛化操作,再利用新型属性约简算法,获得属性集的最小约简。 (3) 根据数据挖掘后的约简属性来建立回归模型,并通过获得的模型来验证属性约简算法获得的强影响因子。 (4) 在整个实验过程中,我们发现针对海洋环境因子数据,我们需要着力解决海洋数据的编码格式统一、度量统一、数据结构统一、可定制化和及时传输等问题,而这些问题随着引入RSS技术,可以得到有效的改善,事实上,USGS(U.S.Geological Survey)已经通过RSS技术来发布关于地震信息的数据了,并且取得了较好的效果。最后提出基于RSS的围网渔业自动化渔情预测软件框架,通过之前数据挖掘研究中书写的两个SQL存储过程结合RSS技术实现自动化的数据收集、数据泛化、约简属性提取,进而建立预测模型。 本文针对传统围网渔业渔情预测方法的缺点,首次综合多种类型海洋环境因子,采用数据挖掘技术中的面向属性归纳和新型属性约简方法,获得多种类型因子中的约简属性,即影响围网产量的强影响因子,进而通过构建回归预测模型进行验证,为渔情预测研究开辟了一条新的道路,也为以后的海洋数据研究工作做出一定的指导。
其他文献
嵌入式系统与网络技术以及数据库技术的结合可以极大地增强嵌入式设备的智能化与灵活性。将数据库系统移植到嵌入式设备中,可以方便、有效的管理嵌入式设备上的数据;将Web服
作为智能汽车视觉系统的重要组成部分,同时作为自动目标检测与识别技术的一个典型应用,交通标志检测与识别技术越来越多地受到关注。但该课题由于对实时性能有很高的要求,在
随着2003年人类基因组计划的完成,生物信息学的研究已经进入后基因组学时代,基因组信息学研究重心开始从揭示生命的所有遗传信息转移到从分子整体水平上对基因功能的研究,从
学位
计算机辅助整形外科手术计划和结果预测作为整形外科手术一个研究热点,由于其简单、直观、易用的特点,正日益得到广泛的研究和应用。虚拟切割是虚拟手术过程中至关重要的一种
需求是软件开发的基础。调查表明,51%的软件项目失败的主要原因是需求不完善,44%到80%的软件缺陷是在需求阶段产生的。因此,要保证软件项目能够成功,就必须对需求及其变化进
近年,煤矿突水事故时有发生,给人民的生命财产带来极大的危害。因此,通过电磁法研究矿井地下地质构造,预测水害发生,对煤矿的安全生产具有极大的意义。集散型电法系统采用主
对等网络(Peer-to-Peer)作为一种新兴的网络计算模式,打破了传统的客户机/服务器(C/S)模式,其应用越来越广泛。在现有的众多P2P网络模型中,Gnutella是一种完全的分布式、无等
二维排样问题是具有很高计算复杂度的NP难度问题,在机械、家具、船舶等制造行业中有着广泛的应用。本文研究了矩形件二维剪切下料排样问题,优化目标是:寻找一个排样方案,使得
网格是一个集成的计算与资源环境,它能充分吸纳各种计算资源,并将它们转化成一种随处可得的、可靠的、标准的同时还是经济的计算能力,实现资源的全面共享。网格任务调度是网