论文部分内容阅读
近年来随着风电技术的快速发展和普及,风电机组的装机容量迅速增长,风电机组在日常运行过程中沉积了大量生产、运维数据,有效利用这些数据对于提高风电机组的发电效率和运维水平有着至关重要的作用。因此,如何高效管理数据成为了风电机组运维中面临的问题。(1)本文针对传统关系型数据库海量数据查询任务超时、系统性能低、可扩展性差等问题,基于分布式数据库Hbase设计了风电机组运行数据的数据库,实现海量风电数据的快速存储。(2)针对因Hbase不支持非主键查询所导致的风电机组运行数据查询效率较低的情况,设计了一种基于热度与时间指数式衰减的热度排名策略和基于热度排名的二级索引机制。在此基础上提出了一种非主键索引的Hbase分布式集群优化方案,该方案根据指数式衰减的热度排名策略建立热数据索引,据此采用该策略存储数据热度排名TOP-K的二级索引以提高查询效率。实验结果表明将数据访问热度与时间建立指数式递减关系后,数据的热度排名更加有效,能够提高数据查询效率和访问命中率。(3)最后基于本文所提出的策略开发了风电机组运行数据存储与检索系统,通过比较二级索引机制查询响应时间表明该方案能够提高Hbase数据库的查询效率。