论文部分内容阅读
随着高校互联网的快速普及与发展,越来越多的教学资源通过网络传播实现资源共享,散落在网络各处的资源如何高效、快速的被用户检索,如何统一的实现资源管理与资源开放,成为当下校园网络数字资源亟待解决的问题。本文基于实验室”北邮青年科研创新计划专项”的”基于图书馆业务数据分析服务的学生个性化知识服务平台”项目,该项目意在为北邮在校师生提供一个数字资源共享平台,因此,该平台急需要实现一个数字资源存储系统,现在已有存储系统有传统单机与分布式两种,然而根据该平台数字资源密集型读写应用场景,该存储系统需要满足以下三点需求:(1)数字资源可靠安全存储,且在密集型I/0任务下的读写高性能(3)存储服务与上层应用松耦合(3)方便第三方应用快速集成。针对上述目标,本文首先采用HDFS框架实现数字资源的分布式存储架构,为了达到在密集型I/0任务F,存储系统仍然具有很高的读写性能,本文抛弃了传统的Java E与HDFS的结合方式,提出并实现了一种基于Node. js与HDFS结合的存储架构;其次,为了将数字资源存储系统与上层应用松耦合,本文对外提供了RESTful方式的存储服务接口;最后,本文设计并实现了基于JSONP的前端可插拔式组件,方便第三方应用对本接口服务的快速集成。本文最终实现了一个基于Node.js的分布式数字资源开放服务系统,其中解决了Node.js与HDFS直接交互问题,设计并实现了两者的桥接模块;同时,本文针对RESTful数字资源开放服务接口,设计并实现了基于JSONP的可插拔式前端组件,该组件可实现第三方应用对本服务接口的快速集成。本系统现在已经在个性化知识服务平台部署应用,并上线,已表现出非常出色的高并发工/0读写性能。最后,本文将Node.js与HDFS的分布式存储架构与传统的Java EE与HDFS的存储架构进行了性能测试比较实验,经测试,验证了本文提出的Nodejs与HDFS结合的存储架构在密集型I/0任务上良好的性能表现。