论文部分内容阅读
科学数据是人类社会科技活动所产生的基本数据、资料,以及按照不同需求而系统加工的数据产品和相关信息,具有明显的潜在价值和可开发价值,并在应用过程中得以增值,是信息时代最基本、最活跃、影响面最宽的科技资源。如何尽可能充分地利用这些资源,使科学数据在大范围内实现共享,一直是研究人员所面临的问题。数据网格(Data Grid)以资源共享为核心目标之一,如何有效地促进科学数据资源的共享和应用是数据网格技术的一个重要研究方向。
科学数据网格(Scientific Data Grid,SDG)是以科学数据共享以及在此基础上的协同工作为核心的应用系统,如何屏蔽科学数据库的异构性,使这些地理上分布的,异构的和自治的数据资源在大范围内共享成为科学数据网格中间件的技术难题之一。
本文对数据访问服务系统如何处理数据模式异构的问题进行了较深入的研究,提出了一种解决数据模式异构的元数据模型。元数据模型首先对分布的异构数据资源进行抽象,在此基础上得到具有统一的数据模式的虚拟数据库,然后应用统一视图(Universal Relation)模型来简化虚拟数据库,应用一种易于理解和操作的新的查询方式,使得数据使用者不必知道具体的物理数据存储方式和数据模式可以得到想要的结果,这种方案为以后的数据集成提供了一个良好的平台。系统在处理数据抽象化的过程中,实现了数据网格中访问权限控制的要求,达到数据共享的安全性:实现了数据访问的普通查询和高级查询,实现了系统的易用性和适用性;实现了客户端并发传输功能,利用多线程和数据库连接池技术,达到客户端较高的吞吐率。文章最后简要介绍了此方案在数据访问服务系统中的应用情况。