论文部分内容阅读
在电子商务、城市应急、科学计算等诸多领域,业务用户通常需要按照其个性化的需求快速集成互联网上跨域的数据资源。然而,互联网上的数据资源分布、自治、异构的特点给用户的数据集成带来了很大的困难。基于数据服务的情景数据集成是一种业务用户主导的即时数据集成方法,它将数据服务作为数据资源的统一抽象,解决数据资源存在的异构性,规范对数据资源的访问,使用户能够通过组合数据服务实现数据的集成。 基于数据服务的情景数据集成通常需要利用多个数据服务的组合建立不同数据资源之间的数据关联。数据资源服务化后,不同资源之间的关联表现为数据服务之间的关联,这种关联是选择和组合服务时的重要依据。现有方法需要用户手工选择和组合服务,该过程较为繁琐,易出错,用户集成数据的效率低。该问题存在的一个原因是当前的数据服务不包含与其他服务的关联信息,无法为用户提供发现和组合服务的辅助手段。为此,本文主要研究数据服务之间数据关联的建模以及利用这种关联辅助用户发现服务、组合服务的方法。主要工作和创新性贡献如下: 1.提出了数据服务超链模型,用以刻画数据服务之间的数据关联。通过一组映射关系,一个数据服务超链能够表达其源服务的输出参数与目标服务的输入输出参数之间存在的多种关联方式;提出了一种包含服务超链的数据服务模型,在原有的基于嵌套表的数据服务中添加了数据服务超链,使数据服务能够包含与其他服务的关联信息。 2.提出了一种手工建模与自动建模相结合的数据服务超链建模方法,重点实现了该方法中基于服务组合案例的数据服务超链自动建模方法,能够根据已有服务组合案例得到案例中的数据服务之间存在的服务超链。实验表明,基于组合案例的数据服务超链自动建模方法的准确率在85%以上,而随着组合案例数量的增加,方法的召回率也会提高。 3.提出了基于数据服务与数据服务超链的服务推荐和服务组合辅助方法。 首先,为了辅助用户发现所需的数据服务,提出了两种服务推荐方法。第一,根据用户当前集成过程中使用的数据服务推荐后续需要的其他服务。实验表明,与类似的两种服务推荐方法相比,该方法的准确度更高。第二,针对集成过程中用户新引入的数据服务,为用户推荐由一组数据服务和服务超链构成、能够通过服务超链连接已调用服务与新引入服务的数据服务组合片段。通过引入服务组合片段中的服务,可以使当前集成过程中的所有数据服务的输入参数所需数据能够通过其他服务的输出获得。 其次,为了辅助用户快速准确的组合两个数据服务,提出了一种基于数据服务超链的服务组合辅助方法,根据一个数据服务超链中的一组映射关系自动得到该超链所关联的两个服务的组合方案,包括了组合时所需的操作、操作执行时的参数以及操作的执行顺序。实验表明,在自动生成的服务组合方案的辅助下,用户组合服务时花费的时间和出现的错误可以得到有效降低。 在应用层面,基于原有的数据服务组合环境—数据服务空间,构建了支持超链的数据服务空间原型系统,实现了上述工作中的主要功能,印证了方法的效果。