数据质量分析系统的研究与实现

来源 :华南理工大学 | 被引量 : 0次 | 上传用户:BlueWindow
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
本文先后讨论了数据质量的产生原因及其影响要素、数据质量问题的分类、数据质量分析方法以及数据质量分析系统的概要模型。主要工作和创新点如下: 1.将数据质量分析方法归结为基于规则分级别分析的方法;应用动态聚类算法来进行相似重复记录检测,采用编辑距离算法度量记录之间的距离; 2.在总结当前数据质量分析方法的基础上,设计数据质量分析系统的概要模型,将数据质量分析系统的主要功能分为域分析和过滤器分析; 3.设计和实现了一个应用XML,WEB SERVICE等技术的数据质量分析系统,实现了域分析与过滤器分析等主要功能模块,为用户提供了一个分布式、跨平台、扩展性强、支持多用户、界面友好的数据质量分析平台; 对数据质量分析方法进行了总结,并设计了数据质量分析系统的概要模型,具有一定的理论意义;在此基础上,设计的数据质量分析系统,对该模型进行了实现,给用户提供了一个容易使用,界面友好的分析流程,增加了系统的实用性,这些都是对数据质量技术的应用很有意义的研究。
其他文献
学位
经过多年的信息化建设,各企事业单位已具备了较完善的OLTP系统,积累了海量的业务数据,但是他们分散、不共享,数据的完整性、一致性缺少很好的保证,且OLTP系统已远远满足不了企业应
学位
在互联网上实现大规模的流媒体数据直播服务,一直是普通网络用户和研究者追求的梦想。客户端/服务器架构需要很高的成本,且缺乏良好的可扩展性;作为最理想解决方案的IP组播因为
计算机视觉中的视频任务都有着很重要的实际应用,对视频数据建模和处理方法的研究是一个十分重要的方向。视频数据的复杂性,使得合理准确地建模视频数据成为非常困难的问题。传
云计算已经是下一代服务计算模式,并且全面进入实践和应用的阶段。由于硬件升级换代,在性能价格比、可扩展性和可用性方面,云计算资源虚拟化和异构集群系统显现出巨大优势,这使得
计算机游戏是计算机科学的一个重要组成部分。计算机游戏的研究领域包括游戏AI引擎、游戏视频引擎和游戏音频引擎等。在当前的计算机游戏研究中,开发人员把主要的精力集中在AI
随着信息技术和对地观测技术的不断发展,空间数据呈指数级爆炸性增长,地理信息服务日益成为人们日常生活的必须。空间数据管理是地理信息服务的核心,其性能的优劣直接影响地理信
在并行与分布式系统中,负载平衡是优化系统性能、增强其效率的重要环节。扩散和维交换方法已经成为两类重要的局部迭代负载平衡方法。自1989年由Cybenko和Boillat提出局部迭代
随着AMD和Intel陆续推出多核CPU,算法对并行计算的需求更加迫切。在数据挖掘领域中,支持向量机(SVM)由于其在分类和时间序列挖掘等应用领域中的高准确度而为业界普遍推崇,但同时
本文首次提出了一种基于安全协处理器的无线传感器网络安全解决方案,该方案包括:安全协议、指令集的抽象、安全协处理器的实现、模拟器的实现。 采用通用嵌入式处理器进行加