数据挖掘技术研究以及在档案计算机管理系统中的应用

来源 :沈阳工业大学 | 被引量 : 0次 | 上传用户:zhaocd
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
数据挖掘是指从数据中发现隐含在其中知识的一种实践过程,作为一种技术它已应用在很多领域,而在档案信息管理领域中它还很陌生。档案是人们在各种实践活动中形成的信息记录。在我国档案界十余年的自动化管理中目前已形成大量的数据,这些数据由于不能被充分利用,造成了大量人力、物力、资源的浪费。针对这种情况,迫切需要利用数据挖掘技术将档案与利用者之间、档案与各种实践活动之间以及档案之间的关系揭示出来,从而在更深层次上发挥这些档案数据的信息作用。本文评述了档案自动化管理现状和数据挖掘技术的发展状况,从数据清洗方法、数据挖掘算法、数据仓库的建立等方面论述了如何将数据挖掘技术与档案工作相结合的具体思路,并提出了一个数据挖掘系统的设计思想。文章首先,针对档案数据的现状,提出了应对档案数据进行预处理工作,包括数据质量评估、数据清理、数据变换和归约等过程;其次,在具体实现数据挖掘过程中,本文结合档案数据的特点探讨了概念描述、关联规则、分类等三种常见挖掘形式的实现方法,提出了具体的实现算法和程序设计框图,并论述了各种算法在档案工作中的应用范围及前景;第三,在上述基础上,又论述数据仓库在档案数据挖掘中的重要性并提出了实现一个档案数据仓库的方法;最后,从处理数据的多样性、算法的多样性、挖掘结果的多样性、数据预处理可视化、挖掘对象描述的可视化、挖掘过程可视化、结果显示可视化、用户需求的描述及问题定义等几方面讨论了实现一个档案数据挖掘系统的几个重点问题。全文以探讨如何将数据挖掘技术引入到具体的档案工作实践中为核心。
其他文献
该文的工作正围绕数据挖掘技术在基金评估与时间序列分析中的应用展开.主要的工作如下:(1)该文详细分析了数据处理和数据挖掘相关技术的发展现状.讨论了各种实现方法的特点、
近年来随着互联网技术的高速发展,学术研究领域也发生着翻天覆地的变化,网络上学术论文的数量呈爆炸式增长。研究人员在网络上查找其所需要的学术论文信息时,往往需要花费大
该文在图像检测、分割以及检索三个方面分别提出了相应的纹理模型来表示纹理特征:在敏感图像检测方面,该文分别基于DCT变换和Gabor小波变换两种方法进行皮肤纹理的特征提取,
该文从中文搜索引擎的分类技术,自动分词技术和检索技术等主要三个方面探讨中文智能搜索引擎的研究,系统论述了智能搜索引擎技术的概括,总体技术,组成和特点,以及中文智能搜
中央人民广播电台人事信息管理系统(简称CNRPMS)项目软件采用.NET四层体系结构的先进技术,对中央人民广播电台人事信息进行科学管理;借助面向对象技术,该软件实现对中央人民
该文内容主要包括: (1)深入探讨了密码学关于数据加密的典型算法.(2)介绍了当前广泛使用或较为时髦的三种数据加密技术及其数学背景,并客观地对其进行了分析.(3)分析比较了目
随着人们越来越依赖互联网来获取信息,互联网所承受的压力也越来越大。从用户的角度来看,网络数据的访问存在着时间和空间上的相关性,当某区域内有用户访问过一个内容后,该区
布匹瑕疵实时检测要解决"两高一低"即高检测率、高速度和低误检率三个难点问题.从这些要求出发,我们开发了一套基于视觉技术的布匹瑕疵自动检测系统.该论文主要研究用于该系
模型驱动架构(Model-DrivenAichitecture)是对象管理组织(OMG)近年所提出的软件开发架构规范.MDA提供了一条开放的、厂商中立的道路以应对业务与技术的不断变化.严格的基于统
随着计算机技术、控制技术、通信技术、CRT技术等的发展以及工业生产对计算机控制水平要求的提高,管理的集中性与控制的分散性这一实际需要推动了集散计算机控制系统(DCS)的发