高校规模分析决策支持系统的总体设计与数据挖掘

来源 :沈阳理工大学 | 被引量 : 0次 | 上传用户:zldzhang
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
近年来随着我们产生和搜集数据的能力不断增强,在许多商业和政府事务中计算机的日益普及、以及在数据收集工具方面的不断进步,我们面临着大量的数据。成百万的数据库已经被用于商业管理、政府管理、科学和工程管理以及其它许多应用领域。数据和数据库的飞速增长迫切要求我们保存大量数据并且从己经拥有的大量数据中产生有用的知识或信息。因此,数据仓库和数据挖掘作为一种能够满足这种需求的技术应运而生,其重要性得到了前所未有的重视。 数据仓库技术和数据挖掘是信息技术领域的一门新兴技术。数据仓库的主要特点是面向主题性、集成性、时变性、非易失性。数据挖掘是利用分析工具从大量的、不完全的、有噪声的、模糊的、随机的数据中,提取出隐含在其中、事先未知、但又潜在有用的信息和知识的过程,建立数据间关系模型,并用其做出预测。采用数据仓库技术,可以充分利用己有的海量数据资源,以便从中挖掘出有用价值的知识和规则。 本设计是将数据仓库和数据挖掘技术应用于高校扩建可行性的研究工作,对以往人口出生、高校招生、学生就业、国家政策大量数据进行分析,从而科学的实现对高校的建设投入,为国家节省不必要的投资浪费。 全文共分五个部分: 第一部分:是绪论,介绍课题的背景及意义,数据仓库和数据挖掘技术的现状; 第二部分:是数据挖掘技术的介绍,详细介绍有关数据挖掘的概念、特点、实现方法等; 第三部分:是介绍本设计中采用的神经网络方法,详细介绍本课题中应用的BP网络算法及改进; 第四部分:是结合本课题详细阐述本设计实现思想和方法,重点介绍系统是如何实现的; 第五部分:为本文总结和展望。
其他文献
Internet的出现和快速发展,现已成为目前世界上最大的信息资源库。然而面对巨大的Web资源库,用户若想获得所需要信息已不再是一件简单的事情。通用搜索引擎虽然在一定程度上满
网络管理技术是用来解决网络失效、性能欠缺、配置不当、安全性差等问题的。当前网络管理系统正在逐步向分布式和智能化发展,而移动Agent技术作为一种新型的智能分布式技术,正
面对日益庞大的数据资源,数据挖掘技术应运而生。它是一种致力于数据分析和理解、揭示数据内部蕴藏知识的技术,是当前人工智能领域和数据库领域相结合的热点研究课题。概念格
目前,在软件开发领域极其推崇的是面向对象程序设计方法,因为它具有确保软件质量、可重用性、灵活性、可维护性、可扩展性的技术,所以得到广泛的应用。而数据库的应用大多数企业
采样是遥感图像监督分类的基础,样本的质量会直接影响遥感图像分类结果的质量,因此对样本进行质量评价,从而得到关于样本的不确定性描述是非常必要的,目前对于样本的评价大多是基于统计的,通常,样本点是凭先验知识和经验获得的。在相同采样模式和样本量的前提下,一组作为训练分类器的样本数据集的“真实效用”如何,只能经过分类之后才能进行相应的验证和评价,即在这组样本数据集中,能够全面体现光谱特征,保证分类质量和效
康托尔于1874年创立了普通集合概念。在康托尔(Cantor)集合理论中,集合中任一元素,要么属于一个集合,要么不属于,二者必居其一,绝不模棱两可。也就是说,康托尔的集合论只能将
计算机支持的协同工作(Computer Supported Cooperative Work,CSCW)所研究的是一个群体在计算机支持的环境中如何协同工作完成共同的任务,它是一个多学科交叉的研究领域,需要计
随着科学技术进入一个多学科相互交叉、相互渗透、相互影响的时代,源于模拟某一自然现象或过程并且具有自组织、自学习、自适应等特征的神经网络、细胞自动机和进化计算等研究
基于基因表达谱在分子水平上对肿瘤进行分析和研究,是当前生物信息学研究的重要课题。本文将数据挖掘技术应用在基因表达谱分类分析领域,对特征提取及肿瘤亚型识别问题进行了研
肿瘤细胞图像是一种医学图像和自然图像,具有高维复杂的特性,含有较多的冗余信息。目前针对医学图像的识别尤其是肿瘤细胞图像的识别出现了各种不同的分类诊断方法,但一般的分类