论文部分内容阅读
二十世纪末,网络技术、数据库技术、图像处理技术、多媒体技术、海量信息存储技术、计算机软件技术等新技术的发展使互联网在硬件与资源内容上都得到了日益升级与壮大,并成为知识信息生产、传输与消费的强大驱动力。这些均使得网络在信息的数量、可获得性与应用都在迅猛地增加,同时人们的信息需求理念也发生了质的变化。由此对Web信息的知识挖掘研究逐渐成为了目前一个热门的研究课题。 知识挖掘已经被应用于很多领域,为了增加研究的深度,本文将研究重点放在了对Web信息的知识挖掘研究上。Web信息的知识挖掘研究是将知识挖掘理论应用于Web信息中从而获取知识的过程。本文通过对知识挖掘概念、技术和方法的探讨,在理论研究的基础上得出结论和方法,然后和实际应用(在本文中,我们是将它应用到企业客户关系管理中以获取企业客户知识)相联系,在实践中检验和证实理论的正确性。论文全文共分为五个部分: 第一部分,通过对Web信息资源特点的分析,以及传统的Web信息获取方法的分析,并结合现阶段的研究现状,阐明对Web信息进行知识挖掘研究的意义。 第二部分,简要的介绍了知识挖掘的基本概念,同时介绍了Web挖掘的概念、方法以及工具。 第三部分,详细的讨论了目前常用的知识挖掘技术(包括神经网络,决策树、集合论方法、遗传算法和聚类分析),并讨论了目前比较流行的知识挖掘工具。本部分所介绍的方法是知识挖掘的指导思想。 第四部分,首先对Web信息的知识挖掘进行分类。然后分别从三个方面(Web信息的内容挖掘、Web信息的结构挖掘和Web信息的使用记录挖掘)详细的分析了对Web信息进行知识挖掘的方法。最后,针对Web信息的特点,分析了XML技术在Web信息知识挖掘中应用。 第五部分,构建面向企业客户关系管理的知识挖掘应用.首先介绍了CRM的概念和发展现状,并分析了企业实施CRM的好处。然后将知识挖掘技术应用到企业CRM中去,挖掘出对企业有意义的客户知识从而指导企业战略规划和决策。最后进行案例分析,介绍了SAS知识挖掘的方法。