论文部分内容阅读
数据挖掘是一种典型的面向信息智能的应用技术,它不仅能对海量数据进行分析处理,并且能够找出数据之间的潜在联系,从而得到有价值的信息,帮助科学决策。本文就是对数据挖掘技术的一种应用研究,将数据挖掘技术应用于校园网络的资费标准制定中。 本文研究结合华北科技学院校园网计费的实际情况,获取来自华北科技学院网络计费系统的校园网用户登录及流量信息数据,运用数据挖掘中的关联规则挖掘技术,借助sql server2005中的数据挖掘工具,对这些数据及属性进行关联规则挖掘,并分析得出校园网用户的行为规律,为校园网资费标准的制定提供了重要的理论依据。 数据预处理技术在数据挖掘之前的使用,可以大大提高数据挖掘模式的质量,降低实际挖掘所需的时间。在本文关联规则处理的数据中有一部分是时间数据,而且是分析的重点。为了便于将时间数据进行概念分层,研究提出了适合于时间数据规范化的(0,1)规范化技术,将时间数据巧妙转换为数值数据。接着在进行时间数据概化过程中,根据数据特点、挖掘任务需要等实际情况预先设置分值点,并运用概念分层技术中的直方图分析法,对预先设定的分值点进行微调,提出了直方图分值点微调技术。 在运用关联规则挖掘技术对校园网用户登录及流量信息数据挖掘过程中,重点研究分析了数据特点、挖掘任务需求,将一个貌似数值型的多维关联规则挖掘转换为布尔型的二维关联规则挖掘,并提出了一种布尔型二维关联规则挖掘算法。本文借助sql server2005中的数据挖掘工具,按照数据准备、设置数据源、设置数据源视图、创建挖掘模型、挖掘结果分析的挖掘步骤展开挖掘。创建了多个挖掘模型,并对每个挖掘模型进行二维布尔关联规则挖掘,得出了影响校园网资费标准制定的各属性间的关联关系。 最后,根据挖掘分析得出的华北科技学院校园网用户行为规律,就校园网资费标准的制定提出了实用性建议,有助于校园网更加高效、稳定的运行。