论文部分内容阅读
SaaS模式作为一种完全创新的软件应用模式,已经被认为是IT行业发展的无可争议的方向。与此同时,SaaS平台上的数据在急剧的增长,海量数据处理和海量数据应用成为了SaaS平台一个重要的问题。SaaS平台上的数据具有复杂、海量、异构、多源等特点,这样对SaaS平台数据分析面临着巨大的挑战,所以需要借助数据挖掘软件来完成SaaS平台数据分析。由于SaaS发展起来的时间并不长,针对SaaS平台的功能正在不断的扩展完善,本文根据用户及SaaS厂商的需要提出SaaS平台数据挖掘的解决方案。本文首先分析了SaaS平台的大数据,并对SaaS平台数据存储方式及数据特点进行了分析,根据上述分析提出了SaaS平台数据挖掘功能需求及系统需求。其次,本文对数据挖掘技术进行了简单描述,简要介绍了数据挖掘的流程及经典数据挖掘算法。针对SaaS平台,在比较当前流行的数据挖掘软件后本系统选择了公开的数据挖掘软件Weka,并针对SaaS平台注册公司信息数据、公司使用用户数据、SaaS模块租用信息数据分别提出了相对应的数据挖掘算法。然后,本文提出SaaS平台数据挖掘系统设计方案,采用分模块的设计思想,SaaS平台数据挖掘系统分为存储各种数据的数据模块、进行数据转换及预处理的数据服务模块、进行数据挖掘算法实现及应用程序实现模块。最后,本文实现了SaaS平台数据挖掘过程,封装了SaaS平台数据挖掘算法,并通过实验验证了本系统的有效性及实用性。实验结果表明:租用者在选择SaaS模块时,SaaS提供商可推荐相应关联性大的模块;公司根据员工信息对员工进行分类,公司可以更方便的对员工进行分层次管理;通过对注册公司性质的预测,SaaS提供商可更好的做好SaaS商品营销策略。