论文部分内容阅读
随着WWW上信息的爆炸性增长,在如此海量的数据中发现有用的信息变得越来越困难。数据挖掘就是从大量的数据中发现隐含的规律性的内容,解决数据的应用质量问题。充分利用有用的数据,废弃虚伪无用的数据,是数据挖掘技术最重要的应用。因此,采用数据挖掘技术从WWW上提取隐含的、未知的、非平凡的及有潜在应用价值的信息,具有十分重要的现实意义和广泛的应用前景。本论文系统地阐述了从数据挖掘、Web数据挖掘到Web日志数据挖掘整个过程,运用适合分析关联性问题的关联规则,找出用户所浏览的网页间的关联性;另外,结合用户存取时间、目标网页、偏好度(Pref.)及停留时间等数据作为推荐系统参考因素。通过对相关数据的辅助分析及比较浏览序列长度的方法,最后验证个性化推荐服务的效能,网站管理者可以轻易做到推荐用户最佳浏览网页。
本研究中采用假设验证的实验方法,并仿真一网站雏形以作为本研究实验验证的机制,探讨了面向Web的数据挖掘技术在网站个性化服务系统中的应用。