数据挖掘技术在Web个性化推荐中的应用研究

来源 :中国人民大学 | 被引量 : 0次 | 上传用户:zywlaoying
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着WWW上信息的爆炸性增长,在如此海量的数据中发现有用的信息变得越来越困难。数据挖掘就是从大量的数据中发现隐含的规律性的内容,解决数据的应用质量问题。充分利用有用的数据,废弃虚伪无用的数据,是数据挖掘技术最重要的应用。因此,采用数据挖掘技术从WWW上提取隐含的、未知的、非平凡的及有潜在应用价值的信息,具有十分重要的现实意义和广泛的应用前景。本论文系统地阐述了从数据挖掘、Web数据挖掘到Web日志数据挖掘整个过程,运用适合分析关联性问题的关联规则,找出用户所浏览的网页间的关联性;另外,结合用户存取时间、目标网页、偏好度(Pref.)及停留时间等数据作为推荐系统参考因素。通过对相关数据的辅助分析及比较浏览序列长度的方法,最后验证个性化推荐服务的效能,网站管理者可以轻易做到推荐用户最佳浏览网页。   本研究中采用假设验证的实验方法,并仿真一网站雏形以作为本研究实验验证的机制,探讨了面向Web的数据挖掘技术在网站个性化服务系统中的应用。
其他文献
近年来,随着无线通信的快速发展,在电网未能覆盖到的边远地区,利用风能、太阳能光伏发电设备组成的通信电源系统,在解决通信系统供电中正发挥着越来越重要的作用。可再生能源利用
自计算机技术出现以来,各种应用不断的推广,使各种数据信息资源也不断的膨胀,大量的数据信息需要存储和管理,关系数据库很好的解决了信息的存储和一些管理上的应用。在这些大量的
语言知识库是众多自然语言处理系统不可或缺的组成部分,同时也是各种自然语言处理技术赖以实现的基础。随着语料库方法和统计语言模型在自然语言处理领域的广泛运用,大规模语言
学位
在传统机器学习研究中,学习对象仅由一个类别标记来描述其语义概念。而在许多实际应用中,学习对象往往同时与多个语义概念相关联。多标记学习是研究此类任务的一种学习框架,并已
星载合成孔径雷达(Synthetic Aperture Radar,简称SAR)是一种工作在微波波段的主动式遥感器,因其具有不受日照和天气条件限制并对某些地物具有一定穿透能力的特点,现在已在对地
保证电路的“时序安全”-电路中时序路径的时延变化不引起同步失效-是确保电路可靠工作的基本条件之一。然而,随着制造工艺持续向纳米尺度推进,确保时序安全变得愈发困难和代价
频度、匀度和信息熵是语言的计量研究中极为重要的指标,本文对均方匀度、熵匀度和均根匀度进行了系统的比较研究,并针对均根匀度进行了深入的探索,得到了二元均根匀度和多元均根
学位
随着集成电路制造工艺进入纳米级,高性能微处理器的物理设计面临着越来越多的挑战:不断增加的工艺、电压、温度的在片波动,超大的设计规模,高主频、低功耗的设计要求。这些挑战正
本文首先说明了当前网站安全的严峻形势——网页篡改事件发生的数量剧增,再分析了传统的网站安全配置在防范网页篡改时表现出来的越来越明显的不适应性,接着分析了当前网页防
矢量场可视化是科学计算可视化领域中最具挑战性的研究课题之一,它以直观的图形图像显示矢量场的运动,使人们以直观形象的方式解释理解抽象科学数据中所包含的客观规律。线积