论文部分内容阅读
Web已成为人们获取信息的一个重要途径。随着Internet的不断发展,Web上的信息已日益增长,传统的“人找信息”的服务模式已越来越难以适应迅速增长的Internet信息资源。于是出现了Web站点的个性化服务。Web站点的个性化服务是指分析用户行为(使用数据)与其他从Web文本、标题、结构、内容和用户描述收集得到的信息之间的相关性,从而获取一定知识,并利用这些知识制定满足不同用户的站点的过程.现有的Web个性化服务有三种形式:个性化推荐、个性化网站和个性化信息检索。已经存在许多个性化服务系统,应用于电子商务、电子邮件、数字图书馆等领域,但个性化服务技术仍有许多值得研究和改进的地方。 本文在分析现有个性化服务技术的局限性以及国内外研究现状的基础上,对个性化推荐进行了深入研究。研究了在个性化推荐系统中涉及到的三大关键技术,即用户兴趣建模(用户描述)、网站资源描述及推荐技术,并对相关技术进行了论述。在用户兴趣建模部分,对Web日志挖掘及数据预处理的方法进行了研究。对于网站资源描述所涉及的中文自动分词技术,本文介绍了双向匹配分词法,并将基于统计的无词典分词方法用于未登录词处理。在对文本特征提取和专家系统研究的基础上,提出了一种新的用属性分级描述网页的方法,使得对网页的描述更加全面且利于计算。对于推荐技术,本文探讨了将基于内容和协同过滤相结合的混合推荐方法,使得推荐不仅能满足用户已有的兴趣还能发现用户新的兴趣。综合以上研究,本文提出了一个个性化信息服务的结构模型,通过对用户信息的分析与挖掘,根据用户喜好将内容推荐给用户.另外,模型中用户信息获取采用的是隐式收集方式,不要求用户提供任何信息,一方面克服了用户不愿提供个人信息而无法获取有用信息的问题,另一方面保护了用户的隐私。最后结合实际应用领域开发影视网站个性化推荐系统,验证了上述个性化信息服务模型的有效性,并提出了今后的研究方向。