论文部分内容阅读
协同过滤是目前最成功的推荐技术,它被广泛应用于网上多个成功的推荐系统中。协同过滤根据其它客户的喜好来为目标客户推荐产品。协同过滤系统使用统计技术来找出称为邻居的客户群体,这些群体的特点是他们都与目标用户有相似的喜好。
虽然协同过滤技术在电子商务网站中得到了非常广发的应用,但协同过滤推荐技术本身还是存在一些缺点,这些缺点包括:(1)数据稀疏性问题;(2)系统可扩展性问题;(3)项目的同义词问题。其中的数据稀疏性问题直接影响到推荐结果的质量,并且由于商务网站上商品数量非常多,也导致了用户-商品评分矩阵的数据量异常庞大。但由于用户一般只对其中的很小一部分商品进行了评分,所以导致了用户-商品评分矩阵变得稀疏。
本文针对目前电子商务网站中的用户-商品评分矩阵数据量庞大和数据稀疏性的问题,提出了进行协同过滤个性化推荐之前,先对用户-商品评分矩阵应用改进的K-均值聚类算法,降低数据维度,在聚类后已经降维的数据集上进行协同过滤推荐。
考虑到K-均值算法在选取初始K个中心点时存在可能不能达到全局最优的不足,本文提出了根据消费者所偏好的菜系进行初始K个中心点的选取的方法。而在为消费者产生推荐信息阶段,针对目前平均评分预测算法以及改进的平均评分预测算法的不足,提出了结合这两种算法的混合型评分预测算法(MPP,Mixed Preference Prediction),通过在“美食在线”商务网站上的数据进行的实验显示,混合型评分预测算法比另外两种评分预测算法更加适用于商务网站。
目前相关技术已经在“美食在线”商务网站上得到应用。该网站拥有六大功能模块:消费者订餐模块、餐馆后台管理模块、加盟商管理模块、原材料提供商管理模块、美食在线后台管理模块以及自动处理程序模块。