【摘 要】
:
随着移动互联网的不断发展,用户通过互联网产生了大量的用户评价数据,例如电子商务中用户对商品给出的评价,这些数据体现了用户对商品的满意(即偏好)程度。充分挖掘用户评价数据中包含的有效信息,并为用户提供个性化的产品、服务具有重要意义。用户评价数据包括评分数据和评论数据,评分数据可以从整体上体现用户偏好,评论数据则可以表达用户对产品不同方面的关注和偏好。近年来,已有许多研究工作利用评价数据进行用户偏好建
论文部分内容阅读
随着移动互联网的不断发展,用户通过互联网产生了大量的用户评价数据,例如电子商务中用户对商品给出的评价,这些数据体现了用户对商品的满意(即偏好)程度。充分挖掘用户评价数据中包含的有效信息,并为用户提供个性化的产品、服务具有重要意义。用户评价数据包括评分数据和评论数据,评分数据可以从整体上体现用户偏好,评论数据则可以表达用户对产品不同方面的关注和偏好。近年来,已有许多研究工作利用评价数据进行用户偏好建模,但这些方法往往忽略了评论数据中不同评价方面之间的内在联系,难以描述用户评价数据中不同属性之间的不确定性依赖关系。本文将用户对评价对象在不同方面的评论,分别描述为不同的评论属性,使用词向量工具挖掘评论数据中用户针对不同评论属性的语义信息。同时,隐变量模型可以通过隐变量描述隐含知识,所以本文将用户偏好用隐变量进行表示,构建基于用户评价数据的用户偏好模型。综上,本文的主要研究内容可以概括成以下三点:1)针对评论文本数据的预处理,本文首先使用Word2vec词向量工具将评论文本数据转化为文本词向量,通过k-means聚类算法对评论数据的词向量进行最优聚类,根据聚类结果确定评论数据中包含的评论属性个数。通过词向量空间距离度量的方法对评论文本词向量进行分类,将评论数据转化为用户针对不同评论属性满意程度的分类数值数据,重构用于模型构建的样本数据集。2)为了保证模型构建的有效性,首先根据评论数值数据学习评论属性之间的依赖关系,分别从评分和评论出发确定模型的初始结构约束。然后根据初始结构约束以及变量的实际含义,给出了用户偏好模型的初始参数约束。在此基础上,根据重构后的样本数据集,分别使用EM(Expectation Maximization)算法和SEM(Structual Expectation Maximization)算法进行参数学习和结构学习,构建基于约束的用户偏好模型。3)基于已构建的用户偏好模型,本文在变量消元法的基础上提出了一种根据用户评价数据估计用户偏好的算法。该算法实现了在“无评分、无评论”,“有评分、无评论”,“无评分、有评论”和“有评分、有评论”等四种情况下的用户偏好估计。
其他文献
目的:本研究旨在分析胃炎和胃癌胃黏膜组织中FRA-1表达的基础上,进一步研究H.pylori感染胃黏膜上皮细胞对FRA-1表达的影响,探索FRA-1在H.pylori感染后癌症进展中的作用及作用机制。有望为临床H.pylori感染相关性胃炎及胃癌的分子诊断及靶向治疗提供新的依据和思路。方法:通过Oncomine数据库分析胃癌患者癌组织及相应癌旁组织中FRA-1 m RNA水平的表达差异,了解胃癌患
随着社会的发展和时代的进步,作文教学越来越受到人们的重视。在作文教学中,作文评改也是重要的一环,它的特点是能够精确到每一个学生的每一篇作文,具有较强的针对性。掌握科学有效的评改方法,能够使作文教学事半功倍,对提升学生的作文水平大有裨益。从作文内容包含的方面来看,可以分为主题、结构、材料、语言、文面等部分;从作文评改方法来看,又可以分为教师评改、师生共评、学生互评、学生自评等方法,而随着科技的发展,
汉语起源于汉藏语系,是一种以主题为中心的语言,重意合,其篇章结构具有离散性。而印欧语系重形合,篇章结构具有连续性。作为一种语篇衔接手段,零形回指是指在语流中再次提到某一概念实体时采用零形式。零形回指在汉语中出现的频率远高于印欧语系的语言。它不仅出现于典型的动词谓语句中,还出现在包括名词谓语句、形容词谓语句和主谓谓语句的名词谓语句中。作为研究热点,学者对零形回指进行了多角度的探讨。随着认知语言学的发
在现代数据中心中各种大规模应用的海量数据处理中,键值存储扮演着越来越重要的角色,日益增长的数据量也催生了对高存储密度的键值存储的需求。瓦记录技术作为最为方便提升磁盘存储容量的技术,同时也存在随机写性能缺陷和严重写放大问题。虽然基于日志结构合并树的键值存储能将随机写转化为顺序写,具有较高的写性能,但是简单地将键值存储应用到瓦记录磁盘上,会带来额外的随机读写和写放大问题,传统的键值存储并不能完美适配瓦
铝合金集装箱运输半挂车以其自重轻、强度高、耐腐蚀、寿命长、材料回收利用率高等特点,在我国高速发展的快递物流企业越来越受青睐,本文论述了铝合金集装箱运输半挂车的结
阅读,写作和计算能力被看作是人类应具备的最基本的能力。从小学低年级到基础教育的全过程,都把它视为最基本的能力来培养。其中阅读能力占据首位,这也说明了阅读的重要性,也使阅读教学在朝鲜语文教学中占据了最重要的地位。注意到近年来学生不爱读书的现象,读书研究者将其原因归结为阅读动机。阅读动机被认为是诱发阅读行为的心理因素,以心理学为基础研究一直备受关注。另一方面,由于中学生在发育过程中的阅读动机尚未充分形
随着全球经济不断全球化,市场竞争日益激烈,采购部门的采购战略已成为企业核心竞争力之一,其中供应商管理策略更是受到各企业的高度关注。西方国家已形成了系统的管理方法和工具,但是,绝大多数的理论和工具都适用于大型的、实力雄厚的供应商,在管理中小型制造型供应商时,有些力有未逮。在H公司安全防护产品业务集团,中小型制造型供应商比例已达到50%以上,成为企业的供应商资源中名副其实的主体,其具有批量小、种类多、
刀具是燃气轮机制造的重要资源,直接影响燃机加工的质量和成本。刀具种类繁多,数量巨大,且随着新产品的开发,刀具的品种和用量不断增加,刀具成本在企业成本中的占比也在不断增加。另一方面,由于缺乏刀具的统一、协调管理,也存在刀具库存偏高和使用效率偏低等问题,以致刀具成为加工能力瓶颈,限制了燃气轮机制造企业的核心竞争力。为此,迫切需要在燃机车间应用实施刀具全生命周期管理信息系统。首先,阐述了刀具全生命周期管
本论文旨在透过阅读理解的表象来揭示学习者在阅读理解过程中遇到困难的深层原因及其应对这些困难的潜能。因而本文主要探讨互动式动态评估在大学英语学习者阅读理解过程中的作用机制。其主要目的是研究动态评估对学习者学习潜力开发的影响,并观察调节指导是如何在互动式动态评估中对调节者和学习者的反应产生影响,从而探索出一种动态评估运行模式。本研究以社会文化理论下的动态评估为理论框架,采用混合方法的实验设计且以微变化
随着半导体工艺节点的推进与器件特征尺寸的减小,传统浮栅存储器面临着器件漏电增大、电荷泄露严重和可靠性下降等问题。采用分立式电荷存储结构的纳米晶作为电荷存储层,纳米晶浮栅型存储器具有低工作电压、高擦写速度以及与CMOS工艺兼容等特点,得到了广泛的研究。本论文将结合理论仿真与实验制备两方面对InP纳米晶浮栅存储器进行研究。理论方面,根据纳米晶浮栅型存储器的电荷输运与隧穿机制,结合电子直接隧穿电流与阈值