面向社会标注系统的信息服务关键技术研究

来源 :中国科学院研究生院 中国科学院大学 | 被引量 : 0次 | 上传用户:lzzhong9910
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着互联网进入Web2.0时代,以Flickr、CiteULike等为代表的社会标注系统己逐渐成为新兴的知识共享平台。用户可以使用任意标签对自身创建或他人创建的网络资源(如图片、文献等)进行标注,还可以通过参加群组来与有类似兴趣的用户更好地分享相关资源。标签一方面代表了用户对资源的理解,反映了资源的内容;另一方面,多个用户标签的集合,也形成了对群组的高层语义描述。因此,标签成为联系用户与资源、用户与群组、资源与群组的桥梁。利用几类实体之间的关联关系,研究用户行为模式、资源组织方式,从而改善信息服务质量,成为相关研究面临的主要挑战。   社会标注系统对群组的支持增强了标注的社会化特性,然而,群组数量的迅速增长,却为用户参与其中带来困难,利用标签的桥梁作用,挖掘用户与群组之间的潜在关联,为用户推荐其感兴趣的潜在群组,能够加强用户间的信息交流,提高资源的利用率;标签和群组等信息为资源提供了多角度的描述,同时,语义相关的标签和内容相似的群组从不同的方面增强了用户对资源的认知,综合考虑这些信息,为新上传的资源同时提供标签和群组推荐,有利于其他用户对资源的发现,促进知识的共享和传播;目前,群组主要提供按照资源分享时间排序浏览资源的方式,这种浏览方式导致大量高质量的资源随着时间的流逝而被淹没,群组将标注聚合到一起,由此产生的标签共现关系为信息的组织和发现提供了基础,利用群组中大量用户对资源的标签挖掘资源的主题,并根据用户对资源的反馈信息排序主题内资源,提供面向主题的群组内资源浏览,能够帮助用户快速定位感兴趣主题高质量的资源;用户为资源添加标签的时间体现了用户在该时间点的兴趣,然而,用户的兴趣会随着时间的推移而发生变化,考虑用户的兴趣漂移,可以为用户提供符合其当前兴趣喜好的信息服务。本文的工作以图片标注系统Flickr和文献标注系统CiteULike为研究对象,针对上述几个问题,研究的主要内容如下:   1、提出了一种基于张量分解的群组推荐方法,用于集成以标签为桥梁的多维实体。该方法采用张量表征“用户-标签-群组”三者之间的交互关系,利用非负张量分解算法挖掘三类实体的共同主题空间,基于用户和群组在共同主题空间上的投影,计算它们的潜在关联,实现为用户推荐群组的服务。我们通过多组实验,对比当前流行的推荐方法,验证了模型的有效性,并深入分析了标签在群组推荐过程中的作用。   2、提出了一种基于实体问和实体内关联的标签和群组推荐方法,该方法通过抽取对资源进行标注的用户、描述资源内容的标签和资源所加入的群组之间的实体间关联,分析用户的好友、语义相关的标签、内容相似的群组的实体内关联,采用互增强学习挖掘各类实体与资源之间的潜在关联,实现为资源同时推荐标签和群组的功能,提高了用户参与标注的效率,有利于资源的发现和传播。   3、提出了一种两阶段面向主题的群组内资源浏览方法,方便用户定位和发现感兴趣主题高质量的资源。该方法第一阶段通过对标签共现关系的分析,使用标签作为描述资源的特征向量,构建“资源-标签”的矩阵空间表示,然后基于非负矩阵分解算法挖掘资源的主题。第二阶段针对每个主题,综合考虑资源的浏览次数、好评次数和分享时间建立主题内资源的影响力计算模型,实现对同主题资源的排序。   4、提出了一种基于用户兴趣漂移的资源推荐模型,为用户提供符合其当前兴趣喜好的资源。由于用户当前的标注比先前的标注对预测未来的兴趣更具影响力,我们使用指数衰减函数模拟用户标注兴趣的变化,并基于该函数生成用户对资源的评分数据,与传统二值评分相比,该评分数据能更准确的表达用户当前对资源的喜好程度。然后,利用生成的评分数据基于协同过滤的思想实现资源推荐。最后,我们构建了一个原型系统,通过该系统用户不仅可以看到自己或他人的历史标注行为以及标注随时间的变化情况,也可以通过可视化界面了解与自己当前兴趣相投的用户,并得到基于当前兴趣的实时推荐结果。
其他文献
海天背景与目标实时红外仿真技术研究,主要以红外辐射、红外成像理论为基础,研究海面、天空背景和目标的几何特性和红外特性,建立海面、天空背景和目标的红外模型,利用虚拟现
掌纹识别技术是一种新兴的生物特征识别技术,是近年来研究的热点之一。与其他生物特征识别方法相比,掌纹特征信息更加丰富,图像采集方便且掌纹识别对掌纹图像质量要求不高,易
近年来,无人机技术和传感器技术的发展促进了小型、低功耗组合导航系统的研究。本文对应用于旋翼飞行机器人的组合导航系统开展研究。在查阅大量文献的基础上,本文研究了捷联
超声速飞行器特别是高超声速飞行器的发展是一个国家国防实力的重要体现,因此,发达国家投入大量的物力和财力开展超声速飞行器的研究。超声速飞行器进入大气层高速飞行的过程中
近年来,脑卒中患者逐年增加,导致越来越多的患者受到不同程度的运动功能障碍的折磨,因此,实现切实有效的康复治疗成为当今的研究热点。而脑机接口技术作为近年来新兴的技术,
统计学习理论在低维独立同分布采样的数据上面有很好的理论性质及应用效果。随着应用层面的扩大,结构化数据以及有各种复杂约束的数据集合层出不穷。研究人员急需将传统的统计
随着我国社会经济和科技的高速发展,高层建筑不断增多,电梯已成为现代社会生活不可或缺的公共设施。然而在电梯的同常运行中常出现以下现象:电梯门打开,却无人候梯;轿厢空间已满,电
同时定位与地图构建(Simultaneous Localization and Mapping,SLAM)是机器人导航中的重要研究内容,其中实时定位与三维地图构建(3D-SLAM)是目前的国内外一个重要研究方向。随
钢铁生产是一个多阶段过程,每个生产阶段存在多条并行产线,每条生产线前是其原料库,用于存放原料,其后是产品库,用于存放加工的产品,考虑钢铁生产具有启停费用高,生产连续等
化工过程一般为指数1型广义非线性系统,本论文针对催化裂化提升管反应器装置设计了指数1型广义非线性状态观测器,对油品产率、催化剂循环量等不可测变量进行在线观测。论文主