面向多场景的社会化媒体兴趣点推荐研究

来源 :北京交通大学 | 被引量 : 0次 | 上传用户:wcf2009
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
社会化媒体指基于互联网的、允许用户以创建和分享信息来进行社会交互的新型媒体。兴趣点数据指一种代表真实地理实体的点状地理空间数据。社会化媒体使得更多的兴趣点得以被发现,丰富了兴趣点数据;兴趣点数据通过地理维度刻画社会化媒体,提供了新的研究视角。社会化媒体的兴起和兴趣点数据的丰富,使得人们在线上的交互和线下的活动逐渐趋向于融合,互联网与真实世界的结合变得越来越紧密,社会化媒体兴趣点推荐由此成为热点问题。在深入了解用户出行模式并充分挖掘用户偏好的基础上,社会化媒体兴趣点推荐一方面能够向用户提供建议,帮助其了解感兴趣的场所和地点,从而提升社会化媒体的服务水平;另一方面将场所和地点通过社会化媒体平台展现给潜在用户,实现相关企业的精准营销,从而获得用户和企业的双赢。社会化媒体具有其独特的属性和结构,表现为如下三个方面:(1)丰富的信息,即社会化媒体中具有大量不同种类的实体,从而形成了不同结构的上下文信息;(2)复杂的关系,即不同种类的多个实体之间交互行为产生了不同的关系;(3)各异的场景,即丰富的信息和复杂的关系反映了用户的不同需求。社会化媒体的空前繁荣,使得社会化媒体营销能够加强企业与用户之间的互动,从而帮助企业取得市场优势。目前,社会化媒体营销已成为众商家最重要的营销手段之一,也为社会化媒体兴趣点推荐提供了前所未有的市场机会和应用前景。兴趣点数据反映了地理实体所承载的人类活动以及人类活动与地理位置的相关性。随着研究的不断深入,本文认为基于兴趣点数据的研究呈现出人地耦合、方法创新与知识协作三大趋势。其中,人地耦合指针对“人-地”系统之间耦合关系的探寻与解析,尤其是兴趣点推荐,已成为兴趣点数据研究的主要发展趋势;方法创新指应用时空聚类特征、时空关联规则以及机器学习、深度学习等方法,进行人地要素多维语义的自动化、智能化分析;知识协作指兴趣点数据需要与社会化媒体数据相结合,深入研究人与环境的相互关系。社会化媒体兴趣点推荐可分为多种场景。本文主要研究面向单一用户的单一兴趣点推荐、面向单一用户的下一个兴趣点推荐以及面向群组的事件兴趣点推荐三类应用较为广泛的场景。现有的社会化媒体兴趣点推荐方法在上述不同场景中对用户的行为建模不够精准,亟需充分挖掘社会化媒体中丰富的信息,充分利用社会化媒体中复杂的关系,完全认识社会化媒体中各异的场景。针对上述问题,本文面向三类场景并利用不同信息,提出了相应的兴趣点推荐算法,从而提高兴趣点推荐效果,并改善用户体验。具体来讲,本文的研究内容如下:1.面向单一用户的单一兴趣点推荐。基于位置的社交网络中具有大量异构数据,很难统一表达其含有的丰富信息;“用户-兴趣点”矩阵非常稀疏,不利于提取其对应的特征。本章对基于位置的社交网络中的地理位置、社交关系以及时间周期三类影响因素进行了综合分析,并提出了一种基于加权异构信息网络的算法进行兴趣点推荐。首先,在分析人类移动行为模式特征的基础上,重点研究了时间周期对兴趣点推荐的影响,并使用8个时间段表示共同访问行为。其次,采用加权元路径对地理位置,社交关系和时间周期三类信息进行融合,在此基础上提出了SVD++&FM模型。最后,基于真实数据集对所提出的算法进行评估。2.面向单一用户的下一个兴趣点推荐。下一个兴趣点推荐指的是预测用户在特定时间段内将访问的下一个兴趣点。用户出行模式受到异构的上下文因素影响,包括连续值(例如,地理距离,时间间隔)和离散值(例如,社交状况,星期状况)。本章采用稀疏共享的结构来产生专家网络,并采用多门混合专家模型来实现多个目标任务之间的参数共享。首先,使用稀疏共享结构针对每个目标任务从基础网络中生成对应的专家网络,并采用迭代幅度剪枝法选择专家网络。其次,多门混合专家模型采用专家网络作为将输入层,每个专家网络对于输入信息的处理具有不同的侧重,并采用多个门网络对任务目标进行专家网络的共享选择。最后,基于真实数据集对所提出的算法进行评估。3.面向群组的事件兴趣点推荐。群组指的是多个用户形成的群体。面向群组的事件兴趣点推荐,涉及到多个实体(如用户,群组,事件,兴趣点等)之间的复杂交互。本章提出了一个基于异构信息网络和深度神经网络的事件兴趣点推荐算法,为事件推荐合适的举办兴趣点。首先,使用了基于优先级的采样技术来选择高质量的路径实例。然后,构建了群组,事件,兴趣点和基于元路径的上下文的嵌入表示,并采用共同注意机制对其进行改进。最后,基于真实数据集对所提出的算法进行评估。基于上述研究内容,本文的创新点概括如下:1.面向单一用户的单一兴趣点推荐。本章对基于位置的社交网络中地理位置、社交关系以及时间周期进行了综合分析,并提出了一种基于加权异构信息网络的算法产生兴趣点推荐。本章采用加权元路径对地理位置、社交关系和时间周期三类信息进行融合,缓解了冷启动与数据稀疏问题;采用SVD++&FM算法,降低了推荐过程的计算成本。基于真实数据集对所提出的算法进行评估,验证了本章方法的有效性和实用性,以及将加权异构信息网络和加权元路径应用于个性化兴趣点推荐的前景。2.面向单一用户的下一个兴趣点推荐。本章基于多任务学习对用户的多种类型行为进行建模,提出了一种基于稀疏共享的多门混合专家模型。稀疏共享结构针对每个目标任务从基础网络中生成对应的专家网络,无需人工设计专家网络,同时使得专家网络更有针对性;多门混合专家模型中每个专家网络对于输入信息的处理具有不同的侧重,改善了由多模态生成的复杂特征空间中的表示学习。基于真实数据集对所提出的算法进行评估,验证了本章方法的有效性和实用性,以及将多任务学习和稀疏结构共享应用于下一个兴趣点推荐的前景。3.面向群组的事件兴趣点推荐。本章对基于事件的社交网络中多个实体及其交互进行了综合考虑,提出了一个基于异构信息网络和注意神经网络的事件兴趣点推荐算法。首先,使用了基于优先级的采样技术来选择高质量的路径实例。然后,构建了群组、事件、兴趣点和基于元路径的上下文的嵌入表示,并采用共同注意机制对其进行改进,从而增强了模型的可解释性。基于真实数据集的实验结果,验证了本章方法的有效性和实用性,以及将异构信息网络和注意神经网络应用于事件兴趣点推荐的前景。
其他文献
逻辑回归是一类非线性回归模型,作为一种重要有效的分类工具,在机器学习、数据挖掘、模式识别、医学和统计等领域都有着广泛的应用.近些年来,由于实际问题产生的数据规模不断扩大,但仅有部分特征起到作用,这导致大规模稀疏逻辑回归问题的产生.同时数据规模大、数据的不确定性、约束复杂等原因给计算带来了不小的挑战,因此发展设计快速有效的算法来解决稀疏逻辑回归问题是非常有必要的.本文基于最近几年对统计学中的变量选择
基于视频智能分析的异物入侵检测是铁路周界安全监测与防范领域的重要技术手段,对保障铁路行车安全具有重要意义。近年来,随着深度学习技术的快速发展,基于卷积神经网络等深度神经网络的视频分析算法极大提升了检测性能,但由于深度神经网络存在复杂度高、训练耗时长、计算和存储量大、对硬件需求高等问题,无法在具有大量监控相机的铁路周界安防系统中广泛应用。为此,论文研究卷积神经网络剪枝、压缩训练、网络架构自动优化等系
铁路是国民经济大动脉、关键基础设施和重大民生工程,在我国经济社会发展中具有重要作用和地位。近年来,围绕交通强国建设目标,铁路工程建设规模庞大,施工招投标市场活跃,已纳入公共资源交易市场的铁路工程施工招标项目均不同程度采用了电子招投标形式,传统招投标监管方式难以满足监管需求,监管方式亟需创新以提高监管效能。大数据技术作为创新监管方式的一个重要着力点,电子招投标过程中积累的海量数据奠定了数据基础,研究
学位
伴随20世纪后半叶第三次科技革命的到来,人类社会在微电子计算机技术与网络信息技术的推动下步入了信息化时代。以网络媒体为代表的信息技术变革直接影响了以信息传递为基础的社会交往方式,信息传播、交往和分享的程度被网络媒体无限放大。天然的意识形态属性决定了网络媒体不仅成为各种社会思潮和利益诉求的集散地,也成为我们开展宣传思想工作的全新载体。然而,网络媒体的发展是与其商品化进程息息相关的。商品化一方面加快了
电磁泄漏发射是信息安全领域破坏信息保密性的一种重要风险,而传导泄漏发射是电磁泄漏发射研究领域中的一个关键问题。相对于自由空间辐射的泄漏发射,对传导泄漏发射的机理和传播规律的认识还存在不足。随着高速器件的快速发展,信息技术设备的数字信号频率越来越高,泄漏发射的频率范围也越来越宽,测试设备的发展远远不能适应评估泄漏发射风险的需要,已有的电磁兼容测试方法和手段还不能有效测试评估传导泄漏发射风险,特别是测
镉基半导体量子点是最有潜力的下一代发光材料之一。但目前,镉元素的污染性和毒性大大限制了其发展。因此大量的科学研究工作开始集中到了绿色无毒或低毒的量子点的可控合成和提升无镉量子点电致发光二极管器件性能上来。而多元铜基硫族半导体量子点作为镉基量子点材料的替代者之一,其具有低毒性和元素来源广泛的优点,但是其光致和电致发光性能还不能与镉基量子点相媲美,因此寻求提升多元铜基硫族量子点发光性能的策略,进一步提
大型养路机械捣固维修作业是各国铁路工务部门为改善有砟轨道的轨道几何状态而采用的最主要、最有效的维修方式,也是成本最高的轨道维修作业之一。目前,我国铁路主要采取“周期修”的捣固维修模式。随着路网规模的不断扩大、列车速度的高速化、列车载荷的重载化,传统的捣固维修模式已经难以满足铁路运输对轨道状态安全性、稳定性、可靠性的要求,以及管理者在维修成本控制方面的迫切需求。因此,我国铁路捣固维修模式正逐步由“周
一、前言边塞诗,发端于《诗经》,形成于南朝,繁荣于唐代,新变于两宋。举凡书写边塞有关之诗篇,如从军出塞、守土卫边;遣使北国、沦落异域者皆属之。上自政治、经济、军事、外交,下自风土、民心、国恩、亲情,皆可挥洒入诗。或叙事,或记游,或怀古,或抒情,多交
会议
随着城市轨道交通线网规模的快速扩张和客流量的急剧增加,线网客流的时空分布日趋复杂,高峰时段供需不平衡问题愈加突出,部分车站客流超过设计能力,常态化限流车站逐步增加,系统安全运营和应急管理面临巨大挑战。大数据、人工智能等技术的兴起为应对现实挑战提供了解决思路,促使轨道交通逐渐向智慧轨道交通生态的方向发展。短时客流预测是构建智慧轨道交通生态的基础研究内容,然而既有相关研究存在预测精度较低、系统性较弱、