基于网络嵌入的领英账号分类方法研究

来源 :电子科技大学 | 被引量 : 0次 | 上传用户:chad
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
领英作为全球最大的职场社交媒体平台,用户在平台上可以更新个人的职业档案、寻找职业发展机会以及与其他用户进行互动交流等。对领英用户账号进行分类,对领英平台而言,有助于更精准地投放广告以及开展相似用户的推荐服务,也可以对用户构成情况进一步分析,把握人力市场供求关系的状态;对用户而言,通过领英平台的推荐服务能够扩展自己的社交网络,获得更多的职业发展机会。现有的研究表明,用户的属性信息和用户在关系网络中的特征能够有效提高用户分类的准确性。然而,领英用户间交互联系较少,无法有效的构建用户关系网络。领英用户属性信息丰富,且较真实可靠,因此,本文基于领英账号的属性数据构建了特征词共现网络,提出基于网络嵌入的账号分类方法。本文的主要工作和贡献有以下几个方面:第一,针对领英账号之间交互较少,难以通过账号之间的交互联系来进行账号分类的问题,本文通过构建属性特征词共现网络来挖掘领英用户账号间的相似性。本文以用户账号为节点,以用户账号之间属性的特征词共现关系为边,构建属性特征词共现网络,通过对复杂网络的分析来挖掘领英账号间的相似性,为后续账号分类打下基础。第二,针对传统账号分类研究中表征用户账号不全面的问题,本文提出一种新的表征用户账号的特征选择方法。首先引入基于谱图小波的网络嵌入表示方法,挖掘账号节点在特征词共现网络中的结构特征,然后与账号的固有属性特征聚合,即账号的词特征、文本特征和网络结构特征一起作为新的特征来表征账号,实验结果验证了该方法的有效性。第三,为了综合考虑属性信息在网络嵌入表示中对用户账号节点的影响,本文提出一种融合属性信息的网络嵌入表示方法,并将其应用在领英账号分类研究中。首先针对不同的特征词共现网络提出不同的边权值计算方式,然后将用户账户属性与特征词共现网络融合,采用适合特征词共现网络的随机游走策略捕捉节点的网络结构,最后通过Skip-gram模型获得融合了账号属性信息的节点向量化表示,挖掘用户账号的网络结构特征。在领英账号数据集上的实验结果表明,该方法能够有效挖掘用户账号特征,提高领英账号分类的准确率。
其他文献
交易型开放式指数基金(ETF)与期货的结合是对投资品种的再丰富,扩充了资产配置工具包,使基金与期货相辅相成,不管是对基金市场的发展还是期货市场的发展,都产生了极大的推动
二十一世纪,语文学科的学习面向的是更广阔的世界,不再是单纯的语文知识的学习,语文课程充分体现出其开放性。语文名著导读已成为初中语文课本的一个重要内容之一。它并不是
进入21世纪,我国商业地产进入高速发展期,同时由于商业地产是属于资本密集型性的行业,商业地产的特点就是项目投资期较长,投资金额较大,经营风险比较高,稳定的资金支持是商业
目的:观察并分析贝那鲁肽联合CSII治疗2型糖尿病合并代谢综合征的各项临床指标的变化,评价贝那鲁肽治疗的有效性和安全性,为临床上治疗2型糖尿病合并代谢综合征提供循证医学证据。方法:收集2017年12月至2019年5月就诊于吉林大学第二医院内分泌科符合入组标准的2型糖尿病合并代谢综合征患者。将入组患者随机均分为三组,分别命名为A、B、C组,A、B组为实验组,C组为对照组。A组给予贝那鲁肽联合胰岛素泵
阅读和写作都是初中语文教学的重点部分。同时对学生来说也是两个比较难以掌握的内容,但是不管是在教和学的过程中,两者都是相辅相成、不可分离。为了提高学生的阅读能力和写
目前,我国社会转型的加剧导致群体性冲突增加,社会问题明显增多,公安机关行政执法过程中,过度依赖行政手段难以高效解决发展过程中遇到的问题,未解决的不稳定因素又将产生新
弹幕是青少年热捧的网络符号,他们的喜爱程度与自我表现不仅仅局限在屏幕上方短暂的几秒钟,更体现在由弹幕衍生出的新场所。故本文选用弹幕群聊室作为考察地点,运用网络民族
在我国经济水平高速发展的背景下,国民消费水平逐年提升,消费结构不断完善。国民的消费目的从“物质消费”逐渐转向至“精神消费”,这极大地促进了我国文化创意产业的发展。