基于多模态的用户画像系统

来源 :北京邮电大学 | 被引量 : 3次 | 上传用户:www752169
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着互联网的蓬勃发展,多样化的社交媒体网络应运而生。用户在不同的社交媒体平台留下了丰富的用户信息和海量的结构化与非结构化数据,而且这些数据是用户自发产生的,具有很高的真实度和多样性。通过对用户产生的多源多模态数据进行综合分析,能更准确、全面地理解用户画像。本文主要从跨平台的角度对多源的社交媒体网络进行了分析,以用户为纽带深入挖掘和提炼跨平台数据中的联合信息,提高多源数据的利用率,同时引入人格维度,构建更丰富的用户画像。本文的主要工作如下。1.关联用户在新浪微博和网易云音乐两个社交平台的账号,通过爬虫技术爬取用户在不同平台产生的数据,包括微博文本、个人信息、喜欢的音乐等多种结构化和非结构化数据,并通过文本清洗、标签提取、偏好聚类等方法,构建规则整齐的多源多模态真实社交数据集。2.基于SC-LIWC字典提取用户微博文本中心理学词频特征,建立用户人格映射分词模型,采用基于微博文本的CNN线性回归网络计算用户大五人格,摆脱了传统的基于调查问卷的获取用户人格的束缚。同时分析用户人格与用户属性、用户行为和微博标签之间的关系,构建微博画像。3.基于音乐标签计算用户音乐类别偏好和音乐情绪偏好,并用K-均值法将用户的音乐偏好进行聚类,得到五个典型音乐类别偏好和四个典型音乐情绪偏好。训练基于音乐标签的线性回归人格计算模型,分析用户的音乐偏好与用户人格、属性特征之间的联系,实现跨平台、多模态数据的深层联合建模,得到全面的用户画像。4.基于Flask框架对多模态的用户画像进行可视化展现,使结果更直观,完成整个基于多模态的用户画像分析系统。
其他文献
本研究运用问卷调查法、访谈法、文献资料法等研究方法,对连云港市大专及以上高校包括淮海工学院、南京医科大学康达学院、连云港市中等师范专业学校、连云港市财经职业技术
<正> 经营盈亏分析,是探索并确定企业经营益损的分歧点,指导企业营销活动,避亏增盈的一种科学决策方法。经营分析正确与否,关系到企业在一定时期内的命运。盈亏分析正确,决策
用八角烘干机、高炉烘房对八角鲜果进行烘干试验。试验结果表明:八角烘干机干燥的干果芳香油含量高,水分含量、碎口率与杀青晒干差异不显著,烘干时间7h~8h;高炉烘房烘干的干果,芳香油、
<正> 心性关系问题是宋代理学讨论的核心问题,理学之所以被称为心性之学,是因为心性论在宋代理学范畴和理论体系中占有十分重要的地位,它充分体现了宋代理学乃至整个中国哲学
化学观念、实验探究和科学的态度与责任是化学学科核心素养的基本内容。高中化学教师要在指导学生对基本化学知识理解和掌握的基础上,注重对学生核心素养的培养,通过创设科学
目的:比较全程参与式与传统教学方式的优劣。方法:招募2017年1月至10月在我院骨科实习的医生。随机分为全程参与式教学组与传统教学组,比较两组实习医生各项考核指标。结果:
以某工程为例,详细分析了地铁深基坑支护和土方开挖施工过程中的要点,并提出了施工过程中需要注意的问题,以保证施工质量,推动地铁工程的顺利实施。
目的探讨克雅病医院感染预防控制措施及实施效果。方法对收治的1例疑似克雅病患者制定以隔离传染源、严格消毒传播介质和焚烧医疗废物、医务人员落实标准预防的院感综合防控
在互联网高度发达的今天,网络传播的信息繁多,对当今社会的影响也日益凸显。在充分认识互联网信息传播的特点和优势之外,更要深刻认识网络信息传播与安全治理的艰巨性。应对