【摘 要】
:
随着互联网应用的普及,各类在线社区不断涌现,而社区内的用户生成内容也爆发式增长。伴随“互联网+健康医疗”战略的推进,在线健康社区取得蓬勃发展,大量互联网用户活跃其中,用户的交互行为生成了大量的文本数据,这为研究者提供了丰富的研究内容。在线健康社区用户参与到社区中最主要的目的是获取所需的健康信息和知识,为了帮助用户快速获取所需的信息和知识,本研究提出一种用户生成内容主题挖掘模型,并根据主题挖掘结果进
论文部分内容阅读
随着互联网应用的普及,各类在线社区不断涌现,而社区内的用户生成内容也爆发式增长。伴随“互联网+健康医疗”战略的推进,在线健康社区取得蓬勃发展,大量互联网用户活跃其中,用户的交互行为生成了大量的文本数据,这为研究者提供了丰富的研究内容。在线健康社区用户参与到社区中最主要的目的是获取所需的健康信息和知识,为了帮助用户快速获取所需的信息和知识,本研究提出一种用户生成内容主题挖掘模型,并根据主题挖掘结果进一步构建主题网络,为社区用户提供系统化的健康信息和知识,同时依据链路预测方法预测主题网络中可能产生关联的主题,帮助社区用户完善自身的健康知识系统,最终获得所需的健康信息和知识。首先以在线健康社区用户生成内容为研究对象,结合在线健康社区用户的健康信息与知识需求,针对传统的LDA主题模型在进行主题挖掘时没有考虑信息质量这一不足,研究在线健康信息质量评价体系,并对网络健康信息进行质量加权,在LDA主题模型的基础上建立Q-LDA主题挖掘模型,增强模型的主题表示能力。然后依据Q-LDA主题模型的挖掘结果,通过改进的GED算法计算各主题内容之间的相似程度,并将内容之间的相似程度定义为紧密度,以紧密度为边权构建主题网络。最后,针对链路预测基于节点局部信息的相似度指标在计算时没有充分考虑网络结构特征的不足,结合构建的在线健康社区主题网络的结构特征,依据主共同邻居主题节点之间紧密度与相互之间联系的复杂度构建基于共同邻居节点链接紧密度的链路预测相似性指标LTCN,提出一种有效的在线健康社区潜在关联主题发现方法,通过预测主题关联帮助在线健康社区用户进一步完善自身的健康知识系统。经过实例验证,本研究所构建的Q-LDA模型的结果可解释性和主题表达能力优于传统的LDA主题模型,其主题挖掘效率提高了 16%,能够更有效地挖掘网络健康社区信息所隐藏的主题。在为用户提供系统化的健康信息的基础上,通过构建的基于共同邻居节点链接紧密度的链路预测相似性指标LTCN可以有效提高在线健康社区主题关联预测精度,其结果可以有效帮助社区用完善自身的健康知识体系。在线健康社区的相关运营企业在进行用户个性化推荐、定向广告投放等运营活动时可以根据主题挖掘结果以及主题关联分析进一步提高推荐或者投放精度。
其他文献
伴随着经济全球化与国内经济的快速发展,国际产业资本控股A股上市公司的事件开始变多。理论上,通过输出优质技术、管理理念、运营经验等方式,外资控股国内上市企业后可以帮助
褐环粘盖牛肝菌(Suillus luteus(L.:Fr.)Gray)是一种分布比较广泛的外生菌根真菌,能够与松科等植物互利共生,还能改善土壤环境、增加植物对水份及营养物质的吸收。该菌生长的
在统计分析中,经典的回归模型已经不能用来刻画越来越接近实际的混合数据.针对现实生活中存在大量的混合数据,多元统计分析中的聚类分析方法是分析混合数据的重要统计工具之
时滞微分方程是具有时间滞后的微分方程,它用于描述既依赖当前状态,又依赖过去历史的动力系统.由于充分考虑了历史对当前状态的影响,它在物理、化学、工程、信息、经济,特别
纤维素酶是一种复合酶,分解纤维素时起生物催化作用,广泛存在于自然界的生物体内。一般用于生产纤维素酶的菌株主要为丝状真菌,产生外切葡聚糖酶、内切葡聚糖酶和p一葡萄糖苷
磷脂酶A1广泛存在于生物体内,并参与生物体内多种生理功能的调节,是一类可以水解磷脂的酶,其水解产物溶血磷脂可以作为食品添加剂和乳化剂等,广泛应用于食品加工、油脂脱胶、
随着集成电路测试成本越来越高,成本管控能力成为封装测试厂的核心竞争力。本文针对NAND FLASH存储器测试,提供了具有实际意义的良率提升和测试时间优化的方案。在良率提升方
近年来,饮食结构与营养摄入造成的健康隐患,成为了全世界范围内的重大问题。作为营养健康研究的重要一环,我国居民膳食结构与营养数据采集分析方法还存在着诸多不足,如何结合现有科技手段建立一个便捷准确的营养数据采集分析平台成为了一个亟需解决的重要课题。而随着移动互联网的不断发展与移动终端的快速完善,智能手机在人们生活中扮演着越来越重要的角色,如何将移动互联网应用于营养健康领域值得深思。基于以上问题与现状,
立德树人是教育的核心问题,职业素养是中等职业学校教育工作的重要内容。德育课程是中等职业学校德育工作的主要载体,是提升职业素养的重要途径,基于职业素养培养的德育课程改革是中职教育的关键问题。但是,当前中等职业学校德育课程还存在着教学内容与职业需求脱节、教学模式与学生身心特点不相适应、德育内容缺乏职业特色、教学方法的实践性差、德育课程的地位边缘化等问题。中等职业学校的德育课程还不能有效助推学生职业素养
土壤重金属含量高低直接影响人们生命安全及相关部门管理决策。对于土壤调查获取的重金属数据中,由于数据错误或实际含量异常等往往使得其表现出与其邻域范围内数据存在显著差异,因此有必要对土壤重金属数据进行异常识别,用以指导后续科学处理以达到消除或削弱异常数据的影响。目前针对异常值检测研究主要从属性值,时间及空间三方面进行考虑。其中基于属性数据利用传统统计指标的方法仅能够识别属性值的全局异常;基于空间邻域的