基于深度学习的在线问答社区问题标签推荐研究

来源 :重庆大学 | 被引量 : 0次 | 上传用户:ip81890
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着互联网技术的高速发展,人们对信息的获取日益便捷,各种信息分享平台不断出现。在线问答社区在此背景下应运而生,并且吸引了越来越多的用户,已经逐渐成为人们获取和分享信息的一种重要平台。在线问答社区蓬勃发展的同时,每天都会产生大量的新问题,为了能够有效地管理、组织这些问题数据,社区采用了标签这一大众分类的方式,为每个问题赋予一个或多个标签反映问题的主题。标签不同于一般的目录结构自顶向下的层次分类方法,各个标签之间是一种平行的关系,它以较少的代价细化分类。在线问答社区通过将问题标签化,有效地解决了问题资源管理的问题。目前在线问答社区问题标签由用户提出问题时给定,由于用户本身不同的知识背景,往往不能准确快速的选出合适且全面的标签来描述问题。为了解决这个问题,一些标签推荐方法被提出,旨在为用户在提问时推荐一系列高质量的标签供其选择,提高问题标注的效率和准确性。本文提出基于深度学习的标签推荐模型,运用深度学习的方法提取问题的语义特征对在线问答社区进行标签推荐工作,并且采用数据增强的方法提升模型性能,除此之外还提出基于深度学习模型的融合模型。本文的主要工作内容如下:(1)阐述了在线问答社区的问题标签推荐的研究背景和意义,分析了国内外研究现状,总结目前的研究方法及其优缺点,并研究了相关的理论和技术。(2)选取了合适的数据对象,并对数据进行解析提取,预处理和词向量训练,为本文研究的问题提供基础数据的支撑。(3)构建了三种基于深度学习的标签推荐模型,包括基于卷积神经网络的模型、基于长短时记忆网络的模型以及基于卷积循环神经网络的模型,研究了参数对于模型的影响,对比了深度学习模型与传统方法的标签推荐效果。(4)采用了数据增强的方法训练模型以及提出了融合模型,通过实验探究了它们的标签推荐效果。本文的实验结果表明,基于深度学习的标签推荐模型与传统推荐方法相比,推荐标签的准确率,召回率和F1值都有明显的提升。同时,采用数据增强的方法可以进一步提升模型的性能,融合模型的标签推荐性能比三种基本模型更好。
其他文献
三七是我国特有的名贵中药材,其中以云南省产量居多,三七具有止血、定痛、保护肝脏的药理作用,同时对心脑血管疾病预防有显著疗效。随着云南省三七产业的快速发展,市场需求量
利用机器人遍历多边形区域的online探索问题是计算几何学和机器人学的经典问题,本文研究平面网格多边形的online探索问题,研究目标是在机器人视距受限的情形下找到遍历给定多
近年来,我国的城市化进程获得了快速发展,城市格局也发生了深刻变革,城市发展对自然资源的过度依靠致使城市问题愈发严重,城市生态环境整体功能降低,阻碍了城市的可持续发展
模块化多电平换流器(MMC)是柔性直流输电系统里一种新型的灵活输电形式,广泛应用于柔性直流输电工程和其它中高压技术领域。MMC是由大量子模块级联而成,一旦发生故障,会严重
番茄营养丰富,味道鲜美,是世界上栽培面积最大的蔬菜之一。在逐渐重视品质与营养的当今社会,研究番茄生长规律和与环境的交互作用具有重要的理论与实践作用。根据作物生长过
海上浮动核电站是核电工程和海洋工程的结合,具有复杂、高效、灵活、经济等优点,可在不同海域灵活部署以达到能源供给,是理想的海洋开发的能源保障。为满足现代能源的需求,我
为了评价不同品系密枝类型柽柳的抗寒性差异,在-16℃、-24℃、-32℃、-40℃、-48℃、-56℃、-64℃、-72℃等8个低温梯度下,采用随机区组试验设计,以中华柽柳为对照,测定了11
华北落叶松是我国华北地区营造经济生态林的重要树种,具有生长快、材质好、用途广等优良品质。我国上个世纪六十年代至七十年代开始营造落叶松种子园,为良种推广和研究其遗传
移动机器人的定位导航是机器人领域重要的研究课题之一,决定了移动机器人的智能化程度。传统移动机器人定位导航方式有着依赖外部辅助设备,路线固定等问题,如何实现更智能的
云南是一个农业大省,其中蔗糖产业是仅次于烟草行业的第二大高原特色农业。甘蔗作为一种喜热喜光的农作物,得益于云南较大的海拔差造就的长时间日照,云南生长出的甘蔗糖分充