基于图文语义关联的微傅关键词抽取方法研究

来源 :武汉科技大学 | 被引量 : 0次 | 上传用户:chunhuaqiuyue
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
关键词抽取是抽取一篇文章中的几个核心词汇以表示文章主题的技术。随着互联网的高速发展,网络上的信息呈指数级增长,如何快速高效地访问信息变得困难,而关键词可以帮助人们快速地了解一篇文章的核心内容。同时,关键词抽取在文本分类、文本聚类、信息检索等方面也有着十分重要的作用。如今,互联网上的信息大多以多源方式呈现,如新闻文本周围通常会有图片,微博往往也会配有图片,图片新闻或微博也更容易获取人们的关注。前人对关键词的研究大多是基于文本的,本文旨在研究使用图文语义关联信息来改进微博关键词的抽取。网络上获取的图文微博数据中图片和文本并非一定相关,本文首先提出了图文语义关联关系的识别方法,而后提出了基于图文语义关联信息的图文微博关键词抽取方法。在图文语义关联关系识别中,本文通过提取微博的文本特征、社会特征和图文语义相似度特征,将关联关系识别转化为一个二分类问题,使用机器学习分类模型进行关联关系识别。识别模型选用了BP神经网络、朴素贝叶斯和逻辑回归三种进行对比。实验结果表明,使用BP神经网络结合Word-Embedding方法计算的图文语义相似度特征,并加入文本特征和社会特征后识别效果最好。在基于图文语义关联的微博关键词抽取过程中,使用TFIDF、Text Rank和朴素贝叶斯方法计算得到文本候选词权重,而后使用图文语义关联信息对候选词进行相应语义加权,按权重排序得到微博关键词。实验结果表明,使用TFIDF方法提取微博关键词效果较好,加入图文语义关联信息后,结果有明显提高。
其他文献
目标检测是计算机视觉领域中非常重要的任务,当前许多目标检测方法都采用了anchor boxes作为回归参考。然而,检测器的精度对anchor boxes的具体设置非常敏感,当我们把这些检
在爆轰发动机的研发与应用过程中,如何获得稳定的爆轰波是其中极其重要的环节。而如何在小能量、短距离内获得爆轰波更是成为研究的重点。相较于其他的起爆方式,通过障碍物管
损伤识别是结构健康监测系统中的核心内容,对于大型工程结构的安全预警、寿命评定、维修加固有着重要作用。实际工程中,由于传感器数量、测量条件等限制,只能对有限测点进行
柴达木循环经济试验区(以下简称“试验区”)是我国西部重要的资源开发区,在全国生态格局中的影响大、贡献大、责任大、价值大,具有维护国家生态屏障和实现区域经济社会可持续发展的重要意义。但目前试验区资源型企业“大”而不“强”,作为生态行为实践的主体,其发展呈现出高投入、高能耗、高污染等特征,严重阻碍了试验区循环可持续发展。当前无论是从国家层面还是区域层面对产业生态化的关注度越来越高,但从行为实践视角对微
在经济全球化的大环境下,各国之间的竞争也愈演愈烈,像中国这样的发展中国家继续以往的成本优势已经很难在国际市场上维持,技术水平已经成为一个国家或企业的核心竞争力,在获
青藏高原独特的气候对极端生境微生物资源的开发提供了平台,青海省是我国最大的草地畜牧业生产基地,草业的可持续发展极为重要。本研究以青海省极端生境芽孢杆菌(Bacillus spp.)、高原牧草梭罗草(Kengyilia thoroldiana)为研究对象。分离筛选极端生境芽孢杆菌,筛选优质芽孢杆菌菌源,建立芽孢杆菌促梭罗草生长最佳互作体系,通过转录组测序分析探究梭罗草对芽孢杆菌的应答反应,揭示生防芽
目的研究芪归相须干预肿瘤恶病质的效应及最佳配伍比例,并对机制进行探讨。给中医治疗肿瘤恶病质的理论提供现代实验数据支撑,为临床诊疗提供新思路。方法1.芪归相须干预肿瘤恶质的效应:将48只小鼠分为空白组、模型组、阳性组、黄芪当归5:1组、黄芪当归1:1组、黄芪当归1:5组,造模(小鼠右侧腋下种植CT-26细胞,观察小鼠一般情况,摄食量,体重下降率等),评价模型成功后,药物干预12天,取小鼠腓肠肌,观察
随着柴油机燃油共轨系统喷射压力的不断提高,世界主流喷油器公司陆续推出了喷射压力200MPa甚至更高轨压的燃油喷射系统。喷射压力的提升增加了喷孔内部射流的湍动强度,致使喷
美容业是我国传统的服务业,深入到老百姓的日常生活中,改革开放以来我国经济发展迅速人们生活水平日趋升高,美容业也顺势而动,呈现出一往直前的态势。2008年金融危机以来,我
为探求黑土滩人工草地向高寒草甸演替趋势和进程,以高山嵩草斑块为研究对象,在果洛州玛沁县,选择2000年、2004年、2007年、2017年建植的黑土滩人工草地,同时以黑土滩为对照,在样地中设置3个直径为15m的样圆,测量样圆中高山嵩草斑块面积,分析斑块分蘖特征,人工草地群落和土壤特征,以及不同年限黑土滩人工草地中高山嵩草斑块的分布、扩展、生物及生态学特征,研究黑土滩人工草地的演替趋势与进程,为黑土