基于深度语义的文本标签推荐方法研究

来源 :湖南科技大学 | 被引量 : 0次 | 上传用户:qwerty_123asd
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着信息时代的发展,网络上的数据信息海量增长,用户在搜索想要的信息时通常效率较低且十分耗时。标签是对信息的简单描述,为文本推荐合适的标签是组织和使用文本内容的一项有效手段,近年来越来越受到研究人员重视。目前现有的标签推荐方法研究主要分为基于传统语义的标签推荐方法和基于深度语义的标签推荐方法。基于传统语义的标签推荐方法一般是通过基于人工提取特征进行文本语义挖掘,推荐效果不尽人意。近年来,随着深度神经网络的迅速发展,使用其提取文本特征可以有效地挖掘文本的深度语义,从而解决传统文本标签推荐方法面临的诸多问题,因此受到了越来越多的重视,成为了近期的研究热点。目前大部分基于深度语义的标签推荐方法主要是通过挖掘文本内容中的深度语义来进行推荐。然而,大部分数据信息并非独立存在,如语料库中的文本间词共现关系可形成复杂的网络结构。由于该类方法仅仅考虑了文本内容信息,忽视了文本间的网络结构信息,从而影响了标签推荐的准确性。同时,目前常用于标签推荐的深度神经网络模型主要为卷积神经网络和循环神经网络,忽略了其他更为合适的模型,如语言模型和预训练模型等。针对上述问题,本文在已有研究工作的基础上,主要做了以下两个方面的工作。1、本文提出了一种融合网络结构信息与文本内容的标签推荐方法。该方法首先将文本与词汇作为节点构建异构文本图,利用图卷积神经网络提取文本间网络结构特征;然后利用循环神经网络模型对文本特征进行编码以获取文本顺序语义特征;最后利用注意力机制融合文本间网络结构特征与文本顺序语义特征进行标签推荐。实验结果表明,该方法可以有效改善标签推荐的效果。2、本文提出了一种基于Transformer结构的标签推荐方法。该方法将文本与每个候选标签组成文本-标签对,并对文本-标签对进行编码,以捕获基本的匹配关系;然后使用自注意力掩码矩阵,通过预训练好的大型语言模型,将标签推荐任务作为下游任务进行处理。实验表明,该方法明显优于目前大多数基于深度语义的标签推荐方法。
其他文献
由于疲劳断裂的隐秘性和突发性,疲劳损伤一直是影响铝合金构件服役安全的关键问题。大量的研究表明,服役环境是影响铝合金疲劳损伤一个重要因素。而目前国内外主要针对铝合金在温度、腐蚀介质、湿度和气氛环境等方面展开了研究,但在粉尘环境对铝合金疲劳损伤行为的影响还鲜有报道。本文研究了实地环境粉尘对7N01-T6铝合金疲劳裂纹扩展行为的影响。结果表明:(1)在裂纹扩展前中期,扬尘、煤尘和矿尘粉尘颗粒能降低铝合金
学位
森林脑炎又称蜱传脑炎,已被列为中国五大职业性传染病之一,是由携带森林脑炎病毒(Tick-borne encephalitis virus,TBEV)的蜱虫叮咬后所致。在我国的发病率呈上升趋势,据研究统计,森林脑炎在我国东北的发病率高达80%,致死率约为10-20%。森林脑炎治疗没有特效药物,因此需要我们进一步研究该病毒的特点,从而加快TBEV相关疫苗和抗病毒药物的开发。本论文重点构建5种TBEV重
学位
绝热剪切带是金属柱壳在高应变率坍塌实验中常见的损伤形式,关于其形成机理的研究,一直是固体力学研究和材料科学领域颇受重视的理论和实践课题之一。本文采用外爆加载厚壁圆筒坍塌实验技术,结合表面处理技术、微结构表征技术及剪切带理论模型分析,研究了表面粗糙度对两种组织钛合金柱壳多重剪切带自组织行为影响的细观动力学规律。主要结论如下:(1)表面粗糙度对TC4和TA7钛合金柱壳中多重剪切带的自组织行为具有影响。
学位
为了建立能够猪瘟病毒(Classical swine fever virus, CSFV)和非洲猪瘟病毒(African swine fever virus, ASFV)双重荧光定量PCR方法,试验比对了CSFV与ASFV的基因组序列,针对CSFV 5′-UTR和ASFV B646L保守靶序列,分别设计2条特异性引物及1条TaqMan探针,通过优化扩增体系和程序,建立可同时检测CSFV和ASFV的
期刊
镁合金具有密度低、比强度和比刚度高等优点而广泛应用于武器、航天航空以及交通运输等领域。镁合金零部件应用在这些领域不可避免的要承受中高温高速冲击载荷,而镁合金的低屈服强度限制了它的应用。研究发现,预孪晶可以提高镁合金强度。因此,研究预孪晶镁合金在中高温高速冲击载荷下的变形机理很有意义。本文通过预变形引入不同孪晶密度的AZ31镁合金,同时对比了不同孪晶密度的AZ31镁合金在中高温高速冲击载荷下的力学行
学位
食品是人们赖以生存的必需品,食品安全关乎到人类健康及社会经济的发展。随着人们生活水平的提高,科学技术的进步,对食品污染物的快速检测成为热门的研究领域。黄曲霉毒素B1(Aflatoxin B1,AFB1)是一类具有致癌、致畸、致突变作用的化合物,可以污染多种食品,有研究表明,长期摄入AFB1会导致人畜罹患癌症。由于AFB1分布广、毒性强、危害大,所以目前用于检测AFB1的方法有很多,但这些检测方法也
学位
DRG支付方式改革为当前公立医院成本核算提供了新的思路与方向,本文对DRG成本核算三种常用方法——自上而下核算法、自下而上核算法、成本收入比法进行了详细阐述,明确原理与计算步骤。通过比较三种方法的优缺点,建议公立医院应结合实际情况对核算方法做出选择,不断优化成本核算方法,增强管理效率。
期刊
细胞计数在生物学、细胞学以及医学等领域中是一项基础而又重要的工作。细胞计数是为了检测特定体积的细胞样品中细胞的数量,并以此作为细胞增殖能力、生物个体的健康状况等指标的重要评判手段,因此,实现细胞计数的自动化具有重要的研究意义。本文主要结合光学、机械、电子、计算机、生物等多学科交叉研究,设计并开发出了一项可自动对焦的全自动显微细胞计数系统,其主要应用于明视场环境下,实现对细胞悬液中细胞的自动计数。该
学位
为解决顶管综合管廊工程中的功能区间布置、标准断面布置、综合井布置、支架布置等有别于传统管道顶管工程中的技术难点,提出将综合管廊建设技术与顶管技术合理结合的方法。依托湖北省黄冈市中心城区新港北路长距离顶管综合管廊工程,对顶管管廊总体布置、断面设计、施工期顶管井、使用期功能井、管节与接头等技术方案进行分析,并对长距离顶管综合管廊功能区间设计、多功能复合的工作井、基于管廊特点的顶管设计以及管线支架等关键
期刊
随着无人驾驶相关技术的发展和人们的关注,无人车可能成为未来网约车平台的主流车型,仅仅根据实时订单需求和路网现势数据很难高效运营无人车,然而网约车历史轨迹和订单数据充分反映了城市路网运行和居民出行的规律。因此,本文融合上述相关数据与实际环境数据以开展无人车智能运营的研究工作,包含红绿灯检测、路径规划和调度三个方面。首先,本文使用轨迹数据低成本更新地图,来添加开源地图OSM(Open Street M
学位