基于层次注意力机制序列生成网络的多标签罪名预测算法研究

来源 :山东大学 | 被引量 : 0次 | 上传用户:chenyinan
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着以深度神经网络为代表的人工智能技术的快速发展,司法领域正在向智能化、自动化方向迈进。作为司法审判中的重要环节,罪名预测任务直接关系到整个案件的裁决与性质。目前基于犯罪事实描述的单标签罪名预测研究工作已经相对成熟,但在实际应用场景中,“一人多罪”、“数罪并罚”的情况也同时存在,这就需要进行多标签罪名预测任务的研究工作。传统基于犯罪事实描述的多标签罪名预测方法,大多利用阈值神经网络框架,即在罪名概率向量的基础上手动设置先验阈值,按照单标签多分类的方式来完成预测任务。还有一些研究工作利用问题转换方法,将多标签罪名预测任务转化为并行的单标签罪名预测任务,通过在每个罪名标签上构造分类模型并进行训练,然后集成元分类模型最终实现多标签罪名预测。此类方法虽然计算逻辑简单,但没有考虑到罪名之间的逻辑关联,如贩卖毒品罪与容留他人吸毒罪等,导致在预测有内在犯罪关联的案例时召回率指标下降,并且在样本标签空间特别大的情况下模型复杂度就会升高,不便于在实际场景中使用。在分析前人相关研究工作的基础上,本研究一方面通过将多标签罪名预测任务转换为罪名序列生成任务,从机器翻译的角度将罪名之间的逻辑关联融入到模型中,即完成对犯罪事实描述到罪名序列的映射建模,利用循环神经网络解码单元进行链式计算,串行输出罪名序列,提升了模型的多标签预测效果,同时因为无需构建并行训练数据集,也降低了在大样本标签空间下数据处理的人工成本。另一方面,鉴于犯罪事实描述的篇章级文本特征,传统循环神经网络已经不能满足对长序列文本的建模需求,因为循环神经网络的链式结构在模型训练时容易出现梯度消失或梯度爆炸的问题。本研究中采用基于层次注意力机制的网络结构,将犯罪事实按照语句结构进行拆解,分别在单词和语句级别进行注意力建模得到文本表征向量。通过这种分层机制,模型可以挖掘出犯罪事实中的关键单词和关键语句,从而缓解了犯罪事实文本过长带来的信息丢失问题,提高了模型预测的精度。通过在两个多标签罪名数据集上与多个基准模型的实验对比,本研究提出的基于层次注意力机制的序列生成模型,在多标签罪名预测任务中,较大幅度地提升了准确率和召回率。实验结果充分验证了层次注意力机制和增加罪名逻辑关联信息对多标签罪名预测的有效性。
其他文献
肺癌是呼吸系统最常见的一种恶性肿瘤。在我国,肺癌的发病率和死亡率都高居第一位。肺癌的早期缺乏典型症状,一旦发现,患者大多处于中晚期且易伴随远处转移,治疗变得非常困难
金属有机框架材料(Metal organic framework,MOF)作为多孔材料中的新生力量,具有比表面积大、活性位点多等优点,被广泛应用于催化、气体储存和分离、电化学等领域。然而MOF材
未知源识别反问题是一类不适定问题,这类问题是数学物理反演问题的一个重要研究领域,该类问题的解即使存在但依然不连续依赖于测量数据.本文分别研究了热方程的未知源识别问
我国经济步入新常态以来,已由高速增长阶段转向高质量发展阶段,正处在转变发展方式、优化经济结构、转换增长动力的战略攻关期,经济增长动力亟需由依靠要素投入扩张转变为依
互联网众筹打破了传统的融资模式,依托互联网平台,为拥有创新创业想法的小微企业和个人提供了融资渠道。2001年,美国音乐类众筹网站Artist Share成立,标志着现代互联网众筹的
维州企业家江苏驻点交流项目是维多利亚工商会与江苏省工商联之间基于友谊的商业交流项目,报告人于2018年5月20日至26日作为讲座口译及联络口译分别参与到讲座培训及实地考察
改革开放四十多年来,我国经济保持了持续的快速增长,堪称人类历史上前所未有的发展奇迹。但是,伴随着经济的快速增长,我国的能源消耗也开始急剧上升,最终导致我国对境外能源的依赖程度日益加重以及生态环境的日趋恶化。在此大背景下,准确评估我国各省的能源效率及其影响因素,不仅可以了解我国省际能源效率的差异,发现各省在能源效率上的改善空间,还可以提出针对性的建议,对我国保持经济的可持续增长有极其重要的意义。本文
区片综合地价的确定对进一步规范和完善征地补偿制度,确定公平合理的征地补偿办法,进一步保障农民的合法权益,保持社会经济可持续发展具有意义重大。本文借助Arc GIS地理信息
作为经典随机游荡的量子类似物,量子随机游荡属于量子概率论的研究范畴,并且在量子信息、量子计算及其他领域中都有着广泛的应用.量子Bernoulli噪声是定义在平方可积Bernoull
在自然界中,动物所需的食物资源会随生境的变化而发生一定的改变,与此同时,不同种类的动物具有一系列的生存机制以适应复杂多变的环境,其中小型哺乳动物在应对食物资源短缺时