论文部分内容阅读
近年来,智慧司法领域中针对法律裁判文书的分析和挖掘已成为计算法律学的热点研究问题。法条预测与相似案例匹配是智慧司法中的两个重要任务,法条预测通过分析案件的事实描述部分自动预测涉案法条,相似案例匹配通过对比文书相似度从候选案件中选出最相似案件。法条预测与相似案例匹配能够协助法官审理案件,同时也能帮助普通民众理解案件。目前,智慧司法方面的研究主要集中在判决罪名预测,专门针对法条预测与相似案例匹配的研究较少。面向司法大数据的法条预测与相似案例匹配研究是利用深度神经网络模型实现法条预测和相似案例匹配,提升智能司法服务水平。论文的主要工作为:(1)在法条预测任务中,首先构建了卷积神经网络法条预测模型与注意力双向LSTM法条预测模型,在实验中对比了不同输入层与Embedding层的卷积神经网络法条预测效果,然后通过对错误样例分析后定义了法条预测的易混淆问题,针对该问题,提出了基于分层学习的易混淆法条预测模型,该模型由两层学习框架组成,以卷积神经网络为特征提取器,单独训练易混淆法条模型。(2)在相似案例匹配任务中,构建了基于注意力卷积神经网络的相似案例匹配模型,模型包含两个卷积池化层,并在卷积层中加入注意力机制。针对相似案例匹配中训练数据较少且文书间不易区分的问题,提出基于孪生Bert的相似案例匹配模型,该模型主体框架采用孪生结构,以Bert为文书编码网络,通过余弦相似度公式计算文书相似值。(3)模型在基于中国裁判文书网的真实案件数据上进行实验。在法条预测任务中,基于分层学习的易混淆法条预测模型在CAIL2018数据集与自定义易混淆法条数据集上都取得了最优的效果,表明分层学习模型对易混淆法条预测的有效性。在相似案例匹配任务中,基于孪生Bert的相似案例匹配模型在CAIL2019_Small的准确率达到88%,在CAIL2019_Large的准确率为78%,表明基于孪生Bert的相似案例匹配模型能够较好解决相似案例匹配中训练数据较少且文书间不易区分的问题。