论文部分内容阅读
为提高中医电子病历的实体抽取精度,针对中医电子病历中语言半白话半文言的特征,基于双向长短时记忆网络、自注意力机制和条件随机场构建实体识别模型,基于双向长短时记忆网络与多层感知器构建实体依存关系挖掘模型,分两步抽取中医电子病历中的实体类别和关系,并采用真实的中医电子病历数据集进行算法性能测试.实验结果表明,与其他常用自然语言处理模型相比,实体识别模型对5类实体的识别召回率最高,均达到85%以上;依存关系挖掘模型在保证较高召回率、F值和准确率的情况下受空依存关系的影响最小.面向中医电子病历的实体抽取算法能很好地应对半白话半文言的语言特色,提高实体抽取精度.