【摘 要】
:
随着医疗信息化进程的推进,中文电子病历的数量也在不断增加。电子病历包含了丰富的医疗领域知识,对于医疗健康服务的信息化、智能化发展有着重要的意义。电子病历包含了病人就诊过程中产生的各种诊疗信息,有效的挖掘并利用其中的医疗知识对于医疗事业的健康发展有着积极的意义。不同于通用领域的信息抽取,中文电子病历固有的很多特点,使得对于中文电子病历的信息抽取面临一定的难度。本课题在充分调研通用领域信息抽取的基础上
论文部分内容阅读
随着医疗信息化进程的推进,中文电子病历的数量也在不断增加。电子病历包含了丰富的医疗领域知识,对于医疗健康服务的信息化、智能化发展有着重要的意义。电子病历包含了病人就诊过程中产生的各种诊疗信息,有效的挖掘并利用其中的医疗知识对于医疗事业的健康发展有着积极的意义。不同于通用领域的信息抽取,中文电子病历固有的很多特点,使得对于中文电子病历的信息抽取面临一定的难度。本课题在充分调研通用领域信息抽取的基础上,对中文医疗领域的信息抽取任务展开了以下研究:首先,传统的命名实体识别方法需要人工构造大量的特征,针对这一问题,本文设计了基于字标注的医疗命名实体识别算法,通过在词向量表征中添加词性、词典等特征,以丰富原有字向量的表示,并在BiLSTM的输出层后加入CRF层,来学习标签之间的依赖关系。在自建数据集上的实验结果表明,本文提出的基于字标注的BiLSTM-CRF方法,能够有效学习句子的表征,提升医疗实体识别的效果。其次,针对医疗实体关系类别较多,受限于有限的标注数据,提出一种基于特征融合的方法,首先提取句子的词法特征和句法特征作为基本特征,通过支持向量机模型构建多个分类器预测医疗实体的关系类别。并根据电子病历的文本特点,在采用基本特征的基础上,融合区间信息、描述词和否定词信息、最近句法依赖动词等扩展特征,提高了中文医疗实体关系识别的效果。最后,针对基于特征的方法不能学习到深层的语义信息且小规模标注语料并不适合采用深度学习方法进行训练这一问题,本文采用基于远程监督的方法,通过知识库结合规则约束的方式从未标注语料中自动构建出大量训练实例,并提出了一种基于词注意力机制的CNN模型,在模型训练过程中充分考虑了不同词对关系分类的重要程度,实验表明,本文提出的模型能够明显提升关系抽取的效果。
其他文献
目的探讨螺旋CT在显示中耳结构时的优越性及临床价值。方法分析97例中耳炎患者术前螺旋CT特征,将手术结果与CT表现进行对比分析。结果螺旋CT能清楚地显示起源部位不同和大小
任务型教学(task-based approach)是以任务来组织课堂教学活动的。在履行教学任务的过程中,学生通过亲自参与、特点和现状,分析了在旅游英语教学中使用任务型教学法的优越性
近日,随着科学技术的迅速发展,生活水平的提高,对能源的渴求日渐增加,亟待寻找一种能量转化率高的清洁能源来代替传统的化石燃料能源。氢气燃料电池是最清洁的能源,然而由于
血小板流变行为受多种因素影响,损伤是其中的常见因素。损伤不仅引起血小板数量和形态结构改变,还引起血小板黏附、聚集、收缩及释放反应。导致微血管功能及微循环血液流变学
法国文化教育学家斯普朗格曾说,教育的最终目的不是传授已有的东西,而是要把人的创造力量诱导出来,将生命感、价值感唤醒,一直到精神运动的根。其实,语文教育正是这种唤醒人
以麻鸭为试验原料,通过酱腌风干成熟制作风干酱鸭,分析加工过程中脂肪氧合酶(lipoxygenase,LOX)酶活、硫代巴比妥酸(thiobarbiturie acid reactive substance,TBARS)反应底物值和过氧
目的寻找生物标志物就是寻找与机体生理或病理过程相关的可监测的变化。尿液,作为体液重要的组成部分之一,在生物标志物研究方面有巨大的优势。尿液不受稳态的调节,从而更好
<正>人类最高贵的灵魂是能做到自律。一般人连他律都做不到,所以能够做到自律的人,肯定是不同于一般了。古代圣贤留下很多耐人寻味的话,比如劝人为人要"静坐常思己过,闲谈莫
高中美术生活化教学逐步成为当前高中教育的重中之重,也是高中美术教师不断探究的新课题。艺术来源于生活,通过生活化教学可以促进高中生养成健康的人生态度和艺术观念,还能
在我国专利侵权诉讼与专利无效程序二元分立背景下,专利授权确权与侵权认定权利要求解释标准是否应当不同颇受争议。现有研究鲜少将司法行政实践中专利授权确权与侵权认定权