面向医疗文本的机器阅读理解研究

来源 :哈尔滨工业大学 | 被引量 : 0次 | 上传用户:eoast
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
机器阅读理解技术是自然语言处理领域中前沿研究任务之一,旨在从文本数据中推理得到问题的答案。在“互联网+”的大背景之下,人工智能与医疗相结合是大势所趋,在医疗领域研究机器阅读理解技术有助于解决“看病难、看病贵”的问题。但是,目前关于医疗领域的机器阅读理解研究较少,并且没有大规模的医疗领域数据集。因此,在医疗领域研究机器阅读理解技术不仅有极大的研究价值和实际意义,也具有很大的挑战性。本文针对面向医疗文本的机器阅读理解研究这一课题,首先对面向医疗文本的单文本机器阅读理解技术进行了研究。为了解决缺少医疗领域数据的问题,本文提出了面向医疗文本的自动提问技术,自动生成了大规模的医疗领域语料。最后,本文着眼于在线医疗搜索问答的场景,对面向医疗文本的多文本机器阅读理解技术进行了研究。在面向医疗文本的单文本机器阅读理解实验中,本文首先尝试了BiDAF模型,但是受限于训练集缺少医疗领域的知识,实验结果并不理想。因此,本文利用BERT在预训练中学习到的医疗知识作为外部知识,使用了基于BERT的机器阅读理解模型,提升了实验效果。面向医疗文本的自动提问技术包括句子过滤和问题生成两个模块。在句子过滤模块中,本文提出了Attention-based LSTM模型和基于BERT的模型。在问题生成模块中,本文提出了Attention-based Seq2Seq模型,并通过引入拷贝机制使得生成的问题更为流畅、自然和真实。最后,本文利用无标注的医疗文本构建了大量医疗领域的机器阅读理解训练数据,进一步提升了机器阅读理解模型在医疗文本上的实验效果。对于在线医疗搜索问答的场景,通过结合单文本机器阅读理解与候选答案排序的方式实现了面向医疗文本的多文本机器阅读理解。本文基于Pointwise方法和基于Pairwise方法提出了多个候选答案排序的模型,并在基于Pairwise的方法中尝试了多种损失函数。最终,提升了面向医疗文本的多文本机器阅读理解任务的实验结果。
其他文献
为了探讨中枢性高热的降温方法,对30例在接受物理或药物降温后体温仍高于39℃的中枢性高热患者,静脉滴注低温液体,液温0~10℃,40~60gt/min进行降温。结果:降温有效率达100%,降温前后体温差经统计学检验,P<005。
目的观察腹腔镜卵巢电凝打孔术对多囊卵巢综合征患者性激素和胰岛素抵抗的影响。方法于2004年1月-2006年6月对30例耐药的多囊卵巢综合征患者进行腹腔镜下卵巢电凝打孔术治疗,
目的:肝癌危害生命主要原因在于转移。而肝癌转移是多基因参与的、复杂的过程,它涉及大量基因异常表达以及相关信号通路的异常。人即刻早期应答2基因(immediate early respon
焦虑抑郁状态是由社会心理因素引起的一种持久心境低落状态,或者伴有焦虑躯体不适、睡眠障碍等为特征的一组神经症,随着社会竞争的加剧,焦虑抑郁状态的患者日趋增多。近10年
采用马来酸酐接枝乙烯-辛烯共聚物(POE-g-MAH)对两种尼龙6树脂增韧改性,制备了不同增韧剂含量的增韧尼龙6材料。通过力学性能测试和SEM研究了增韧剂质量分数对其力学性能的影
以双季戊四醇(DPET)、季戊四醇(PET)两种多元醇与己二酸部分酯化合成混合季戊四醇己二酸酯(MixPETE)。采用差示扫描热分析(DSC)研究了MixPETE的熔融温度,在DPET、PET、己二酸
目的评价正畸牵引术对恒上前牙龈下冠根折的保存修复临床效果。方法选择6例患牙,经完善根管治疗后采用正畸牵引术使牙根断缘暴露,达到修复条件后固定8~10周,对增生牙龈行牙龈
研究了在两种不同渣系条件下,惰性气体保护电渣重熔(IGESR)对825合金钛含量的影响,分析了变化机理,结果表明用含有TiO2的渣系可以精确控制825合金钛含量。
目的比较卡前列素氨丁三醇与米索前列醇防治宫缩乏力性产后出血的效果及不良反应。方法 70例宫缩乏力性产后出血高危因素的产妇根据数字表法随机分为2组,A组(n=35例)采用米索
采用熔融共混的方法制备了导电炭黑填充乙烯-醋酸乙烯酯共聚物复合体系,分别通过添加填料粒子和熔融态等温处理促进粒子凝聚成网两种方法研究了体系在渗流转变过程中的电性能