基于电子病历的疾病预测方法研究及应用

来源 :郑州大学 | 被引量 : 0次 | 上传用户:jackwang520
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
电子病历是指对病人就诊信息的电子化记录,它记录了病人从入院到出院期间的全部信息,可以为病人或医生提供查询及决策支持。电子病历一般包括图像和文字信息,而文字信息以半结构化文本或自由文本的形式存在,以电子病历为基础的医疗数据研究,具有重要的意义。本文针对电子病历文本,主要研究内容如下:(1)电子病历的匿名化处理。电子病历中包含很多隐私信息,这些有标识的信息如果被泄露会给病人带来危害,因此要识别其中的隐私信息并进行处理。先对文本进行清洗并规范化,生成基本结构和表示方法,提出了结合边界特征的深层条件随机场模型,选择最优特征集训练。将文本表示为词向量的形式,作为神经网络的输入进行模型训练,提出了基于块表示的BR-BiRNN、BR-BiLSTM-CRF命名实体识别模型,实验结果表明其F值均高于传统方法。(2)针对妊娠高血压疾病,提出了基于特征融合的循环神经网络预测模型。妊娠高血压疾病是孕妇妊娠期间所特有的一种疾病,该病的存在影响孕妇和胎儿健康,及早发现孕妇是否患病对保障母婴健康有重要意义。本文针对妇产科电子病历文本进行预处理后,提出了特征融合的方法,将词向量和词性向量进行拼接得到融合后的特征(mixed feature),模型无需其他专业医疗经验,就可以实现较好的训练结果,分别采用word feature和mixed feature进行对照实验,实验表明采用mixed feature比采用单一word feature正确率提高了约2%。(3)提出了基于文本数值化的TQ-LSTM妊娠高血压预测模型。首先通过信息抽取将文本数值化表示,提取了与孕妇身体状态相关的生理参数作为特征向量,并对缺失数据进行了补全。同时与一般结构的RNN模型对比,实验结果显示TQ-LSTM模型实现了对妊娠高血压疾病的预测,而且比一般RNN模型的正确率更高。
其他文献
运用马来西亚的事例强调了族群性与国家权力之间的关系并强调了涉及不同族群的政治程序的重要意义。族群的形成涉及一系列的过程 ,这些过程使人们在一国家内意识到一个共同想
保护商标上的生物多样性问题将成为社会关注的焦点。用生物的形象或图形作为标识的商标定义为生物商标,同时将用于商标的生物称之为商标生物。商标作为一种商品,一种无形资产
随着CAD技术的发展,模具CAD/CAM的应用已成为保证模具设计和加工质量、提高效率的有效途径。但是,目前模具辅助设计系统基本上都是基于单一CAD平台开发,倘若想在其他CAD系统
玉米种质资源遗传基础狭窄已经成为限制我国玉米育种及生产可持续发展的重要因素之一,利用遗传基础丰富的玉米群体改良现有优良玉米杂交种亲本的缺点,进而创造新的优良玉米新种
正值中国企业从“中国制造”向“中国创造”转变之时,生产中对产品提出了“高,精,尖”的要求。对传热,组织变化,变形进行耦合模拟分析才能更准确地模拟出材料变形时温度场、
近年来,养老院中的劳动者虐待老人的问题时有发生,很多人把这类问题归结于劳动者本身的心理异常。而本文认为这类问题的发生有其社会性的原因,它与劳动者的劳动状况、劳动过程中
钛合金因其优越的综合性能而被广泛应用于航空航天领域,但钛合金的难加工特性一直是加工领域研究的重点,特别是钛合金薄壁件。由于薄壁件比强度高、比刚度大等显著优势,在航
针对浮空式角反射体新型无源干扰器材的末制导雷达目标识别问题,对其雷达截面积统计特征及识别模型进行研究。采用理论推导方式依次构建浮空式角反射体及其阵列雷达截面积模
该文设计了一种基于非色散红外吸收原理(NDIR)的可燃气体浓度探测仪。设计了针对可燃气体特性的气体检测室,针对红外热释电探测器输出的特性设计了微弱信号放大电路,使用前端
高职《人力资源管理》课程的培养目标应依据我国的国情和现实制定,注重技能的培养,使学生掌握人力资源管理的基本技能,即识别、选拔、培育、使用和留住人才的技能。教学实践