论文部分内容阅读
智能计算技术的不断发展,推动了智能辅助系统在各行各业的广泛应用。在现代医疗中,医生运用其工作中积累的经验和医学知识对病情进行诊断,并得出结论。为了有效继承医生积累的诊断经验,研发人员提出了利用人工智能技术开发智能医疗诊断辅助系统的思路。本文针对上述问题,将机器学习技术引入医疗领域,讨论了一种基于机器学习的智能诊断辅助方法,并利用医院现有医疗病历数据,设计实现了相应的智能诊断辅助方法。本文的研究工作主要包括以下几个部分:首先,本文基于机器学习在自然语言处理中的应用技术,设计了面向电子病历的智能医疗诊断辅助系统的框架,将诊断辅助问题分别归纳为数据处理和病历文本分类问题。在数据处理部分,针对医疗病历数据文本具有明显医学专业语言的半结构化、信息多维等特性,本文研究设计了一种语义传播算法、基于医学语言特性的病历文本词库建立和创建具有医学语言特性的文本匹配模式,从而实现电子病历文本的向量化特征表达和基于匹配的特征提取。在病历文本分类部分,面向具体的电子病历文本数据,采用目前典型的支持向量机(SVM)和多层感知机(MLP)两种分类方法,分别进行疾病分类判别,通过对实验结果进行评测,对两种方法的性能进行对比,得出MLP优于SVM的评测结论,从而为实际应用系统的研发提供参考。进一步地,针对深度学习中长短期记忆模型(Long-Short Term Memory,LSTM)这一热门技术,通过对相同电子病历数据的处理,得到相应的实验结果。经过与SVM和MLP两种技术所得到结果的对比,我们发现在面向较小数据量的电子病历文本分析中,LSTM模型的深度学习智能诊断能力不能得到充分发挥,传统机器学习中的MLP分类方法具有最佳性能。