论文部分内容阅读
医疗领域大数据应用是国家大数据战略布局中的一部分,同时也关系到全民健康的发展。医疗健康数据具有持续快速增长、多模态、复杂性等特点,其分析和应用面临巨大的挑战。如何及时准确地采集和获取数据,如何高效地、可靠地在高速网络环境中传输数字信息、图像信息、语音信息,如何运用人工智能技术从医疗大数据中挖掘出有用的信息,开发出方便广大医务人员和民众使用的智能化应用,是目前医疗数据应用和分析中面临的主要挑战。针对从医疗健康数据中挖掘信息和开发智能化应用相关问题,研究了多模态医疗健康数据特征表示学习相关内容,提出了几种特征学习模型,应用于疾病风险评估中。针对如何为智能化医疗应用提供完善的大数据服务,提出了云端融合系统半实物仿真的方法。主要贡献如下:(1)在医疗文本特征学习方面,提出了基于卷积神经网络的医疗文本特征学习模型。将深度学习文本分析技术应用于疾病风险评估应用中,文本数据特征表示采用深度学习方法,不同疾病特征的学习和提取使用相同的方法,实现了模型的通用性。为了减少模型中文本数据特征对数据的强依赖性,增加了医疗专业人员设计的结构化特征,提出医疗文本数据特征与结构化数据特征融合的模型。实验结果验证了模型的有效性、通用性和稳定性。(2)在多维数据特征学习方面,提出张量卷积自编码神经网络模型。多维医疗影像数据,对于普通的图像数据来说,其像素空间位置关系包含更多信息。在卷积自编码神经网络中使用张量计算,从向量空间应用延伸至张量空间应用。使用张量距离作为误差函数,有效利用数据在张量空间的位置特征。提出的模型用于肺部CT(Computed Tomography)图像肺结节风险评估和相似结节检索,验证了模型的有效性。(3)在时间序列数据特征学习方面,提出了多通道卷积自编码神经网络。分析疲劳和情感异常之间的联系,定义了情绪疲劳的概念。使用提出的多通道卷积神经网络学习ECG(Electroardiogram)数据特征,使用卷积自编码神经网络学习面部图像数据特征,这两种特征和采集的生理数据融合进行情绪疲劳检测。建立多模态数据特征融合的情绪疲劳检测演示平台,实现数据采集、情绪疲劳检测和情感反馈功能。对情绪疲劳检测平台进行了测试,验证了提出的模型可用于时间序列数据特征学习。(4)在大数据为智能化医疗应用提供服务方面,提出了云端融合半实物仿真模型。智能化医疗应用中,数据呈现多样性和复杂性的特点,为了研究如何构建灵活的网络架构、提供安全有效的数据传输,搭建了云端融合半实物仿真模型。模型为建设真实的云端融合系统提供了技术支持和参考。