论文部分内容阅读
基于人类疾病表型的诊断分析是一个复杂判别决策问题,涉及到多种不同类型的数据及其相互之间的复杂交互关系。如体征时间序列数据是人类健康的一个重要数据资源,传统的基于时间序列分析的方法以发现局部的结构模式为主要目标,忽略了人体作为复杂系统所展现的整体信息规律和模式的发现,从而存在一定的局限性。而中医临床证候预测作为中医证候学研究的主要内容之一,是一个典型的多标签分类问题,多标签分类问题常用的标签拆分方式将证候看作独立的个体,而中医理论认为证候之间存在着复杂的联系。并且,证候辨证的主体是临床医生,辨证的过程受医生经验等因素的影响,在症状体征的获取上存在较多的主观性偏性从而导致症状数据存在严重的缺失问题。本文针对上述两方面的问题,采用基于复杂网络特征的机器学习方法进行探索,主要研究工作如下:(1)人体生理系统对体征的调节使体征时间序列数据呈现分形特性,且不同健康状态的系统的调节能力不同使体征时间序列的分形特性也不同。本文中利用复杂网络技术研究体征时间序列,采用可视图方法将体征时间序列数据进行网络化,将体征时间序列的网络特征作为属性,体征数据来源的人的健康状态作为类别,分析了和健康状态相关的主要网络特征。文中分析了标准心率时间序列数据和穿戴医疗设备希盟(CIM)采集的老年人体征数据,发现和健康相关的主要网络特征为图密度。(2)针对临床医生在辨证论治过程中存在的主观性问题,基于共现性原理,利用临床病例数据样本分别建立了症状关系网络和证候关系网络,在症状关系网络中,利用基于网络结构的DIAMOND算法进行了样本症状的扩展,利用基于网络结构传递的Prince算法和基于超图的模型进行了证候的预测。实验结果显示Prince和DIAMOND结合的算法具有较好的预测效果,Hamming Loss为0.0925,Ranking Loss为0.2018,基于超图的模型预测效果较差。这一结果表明症状关系和证候关系是证候预测问题需要考虑在内的因素。