论文部分内容阅读
探测复杂疾病临界点对疾病早期诊断至关重要,本文利用多个样本与单个样本分别提出了两种基于隐马尔科夫模型的挖掘复杂疾病临界点的算法,构建了两种综合不一致性指标,以挖掘健康期到疾病爆发之间的临界状态.为验证算法的有效性,将两种指标分别应用在仿真网络数据,肺部急性损伤数据、乳腺癌数据中,并在疾病恶化前,成功探测并及时发出预警信号,另外,两个实际数据集的结果均通过留一法、生存分析、KEGG功能得到验证.第一章,绪论.该章主要介绍论文的背景,论述了复杂疾病的复杂性与危害性,探讨了探索复杂疾病临界点的必要性.并且介绍了在过去的研究中几种探索复杂疾病临界点的方法或算法.第二章,预备知识.在该章中介绍了隐马尔科夫模型的几个重要步骤,临界点分岔理论与构造个体特异性网络的方法,以上皆是本文的算法基础.第三章,算法设计.在该章中叙述了两种挖掘复杂疾病临界点的算法的算法步骤,一种算法是结合了临界分岔理论,构建了一种基于多样本的指标;另一种算法结合了个体特异性网络的性质,构建了一种基于单样本的指标.两种指标均能够在疾病临界状态时发出预警信号.第四章,仿真实验.在该章中构建了一个具有9个节点的仿真网络,首先对临界点分岔理论、个体特异性网络的性质在仿真数据中进行验证,然后分别将两种指标应用在仿真网络数据上,均在系统参数→0时发出预警信号,成功挖掘出其临界状态.第五章,实际应用.在该章中我们将两种指标应用至小鼠肺部损伤数据与人类乳腺癌数据中,均得到一致的结论:小鼠暴露在光气后的第4小时到第8小时进入临界状态,而乳腺癌在状态IIB到IIIA期间进入临界状态.为验证结果,本文进行了留一法交叉检验,验证了结果的稳定性.另外,我们分析了在所探测的临界点中表达最具有显著差异基因:结合生存分析,发现ABCA10、ADAM33、BAI3等基因对乳腺癌有显著影响;结合功能分析,发现这些所在的通路与疾病有密切的联系.