论文部分内容阅读
现如今,伴随着我国经济的飞速发展,糖尿病已经从一种小众的“富贵病”,成为一种患病率极高,威胁大多数人生命健康的严重疾病。糖尿病的预防及治疗成为多数人们谈论的热点问题。伴随着科学技术的进步,在Web已经成为我们获取知识信息的重要来源的今天,想要在信息如海量般增长地Web上获得自己想要的准确信息已经十分困难了。例如,在Google上搜索“糖尿病预防”,马上就会得到48,300,000个结果,其中不乏各类广告等无用信息。为了使计算机更好的“看懂”查询的内容,更加准确的帮用户找到所需的信息,语义Web在众多学者的研究和开发下就由此而产生了。它的基本思想是提供基于机器可处理的数据语义,并应用这些数据的启发式进行自动化的信息访问。其中,本体,即领域共享概念的明确的形式规范化说明,成为了语义Web实现的关键之一。本文介绍了首先国内外关于本体及应用于医疗方面的本体的研究现状,详细的阐述了本体的分类、语言描述、构建方法及构建工具等相关理论知识。以医学主题词表(MeSH)作为基础,结合中文医学主题词表(CMeSH)及澳大利亚Hadzic等人建立的通用四维疾病(即疾病类型、表型、病因和治疗手段)本体模型,依据斯坦福大学医学院开发的“七步法”,尝试构建了糖尿病领域本体模型。通过构建本体,使得现有的海量的数据有了特定的组织形式,让原本很难发现相互关联的知识概念之间建立了联系,让知识带有语义,从而可以被计算机所理解。糖尿病本体的构建对相应知识领域的处理和检索都是具有一定益处的。本文创新点是通过对各类健康网站论坛上关于糖尿病病症的信息进行获取,结合我们所建立的糖尿病领域本体进行推理,并进行信息检索,从而对用户进行适当的糖尿病预警。本文的研究意义在于通过全面而具体的对本体构建的相关理论、方法及核心技术的阐述,尝试性的设计并构建了糖尿病本体模型,并通过在Web上对糖尿病其相关内容上进行自动获取数据,再尝试借助糖尿病本体模型这一手段进行推理,最终达到预警的效果。希望这种方法可以在更多的医学领域得到应用。