论文部分内容阅读
循证医学(Evidence Based Medicine,EBM)源于临床实践,对医疗模式的转变产生了巨大影响,传统以疾病为中心的生物医疗模式已经转变为以患者为中心的现代生物—心理—社会—医疗模式。作为一种新的医疗模式,循证医学概念的内涵和外延历经了长期的发展,已经日趋完善,其核心思想可总结为:当临床医师在做出医疗决策时,必须以客观真实的临床科学研究为依据,并结合自身的临床专业知识和患者本人的意愿。临床医师若要基于EBM做出高效判断,全面、可靠、相关和及时的证据获取至关重要。随着人工智能和机器学习的飞速发展,其方法和思想已成功应用于多个领域,都取得了不错的效果,其中不乏有生物医学的相关领域。因此,本研究尝试在循证医学过程中引入人工智能和机器学习的方法,去寻找和鉴别高质量的证据文献,为循证医学的实践提供帮助和借鉴。 鉴于临床科学研究成果往往以科技文献的形式体现,并且本文作者通过实际访谈发现,临床医师往往通过科技文献摘要部分的阅读,即可初步判断证据资源的相关性和有效性。因此本文尝试识别生物医学领域科技文献摘要部分的关键句子,将其映射到特定组织结构模型中的各个部分,从而实现摘要内容的建模及语义关系的量化表示。基于上述己结构化表示的摘要文本,本文结合了题目、发表类型和医学主题词表构建出了文献分级的特征向量。 由于文献分级的分类变量是有序的,并且考虑到所能获取的语料库中的数据集的特征多于样本数量,所以本文结合支持向量回归构建了有序多分类模型用于文献的分级。实验结果表明,对比基于规则和基于C-SVC无序分类的方法,基于e-SVR的有序分类方法整体表现最佳,通过对准确率和召回率的观察,本文发现支持向量回归对数据集的拟合程度更好。研究应用机器学习的方法对生物医学领域的科技文献进行分级仍然处于探索阶段,本文方法在词汇、语义等层面对文本进行挖掘分析后进行的有序分类,准确率和召回率依然有很大的进步空间,在后续研究中需要不断改进。