论文部分内容阅读
伴随着信息时代的飞速发展,信息爆炸式的增长引发了“信息过载”问题。医学领域中,广泛应用的经食管超声心动图(TransEsophageal Echocardiography,TEE)在临床诊断与治疗中具有极其重要的地位,同时TEE超声记录中记载的一系列相关指标和病例信息对研究和学习TEE技术有很大的参考价值,受到了相应领域专家和医师的普遍关注。然而由于医学信息的更新迅速,TEE超声记录的数量也不断增长,而目前用于管理TEE超声记录的系统只能按时间、病症、培训医师或病例号/住院号进行查询,但通常查询出来的条目很多且按时间倒序显示,由此使得相关专家和医师用户很难高效获取其真正感兴趣的记录信息。 利用推荐系统可以解决“信息过载”的优势,结合系统特点,进行了基于TEE超声记录的病例推荐系统研究。首先介绍了推荐系统相关技术,包括主流的推荐算法原理及使用特点,其中协同过滤推荐、基于内容推荐以及二者的混合推荐是常用的推荐策略;同时介绍了四种基本的数据预处理技术,即数据清理、数据集成、数据变换、数据归约;此外还简要介绍了相似度计算方法、向量空间模型及特征提取等相关技术。 然后从系统整体出发,展开了研究主题。根据系统需求分析、构建原则、整体框架和推荐流程,同时结合已有的数据资源和系统实际情况等特点,选择合适的推荐算法,主要算法为基于项目内容推荐、项目协同过滤推荐以及二者的混合推荐。紧接着,对现有的数据进行处理,设计具体的推荐算法流程,其中混合推荐策略中有线性混合推荐与连续混合推荐。 随后,为了衡量各算法的推荐效果,根据具体实验和经典的算法评测指标,对实验结果进行统计分析对比,由此评估各算法的推荐效果。经实验分析得出,基于TEE超声记录内容和协同过滤的两种混合推荐方式(即线性混合推荐和连续混合推荐)的推荐效果都比只进行基于TEE超声记录内容推荐或者只进行基于TEE超声记录协同过滤推荐效果好,并且在现有系统实验数据集下,连续混合推荐的精度更高。另外,还对比了随机推荐和热门推荐效果,发现设计的四种推荐算法均明显优于随机推荐或热门推荐,从而能够提升相关医师用户的查询效率和体验度,同时提升系统的转化率等性能。